人工智能2.0：大数据智能、跨媒体智能、自主智能、人机混合增强智能、群体智能

2018-12-26 18:00

人工智能在经历了60年的发展之后，终于从婴儿发育成幼儿，开始显现出自身远大的发展前景。

如今，人工智能已经从对世界的观察和理解时期开始蹒跚学步，逐步向自己周围的环境进行探索，并参与其中。主要表现在以下几个方面。

0 1

人工智能1.0已基本成熟

>>>>

棋类游戏全面战胜人类对手

从计算量较小的国际跳棋到计算量最大的围棋，人工智能在棋类游戏领域已经全面战胜了人类的对手。

人机大战历史进程

李世石对战AlphaGo

>>>>

识别与理解能力开始显著提升

在语音识别与理解领域已经超过人类，并开始在语音输入、自动化客服等相关领域商用，并开始向同声传译进军。

牛津大学2016年11月发表的论文显示，其研发出的人工智能系统LipNet能够将视频中人物的嘴巴活动与其台词进行匹配，准确率高达93.4%，而即使是最专业的唇语解读者，其准确率也只有20%-60%。

在图像识别与理解方面，目前机器图像分类的错误率仅为3.0%，而人眼的辨识错误率约在5.1%左右，并能够根据图像写出其所表达的含义。

除了我们常见的二维码应用和OCR（光学文字识别）已经获得广泛商用之外，图像识别与理解技术在自动驾驶、智慧医疗等领域的能力表现也显著超过了人类顶级专家。

与 Libratus对抗中的德扑专业选手 Jason Les。

今年年初，卡内基梅隆大学研发的人工智能系统Libratus就在长达20天的鏖战中，打败了4名世界顶级德州扑克玩家，最终赢得了德州扑克大赛，这标志着人工智能已经不再仅仅是暴力计算的代名词，而是有了对不完整信息的理解能力以及据此作出最佳策略的能力。

>>>>

基于深度学习的各类应用已陆续展开

目前，基于深度学习的各类应用已经取得了较好的应用效果，并且正在推动人类社会从信息化时代向智能化时代转变。在云计算、大数据以及深度学习的推动下，人工智能技术已经开始改变网络空间中业务模式。

搜索引擎机器人能够根据用户画像为用户推荐满意的搜索结果和广告，写作机器人能够自动撰写新闻甚至科研论文，传媒监管机器人还能够自动识别黄色和政治敏感的图像与视频。

2016年3月25日不到一天的时间，推特(Twitter)上的微软人工智能机器人Tay就被人类“教坏”，成为一个脏话连篇的种族主义者，虽然微软不得不将其立即下线，但人工智能强大的学习能力已经表露无遗。

IBM基于前期60多年的持续技术积累，已经将其技术精髓集中体现在Watson之中，并从近几年开始陆续将其所取得的成果在十几个行业进行商用，从最初的信息产业延伸至医疗、环保、投资、保险、并购、法律、时尚等，为相关用户提供较为完善的解决方案，期望引领整个社会全面迈入认知商业新时代。

基于上述原因，我们完全有理由判定，人工智能将会改变人类生活的方方面面。

>>>>

人工智能尚未出现本质性突破

人工智能的发展已经经历了三次大的浪潮，如图2所示。现在人工智能在深度学习的推动下，迎来了新一轮的发展浪潮中。但是，本次浪潮仍然还是由于互联网、云计算、大数据等发展所带来的红利，无论是从技术上还是从应用上来看，人工智能仍然处于处级发展阶段，没有出现本质性的突破。

人工智能发展浪潮

随着应用的不断深入，目前基于深度学习的人工智能已经开始逐渐显现出诸多弱点。

深度学习是基于统计学的方法，并不能保证随着层数的增多和训练数据集的增大而获得更高的精度。
深度学习所学习到的内容是数据集的特征，而不是用户所关心的知识。
深度学习还存在黑箱问题，用户根本就不知道深度学习分析的结果所为何来。
深度学习是基于大数据的智能，无法解决小数据问题。
深度学习限于其数据集的问题，还只能用于某个特定领域之内，无法解决常识性知识问题，因而也不具备通用智能。

0 2

向人工智能2.0迈进

潘云鹤院士《人工智能迈向2.0》一文中给出的定义，人工智能2.0是基于中的变化的信息新环境和发展新目标的新一代人工智能，所涉及的技术包括大数据智能、跨媒体智能、自主智能、人机混合增强智能和群体智能等。

>>>>

1.大数据智能

基于大数据的深度学习通过与增强学习的结合，利用增强学习过程中积累的知识，不断优化和提升自身的理解水平，实现了大数据驱动的知识学习，促进了大数据智能的产生，使得原本依赖于暴力计算的深度学习焕发了活力，具备了单一任务中的分析、推理和决策能力，并将在一定程度上解决深度学习的黑箱问题。

实际上，AlphaGo通过其“估值网络”和“快速落子”两大法宝，已经发展出了“直觉感知”和“推理”的能力，初步具备了大数据智能。

>>>>

2.跨媒体智能

人类可以通过视觉、听觉、嗅觉、味觉、触觉等以及其他知识进行综合感知，形成对周围世界的全面认识，这也是人工智能所希望达到的目标之一。

跨媒体智能技术就是要让人工智能能够综合理解文本、图像、语音、视频、地理信息或其他类型数据及其相关属性。通过跨媒体计算，人工智能可以打破单一数据的局限性，随时多维度感知周围世界的几乎所有信息，实现跨媒体语义贯通，为人工智能的智能行为奠定基础。跨媒体智能除了可以与情感计算结合用于实现高仿真情感机器人之外，还可以使人工智能发展出联想、设计、概括、创造等能力。

>>>>

3.通用智能

目前的人工智能饱受质疑的一个主要方面就是单个系统只能解决单一的问题，而且即使是在某一专门领域能够轻松战胜人类的人工智能系统，也难以应对其他领域的简单问题，甚至根本不能解决常识性问题。为解决这一难题，人工智能必须学会在没有先验知识的情况下，主动寻找知识关联，扩充自身知识图谱，实现举一反三的能力。实际上，人工智能在具备了跨媒体智能之后，完全可以通过跨媒体数据学习获得一定的通用智能，从而打开通往通用智能之门。

2017年3月底，百度IDL研究院徐伟等就提出了一个新的通用智能架构，能够使得智能体通过多任务强化学习和零数据的情况下，结合语言和视觉两种信号在迷宫中导航并定位物体。

>>>>

4.自主智能

人工智能饱受质疑的另一个方面是缺乏自主学习的能力。比如，在无人车间、无人工厂、太空、极地等控制人员不在现场或不便于在现场的情况下，无人机、无人车、无人船、服务机器人、空天机器人、极地机器人等各类智能设备需要其在遇到新的问题时，具备像人类一样的思考和处置能力，甚至可以应对自身所处的未知环境和问题，在全新环境进行自主决策。经过科学家门的不懈努力，目前自主智能领域已经取得了一定成绩。一方面，基于跨媒体智能与SLAM（simultaneous localization and mapping，即时定位与地图构建）技术结合的全自主移动机器人已经开始出现初级原型系统；另一方面，DeepMind已经开发出了一种算法，允许Deepmind系统的神经网络自主学习并再次使用所保留的信息，甚至开始向机器自主编程方向迈进。

>>>>

5.混合增强智能

除了让机器具备人类智能之外，人工智能的另一个研究方向是混合增强智能，包括各种各穿戴设备、智能驾驶系统、外骨骼设备、人机协同手术系统等，它们都是以人类为本身为基础的，利用人类的意识进行机械系统的操作，实现人机协同。这类人工智能系统由于有人类的直接参与，获得了社会上较高的认可。

如霍金所用的座椅就可以让毫无语言能力和肢体活动能力的霍金进行现场演讲；另外，一些通过脑电等操作的机械手臂等也已经开始帮助残障人士实现自主活动。

由于混合增强智能使得人类能够利用自身意识，通过机械化延伸与扩展，来实现人脑主导的体力、感知力和智力等各方面增强与拓展，更加易于为人类所接受，并带来直接的益处，因此在近期可望取得明显的市场发展。目前，市场上已经出现了一定数量的混合增强智能系统，但还存在成本居高不下，难以普及等问题，尚需要从混合增强计算架构的理论与工程实践上继续加以深入研究。

>>>>

6.群体智能

群体智能主要是来自于对自然界的研究中所受到的启发。人们发现，在自然界中，单个的小鱼、小鸟、蜜蜂、蚂蚁等并不具备有多大智能，但是当它们动态统一成一个群体时，所表现出的能力往往会超越所有个体能力之和。群体智能中所需要解决的问题包括群体成员之间的主动感知与发现、群体知识的获取与生成、群体成员间的协同与知识共享、群体智能的评估与演化、群体成员的自我维持与相互之间的安全交互等。目前已经有一些群体智能的应用出现。

Unanimous所开发的Swarm AI平台在第89届奥斯卡大奖名单的预测中，准确率达到了75%。另外还有一些人工智能系统，分别在体育赛事、股市预测等方面，表现出了超过人类顶级专家的能力。

>>>>

7.类脑智能

类脑智能已经开始显现出深度学习无可比拟的优势。类脑智能借鉴大脑中“内存与计算单元合一”等结构和信息处理方法的特点，在硬件实现与软件算法等多个层面，对于现有的计算体系与系统做出本质的变革，从计算能耗、计算能力与计算效率等诸多方面都有了大幅度的提升，已经成为一个明显的发展趋势。而且，人类对人脑的认识才刚刚开始，随着神经科学、脑科学、认知科学、生物科学、材料科学的不断发展和通信技术的不断进步，类脑智能必将会在不远的将来取得飞跃式发展。类脑芯片开始出现。高效能可重构类脑计算芯片。存储和计算微模块化组合，缩小了相互之间的瓶颈。

--THE END--

来源：选自《中国人工智能学会通讯》2017年第7卷05期《拥抱人工智能2.0新时代》，有改动

免责声明：本文系网络转载，仅为分享优质文章，不代表本公众号观点。如涉及版权，请联系删除！返回搜狐，查看更多

责任编辑：

平台声明：该文观点仅代表作者本人，搜狐号系信息发布平台，搜狐仅提供信息存储空间服务。

阅读 ()

华制智能

人工智能2.0：大数据智能、跨媒体智能、自主智能、人机混合增强智能、群体智能