本文内容来自阿里云研究中心、波士顿咨询公司以及Alibaba Innovation Ventures合作共同推出的《人工智能:未来制胜之道》,亿欧整理了这份报告中的重点内容,主要包括人工智能会做什么,人工智能能用在哪,以及大数据是人工智能时代竞争优势三个方面,整理者李基祥。
一、人工智能会做什么?
人工智能具备“快速处理”和“自主学习”两种能力。
计算机处理信息、沟通信息、并行计算和线性计算的速度都快于人类。此外,计算机还能够不停迭代和优化“试验—验证—学习”的正循环。例如在上文提到的阿里云ET人工智能调度交通的应用中,城市的交通是非常复杂的。机器需要对成千上万个路段的海量历史数据进行处理和学习,以获得路段的全天路况模型,再结合城市的每个路口传回来的智能视频信息做全局的、实时的分析,这个过程对数据处理能力在规模、复杂度、实时性上都提出了更大的挑战。
人工智能可以更灵活地自主学习和管理知识,支持知识的“产生—存储—应用—更新”的体系化管理。例如在淘宝和天猫,每天有近5万次热线电话求助。这些海量的语音数据通过人工智能机器的自我学习,使得机器具备能“听”能“懂”的知识,这些知识可以运用到语音交互相关的各个行业和各个场景。
如何让人工智能做好知识管理,是这个体系化工程的重要部分。“双十一”是由淘宝天猫发起的全球消费者的购物狂欢节,在2015年,更是创下了一秒14万笔订单的世界记录。庞大订单量也带来的用户咨询服务和问题的高峰,阿里巴巴的算法工程师们通过对海量问题的分析和预测,在业内首次将知识库的自动更新时效提升至分钟级,使得智能客服在此场景下获得高达94%的智能解决率。
二、人工智能用在哪?
图像识别(包括交通信号灯和人脸)技术已经超越人类水平。微软计算机视觉软件的图片识别错误率已经低于人类。另外,计算机不仅能识别简单图像,还能分析整个电磁波谱。
语言识别和自然语言处理技术已经在日常生活中广泛应用。例如苹果手机内置的语音识别助手Siri、亚马逊智能音箱Echo、阿里YunOS个人助理+、淘宝小蜜、支付宝安娜等。
通过传感器和制动器,人工智能可以感知并行动。机器视觉和各类传感器,结合高精度地图和环境感知信息,机器人、无人机、自动驾驶等智能设备已经投入使用,Google、Uber、Tesla、阿里巴巴与上海汽车合作等都已在无人驾驶和互联网汽车领域布局。
人工智能最适用于解决什么样的问题?
通过分解典型的商业流程,我们发现,人工智能更易于解决符合以下特点的商业问题:
①行业存在持续痛点;
②商业流程本身具备数字化的信息输入,问题可以细分并清晰地界定;
③商业流程存在重复,且获得的结果的沟通以书面沟通或单项沟通为主;
④商业流程较少受整体商业环境的复杂影响。
企业客服就是人工智能应用的一个典型例子,作为企业用户与企业服务的交互入口,客服面对的80%的问题都是简单的、重复的的问题,但是却需要大量人力和时间的工作。同时,客服提供的服务内容大都来自与企业自有知识体系,受整体商业环境的影响相对较弱。这使得企业客服的智能化应用相对容易,很多基于自定义知识库的问答型企业智能客服产品蜂涌而出。
但是如何真正实现人工智能意义的智能客服?与真人深度交互,也就是尽可能地模仿真人的思维交流方式为人类服务,并有效帮助业务提升用户体验,是人工智能时代对商业流程智能化的思考。
2015年起,阿里巴巴推出新一代智能客服产品——阿里小蜜。阿里小蜜通过积累的大数据优势,提前分析、预测消费者的服务诉求,主动触达用户,阿里小蜜将用户转电话及在线人工服务的求助率降低了70%。即便在每天应对百万级服务量的情况下,智能解决率也达到了接近80%,并且依靠阿里巴巴在语音识别领域的知识积累,把服务领域里人机对话语义意图的精确匹配率提升到了93%,满意度比传统的自助服务提升了一倍。
三、大数据是战略性竞争优势
数据是人工智能的基础,拥有针对特定领域的庞大数据集,能够成为竞争优势的重要来源。现阶段,制约人工智能领域很多重大突破的关键,并非是算法不够先进,而是缺乏高质量的数据集。
海量、精准、高质量的数据为训练人工智能提供了原材料(参阅图1),巨型数据库、十几年累积的搜索结果,乃至整个互联网都让人工智能变得更聪明。人工智能从庞大的、复杂的、无序的个体数据中发现更为本质、更能解释世界的规律,并复合多个规律共同作用,以解决问题。
人工智能的三种主要技术,都需要专有类型的数据。机器学习,例如计算机视觉、情感分析、自然语言处理等技术,需要大量的标签样本数据。模式识别,例如文字、语音、指纹、人脸等识别技术,则偏重于信号、图像、语音、文字、指纹等非直观数据。人机交互,如智能机器人技术,则需要积累大量的用户数据。
互联网催生了大数据,大数据催生了人工智能
从信息浏览、社交网络、电子商务、到互联网+,互联网的发展融入到我们生活、工作和经济的各个方面。用户在享受互联网带来的便捷的同时,也在无形中贡献着数据的足迹,音频、视频、邮件、微薄、文件、浏览历史等数据逐渐累积。
互联网的快速发展,推动信息社会进入到大数据时代。同时,大数据也加快推动了互联网的演进。拥有海量用户搜索数据的Google,社交数据的Facebook,交易数据的Amazon、阿里巴巴等互联网公司充分借助云计算、大数据的技术来更好的了解用户,提供更好的或者创新服务和产品。
互联网的演进和催生的新业态,又进一步吸引了大量用户的积极参与,实现了数据“产生—使用—新数据产生—再使用”的闭环,这个闭环恰恰是人工智能自主学习和知识管理的基础。例如:拥有上亿注册用户和上亿商品的阿里巴巴淘宝,后台积累了286亿多个图片文件,更方便的让用户在即时场景(电视观看、社交图片分享、逛街等)下所见即所“得”的找到感兴趣的商品,是淘宝“拍立淘“应用的主要目的。
在“以图搜图”模式下,机器学习正确理解后台几百亿图片并打上标签,用户通过点击商品列表等参与来判断机器的理解是否正确。人工智能的应用的实现本质上就是知识产生—知识应用—知识产生的自我学习和优化的体系化过程的落地。
场景数据的积累,可以促进人工智能技术的应用,从而形成更高效的解决方案
例如,传统外卖配送采用人工调度,由派单员进行手工派单,所依据的是有限的餐厅和配送员的数据,因此派单随机性强,配送效率低,派单高峰时,爆单现象频发,派单本身的人工成本较高。
在互联网外卖应用火爆,积累大量外卖场景的相关数据之后,阿里云大数据孵化器团队采用人工智能技术,基于外卖场景的数据基础,分析餐厅、配送员、订餐人、配送路径的特点、并结合业务规律、天气等数据实现智能调度高级算法,实现机器实时智能调度,从而合理利用运力,提高配送效率。
当场景应用形成正循环后,甚至能够提前对用户行为(如提醒订餐)和餐厅行为(如点菜和出餐速度分析)等进行影响分析,从而进一步提高外卖场景的整体效率。
现阶段,特别是对创业公司而言,数据的来源主要有三种方式
方式一,自筹数据,即从零开始,投入大量人力采集数据。例如,很多聊天机器人公司聘请人类担任“AI训练师”,让他们手动创建或核实虚拟助手做出的预测。一旦能够引发数据网络效应,即形成“更多用户—更多数据—更优智能算法—更好产品—更多用户”的正循环后,所需人力就无需再跟随用户数量同步增加,这种简单的自建数据策略就能取得成功。此外,还有一些公司采取向消费者提供特定领域免费应用的策略,以此来快速积累数据。
方式二,采集公共数据。美国联邦政府已在Data.gov数据平台开放了来自多个领域的13万个数据集的数据。这些领域包括图中所列的农业、商业、气候、生态、教育、能源、金融、卫生、科研等十多个主题。在我国,上海在2012年6月推出了中国大陆第一个数据开放平台,之后,北京、武汉、无锡、佛山南海等城市也都上线了自己的数据平台。
方式三,产业数据协同。即下游创业公司或行业公司和产业链上游的数据或平台型公司建立合作,连接对双方均有利的产品或数据,例如:益海鑫星、有理数科技和阿里云数加平台合作,以中国海洋局的海量遥感卫星数据和全球船舶定位画像数据为基础,功能覆盖从智能指导远洋金枪鱼捕捞到智能预测船舶在港时间,应用场景丰富。
【编者按】阿里的利用自身的产品和业务内容,正在逐步试水人工智能领域。与阿里相似,国内很多科技巨头例如腾讯、华为、百度等也都在积极布局。未来人工智能的应用场景和作用,肯定要比现在大得多。如果你对于自己所从事产业与人工智能之间的结合,还有其他真知灼见,不如在评论区留下你的想法。