为什么要做AI使能平台?清华王生进:AI不是单点技术,而是系统工程
4月27日,正值清华108周年校庆,清华AI使能平台也就此发布。
随着人工智能的进一步落地,安防、汽车、医疗、智能家居及智能制造等领域,都面临着更多的机遇和挑战,各种开源的深度学习平台也随之而出。
2015年,Google正式开放TensorFlow,其目前已成为世界上最大的开源深度学习平台,Caffe位列其后。但我国尚未形成具有国际影响力的人工智能开源平台,这也是目前的短板之一。
2016年下半年,百度开源了国内首个深度学习开源平台PaddlePaddle,之后腾讯、阿里相继推出深度学习开发框架。
清华大学则在去年9月,发布了人工智能开放平台,可支持开发者SDK调用、图像语音识别服务、大数据集、人工智能应用解决方案等功能。
今年4月,清华大学决定将这一开放平台,进行升级。
而为何要把“AI开放平台”,升级为“AI使能平台”,清华大学电子系教授、媒体大数据认知计算研究中心主任王生进在演讲中给出的答案是:随着AI的逐步落地,要解决的场景问题越来越复杂。对应的,AI不是一个单点的技术,是一个系统工程。一个系统的工程,单靠一个简单的AI开放平台是无法实现的。
以安防领域为例,王生进认为,智能安防目前已经成为“AI落地最好、最领先的领域”,海量视频监控数据的智能识别、边缘计算、视频内容的结构化描述等技术都实现了较好的应用。
但也存在以下发展趋势和要面临的困难:
标清向高清和4K化:监控系统更新换代,海量数据分析;
前端摄像头的边缘智能化:嵌入式AI前端,AI芯片、小型化;
多源数据互联互通:传输行业标准,多源数据结构化;
智能视频分析设备:智能分析算法、SDK化,信息联动;
尤其在过往基于AI开放平台的服务中,清华发现,如果企业单独下载一个SDK,在实际应用中,并没有办法实现完整的功能。
王生进举了两个典型例子,在安防领域的人脸识别和车辆违章判别中。单一的识别,无法解决人脸的遮挡问题,以及特殊情境下的车辆违章判别问题。
而跨摄像头的ReID技术,则能更好解决遮挡这一问题;车辆ReID技术定位违章车辆、车道线线检测、特殊标志检测等综合技术,也能更好的进行车辆违章的二次判别。
这些综合技术的实现,就需要平台能力的提升——由以往中心控制、中心管理为主的AI赋能模式,向增强用户AI能力、构建用户AI技术中心的使能模式转化,使用户成为具有AI技术能力的企业,即“AI使能平台”的开放。
以下是王生进的演讲《在人工智能+的机遇中,让AI更使能》原文,中国安全防范行业协会做了不改变原意的整理和编辑:
一、人工智能+首先来看下我们国家和政府对AI的重视程度。
目前,人工智能已经成为世界范围内的热点和话题,从国家领导到政府、企业到科研机构,都在人工智能上注入了很多的精力和资源。
2018年10月,总书记专门组织人学习了人工智能,在今年的政府工作报告中,提出了“智能+”的概念。国务院在2017年《新一代人工智能发展规划》中,提出了“1+N”人工智能项目群。
其中,“1”是指新一代人工智能重大科技项目,聚焦基础理论和关键共性技术的前瞻布局,包括研究大数据智能、跨媒体感知计算、混合增强智能、群体智能、自主协同控制与决策等理论。
“N”是指国家相关规划计划中部署的人工智能研发项目,加快脑科学与类脑计算、量子信息与量子计算、智能制造与机器人、大数据等研究。
并且,提出了新一代人工智能发展分三步走的战略目标,
第一步:到2020年人工智能总体技术和应用与世界先进水平同步,人工智能核心产业规模超过1500亿元,带动相关产业规模超过1万亿元;第二步:到2025年人工智能基础理论实现重大突破,人工智能核心产业规模超过4000亿元,带动相关产业规模超过5万亿元;第三步:到2030年,成为世界主要人工智能创新中心,人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。
这是规划提出的战略布局,在这样的战略布局下,我们面临的机遇是技术该怎样做、产业该怎样升级。
二、AI+的产业机遇第二点,想谈下人工智能的产业机遇。下面我们就几个方面看看AI面临的机遇和挑战。
首先非常热点的就是,“无人驾驶与智能辅助驾驶”技术。
在这一领域,以ADAS为代表的核心技术,包括车道线检测、路标识别、行人检测、车辆检测、障碍物检测等已经取得了一定进展,很多无人车企业也推出了他们的产品。
但是,这一领域也面临着很多困难:传感器智能化程度达不到要求,价格也很昂贵,一台激光雷达几十万,达不到商用的标准;技术鲁棒性未得到充分证明,如特斯拉的汽车就出了很多事故;传感器成本居高不下;无人车立法滞后,如无人车发生事故,责任属于乘车者还是生产商,并不明确。
第二个领域是,智慧医疗和智能诊断。
这里有两个典型案例:一个是胸片判读,包括肺结核等;二是眼底的图像。眼底是唯一能够通过外部看到血管的地方,因此,在眼底图像上可以诊断出很多的疾病。通过基于深度学习的眼底的视网膜,可诊断出50多种疾病。目前,最主要的应用在糖尿病的诊断上。通过医疗影像的诊断,可以提高诊断的精度和普查的力度。
这一领域也面临很多困难:首先疾病的复杂性,要求非常精确的AI技术,如果机器的准确率只有95%的话,那么它是难以被应用的;第二是,可穿戴医疗设备性能需提升;第三是,医疗大数据标注的可靠性,医学上的病理的图像,只有水平非常高的医生的标注才可信,一般人甚至一般医生的标注都难以保证其准确性,因此,医疗大数据的标注目前还是人工智能落地的一大障碍;第四是,医疗数据的隐私问题。
第三个领域是,智能制造与产业升级。
各级制造工厂开始由手工生产线向自动化生产线升级,工业界现在亟需用AI技术进行各种安全质检。
智能制造方面的挑战主要有两点:亟需芯片、视觉、定位等深度学习技术的突破,这些技术虽然在安防领域已经得到较好的应用,但在工业领域,还需要进一步提高;第二是,亟需AI+高端制造业和绿色资源模式的进一步开发。
第四个领域是,智能安防。
智能安防应该说是AI落地最好、最领先的领域,也是带来了非常好的效益的一个领域。目前,在安防领域,AI落地的包括海量视频监控数据的智能识别、边缘计算、视频内容的结构化描述。
但这一领域也存在四类挑战:标清向高清和4K转化下,监控系统更新换代,以及海量数据的处理分析;前端摄像头的边缘智能化,嵌入式AI前端,AI芯片、小型化的发展,以及如何将边缘计算与中心计算相结合;多源数据互联互通,传输行业的标准,多源数据结构化;智能视频分析设备,智能分析算法、SDK化,信息联动,设备如何更好提高性能。
第五个领域是,智能家居。
智能家居是互联网+物联化的体现,与家庭自动化密切相关,以网络家电和信息家电为基础的应用,未来的拓展空间也很大。根据2012年中国室内装饰协会智能化委员会智能家居分类依据,智能家居系统产品共分为20类,这些应用和AI的结合,都需要我们进一步研究。
同样,智能家居领域也有很多需要解决的问题:产品间互联不够,从目前的市场情况来看,小米设备的互联相对较好,但其他厂商的还不够;第二是操作繁琐,用户体验差;第三是市场缺乏统一标准;第四是信息安全存在漏洞,未来,智能家居如何保证家庭的安全,以及家庭数据的安全,这是一个非常严峻的问题。
三、让AI更智能以上,我们介绍了人工智能的大背景下,我们面临的机遇和挑战。接下来,我们看下如何应用AI对整个产业进行提升。
清华电子系在人工智能的领域也有很多应用成果,如我们电子系的人脸识别技术,早在2005年,就和公安部出入境管理局一起把人脸识别技术应用到了我国出入境旅客最多的深圳罗湖口岸,成为世界上首个大规模应用的范例。
清华的人脸识别技术已在多地公安安防、国家金税三期、天津十三届全运会等得到应用;其语音声纹识别在国防、网信领域得到应用。清华大学电子工程系研发了多模态生物特征识别、视频分析与结构化、语音识别、智能辅助驾驶,以及舆情分析、行人再识别等多种先进的AI算法。
去年9月,清华大学还发布人工智能开放平台,提供开发者SDK调用、人工智能技术开放服务、深度学习训练计算、AI应用解决方案、大数据数据集五大功能板块,可部署各类AI算法框架。
但我们认为这样还不够,因此,今天,我们将“AI开放平台”向“AI使能平台”转换。为什么要有这样的转换?
因为我们在AI的服务中发现,AI不是单点的技术。如企业只下载一个SDK,在实际应用中,这是不行的。
AI不是一个单点的技术,而是一个系统工程。所以,我们提出“AI使能”,是想由以往的中心控制、中心管理为主的AI赋能模式,向增强用户AI能力、构建用户AI技术中心的使能模式转换,使用户成为具有AI技术能力的企业。
这是我们由开放平台,向使能平台转化的一个想法。
下面,我举两个例子,为什么单点工程不可行,而要做一个系统工程。
第一个例子是行人再识别。
我们知道人脸识别在安防领域已经有了很好的应用,但我们会遇到很多这样的情况,如被遮挡,不能完整的看到人脸,这时我们就需要跨摄像头进行追踪。
这其中包括行人的检测、行人的跟踪,以及人脸的检测和识别,还有跨网的关联,这些并不是一个单点的技术可以解决的。
第二个例子,是车辆违章二次判别。
我们每天都会拍摄大量的违章照片,但实际上有些属于不违章、或者特定情况下不计算违章的照片。如闯红灯的照片中,像救护车这样的特种车辆,是不属于违章行为的。目前,对于这些不违章的照片,是由交通部门用人力进行筛选。所以,他们就很希望能有一个技术直接进行筛选。
而要实现这些不违章的筛选,就需要如车辆ReID技术定位违章车辆、文本检测识别、地面标线检测、车道线检测、禁令识别检测、红绿灯检测、地面标志检测、特殊标志检测、车牌检测识别等这些技术,综合到一起,这样车辆违章的二次判别才能够实现。
所以,我们才说AI不是一个单点的技术,而是一个系统工程。而一个系统的工程,单靠一个简单的AI开放平台,是无法实现的。
因此,我们希望能通过AI使能平台,深入用户的系统中去,为用户提供这样一个性能。