时间:2023-02-06 12:21:36 | 浏览:458
下载pdf格式报告请关注公众号“行业报告研究院”
12 月 21 日,由鹏城实验室、新一代人工智能产业技术创新战略联盟主办的“2019新一代人工智能院士高峰论坛”进入第二天,12场主题演讲,2场圆桌论坛Panel将论坛推向高潮。当天上午,来自阿里、中科大、清华大学、中科院自动化所、鹏城实验室的专家围绕AI芯片和类脑,分享了各自领域的最新进展;下午,来自中国平安、卫健委、交警局、蚂蚁金服、中科院计算所、云天励飞的专家,则聚焦人工智能和人工智能赋能,深度剖析了人工智能领域的发展现状和未来值得探索的方向。两场精彩的圆桌论坛也从日常生活、交通出行、社会管理、医疗服务、金融等方方面面,探讨了人工智能给我们生活带来的便利之处。
这次会议延续去年强大的院士阵容,今年邀请了多达 10 位院士以及诸多人工智能领域学术和企业界的顶级专家,从各自的领域深度剖析了人工智能领域的发展现状和未来值得探索的方向。
1、蒲慕明院士:脑科学与类脑智能研究
中国科学院院士、美国科学院外籍院士蒲慕明
蒲慕明院士谈到:「我认为下一代人工智能的一个很重要的发展方向就是,脑启发的新型人工智能。我们国家在未来 10 年将启动的重大项目叫做脑科学与类脑研究,整体框架为『一体两翼』,主体是脑认知功能的神经基础,做全脑神经连接图谱,两翼则是指研究内容分为脑重大疾病诊断和干预、脑机智能技术研发两个方向。」
他指出理解大脑需要从三个层面上的神经连接图谱分析:
第一个是宏观图谱。通过核磁成像的技术可以看到毫米级的神经束,每个神经束都有成千上万的细胞纤维,传导方向是双向,但只了解神经束的走向对于理解脑功能并没有太大贡献。
第二个是介观图谱,空间分辨率要达到微米级别。用特殊方法来标记不同的神经元种类,了解不同神经元的功能。介观神经连接图谱是目前神经科学的主要方向。
第三个是微观图谱,空间分辨率要达到纳米级别。在微观层面对神经元轴突和树突的分布以及突触产生规律的研究可以得到很多有用信息的。
进一步,他认为类脑智能研究中要考虑三个层次的认知:
第一个层次是对外界的认知,包括感知觉、多感觉整合和注意、分类等,是许多动物都拥有的认知能力,对此可以从动物模型中寻找一些信息和启发;
第二个层次是对自我和非我的认知,包括自我意识、共情心和理解他者能力,但可能只有灵长类动物才有,因此只能基于灵长类动物进行研究,而这是我国未来在基础神经科学研究中最有优势的领域;
第三个层次是对语言的认知,这是只有人类才具有的句法、文法以及无限开放式的语言结构,对于研究人类语言的神经机制和演化起源,构建非人灵长类转基因动物的模型是必要的。
对于这些脑网络特性,人工智能未来研究中有可以借鉴但目前还没有借鉴地方呢?蒲慕明院士认为有五个重要的点:
第一,神经元很简单,有不同性质和种类的神经元,例如抑制性神经元(信息反转)、兴奋性和抑制性神经元亚型(不同放电特性);
第二,神经网络有顺向、逆向侧向和的联接,现在主要是正向的,而加入反向的联接会带来好处,而侧向联接尤其重要,并且也是有序的。
第三,神经突触的可塑性。这个方面除了传递效率的增强和削弱(LTP 和 LTD)的功能可塑性,突触的新生和修剪的结构可塑性也非常有用。
第四,记忆的贮存、提取和消退也非常关键,网络中特定突触群的效率和结构修饰便是记忆的储存,记忆提出是指电活动的再现于储存记忆的突触群,而记忆消退则是指突触功能与结构修饰随时间消退。另外根据输出对学习相关的突触群修饰,可进行强化学习。
第五,赫伯神经元集群概念的应用,包括细胞群的建立、多模态信息的整合,不同信息的捆绑、同步的信息震荡、时间相位差以及输入信息的图谱结构等等都可以借鉴
最后,他更是对新型人工网络架构和机器学习算法提出了四点建议:
除此之外, 他认为 AI 界应该提出一个新的机器人或智能标准,从语言和感知觉能力的整合、团队合作等更多维度去尝试建立「新图灵测试」。
2、高文院士:数字视网膜与云视觉系统演进
中国工程院院士、鹏城实验室主任高文
首先,他指出了云视觉系统目前存在的两大主要的挑战:
第一,虽然视频数据非常多,但是能够对其进行规范并能够从中挖掘出规律的大数据却并不多。
第二,这些视频数据中绝大多数都是正常视频,而敏感视频比较少,因而产生的价值并不大。
而深究到底,这两大问题其实是整个视觉感知系统架构造成的直接后果。对此,高文院士等人从高级生命体视觉系统的进化历史中寻找灵感,在设计新的第二代城市大脑或者说云视觉系统时,在中间的视觉神经通道做工作。他们将这一想法称之为数字视网膜。
他进一步介绍,数字视网膜的定义包括八个基本要素,按照特征或功能可分为以下三组:
第一组特征是全局统一的时空 ID,包括全网统一的时间以及精确的地理位置两个基本要素;
第二组特征是多层次视网膜表示,包括视频编码、特征编码、联合优化三个基本要素;
第三组是模型可更新、可调节、可定义,即将模型可更新、注意力可调节以及软件可定义三个基本元素组合到一起。
不同于传统的摄像头只有一个流,即一个视频压缩流或一个识别结果流,这种数字视网膜存在三个流,即视频编码流,特征编码流,模型编码流,三者各自有分工,有的是在前端可以实时控制调节,有的是通过云端反馈出来进行调节和控制的。
在过去两三年中,高文院士等人对此也开展了大量工作,重点实现了以下四个使能技术方面的重要进展:
第一个使能技术是高效视频编码技术,其中他们提出的场景编码技术成为中国学者对世界所做出的的一大贡献,将编码效率提升到了一个新的水平;
第二个使能技术是是特征编码技术,其中就包括他们与国际专家一同完成的两个国际标准 CDVS 和 CDVA,而 CDVA 更是为满足支持深度网络而建立的标准。
第三个使能技术是视频和特征联合编码技术,这是由于视频编码和特征编码使用的优化模型不一样,视频编码使用的是 2D 优化模型,而特征编码联合使用的是 R-A 模型,两个模型的曲线方向完全是不一样的,对此他们提出了联合优化模型,将 R-A 和 2D 变成一个目标函数,通过求最优解就可实现联合优化。
第四个使能技术是 CNN 模型编码技术,能够实现多模型重用、模型压缩(差分编码)和模型更新等优势。
最后,高文院士总结到,现在的云视觉系统不是太有效,对此我们可以通过类似于像数字视网膜的新的概念和技术来使其变得更加有效,包括降低码率、减少延迟、提高准确率、降低云计算成本以及让低价值的视频数据转化为大数据等。
随着数字视网膜已实现 1.0 版本,下一步该如何走向 2.0 版本呢?答案是:采用脉冲神经网络的思路来做数字视网膜 2.0。
3、汤晓鸥:人工智能,创新应用
商汤科技创始人、香港中文大学教授汤晓鸥
「我现在都不知道怎么做演讲了,大家往往只记得我讲的笑话,其实我也提到了一些深奥的人生哲理。」
台下非常「应景」地发出一阵欢笑声。
呼应主题,汤晓鸥教授首先分享了他对于「创新应用」的理解:
创新,便是做别人没有做过的事情,带来的结果是花钱,所以从这个意义上来说,创新的主要目的就是把钱花出去,这似乎是大学的功能;
应用,则是要把创新落地到产品中,然后把产品卖出去,核心是赚钱,这是公司应该做的事情。
然而创新和应用这两个看似矛盾的点如何并存于公司呢?他指出,对于于世界上绝大多数公司尤其是创业公司而言,根本无法像谷歌等大公司通过已经成熟的业务应用来赚取大量的收入,从而为每年用于创新所投入巨额的研发费用买单。那该如何找到自己的生存模式 ?
商汤便通过与各行各业进行合作,以 AI+赋能来找到平衡创新和应用的方法论。他进一步以上班族「从早上八点到晚上十点」一天的日常需求,如驾车上班、楼宇办公、午餐、外出开会、游戏娱乐、就医问诊、休闲购物等生活场