摘要:“雨雪淮南雁迹稀”,这是谁的诗句?扑面而来的古意会让不少人猜测,它出自唐宋名家之手。其实,这只是一句当代仿作,作者甚至不是人类,而是一套人工智能算法。这些年来,人工智能带给我们的震撼一个接着一个:阿尔法狗战胜人类围棋冠军,无人驾驶汽车在真实...
“雨雪淮南雁迹稀”,这是谁的诗句?扑面而来的古意会让不少人猜测,它出自唐宋名家之手。其实,这只是一句当代仿作,作者甚至不是人类,而是一套人工智能算法。
这些年来,人工智能带给我们的震撼一个接着一个:阿尔法狗战胜人类围棋冠军,无人驾驶汽车在真实路况中行驶,人工神经网络在瞬间翻译长文……人工智能取得的这些成就就连很多认知科学家都觉得不可思议。
虽有突飞猛进的技术,人工智能企业不得不面对一个难题:它们几乎都处于亏损“烧钱”状态。2021年,“人工智能第一股”商汤科技亏损净额14.2亿元,同为“人工智能四小龙”的云从科技亏损6.32亿元,人工智能芯片企业寒武纪净亏损8.25亿元。从股价来看,不少人工智能明星在二级市场并不被看好。商汤科技、寒武纪、格林深瞳当前股价均低于发行价,云从科技IPO后经历了几轮大涨,随后总体处于下跌趋势。
炫目的科技和惨淡的经营之间,横亘着商业化问题。人工智能企业如何把技术转化为产品运用于现实场景?或者说,把技术用到哪里?更进一步,如何让客户用得起?人工智能经历了10年的大发展后,行业、投资者,以及有落地潜质的各领域都在试图解答这些问题。
聪明点,再聪明点
人工智能热潮方兴未艾。人们一度期待它像上世纪后半叶的互联网技术一样,应用到人类生活的各个方面,成为新的基础设施。2015年,电动汽车制造商特斯拉CEO埃隆·马斯克曾预测,“完全自主”将在2018年到来。然而,时至今日,放眼全球,自动驾驶汽车仍在“蹒跚学步”。人工智能的渗透似乎没有当初预料的那样广、那样快。
人工智能落地慢,很大程度上缘于它还不够智能。以自动驾驶为例,尽管在这个热门赛道上全球若干企业已耗巨资,但业界普遍认为,做到真正的无人驾驶还有很长的路要走。研究机构Pitchbook预言,我们要等到本世纪20年代末。
原来,工程师遇到了长尾问题的挑战——那些在真实环境里发生概率虽小但数量庞大的“怪事”,比如散落在道路中间的轮胎碎片、因道路维修临时摆放的锥桶。对于人工智能来说,这些情况“少见多怪”,因而“莫名其妙”。
因为人工智能依赖的深度学习方法从根本上说是一种统计方法,没有人类大脑的诸多认知能力,不像人类那样会运用“自上而下”的推理来理解世界的运行方式。人工智能只是依据海量“训练数据”规定的方式把输入与输出联系起来。一旦遇到罕见而缺乏数据的“怪事”,它往往束手无策。
虽然还无法驾驭汽车,但越来越聪明的人工智能已有用武之地。业内企业在一些更实际、更易落地的场景中率先开启了商业化之路。
例如上海漕河泾开发区的星猿哲科技(上海)有限公司。他们生产的机器人进入工厂车间,代替人工实现自动化上下料,原本十多个工人才能维持的生产线,现在只需一两台机器人工作站就可以胜任。星猿哲机器人能够抓取无序摆放的工件,依靠的就是人工智能的分支之一——机器视觉算法。除了制造业,近年来人工智能技术及产品在安防、医疗、交通等多领域均有渗透且成熟度不断提升。在特定场景下,人工智能已足够聪明,足以代替人的工作。
拥有“视觉感知”的机械臂,能够抓取无序摆放的工件
政府部门也在推动应用场景建设,加快人工智能落地。今年8月12日,科技部等6部门联合印发了《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,鼓励在制造、农业、物流、金融、商务、家居等重点行业深入挖掘人工智能技术应用场景。上海自2018年底在全国率先启动人工智能应用场景建设计划,累计开放3批58个应用场景,发布洋山深水港、申通地铁、华东无人机基地、张江科学城等综合性应用场景。
复旦大学管理学院信息管理与商业智能系系主任张诚教授说:“上海的人工智能发展可以遵循‘锻长板,补短板’的思路。上海的长板产业是汽车制造业和金融业。这两个行业不仅是上海重要的经济支柱,也是上海在全国人工智能发展中最有比较优势的产业,应当持续推进,以增强人工智能发展主动权。上海还应推进合法合规的数据共享和交易,铸牢人工智能发展的基石,争取在优势产业诞生更多人工智能独角兽企业。”
便宜点,再便宜点
人工智能未能如人们期待的那样迅速普及,除了技术,还有成本原因。张诚说:“商业里最核心的一个问题是投入产出比。在商业应用中,人工智能应用增加的收益起码应当抵销为它付出的成本。人工智能的投入产出比不佳,有些是因为提升的收益不够显著,而大多数情况则是因为成本过高。”
人工智能企业的成本首先来自不可或缺的数据。众所周知,人工智能需要大量“训练数据”。从理论上来讲,这个世界充满数据,然而现实中数据问题是人工智能项目最常见的症结之一,因为所需要的数据可能根本就不存在,或者锁在竞争对手的“保险柜”中。有研究者初步计算,训练一个人脸识别模型大概需要10万个样本,如果样本数据需要购买,整个数据成本要占到项目总成本的近60%。
可惜的是,花费如此高的数据成本之后,所开发模型的通用性并不高。例如A工厂和B工厂场景并不一致,同样的识别模型在两个场景切换时就会产生巨大的效果差异。而修改模型的成本不亚于重新开发一个模型。
为此,一些人工智能企业正试图提高模型复用率。例如专注自然语言处理的竹间智能在创业之初就确定了平台化发展路线,即在同样的技术底座中融合不同的业务来积累经验,把人工智能在某一行业沉淀的语义理解模型迁移应用到其他行业,生成更有延展性的产品,这样一来又能覆盖更多业务场景,形成正向循环。竹间创始人兼CEO简仁贤介绍:“2020年新冠肺炎疫情暴发,一些城市需要机器人流调客服,我们只花了几个小时就上线了疫情机器人,服务多家地方政府单位,并接入四大智能手机。”
人才短缺导致成本增加,这是人工智能行业必须面对的另一大难题。截至2021年7月,我国培养的人工智能专业人才仅5万人,约略等于10个商汤科技或5个科大讯飞的体量。据《中国人工智能人才培养白皮书》估算,目前人工智能行业人才缺口高达500万。上海一家人工智能企业负责人告诉记者,大学刚毕业的算法工程师月收入3万元起步,5万元到8万元月薪在业界很普遍。
在工程师的引导下,机器人NAO正在识别手中物体
为了解决人才紧缺的问题,上海人社部门今年联合人工智能企业深兰科技搭建了上海首个人工智能创新实训中心,预计将实现每年实训500人,服务产业在岗职工培训500人。软银机器人则是和大中小学合作,利用Pepper和NAO机器人培养学生的软件开发能力。软银机器人(上海)有限公司总经理邱靓说:“技术的先进性须以市场为导向,以消费者为目标,为避免研发人员过度追求技术的进步而导致成本居高、背离市场,我们将不遗余力地支持开放式创新,期望在人工智能、机器人、低代码人工智能、智慧养老等方向与高校紧密合作,支持高校人才培养、师资培训与创新实践。”
放眼人工智能产业,可以看到两条相向的进路:商汤、旷视等新兴的人工智能企业向传统行业渗透,而传统行业则向人工智能方向转化。2004年创办的上海复深蓝软件股份有限公司原本是一家传统软件企业,2019年组建了人工智能小组,并逐步扩展为两个人工智能研发中心及一个联合实验室,致力于人工智能在金融等领域场景落地。复深蓝创始人杨万强相信,人工智能会像当初的互联网、大数据等技术一样,慢慢被突破,变成大家都掌握的平台性技术,并深刻改变世界。
杨万强说:“人工智能不应该是高高在上的天池之水,而应当是水润万物之水。”
题图来源:新华社
题图为Pepper机器人检测人们是否正确佩戴口罩
来源:作者:宰飞 俱鹤飞