欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

羊驼开源大模型把ChatGPT逼上梁山?推演大模型的竞争终局!

2023-05-26 22:24:06 386

摘要:近日有消息传出,OpenAI 即将发布一款最新的开源语言大模型。这个距离其将 GPT-2开源,已经整整过去4年了。OpenAI 为什么选择在这个时间点?又为什么选择开源呢?草蛇灰线,伏脉千里。让我们一探究竟。微软&OpenAI帝国的一道裂缝...

近日有消息传出,OpenAI 即将发布一款最新的开源语言大模型。这个距离其将 GPT-2开源,已经整整过去4年了。OpenAI 为什么选择在这个时间点?又为什么选择开源呢?草蛇灰线,伏脉千里。让我们一探究竟。

微软&OpenAI帝国的一道裂缝

虽然 ChatGPT 推出后仅用2个月,月活便突破了1亿,成为史上用户增长最快的应用。但同为 OpenAI 发布的AI作画产品:DALL-E,却一直相对默默无闻,被其开源对手 Stable Diffution 压着打。再后来 MidJourney 凭借出色的艺术效果异军突起,更是让 DALL-E 黯然失色。

也就是说,OpenAI 当前的主要优势还是在语言大模型。但其实这块根据地也已经隐隐有一道裂缝:由Meta推出的开源羊驼大模型,得益于开源模式的众人拾柴火焰高,已经在性能上接近 ChatGPT,并在成本上大幅领先。这让这位如日中天的AI新皇怎能不着急呢?

这里先简单介绍下羊驼大模型的背景

2023年2月24日,Meta(原Facebook)公司发布了语言大模型 LLaMA ,因 llama 在英文中被译作羊驼,故而被业界戏称为「羊驼」。羊驼仅在发布一周后,就被「非故意开源」了,这里的内情根据扎克伯格最新的电话会议可以看出一二,他说「如果行业在 Meta 使用的基础工具上做到标准化,那么 Meta 就能从其他开发者的改进中获益,这样会更好」。这显然是基本的开源理念了。

羊驼发布后,美国的各大顶级学术界、产业界第一时间进行了跟进研究,一时间百花争艳,基于羊驼的家族产品纷至沓来:斯坦福的 Alpaca、伯克利 Vicuna、Koala、ChatLLaMA、FreedomGPT等等。

以伯克利的 Vicuna 为例,在5月份的最新评测中,Vicuna对于许多任务来说,已经是「ChatGPT-3.5的可行替代品」。

而根据伯克利的计算机教授 Ion Stoica 的说法,「现在的免费AI模型,在性能上已经相当接近谷歌和 OpenAI 的专有模型了,毫无疑问,大多数开发者最终都会选择免费模型。」

这里的一个关键是,Vicuna的训练成本能做到几百元美金,而如果选择非开源的商业大模型,训练一次动辄几十万的token费用。

这就是开源的威力!汇集全世界的开发者的智慧与一家商业公司角力。在开源与非开源的竞争中,产品面向的市场越大,开源带来的空间和想象力就越大。典型的如传统的IT领域,开源的 Linux 操作系统,基本垄断了全球的服务器和云计算市场。

因此,在与开源的竞合生态中,做好卡位,已经成为 OpenAI 不得不抓紧布好的一枚棋子。

推演大模型的竞争终局

借着这个事,也推演下未来大模型的竞争终局。以下是三个主要论断:

1. 未来的大模型应用,C端可能属于大厂,但是B端必有开源的半壁江山。

可以预见的是,在未来几年,大模型一定会在C(Customer)端的生活中,以及在B(Business)端产业的各个场景下逐步落地。得益于大厂对消费者需求的深度理解,和海量的用户数据沉淀,其C端产品的用户体验能做到显著优于相对粗矿的开源产品。

但是在B端,每个企业都不希望自己的商业机密、数据被喂给其他商业公司。当然,这通过将大模型私有化部署,可以解决部分数据安全的问题。但是私有化部署,并不能解决供应商锁定的问题:

(1)当你用了这家的方案,后续再想换供应商往往难度巨大,成本高昂;

(2)容易失去谈判的议价权。

并且越大、越成熟的企业越有这方面的担忧。基于产业经验,开源产品会成为很多企业的选择。

2. 大模型的核心竞争点并不在于技术,而在于数据与生态。

技术是门槛,但往往靠堆人就能解决,对大厂之间的竞争来说,并不能成为壁垒。但训练大模型的数据,就要各凭本事了。而数据是大模型训练效果的关键要素。因此,对于通用大模型类的产品,基本主导权在拥有海量数据的大厂和政府。

生态无需多言,目前各个大模型紧锣密鼓的打造各类插件,就是抢占生态位的动作。逻辑和 iphone 的 app store 是一致的。

3. 未来真正的大模型巨头,可能并不在你的视线当中。

从目前看,全球范围内,会逐步走出几个通用大模型巨头,他们将占领生态位;

会有至少数百家垂直领域的大模型公司,立足于解决特定行业和场景的需求,赋能产业;

会有数以几十万计的应用类公司和开发者,丰满大模型的插件、应用和生态。

但是,这轮通用人工智能的浪潮,才刚刚开启。就像我们在门户网站时代,完全预见不到Web 2.0的人声鼎沸,在PC互联网时代完全预见不到移动互联网的满目繁华一样。

真正的巨头,还在至美希望的彼岸!

版权声明:本站所有文章皆是来自互联网,如内容侵权可以联系我们( 微信:bisheco )删除!
友情链接
币圈社群欧易官网