3月15日,OpenAI发布了GPT-4,并迅速成为热点,引发大量关注。GPT-4核心提升可总结为两点:一点是基本智能水平提升。举例说,GPT3.0在全球多项考试中排名在倒数10%,而如今GPT-4在这些考试中能够战胜90%的人类,这种进步源自于数据训练和参数的积累。另一点是多模态模型,ChatGPT过去只能文本交流,现在用户可以发张图片给ChatGPT,而ChatGPT将以文字回应。另外,GPT-4的参数量是GPT3.0的10倍,参数达到百万亿级别,这为GPT-4的用户体验优化提供了保障。
识图能力应用前景广阔
之前上市的ChatGPT实质上等同于GPT3.5,未来,GPT-4的功能将以plus订阅的方式开展。新版本激发了用户热情,付款订阅渠道一度被挤爆。但实际上OpenAI在技术上仍有保留,外界不禁感慨:OpenAI到底领先对手几个身位?
之所以说OpenAI保守,主要是两个原因:
其一是ChatGPT在去年底推出的时候本身是旧版本,很多人发现ChatGPT无法回答2021年以后的问题,原因是ChatGPT2021年就发布了GPT3.0,而ChatGPT只是在GPT3.0的基础上略作优化的GPT3.5版本,而2021年以后新数据都去训练GPT-4,当然就无法覆盖这部分新知识。而GPT-4其实在2022年年中就基本完成,足见ChatGPT的发布是一个保守做法。
其二是GPT-4也是有保留的。原因是OpenAI有另一个热点AI产品,也就是DELL-E2。DELL-E2的功能是你输入一段文字,它生成一张图片。而GPT-4的功能是,你输入一张图片,它生成一段文字答案。如果两项AI功能结合,GPT将同时获得图片理解能力和图片表达能力。可以说NLP自然语言处理只是OpenAI在人工智能领域的一块业务,未来整合旗下的多个AI,功能内容还将进一步丰富。
当前GPT-4的识图能力应用前景也非常广阔。比方说医学影像资料本身是图片,未来普通人可以通过ChatGPT来实现医学影像自检,自己发现疾病。当然,这只是其中一项可能性。在很多行业领域,看懂图片是需要专业能力的,而GPT-4降低了这种识图门槛,比如医学影像、设计图纸、数学模型等,让普通人能够通过AI辅助介入到专业领域当中,所以GPT-4未来很可能成长为生产力工具。
国内企业要“结硬寨”
中国大模型生成式AI企业怎么办?
首先,国内生成式AI企业要走积累的路子。生成式AI需要持续大规模算力投入,微软为GPT提供超过3万张A100芯片的算力支持,一张A100价格要20多万元人民币,而算力训练每次都要消耗大量能源。GPT-4百万亿的参数也需要投入大量人力财力来完成积累。而在数据方面投入的价值也很高,GPT从一 开始就重视“小数据”,也就是高质量数据,而高质量数据是GPT领先于其他生成式AI的核心竞争力。与之相对应的,数据质量提升是需要钱的。综上可以看出,算力、数据、算法调参这三个方面,OpenAI前期烧钱的规模是海量的,而GPT-4也是一步步技术积累的最终结果。所谓台上一分钟,台下十年功,一点也不夸张。
其次,国内生成式AI企业要在基础科学上做积累。大模型算法的道理并不复杂,复杂的是算法细节,自从微软收购OpenAI后,OpenAI的算法不可能开源,所以“等、靠、要”的做法已经行不通,国内AI企业要在算法技术上投入研发,构建中国AI企业自身的算法能力,然而算法的精益也要依靠基础科学的进步,比如基础数学研究。所以要积极在学术上加强投入,而不应该仅仅聚焦在应用科学层面。
再者,国内生成式AI企业不要盲目地推出对标产品。前车之鉴就是谷歌,在OpenAI推出产品后,谷歌匆忙应战,结果发布会的若干个小瑕疵导致谷歌股价暴跌。国内生成式AI企业要清楚认识到,这一次ChatGPT的成功和过去其他概念有所不同,其成功基础在于用户的认可,用户是会拿着ChatGPT和其他竞品比较的,这就让后来者实际上更难做,要求也更高。如果生成式AI方面没有达到ChatGPT的效果,则往往会暴露自己能力上的短板。反过来说,国内生成式AI企业也可以另辟蹊径,GPT-4并不是万能的,在其短板领域完全可有一番作为。
综上,国内AI企业还是要重视积累,包括参数积累、数据训练积累以及算力积累。科技的道路,弯道超车的机会有,但不多,诸如新能源车我国就实现了弯道超车,但大多数科技领域开展的是阵地战,要尝试“结硬寨,打呆仗”的做法,夯实中国生成式AI发展的基础,推出成熟度较高的产品。