新一轮AI大爆发前夜: ChatGPT 横空出世,核心硬件战一触即发
发布于2023-03-06
忽如一夜春风来,ChatGPT几乎瞬间成为妇孺皆知的街头热词——在过去几个月里,这个技术宅们痴迷的领域一跃成为风暴眼的主角,掀起一股AI(人工智能)热潮,并刺激了微软、谷歌、亚马逊、百度等一众科技巨头的神经,纷纷宣布深入这场AI战局。
探索AIGC(AI-Generated Content,人工智能生成内容)应用场景成为全球科技大厂争夺的新赛道。最新的科技巨头动作是,上个月底脸书(Facebook)母公司Meta也官宣加入这场AI大战。当地时间2 月 25 日Meta推出了“Meta 人工智能大型语言模型”(Large Language Model Meta AI),简称“LLaMA”。扎克伯格在社交媒体上称其是“目前水平最高的” 大型语言模型,目标是帮助研究人员推进他们在人工智能(AI)领域的工作。
去年11月30日人工智能初创公司OpenAI发布的新型人工智能聊天机器人ChatGPT,甫一出世即迅速蹿红,成为生成式人工智能(Generative AI)领域的现象级产品。OpenAI公司的估值也由此水涨船高,一度达到290亿美元。今年1月底,微软刚刚宣布将对OpenAI进行为期数年、价值数以十亿计美元的投资。
所谓生成式AI,研究机构Gartner这样解释,指通过各种机器学习(ML)方法从数据中学习要素,进而生成全新的、完全原创的、真实的工件(一个产品或物品或任务),这些工件与训练数据保持相似,而不是复制。
ChatGPT可以通过从数百万个网站收集信息,以对话式、人性化的方式生成独特的答案,为用户提供写论文、写代码、设计商业策划、担任治疗师等一系列服务。其出色的聊天能力以及惊人的准确率迅速在全球获得大量用户青睐,并有望开辟出AI产业化的新路径以大型自然语言模型敲开通用人工智能的大门。
生成式AI崛起:从小模型到大模型
“ChatGPT很了不起,人工智能迎来最好的时代。”中国工程院院士王坚在近期的一场论坛上这样表达。他指出自然语言处理经历了几个非常重要的关键点:早期的自然语言处理基本上都是用逻辑,之后利用统计的方法来做是一大突破。再到后来,当互联网上的数据可以用来作为训练数据的时候,又是一个巨大的变化。
微软CEO纳德拉说,“这辈子第一次见这么大的技术浪潮,AIGC堪比工业革命!微软将全线接入ChatGPT。” 而一向持“AI危险论”的马斯克(Elon Musk)更是再一次表示,“ChatGPT确实很惊人,我们离强大到危险的人工智能不远了。”
事实上,聊天机器人不是一个新产品。在ChatGPT之前,市面上早已经有了诸如微软小冰、苹果的Siri、小米的小爱同学、阿里的天猫精灵等各色产品。比如,小冰同样也能与人类在社交平台上进行多语言对话,还能唱歌、写诗和作画。但小冰自2014年诞生以来,并未获得ChatGPT式的爆发。
而同样是问答类为主的聊天机器人,与天猫精灵、小爱同学等其他AI产品的一问一答模式有所不同的是,ChatGPT具备训练集中的所有知识,具有语言生成能力,可以实现拟人化交流。一个最直观的感受是,ChatGPT更有“人味儿“。
比如,当你问它A和B谁更胜一筹时,ChatGPT给出回复模式更偏向于“各具优势”之类的表达。而当你连续和它聊天超过一小时,它有可能给出“说话过密,请等一会儿再找它这般颇具“人性化”的反馈。
它似乎在不断地学习以“人类情绪进行交互”,这是人工智能的一大跨越。而这一跨越源自于支撑它的重要技术底座——“大型语言模型(Large Language Models)”,简称LLMs,中文习惯称为“大模型”。
这不是一个简单的突破。算法是大模型成功的首要条件,其次是要“喂”给算法海量的数据(数据量级跃升,才能带来更多能力的涌现),更重要的是要搭配强大的“发动机”——大算力。这三者是获得基础的大模型缺一不可的条件。
随着模型越来越大,人工智能开始可以输出达到人类水平的结果,然后是超人的结果。统计显示,从2015年到2020年,用于训练这些模型的计算量增加了6个数量级,其结果在书写、语音、图像识别、阅读和语言理解方面超过了人类的表现水平。其中OpenAI的GPT-3表现尤其突出。
华泰证券研究所计算机首席分析师谢春生对媒体指出,ChatGPT成功的背后,是独特算法模型的加持,验证了单一大模型的实战意义,同时也是AI大模型路线一次里程碑式的胜利。
这代表了新一代AI技术的方向——从“效率工具”到“生产工具”,从简单复制到全新原创。这是生成式AI带来的重要突破,即不仅可以做判断,还可以创造。这意味着AI的用途将有结构性变化。Gartner预计到2025年,生成式人工智能将占所有生成数据的10%,而目前这一比例还不到1%。
红杉资本两位合伙人Sonya Huang和Pat Grady在一篇题为《生成式AI:一个创造性的新世界(Generative AI: A Creative New World)》中指出,生成式AI正在变得不仅更快、更便宜,而且在某些情况下比人类创造的更好。从社交媒体到游戏,从广告到建筑,从编程到平面设计,从产品设计到法律,从市场营销到销售,每一个原来需要人类创作的行业都等待着被机器重新创造。某些功能可能完全被生成式AI取代,而其他功能则更有可能在人与机器之间紧密迭代的创作周期中蓬勃发展。
而人们期待的梦想是——“生成式AI将创造和知识工作的边际成本降至零,产生巨大的劳动生产率和经济价值,以及相应的市值。”红杉资本估算,这涉及到数十亿的人工劳动力,生成式AI可以使这些人工的效率和创造力至少提高10%,它们不仅变得更快和更高效,而且比以前更有能力。因此,生成式AI有潜力产生数万亿美元的经济价值。
图1:资料来源:TrendForce
而为什么是现在爆发?原因是:更好的模型,更多的数据,更大的算力。
根据红衫资本的梳理,回顾到目前为止生成式AI的发展历程,大致已看到4波浪潮。
图2:红杉资本
第一波浪潮是:小模型(small models)占主导地位(2015年前)
小模型在理解语言方面被认为是“最先进的”。这些小模型擅长于分析任务,可以用于从交货时间预测到欺诈分类等工作。但是,对于通用生成任务,它们的表达能力不够。生成人类级别的写作或代码仍然是一个白日梦。
第二波浪潮:规模竞赛(2015年-至今)
Google Research的一篇里程碑式的论文(Attention is All You Need https://arxiv.org/abs/1706.03762)描述了一种用于自然语言理解的新的神经网络架构,称为transformer,它可以生成高质量的语言模型,同时具有更强的并行性,需要的训练时间更少。这些模型是简单的学习者,可以相对容易地针对特定领域进行定制。
第三波浪潮:更好、更快和更便宜(2022+)
算力变得更便宜,新技术,如扩散模型(diffusion models),降低了训练和运行所需的成本。研究人员继续开发更好的算法和更大的模型。对于那些渴望接触LLMs(Large Language Model 大语言模型)的开发人员来说,探索和应用开发的闸门现在已经打开,应用开始大量涌现。
第四波浪潮:杀手级应用出现中(现在)
正如移动设备通过GPS、摄像头和网络连接等新功能释放了新类型的应用程序一样,红杉资本预计这些大型模型将激发生成式AI应用程序的新浪潮。
这就好比十年前,移动互联网的拐点被一些杀手级应用打开了市场一样,生成式AI的杀手级应用程序也会出现。
ChatGPT的出现或许就是这个拐点?但无论如何,比赛开始了。
硬件战是关键一役:AI芯片市场前景可期
ChatGPT代表了新一代AI技术方向,AI扮演的角色正在改变,由此带来的应用场景将不断延展拓宽。
从技术原理角度,ChatGPT是基于GPT3.5架构开发的对话AI模型,历经 GPT-1/2/3迭代,在GPT3.5模型后,开始引入代码训练和指令微调,加入RLHF技术(人类反馈强化学习),从而实现能力进化。其中GPT作为知名的NLP模型,基于Transformer技术,随着模型不断迭代,层数也越来越多,对算力的需求也就越来越大。
而从运行条件角度来看,“训练数据+模型算法+算力”是让ChatGPT完美运行的 三个条件。其中训练数据相对技术壁垒较低,投入足够的人力物力及财力后即可获得;基础模型及模型调优对算力的需求较低,但获得ChatGPT功能需要在基础模型上进行大规模预训练,存储知识的能力来源于1750亿参数,需要大量算力。
因而综合来看,算力是ChatGPT运行的关键所在。也就是说,巨大的算力支撑是大模型应用不可或缺的基础设施。浙商证券在近期的一份研报中就指出,GPU或CPU+FPGA等算力支撑是ChatGPT的“背后英雄”。
TrendForce集邦咨询的最新报告中,以ChatGPT背后的GPT模型为例,其训练参数从2018年约1.2亿个到2020年已暴增至近1,800亿个,TrendForce集邦咨询估GPU需求量预估约2万颗,未来迈向商用将上看3万颗(注:该计算基础以NVIDIA A100为主)。
图3:信达证券研报
未来大模型趋势下,面对指数级增长的算力和数据传输需求,AI芯片市场成长可期。从现阶段AI芯片市场整体发展来看,目前英伟达主导的GPU凭借高算力成为主流选择,其他AI芯片如ASIC、DPU、FPGA也蕴含潜力。
产业格局雏形初现:国内外科技公司抢滩生成式AI
全球范围内生成式AI概念的不断升温,主要源于其广阔应用前景及巨大市场规模。据中信建投测算,按2021年包括游戏、短视频、直播、剧集、电影、综艺、在线音乐、图片版权、网络文学等数字内容领域1万亿元的规模来计算,AIGC的市场空间可达1000亿元。此外,AIGC还将应用到建筑、医药等其他领域。
看到了生成式AI这个万亿级赛道的未来潜力,国内外各大科技公司早已进行入局抢滩。近期,微软、谷歌、亚马逊等国际科技公司在探索AIGC应用场景大动作频频。
1月24日,微软在其官方博客宣布,已与OpenAI扩大合作伙伴关系,微软将向OpenAI进行一项为期多年、价值数十亿美元的投资,以加速其在人工智能领域的技术突破。而早在2019年、2021年,微软便已两度注资OpenAI。2月初,微软即推出了新版必应搜索引擎和 Edge 浏览器,集成了 OpenAI 开发的 ChatGPT 技术。
紧接着,Alphabet旗下的谷歌则在其2月初的人工智能发布会上表示,生成式AI模型(Generative Model)将很快与搜索结果集成。而谷歌也已经发布了自己的聊天机器人服务 Bard。谷歌称,随着其继续将生成性人工智能技术引入产品, “搜索的唯一限制将是大家的想象力。”
数据分析机构PitchBook的融资报告显示,2022年,生成式AI公司在美国的融资额约9.2亿美元,同比增长35%。进入2023年,除去微软向OpenAI投的数十亿美元,多家生成式AI公司已经筹集或正在谈判的金额累计超过7亿美元。
但对比国内外科技行业在这波浪潮中的投入,国内AI大模型领域的投入依然鲜少。目前只有百度等几个大公司零星宣布将在未来推出自己的大模型。
2月7日,百度表示,此前流传的类ChatGPT聊天机器人项目名字确定为“文心一言”,英文名ERNIE Bot,3月完成内测,面向公众开放。目前,“文心一言”在做上线前的冲刺。此外,包括快手、字节跳动、网易、商汤、美图等科技公司都在AIGC领域有所投入。
云启资本对此分析指出,在 ChatGPT 爆火前,做大模型这件事是一个投入巨大、赛道偏门,商业化前景却非常不明朗的“笨生意”。别说普通创业者,就连掌握众多资源的互联网巨头,也鲜有涉猎或者投入有限。这也是当前国内大模型一片空白的直接原因。
此外,尽管随着ChatGPT的爆火 激发了生成式AI的巨大市场潜力,但仍需要注意的是,当前该领域在商业模式和技术方面仍有许多问题需要解决。比如版权、信任、安全和成本等重要问题还亟待解决。
结语
未来会发生什么?
尽管对于当前的网红ChatGPT及其带来的AI产业化前景的讨论已经风声水起。但我们必须清晰地认识,当下生成式AI人处于非常早期的阶段——平台层刚刚有所起色,应用领域才稍有起步。
红衫资本这样描述到现阶段为止生成式AI的发展:“有点类似于iPhone刚出现时的移动应用场景——有些噱头但比较单薄,竞争差异化和商业模式不明确。然而,其中一些应用程序提供了一个有趣的视角,让我们可以一窥未来可能会发生什么。”
就像十年前的那部科幻电影《Her》所展示的对人工智能的想象场景那样,它可以帮我们写出一封封感人的书信,和人类自然地交流对话,甚至具备丰富的情感…… 而电影中设定的时间是2025年。
现在看来,这些科幻的场景正在变成现实,生成式AI将深深融入我们的工作、创作和娱乐方式已经几乎变成近在眼前的未来。
TrendForce集邦咨询预期各行业的语音客服、游戏、零售、语音助理等领域会是生成式AI发展初期主要的应用领域。但是后续产品服务是否能持续推进,并兼具创新与实用,是这一轮AI浪潮保持成长动能的关键。
同时,法令规范、训练素材等挑战是下阶段AI产业面临的重要挑战。前者包括其必须保护个人信息、内容正确性,以及合法合规等;后者则仰赖相关知识平台服务商是否能筛选与整合多元内容,并交由生成式AI开发商进行训练。