年初,李彦宏在一封内部信中预言:“AI技术已经发展到一个临界点,各行各业都不可避免地被改变,中国AI市场即将迎来爆发性的需求增长。” 而几个小时前,百度正式启动产品测评的“文心一言” 全新一代知识增强大语言模型,不仅印证了李彦宏的预言成真,业界也发现百度正在一个个实现曾经吹过的“牛”。 特别是当我国人工智能产业在经历了十几年波峰波谷交替之后,正在生成式AI技术的东风迎来新的春天,文心一言的面世,无疑成为了中国科技企业进入AIGC赛道“掘金”的入场券。 对标ChatGPT?人有我也有,人有我更优 去年,AI行业再度迎来新的节点,人工智能生成内容AIGC以超出人们预期的速度,正在成为科技革命历史上的重大事件。 不论是“AI画师”DALL-E2,还是“万能陪聊”的对话机器人ChatGPT,都在生成式内容的广度和深度上延展,并且走在了规模化爆发的前夜。 在中国,百度可能是最接近ChatGPT、DALL-E2的缔造者OpenAI的对标之一。 因为OpenAI优势在大型语言模型,微软智能云则提供了AI基础设施,百度文心一言则是两者的集合,进而文心一言能做到人有我也有。 在百度文心一言的新闻发布会上我们看到,中国自己的生成式AI在基础的文学创作、商业范本写作、逻辑推理等基础层面,已经表现得十分成熟。 例如新闻发布会现场,文心一言不仅能对一些有标准答案的客观问题对答如流,还可以将知名科幻小说《三体》的核心内容进行总结,并提出五个续写《三体》的建议角度。
在大家之前津津乐道的商业文案撰写方面,AI创意生成方面,文心一言也有着自己独到的见解:
显然文心一言在测试过程中,并且没有一些生成式AI在回答事实性问题时常常“胡编乱造”的,或者用“我不知道”等回答来“摆烂”。说明TA在对话问答、总结分析、内容创作生成的综合能力可以对标一个真实的人类。 另外,文心一言也能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题目时,文心一言不仅能理解题意,并有正确的解题思路;还能看出来人类在“骗TA”,进而让人类给出正确的题目,最后像学生做题一样,按正确的步骤,一步步算出正确答案。
而在我国这个世界上最难的“中文语言处理”土壤中,文心一言则做到了“人有我优”。 在新闻发布会现场展示中,文心一言可以正确解释成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,关键是它还能用“洛阳纸贵”四个字创作了一首古风藏头诗。
既能准确理解人类意图、又能清晰地表达,这是基于庞大数据规模而发生的“智能涌现”。据了解,目前文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于独一无二的位置。 在此基础上,文心一言还表现出更优秀的中文理解及多模态生成能力,李彦宏现场展示了文心一言生成图片、音频和视频的能力,并且可以经受住关于多模态生成素材的“灵魂疑问”。
负责主抓文心一言开发的百度CTO王海峰,在详解 “文心一言”背后技术特性时表示,文心一言是在百度的ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。 文心一言的使命:生成式AI进入千行百业 在文心一言的新闻发布会上,李彦宏又预言道,相信人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。 目前业界的共识是,在进入人工智能时代后,IT技术的技术栈发生了根本性变化。过去基本分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层,而在模型层上,类似文心一言的大语言模型,无论哪家公司都不可能靠突击几个月就做出的。
在AI业界,大模型的训练堪称“暴力美学”,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。百度布局的优势则是可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。尤其是在框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。 对于百度来说,文心一言的基础百度的文心大模型ERNIE 1.0在2019年时就已经投入研发,在不同行业内都具备解决方案,现在文心一言确实已经具备了深入千行百业的潜力,所以有业内人士预言,未来在大模型的基础设施公司,文心一言将根本性地改变云计算行业的游戏规则。 例如许多新型云计算公司,其主流商业模式将从IaaS变为MaaS(模型即服务)。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。 而在全球范围内,在四层架构的每一层都有领先产品的公司几乎没有,这是百度非常独特的优势。后续,芯片、框架、大模型和终端应用场景可以形成高效的反馈闭环,帮助大模型不断调优迭代,从而升级用户体验。
而在需要垂直化、场景化、个性化的模型和应用工具的行业中,基于百度智能云多年来深入千行百业的经验,文心一言的行业Know-how基础就会让别人难以望其项背。例如在复杂的ToB业务和客户服务之间,文心一言可以作为一个翻译官,应用于办公软件、OA、ERP等企业日常管理经营必备系统,以及医疗、教育、金融、客服等行业所需的专业化场景。 在面向用户或者中小企业、C端用户,也可以有文字、图片、音视频等内容生成服务;或者助力一批企业成为应用服务提供商。届时可能基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,涌现出很多创业明星公司。 不久前英伟达CEO黄仁勋将生成式AI爆发的时代比喻为"iPhone"时刻,因为当年谁也没想到,iPhone诞生之后的十余年,围绕着移动生态,移动互联网前所未有的繁荣。 类比当年iPhone先改造再创造的思路,文心一言也可以从现有的工具和服务入手,创造人工智能通用时代的“一言”时刻。因为百度对文心一言的定位是一个通用平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,实现效率提升,创造商业价值。据蓝鲸财经了解,在正式启动产品测评之前,主动接入文心一言的600余家企业,大多都是想通过文心一言去创建更好的客户体验和管理流程,在企业人效和能效的提升上抢跑。 文心一言虽不完美,但有“飞轮机制”不可小觑 其实李彦宏在新闻发布会中也坦诚,从他自己在内测过程中体验到的文心一言的能力来说,(当前)确实不能叫作完美。 所以关于文心一言启动产品测评的时机,市场上还有个小争议——为什么文心一言要和ChatGPT火爆的日子撞车? 许多业内人士表示,百度选择这个时间节点启动测评,是考量了市场需求——百度的各个产品线都在等待这样的技术,客户也在等待,因而需要尽早推出。 但是文心一言的不完美也是暂时的,面世后,文心一言将建立起真实用户反馈。人类反馈、奖励模型和策略优化之间的飞轮机制,会随着真实用户的反馈越来越多,文心一言的效果会越来越好,能力越来越强。 另外,王海峰也表示,随着模型层的文心一言与框架层的百度飞桨平台的进一步融合发展,人工智能技术和应用的研发将越来越标准化、自动化和模块化,加速人工智能的工业大生产,同时也反哺文心一言加速迭代进化,落地更多场景和行业。 纵观生成式AI的发展历史,我们发现文心一言的面世并不是一蹴而就的,而是百度进行“马拉松式研发”的成果。 财报显示,近十年累计研发投入超过 1000 亿元,2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。如此高的研发投入,在国内的互联网大厂中凤毛麟角。 其中,语言模型的训练并不是普通公司所能承受的,资料显示跑通一次100亿以上参数量的模型,算力至少需要1000张GPU,按照一张GPU五万元的市场均价计算,1000张GPU意味着单月至少5000万的成本。业界测算,gpt-3单次训练成本至少460万元。所以国内也只有百度等为数不多的几家公司有这个财力和人力去进行研发。 在互联网界一直有这样一个段子:“2017年,美国公司花了很多钱在做阿尔法狗,中国公司在送外卖。2023年,美国公司花了很多钱在做ChatGPT,中国公司还在送外卖。” 可见技术抛弃人的时候,其实是打了招呼的。所以中国公司更应该去为赚更高精尖的钱而投入,文心一言就是这样一个产物。它代表着百度的技术人员们愿意追逐技术改变世界的梦想,这也是李彦宏愿意为了文心一言再拼一把的原因。 写在最后 有人说2023年是“阳和启蛰”的时刻,也是转换经济动能的关键之年。中国企业,需要更多像文心一言一样的破壁者,才能在人工智能深入实体产业后,摩擦出最原生的中国式突破。 目前,文心一言身上有着百度多年投入的积累,也有中国最大的AI生态纵深,故而也能真正助力企业实现高效的上云运转,让千行百业重塑“筋骨”,搭载着新的生产力工具满配出发。 向作者提问 |