2023年10月17日,身着白衬衫和小白鞋,百度创始人、董事长兼首席执行官李彦宏在台上宣布了一个新时代的到来。
这场以「生成未来」命名的发布会上,李彦宏正式发布公司的大语言模型文心大模型的最新4.0版本,同时手把手教人们,如何用提示词,让升级的文心大模型应用,帮助人们用北京公积金在河北买房、制作广告和视频以及创造网文小说。
在会上,李彦宏自信地表示文心大模型4.0版本的能力,「和GPT-4比毫不逊色」。
同时,半年前宣布「所有应用都值得用大模型重构一遍」的说法,也在当天的会上有了结果。从主营业务搜索,到百度文库、网盘、地图等百度全家桶应用,都已经接入文心大模型,展现出更好的交互和逻辑能力。
在B端,李彦宏也曝光了GBI(生成式商业分析)工具,以及大模型能力加持的办公助理「如流」。
如果说生成式人工智能激活了整个科技圈,那么百度可能是那个受益最大的巨头。
文心4.0
直接对标GPT-4
发布会一开场,李彦宏首先宣布发布了文心大模型4.0版本。
百度对于大模型的能力,划分了四个界定标准:理解、生成、逻辑和记忆。此次的文心大模型4.0升级,基础架构仍然与3.0和3.5版本相同,但宣称在逻辑和记忆的方面提升较大。
按照百度CTO王海峰的介绍,文心大模型4.0理解和生成能力的提升幅度相近,而逻辑的提升幅度是理解的3倍,记忆的提升幅度是理解的2倍。
四个不同的能力,能够提升不同应用场景的效率。对这几大能力,李彦宏都进行了现场展示。
理解是对话式人工智能帮助用户的基础,在*务、营销、客服等等领域十分重要。
在理解能力上,现场用了一个语序颠倒,模糊表述的prompt(提示词)来测试模型的能力:「我想回承德买房,能用公积金贷款吗?手续怎么办?我在北京工作。」
要理解这句话,AI必须理解到「在北京工作」和「回承德买房」,其实具有「在北京缴纳公积金,而户口在承德。」这种极具中国特色的潜台词,才能做出准确的,用户需要的回答。而果然,文心一言迅速地理解了问题的关键,做出了正确的回答。
而生成能力,主要可以提升品牌营销、文案策划和创意类工作的效率。
在现场,李彦宏展示了根据一张图片,用自然语言提示,就能进行背景转换,主体模糊处理,根据官网信息生成海报和文案等多种处理。
而除了这些传统的图片处理之外,此次百度还展示了视频的生成能力。通过自然语言的prompt,在现场演示中,文心一言用几乎没有延时的速度,生成了一条数字人的口播视频广告。视频中融入了产品图,增加了许多过渡背景,还有一位身着西装的数字人不时出现,介绍从官网搜集来的产品特点。
原本多个AIGC产品合作才能做出的效果,在这个展示中,无缝地实现了融合。一条广告片,5个广告文案,还有一张海报,全过程生成只用了不到3分钟。
逻辑推理,通常表现为数学逻辑的测试。此次的展示,百度着重表现了它在教育方面的潜能。
李彦宏给出了一道涉及到锥形体积转换成长方体体积的应用题,文心一言不但给出了解答,同时能够按步骤解题,并分析出每个步骤中涉及到知识点。
对于记忆能力的展示,百度的选择比较特别。
百度选择让文心一言撰写一个武侠小说的大纲设定。在撰写完成后,在原本的提纲上,让大模型增加人物关系,增加戏剧冲突,来展现大模型在增加了复杂信息之后,还能够记得原本的提纲设定和人物能力,没有漫无边际地发挥想象力。
百度也分享了文心大模型能力进步的技术支持。
百度之前就曾宣布,文心大模型是国内首次使用万卡集群训练的大模型,不少人猜测此次文心大模型4.0的参数规模预计突破万亿级别。不过,在此次发布会上,百度并没有强调大模型的参数级别。
除了万卡训练之外,百度CTO还提到了百度的算法训练稳定性的周均值已经超过了98%,在输入和输出方面,都进行了知识点增强的技术。
「重构」百度全家桶
虽然进行了分别展示,实际上更多时候,大模型的四项基础能力是复合应用的。
5月,百度就曾宣布利用大模型重构百度旗下的应用。而此次发布会上,百度也展示了百度应用文心大模型重构的最新成果。
其中,最惊艳的是对于搜索的重构。
2月,微软就已经基于GPT的技术推出了New Bing,对其搜索进行重构。而在最新的出庭证词中,微软的纳德拉表示自从将人工智能功能添加到Bing以来,微软在搜索市场的份额几乎没有变化。
微软的New Bing主要是推出了一个对话机器人的体系,可以与New Bing聊天提问来获得带链接的整合信息。谷歌的Bard也与此相似。
但百度此次推出的搜索重构则更加深入整个搜索体系。百度将其形容为「极致满足、推荐激发、多轮交互」。
极致满足体现在搜索框里输入问题,搜索可以不再是给出链接,而是直接生成一个最好的答案。
在演示中,李彦宏提出了一个过去20年各国工业增加值排名是多少的问题。
不同于New Bing和Bard可能会给出一个带链接的数据答案,新的百度能够直接给出一个动态的表图,以条形图的形式,显示不同国家工业增长值。这个图甚至是动态的,会随时间进行增长和排名变化。
推荐激发功能有点相当于目前搜索引擎的相关问题,可以提示用户继续根据提示了解一些相关问题,如「工业增加值和GDP有什么关系?」「工业对国民经济发展有什么影响?」。
而多轮交互也十分有趣。
目前的大语言模型创业浪潮中,其中有一个许多创业者都在努力的方向,就是利用大语言模型搭配推荐引擎,进行多轮对话,来向用户提供一个最佳选择。
9月,百度举办的文心杯的创业大赛项目,其中的一等奖获得者Buysmart.AI是这个方向的佼佼者。用户用自然语言和点选,不断清晰自己的需求,而Buysmart.AI利用推荐引擎最终为用户推荐最需要的产品。
而重构后的百度搜索,直接在搜索中增加了类似方向的功能。
在演示中,百度的搜索提示词是询问「北京周边登山去哪好?」而搜索引擎在给出了百花山、海坨山等等多个答案后,允许用户进一步点选补充选择自己的情况。比如如果选择徒步新手加亲子,搜索引擎就会改为改为推荐西山和百望山这样的地点,它们相对好爬,对亲子活动也比较友好。
除了搜索的重构之外,百度还展示了对于百度网盘、百度地图、百度文库等应用的重构。
百度网盘的云一朵个人云助理,在之前就已经推出。作为世界上第一个个人云助理,目前用户已经达到2000万。可以用自然语言与助理沟通,一句话操作找到个人云中的某段视频,对于视频内容进行理解,找到视频中的某项内容,总结出视频的金句等等。
百度地图,按照百度的宣传,是全球首个AI原生地图产品。通过与地图的助手对话,可以一步直达多级菜单的几千个服务。也可以推荐地理位置合适的餐厅,对比餐厅的环境进行选择,最后直接约车。
百度文库依托十亿过去的文稿资源,可以直接在用户对特定题材搜索资料后,勾选需要的文章类型,严肃学术文献或是普通大众材料,进行一键文章生成。
重构后的百度文库还添加了PPT生成的功能,能够理解观点之间是并列关系还是递进关系,进行PPT风格风格一键切换,百度宣称「远超市场上其他PPT生成工具。」
发力B端
在此次的演示中,百度还展示了一些全新的B端应用。
其中,此次百度重点推出的是一个商业智能产品。百度GBI,Generative Business intelligence。
这是一个百度推出的全新产品,是国内首个生成式商业智能产品,具有支持自然语言交互、跨数据库分析和专业知识学习三方面能力,将商业分析师十几天才能完成的数据分析工作缩短到分钟级。
在广告片中,面对「成本本预估是多少?不亏钱的价格底线是多少?客户要求我们3个月内完成交付,能做到吗?最快多久?如果竞对,比如我们的报价低,有什么办法?」这一系列相关的财务分析、项目交互、用户分析的问题,百度GBI可以直接通过自然语言对话,给出答案,并生成图文并茂的回答。
不需要专业人士进行操作,跨数据库和表格接入数据也不需要额外的操作。除此之外,企业还可以对其训练,让其学习专业知识,成为行业专家。
另一个B端产品是如流。使用生成式AI进行重构后,如流可以一键生成会议纪要,总结上千条工作群的内容。结合企业的CRM系统,为管理者提出项目背景和项目谈参。根据个人行程,规划工作计划,发出会议邀约等等。
除了赋能办公方面,百度还展示了大模型对于自动驾驶、智能座舱和*智慧监控项目的赋能。
发布半年多以来,文心快速迭代,重构百度应用,同时在逐步建立文心生态。
百度也在发布会上介绍了近期上线的灵境平台。无论是个人或者企业的数据或者是应用,都能够在灵境平台上快速变成一个插件,利用api接入文心大模型的能力中。
百度介绍,目前灵境平台上线一个月的时间,已经有2.7万个开发者的申请入驻,覆盖了20多个领域,包括法律咨询、简历生成,脑图制作、口语练习等等各种各样的场景的原生应用。企业私有数据在没有泄露风险的情况下,也能够方便快捷地接入最先进的这个大模型的能力。
「中国有丰富的应用场景,中国用户又天然愿意拥抱新技术,有了先进的基础大模型,我们就能构建起一个繁荣的AI生态,共同创造新一轮经济增长。」李彦宏表示。