GPT-4掀起新一轮AI风暴,被围堵的文心一言能否一战?
将文心一言发布时间定在3月16日的百度,没能预料到会遭到来自OpenAI、谷歌、微软的轮番轰炸:先是3月15日凌晨,OpenAI发布大型多模态Transformer模型GPT-4;紧接着,宣布开放大规模语言模型PaLM的API接口,并推出面向开发者的工具MakerSuite;文心一言发布之后,巨头们也并没有歇着,3月16日晚间,微软更是发布由AI驱动的办公神器Microsoft 365 Copilot,号称让Word、PPT、Excel、OutLook、协同办公软件的生产力都飙增。
文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个,我自己测试感觉还是有很多不完美的地方。”实践出真知,李彦宏也表现出自己的希冀:“一旦有了真实的人类反馈,文心一言的进步速度会非常快,希望它快点成长。”
GPT-4为何会掀起新一轮AI风暴?
2023开年元宇宙余温尚在,ChatGPT径直成为AI领域的热点之一,在经历短时间发酵之后,OpenAI最终放出大招,发布多模态大模型GPT-4,并迅速引爆全球舆论。事实上,GPT-4前代产品正是ChatGPT大模型——GPT3.5。GPT-4不仅对GPT3.5全方位升级,提升了自然语言文本处理能力,还开放了对图片的处理能力,引发了全球对生成式AI以及未来工作方式的畅想。
而GPT-4则生成了基本符合要求的回答。这也说明,GPT-4不仅能够识别复杂的指令,还能根据复杂的指令执行复杂的操作。据悉,GPT-4能够读取、分析或产生的文字篇幅高达25000词,远超篇幅上限为3000词的ChatGPT,可用于长篇内容创作、扩展对话以及文档搜索和分析等应用场景。
不仅能识别照片中的各项事物,还能够理解事物之间的关系。此外,GPT-4响应被禁止内容请求的可能性降低了82%,产生事实响应的可能性提升了40%。由此可见,支持多模态的GPT-4无论在自然语言处理,还是在安全性方面,都有了一定的改进。
谷歌、微软竞赛拓展生成式AI使用场景
表示新版搜索引擎必应已经在GPT-4上运行,而且正在进行商业变现。目前,微软希望利用外界对新必应以及OpenAI的关注去推动商业变现。据悉,微软正在全球各地举办路演活动,并与广告主和广告公司举行非公开会议,展示其测试中的ChatGPT版必应搜索的广告形式。微软在生成式AI商业模式的探索上,可以说走在了前列。
其目标是庞大的内容创作市场。至少谷歌、微软是这么想的。在OpenAI发布GPT-4之后,谷歌也宣布了自家产品在AI方面的一系列更新,Gmail、Google Doc、Sheets、Slides等所有Workspace办公组件将上线生成式AI功能。同时,谷歌还开放了自家的大语言模型PaLM的API。
Copilot也可以实现自动生成内容,提高办公效率。在发布会上,微软表示,Copilot背后有复杂的处理和编排引擎,将有来自Microsoft Graph、GPT-4等模型的支持。
Copoilt最重大的意义在于大幅提高了生产效率,减少了日常不必要的工作时间浪费。
文心一言是不是被苛求了?
由此可见,百度对文心一言的重视程度。发布会现场,李彦宏展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。然而,在对文心一言评价时,李彦宏表示:“内测中‘文心一言’并不完美,但市场有需求必须要推出来。”
文心一言大模型的训练数据包括万亿级网页数据、数亿级的搜索数据和图片数据、百亿级的语言日均调用数据,以及5500亿事实的知识图谱。换言之,单纯从检索角度来看,只要数据库覆盖得足够广,文心一言地回答绝对不是问题。比如,问文心一言这道数学题——在一道减法算式中,被减数加减数再加差的和是674,又知减数比差的3倍多17,求减数。文心一言准确回答了答案,并列出了相应的算式。
创作的文案文笔流畅,句式多以排比表达,然而缺乏一定的情感流露。在文章写作上可以辅助创作,参考范式。
深层次的语义理解也为文心一言制造了难度,比如,在回答“我爸妈结婚的时候为什么没有邀请我”的问题时,文心一言并没有充分理解其中的逻辑,以至于用最直接的方式回答——很抱歉听到这个消息,也许你的父母有自己的原因没邀请你……事实上,ChatGPT也没能理解其中的关系。
箭在弦上的文心一言
从这一点来讲,文心一言的发布,不仅是国内生成式AI的期盼,同时也是合作伙伴的要求。百度也期望,经过试用之后,一旦有了真实的人类反馈,文心一言的进步速度会非常快,希望它快点成长。目前,文心一言还在内测阶段。
百度是全球为数不多、在这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。其中,文心一言位于模型层,目前,ERNIE 3.0每天接收数十亿次用户的搜索请求。
面对OpenAI的强势迭代让人们对生成式AI的期望值拉高,百度还是决定背水一战,官宣文心一言。正如就像李彦宏所说的:“这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。”
在面对竞争激烈的生成式AI市场,笔者还是对国内同类产品充满期待。