撰稿 | 王瑞平
51CTO读者成长计划社群招募,咨询小助手(微信号:CTOjishuzhan)
北京时间5月11日凌晨1点,2023年谷歌I/O大会拉开帷幕,在经历了近半年的“峰回路转”的对话式AI竞赛的时间点,谷歌带着王牌干货,来证明自己的AI霸主地位。
自2016年Google Assistant发布以来,以AI First为核心战略的Google每年都会在I/O大会上拿出一点AI领域的创新研究成果。此次I/O大会,当然也不例外。
皮查伊公布了一系列重大AI创新成果,还宣布了搜索功能和Bard的“生成体验”。在硬件方面,谷歌展示出Pixel7a手机和平板的全新功能。
2023即将过半,这就让我们看看,谷歌全村的希望都有哪些?
1、全新升级大模型PaLM2亮相,支持语种超GPT4
在众目期待之下,谷歌不负众望,PaLM2大语言模型闪亮登场。
该语言模型能够进行广泛的编码和数学测试、进行创意写作测试和分析。不仅如此,开发人员还可以用它训练聊天机器人等工具。
PaLM2作为谷歌去年4月发布的PaLM语言模型的升级版,旨在挑战聊天机器人ChatGPT开发公司OpenAI的GPT-4。
据悉,PaLM2模型分为四种规格,从小到大依次为Gecko、Otter、Bison和Unicorn。其中,Gecko可应用于移动设备。
不仅如此,PaLM2还使用了多种编程语言,能够应用于20多种产品。
皮查伊表示,PaLM2在逻辑和推理方面进行了广泛的训练,具有极强的逻辑和推理能力并且接受了多语言文本训练,支持超过100种语言。
“PaLM2在以往最先进的语言模型基础上进行一系列优化,使用谷歌定制的AI芯片,比初版PaLM运行效率更高,能够使用Fortran等20多种编程语言以及100多种口头语言。”谷歌AI研究实验室DeepMind副总裁Zoubin Ghahramani在会议期间表示。
Ghahramani还介绍了PaLM2模型的应用:20多种谷歌的产品使用了PaLM2,不仅如此,轻量级的PaLM2版本还能够在移动设备上运行。
但是,针对该模型使用的参数数量Ghahramani没有做过多的阐述。
2、Bard能否逆风翻盘?
在微软新版Bing的步步紧逼下,我们有可能也会看到整合Bard的新版Google搜索。在此基础上,Bard自身是否会有更多能力和体验方面的升级也非常值得关注。
升级版的AI聊天机器人Bard改由PaLM 2驱动,可以提供更高明的回复。会议期间宣布,从本周三起,约180个国家地区的用户都可以开放申请使用Bard,可以应用于回复40种语言。
在编程方面,Bard的能力也有所改善,能接入多种编程工具,学习了C++、Go、Python等20多种编程语言以及和谷歌表格(Google Sheets)的函数。
谷歌副总裁 Sissie Hsiao表示,Bard拥有一种让双眼观看更舒适的深色主题,还称用户可以将Bard回复导出到Gmail、谷歌文档、谷歌的Colab交互式编码工具和第三方协作编程App。
未来,Bard将适时同音乐流媒体Spotify、零售巨头沃尔玛、房产平台Redfin、送餐服务Uber Eats、旅游网站Tripadvisor和招聘网站ZipRecruiter融合。
在接下来的几个月里,Bard将在回复中包含图片。谷歌也将通过Google Lens工具,让Bard更容易回应用户的图片提示。比如,用户可以用智能手机指着满抽屉的艺术品和手工艺品工具和配件,问Bard它们可以用来做什么。
Krawczyk说,未来,Bard能将谷歌地图、文档、表格和 Gmail的信息带入对话中,还将能在Adobe等第三方工具的帮助下回复用户。提到Adobe的生成式 AI服务Firefly,Krawczyk介绍说,它还可以根据文字描述创建图像。
3、戳到痛点,Workspace办公套件嵌入AI
据皮查伊介绍,谷歌正在将生成式AI整合到搜索引擎和其它产品中,例如,可以生成草稿信息的Gmail和对图像进行重大修改的Google Photos。
新的搜索服务被命名为“搜索生成体验”(SGE),它会在搜索结果的顶部显示人工智能生成的响应,旨在回答用户的查询,同时总结关键信息并链接到网站资源。
今年3月,谷歌就宣布为其Workspace办公套件增加了一系列AI功能,以追赶微软的 Microsoft Copilot 服务。在周三的I/O大会上,谷歌将其命名为Duet AI,该公司称其为“AI驱动的合作者”。
谷歌还公布了一项名为“Sidekick”的新功能,可在不同的谷歌应用程序中阅读、总结和回答文档上的问题。
Duet AI涵盖了谷歌生产力应用程序的一系列生成式AI工具。Duet AI还可帮组谷歌的云计算客户完成一系列任务。
Duet AI将允许云计算用户和应用程序开发人员使用AI驱动的提示来编写代码,并在他们的谷歌工作空间应用程序中构建自定义功能。
据悉,在谷歌的云控制平台工作时,用户可以输入有关可用服务的问题,并当场获得答案,因此不再需要在网上其他地方寻找信息。
谷歌云CEO表示,客户可以根据成本和自身业务规模来选择人工智能的模型,并宣布为企业客户推出新的人工智能模型。
4、硬件新品:传说中的Pixel Fold
在硬件环节,谷歌公布的首款产品为Pixel 7a手机,售价499美元起。新的Pixel智能手机集成了人工智能功能。
此外,谷歌还推出了新款的11英寸Pixel平板电脑,配置G2芯片。周三起,新版平板电脑Pixel接受预订,同样配置Tensor G2芯片,有128GB和256GB两种内存的版本可选。
谷歌还推出了自家首款折叠屏手机Google Pixel Fold,为当前市面上最薄的折叠屏手机。
性能方面,Pixel Fold采用自家的Google Tensor G2 SoC,并搭载12GB RAM,对设备在各种情况下的流畅运行还是可以抱有足够的信心。
续航方面,知情人士透露Pixel Fold的电池容量接近5000mAh,这是目前市面上折叠屏设备里电池容量最大的了。
而代价则是其重量或将超过三星的 Galaxy Z Fold4(263克),用重量换来更大的电池容量是否值得,就见仁见智了。
价格上,Pixel Fold 的价格为1799美元(约合人民币12500元),而此前另一则报道则称其价格为1400美元(约合人民币9746元),对比目前市面上主流的几款折叠屏设备,价格只能说中规中矩。
5、写在最后
自AlphaGo震撼问世以来,谷歌这所AI黄埔军校的“海之征途”从未停歇,而此次皮查伊似乎找到了生成式AI爆发时代的征途的灯塔方向:“通过生成式AI,我们正在采取大胆和负责任的方式迈出下一步,谷歌正在重新构想所有的核心产品,包括搜索。”
重新构想核心产品,是AGI的魅力所在,也是谷歌在微软领跑这条赛道下做出的明智策略。而此次I/O大会,我们看到了谷歌不管是在大模型的研究还是在对话应用方面,都有着自己无可撼动的强大优势。
咬定AI不放松,这场没有硝烟的“对话搜索大战”,也许只是进行了上半场,下半场还在路上。