微软:GPT-4下周发布,剑指多模态,可支持视频

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

GPT-4真的要来了!发布时间已确定:

就在下周。而且还是多模态,可支持视频。

听到这个消息,网友们直接炸了锅:大家都准备好了吗?

毕竟在一部分人眼中,ChatGPT都已经如此惊艳,那GPT-4不得是这样的?

微软:GPT-4下周发布,剑指多模态,可支持视频

(不过100万亿参数是谣言)

但也有网友质疑其消息的真实性:不可能的。

微软:GPT-4下周发布,剑指多模态,可支持视频

微软:GPT-4下周发布,剑指多模态,可支持视频

质疑确实也不无道理。OpenAI的进展竟是微软来宣布发布时间。

而且也还不是官方,而是在一个地方论坛上,由微软德国CTO随口说出。

微软:GPT-4下周发布,剑指多模态,可支持视频

△图源:微软

有网友表示:员工可能说错了。等待微软和OpenAI的官方。

微软:GPT-4下周发布,剑指多模态,可支持视频

这究竟是怎么一回事?

微软:GPT-4下周发布

据德国媒体Heise消息,当地时间3月9日一场人工智能相关活动上,四名微软德国员工在现场介绍了包括GPT系列在内的大语言模型(LLM)

微软德国CTO Andreas Braun谈到了LLM的颠覆性影响,是“游戏规则的改变者”——

因为他们教会机器理解自然语言,然后从统计学角度理解以往只有人类才能读懂的东西。

目前这一技术,已经发展到基本上“适用于所有的语言”。

于是就谈到了GPT-4的进展:

我们将在下周推出GPT-4,会是多模态模型。这将提供完全不同的可能性,比如视频。

多模态的出现,微软(-OpenAI)会让大模型更加全面。

值得一提的是,前几日微软刚发布了多模态大语言模型Kosmos-1。它可以感知一般模态、遵循指令并执行上下文学习。

微软:GPT-4下周发布,剑指多模态,可支持视频

Kosmos-1可以自然地处理感知密集型任务和自然语言任务,比如视觉对话、视觉解释、图像字幕、简单数学方程式、OCR等。

因此有媒体认为,这样一来GPT-4指向多模态似乎也并不稀奇。

除此之外,在这场论坛上,还有微软德国的CEO Marianne Janik,全面谈到了人工智能对企业创造性的“破坏”——目前人工智能开发和ChatGPT是“iPhone时刻”。

她谈到,这并不意味着要更换工作,而是以一种跟以往不同的方式来完成重复性工作。新的职业也正在出现,建议企业组建内部“能力中心”,培训员工使用人工智能。

网友:等不及了

虽然此番GPT-4发布时间有待确定,但网友们确实也坐不住了!

比我预想的还快。

微软:GPT-4下周发布,剑指多模态,可支持视频

然后已经有人开始想想GPT-4会是什么样的了。

微软:GPT-4下周发布,剑指多模态,可支持视频

事实上自ChatGPT上线以来,GPT-4早已经是千呼万唤了。

据当时披露,原本GPT-4在OpenAI内部几乎准备就绪,只待发布;结果高层突然宣布新任务:两周后发布免费聊天机器人应用,代号“Chat with GPT3.5”,也就是今天见到的ChatGPT。

随后又有爆料称,GPT-4被曝接入微软必应搜索;GPT-4将有100万亿个参数。(也就是前文那个图,不过很快被Open AI的CEO奥特曼否认了)

现在至少是个微软员工站出来说话,看来GPT-4已经呼之欲出了。

巧的是,谷歌前两天也发了个5620亿超大模型PaLM-E。甚至连机器人都能用,在学术圈引发了不小的热议。

微软:GPT-4下周发布,剑指多模态,可支持视频

怎的,微软谷歌这两家巨头的第二波之争,这就开始了?

以及如果GPT-4真就在下周发表,百度文心一言也在下周发布,刚好撞车…

微软:GPT-4下周发布,剑指多模态,可支持视频

© 版权声明

相关文章