马斯克威胁要起诉微软将Twitter数据训练人工智能系统

马斯克发推文说，“微软公司非法使用推特的数据训练人工智能系统。”

马斯克日前表示要对微软公司提起诉讼，这一威胁是在Mashable和其他媒体报道微软公司将从其广告平台上删除推特之后发出的，该平台使广告买家能够在一个地方管理他们所有的社交媒体账户。

马斯克也是特斯拉公司和SpaceX公司的CEO，他经常在推特上发布从未实现的计划，似乎也没有人对他提起诉讼。推特的新闻专线没有对置评请求做出有意义的回应，微软公司的代表也拒绝对此置评。

马斯克发出威胁是最新的一个迹象，表明数据所有权正迅速成为生成式人工智能热潮中一个令人担忧的战场。大型科技公司正在努力开发像OpenAI公司推出的GPT这样的尖端人工智能模型，数据所有者正在寻求阻止它们或对其内容的使用收费。

微软公司开发了自己的大型语言模型，并出售OpenAI公司的人工智能模型的使用权。微软公司去年向OpenAI公司投资了100亿美元，这是一笔不同寻常的结构化交易。马斯克在2018年退出OpenAI公司董事会之前是该公司的联合创始人，最近他抱怨OpenAI公司从非营利模式研究组织转变为受微软公司影响的高价值业务部门。

像GPT这样的大型语言模型需要TB级规模的训练数据，其中大部分是从Reddit、StackOverflow和Twitter等网站上抓取的。来自社交网络的训练数据很有价值，因为它捕捉到了非正式的对话。

随着这些新的人工智能模型从研究实验室和大学进入企业界，数据的所有者开始提出要求。

例如，Reddit公司在本周早些时候表示，将向访问其编程界面的企业收费，该界面用于将Reddit用户之间的对话输入人工智能训练软件。环球音乐集团日前也表示，采用该公司艺人的音乐对人工智能系统进行这种训练将既违反协议，也违反版权法，例如称使用人工智能模仿说唱歌手Drake的歌曲视频。

图片库GettyImages正在起诉Stable Diffusion，指控该公司复制其内容来训练其人工智能图像生成器。

马斯克在去年12月表示，推特将暂停允许OpenAI公司对其数据库的访问。此外他还宣布，其成立的TruthGPT公司将构建自己的大型语言模型。