2022年已经过去,又到了一年一度展望未来发展的特别时期。依照惯例Ai时代前沿组织收集一波关于未来科技和趋势的文章,以飨读者。
近几年来,人工智能一直在高速增长,似乎任何东西都难以阻止。随着势头的增强,2023年人工智能将朝哪个方向发展?专家们有话说。
许多人工智能项目构思不周,导致最终失败。Pecan AI联合创始人兼首席执行官Zohar Bronfman表示,2023年,在评估人工智能的功效时,企业将更加警惕。
“2023年,企业领导人将比过去更加严格地评估潜在的数据科学项目。这些项目往往无法产生真正的影响,因为它们与业务需求不一致,或者因为它们从未投入生产。随着数据科学所涉及的费用和时间承诺,领导者将更加仔细地审查拟议的工作,并寻求正确的计划。” Bronfman说:“我们将继续努力,以确保在短期内根据模型的输出能够促进业务改进行动,或者在资源浪费之前停止。”
2023年,对数据科学家的需求将继续增加。Domino数据实验室的首席执行官兼联合创始人Nick Elprin预测,对GPU进行深度学习模型训练的需求也将如此。
“人工智能的最大改进来源是在训练系统中部署深度学习,尤其是Transformer模型,旨在模拟人类大脑神经元动作的任务。这些突破需要巨大的计算能力来分析大量结构化和非结构化数据集。与CPU不同,图形处理单元(GPU)可以支持深度学习工作负载所需的并行处理。这意味着在2023年,随着更多基于深度学习技术的应用程序涌现,从翻译菜单到治疗疾病,对GPU的需求将继续飙升”。
支持这一观点的是英伟达DGX系统副总裁Charlie Boyle,他希望明年能销售更多的GPU。
“2023年,无法支持并行处理的低效、基于x86的传统计算架构将被加速计算解决方案所取代,这些解决方案将提供构建语言模型、推荐引擎等所需的计算性能、规模和效率。在经济逆风中,企业将寻求能够实现目标的AI解决方案,同时简化IT合作流程和提高效率。使用软件在基础设施中集成工作流的新平台将实现计算性能突破,降低总体拥有成本,减少碳足迹,加快变革性人工智能项目的投资回报,取代更浪费、更陈旧的架构。”
你认为雇佣一名合格的数据科学家需要多久?有人开玩笑说就像发现一只独角兽一样困难。Kyndi创始人兼首席执行官Ryan Welsh认为2023年会是世界达到“数据科学家高峰”的一年。
“数据科学家和机器学习工程师的短缺一直是企业实现人工智能价值的瓶颈。结果发生了两件事:越来越多的人追求数据科学学位和认证,增加了数据科学家的数量;以及供应商提出了新的方法,以尽量减少数据科学家在人工智能生产中的参与。这两个趋势同时干扰导致“数据科学家峰值”。因为随着基础模型的出现,公司可以在这些模型的基础上构建自己的应用程序,而不是要求每个公司从头开始训练自己的模型。更少的定制模型训练需要更少的数据科学家,同时更多的人正在毕业。在2023年,预计市场会做出相应反应,导致数据科学过度饱和”。
数据科学工具提供商Dataiku的负责人工智能主管Triveni Gandhi预测,有望看到合乎道德的人工智能继续吸引企业的关注和资源。
“虽然我们在新闻中看到了一些公司削减道德人工智能岗位的新闻,但事实是,大多数公司将继续投资于其道德人工智能团队。这一资源对于人工智能的规模和运营至关重要,有助于公司确信其人工智能输出符合其价值观,并以稳健可靠的方式执行。此外,道德人工智能小组让用户相信他们正在与之互动的产品是经过考虑的,并满足安全和信任方面的期望。对于任何一家公司来说,要想保持领先地位,必须建立一个合乎道德的人工智能团队。”
深度学习的困境之一是预测模型的黑箱性质。图形数据库制造商Franz的首席执行官Jans Aasman表示,解决这一问题的一种方法是在2023年将人工智能与因果知识图配对。
“未来几年,因果人工智能将出现增长,首先是创建发现事件之间因果关系的知识图。医疗保健、制药、金融服务、制造业和供应链组织将把特定领域的知识图与因果图联系起来,并进行模拟,以超越依赖历史数据的基于相关性的机器学习。因果预测有可能通过使因果关系透明来提高人工智能的可解释性”。
图形数据库制造商Neo4j的产品营销高级主管Maya Natarajan也预见到图形和AI的结合会取得明显进展。
Natarajan表示:“企业将继续寻找最佳方式,以利用知识图来实现负责任的人工智能。通过利用知识图提供的上下文,组织可以提高道德决策的准确性,通过保持数据流的来源来提高可解释性,并通过开辟新的分析方法来帮助减轻偏见。”
明年人工智能将发现矢量数据库更具魅力。Pinecone创始人兼首席执行官Edo Liberty就是这么认为的,Pinecone是矢量数据库市场的早期领导者之一。
“随着人工智能的不断发展和越来越广泛的应用,将相应地需要更先进和可扩展的基础设施来支持其开发和部署。人工智能基础设施投资的一个关键领域将是专门的数据基础设施,如矢量数据库,其设计用于存储和处理现代ML模型生成的大量数据。Liberty表示:“这将加速人工智能系统的开发和部署,这些系统在许多领域将超过上一年的应用。”
近年来,公司不断增加对人工智能的使用,取得了喜忧参半的成绩。但SAS咨询业务解决方案经理Kimberly Nevala预测,2023年,人工智能将进入“少就是多”的增长阶段。
“随着组织意识到“少即是多”,人工智能将激增,并悄悄地将重点从大规模创新作为目标变为应用于更广泛的小决策点和行动,其集体影响大于各部分的总和。矛盾的是,作为组织和重要员工需要对这些技术有广泛的认识,并能自如地使用。”
所以你已经在GPU上投入了大量资金来训练你的神经网络。你怎么处理它呢?SQream产品副总裁Matan Libis表示,总有一些SQL查询需要额外的马力。
“为AI/ML重复使用计算资源的能力对企业来说是一个激动人心的宝贵机会。重复使用不仅减少了AI所留下的碳足迹,而且更便宜的全球数据存储解决方案的普遍增加也减少了对GPU硬件的依赖。此外当您不需要将数据从一个地方移动到另一个地方时,可以降低延迟。然而,一旦企业在一个地方准备数据,在另一个地方进行训练,并将推理转移到再一个地方,希望通过简化流程,我们将看到AI/ML能力的准确性和速度都有巨大的提高。”
深度学习公司Deci的首席执行官兼联合创始人Yonatan Geifman表示,云计算的高成本正在给每个人带来压力,但人工智能用户可以通过优化模型来对抗成本攀升。
“一直在云环境中运行人工智能模型的企业正在看到高性能云处理可能会给他们带来的财务损失。2023年,可能会看到更多公司寻求降低人工智能推理云成本。实现这一点的最有效方法之一是在保持其准确性的同时提高人工智能模型速度,减少在云上的处理时间,并有效地节省了资金。”
Evinced首席科学家Yossi Synett预测,2023年,我们将看到无需标记数据的自我监督机器学习技术取得更多突破。
“阻碍人工智能发展的一个因素是缺乏高质量的标签数据。虽然我们今天已经看到了进展,但2023年仍将继续增长。我们正在寻找越来越多的方法,使用自我监督学习对模型进行预训练,然后根据特定任务对模型进行微调。这方面最好、最有效的例子是NLP(自然语言处理),其中称为掩蔽语言建模(使模型预测句子中隐藏的单词)和因果语言建模(让模型预测句子中下一个单词)的技术彻底改变了游戏规则。由于自我监督学习不需要标记数据,而微调需要的标记数据要少得多,这使得训练复杂模型变得更加容易。可用于更好地选择标签示例,这进一步减少了AI项目的财务障碍。”
富国银行(Wells Fargo)首席执行官兼集团首席信息官Chintan Mehta表示,要做好准备,让人工智能在2023年达到更高的水平,采用新的用户交互模式,更好地理解意图。
“2023年及以后,人工智能的部署和信号感知将呈指数级加速。人工智能将战胜偏见感知、判断和法律解释。行业将为打破偏见构建更多解决方案,以便人工智能在解释其行动过程的同时为消费者提供解决方案。用户界面将发生转变。他们将超越基于应用的体验从非视觉的轻击/触摸交互到向上下文传递视觉的动作调用以及基于语言和手势的交互。为这些体验提供动力所需的人工智能将大幅增加,超越仅仅理解语言,真正掌握每一次交互的隐藏意图。人工智能将产生人工智能。”
德国IT公司GFT的美国首席执行官Marco Santos预测,2023年,我们将看到前所未有的人工智能和机器学习用例出现并最终成为主流。
“随着公司摆脱传统系统的限制,能够将来自不同系统的大量数据集汇集在一起,我们将看到人工智能和机器学习前所未有的使用案例。例如,在汽车制造业,刚刚开始看到下一代制造业数据平台的出现,或单一且统一的基于云的平台制造商正在聚合其整个组织中的所有数据。一旦有了数据,他们就可以开始构建人工智能应用程序。”