AI和ML:数据中心的新前沿创新和优化

AI和ML:数据中心的新前沿创新和优化

随着对数据处理和存储的需求持续激增,数据中心正在努力应对不断发展和扩展的挑战。平台、设备设计、拓扑结构、功率密度要求和冷却需求的不断变化都强调了对新结构设计的迫切需求。

数据中心基础设施通常难以将当前和预计的IT负载与其关键基础设施保持一致,从而导致不匹配,威胁到它们满足不断升级的需求的能力。在此背景下,必须修改传统的数据中心方法。

数据中心现在正在将人工智能(AI)和机器学习(ML)技术集成到其基础架构中,以保持竞争力。通过在传统数据中心架构中实施人工智能驱动层,企业可以创建自主数据中心,无需人工干预即可优化和执行通用数据工程任务。

使用AI推动传统架构

近年来,数据中心内AI和ML技术的激增引人注目。人工智能正在推动各种用例的效率和性能。

Nisum执行副总裁Sajid Mohamedy表示,人工智能驱动的数据中心可以通过优化应用性能和可用性帮助组织获得竞争优势,这反过来又有助于提高客户满意度和忠诚度。将AI添加到组合中有助于优化资源分配,从而提高数据中心效率并降低成本。”

快速故障检测和预测、根本原因分析、电力使用优化和资源容量分配优化,只是部署数据和算法驱动技术,以最大限度提高数据中心效率的几个例子。

随着中断变得越来越频繁和昂贵,将人工智能整合到数据中心对于每个数据驱动型企业来说变得越来越必要。人工智能驱动的数据中心提供了一系列好处,其中最主要的是有可能减少停机时间,并提高整体系统可靠性,最终为组织节省大量成本。

提高故障检测和预测能力

KPMG U.S.人工智能负责人Ellen Campana表示,人工智能历来被用于增强数据存储优化、能源利用和可访问性。然而,近年来,在将AI的效用扩展到故障检测和预测方面出现了明显的趋势,这可以触发自我修复机制。

“简化自动检测的关键是为AI提供一个了解硬件和软件操作细节的窗口,包括网络流量。如果某个节点内的流量变慢,AI可以检测到该模式并触发进程或整个节点的重启。”

IBM Automation首席技术官Pratik Gupta认为,AI具有跨越数据中心和混合云环境的变革潜力。通过增强应用中的用户体验、简化操作并使CIO和业务决策者能够从一系列数据中收集洞察力,人工智能促进了创新和优化。

清楚地了解应用资源级别

Gupta表示,IBM预计到2030年数据中心的能源消耗将增加12%(或更多),这是由于摩尔定律的到期以及数据量、速度和能源密集型工作负载的爆炸式增长。

“简单地说,人工智能可以减少购买、维护、管理和监控的硬件数量。”

Gupta表示,数据中心管理人员必须清楚地了解其组织的应用资源水平,以便灵活地扩展以满足实时需求。人工智能驱动的自动化可以在此过程中发挥关键作用,降低资源拥塞和延迟的风险,同时确保硬件工作负载保持安全并维持性能标准。

例如,IBM的Turbonomic可以自动优化应用资源级别并根据业务需求进行扩展。

Gupta表示:“这使IT管理人员能够拥有一个单一的仪表板来监督资源水平、实时做出决策并提高效率,因为这确保其应用不会被过度配置。”

最大限度地发挥AI驱动的数据中心的优势

数据中心的AI和ML用例持续增长,但组织在实施之前必须考虑一些关键因素。虽然预打包的AI和ML解决方案越来越多,但仍然需要超越单个点解决方案的集成。DIY AI部署是可能的,但需要对传感器进行投资以收集数据和专业知识,以将数据转化为可用的见解。

Campana表示:“许多组织选择实施自己的数据中心,正是因为其可以确保数据不会与其他人的数据汇集在一起,或以其无法控制的方式使用。虽然这是事实,但组织必须承担维护安全和隐私的责任。”

有了合适的资源,数据中心可以变得更智能、更高效,但实现这一目标需要优化规划。

Gupta表示:“规划应该是实施人工智能驱动的数据中心的关键支柱。成功的部署不会在一夜之间发生,在推出之前需要大量的迭代和思考。IT领导者需要考虑一些因素,例如了解可以和应该保留哪些硬件,以及需要将哪些工作负载迁移到云端。”

灵活性至关重要

人工智能驱动的数据中心成功的关键是采取战略方法。这意味着确定AI和ML的正确用例,投资必要的基础设施和工具,并培养熟练的员工团队,以有效地管理和维护系统。

Gupta表示,企业经常维护庞大的基础设施,从分布式数据中心位置到各种云部署。IT领导者需要考虑是否需要为所有数据源构建一个聚合湖……或者将数据准备、ML和AI工具带到每个位置。随着企业转变其IT基础设施,不仅必须考虑交付的价值,还要考虑产生的漏洞。”

其补充道:”最好的计划也可能会出错。技术推广也是如此,能够快速调整路线的灵活组织将更加成功。“

提高IT和数据中心性能的四种新兴战略

AIOps、MLOps、DevOps和SecOps各有其独特的优势。当结合后,可以优化数据中心运营和更广泛的IT性能,降低成本并实现服务改进。

AIOps自动化和扩展企业范围内的数据中心和IT工作流程

AIOps正在成为企业在数据中心的可持续发展和碳减排工作的核心,并已被证明可以有效地识别出现性能差距的原因。该技术的核心是其能够根据实时性能数据(因果分析)解释和建议行动。

例如,Walmart正在使用AIOps来简化电子商务运营。AIOps依靠ML模型和自然语言处理(NLP)的组合来发现可以提高数据中心运营的准确性、成本效益和效率的新流程工作流。零售商还使用AIOps实时检测和解决低效和不连贯的流程,同时实现技术堆栈自动化和更广泛的基础设施管理。

AIOps可在电子商务平台内实现更准确的实时异常检测。该技术还擅长关联来自数据中心所有可用来源的数据,以提供360度的运营视图,并确定可以改进可用性、成本控制和性能的地方。

零售商依靠DevOps来加速应用开发

零售商依靠DevOps来保持竞争力,并缩短新应用和功能的上市时间。DevOps基于强调软件开发人员和IT运营团队之间协作和沟通的软件开发方法。其在简化新移动应用、网站功能和基于客户体验的增强的软件交付和开发方面被证明是有效的。

Amazon、Target、Nordstrom、Walmart和其他领先的零售商都采用DevOps作为主要软件开发流程。零售CIO表示,DevOps代码库的质量越高,数据中心运行的效率就越高,为全球客户提供最新的应用版本。

MLOps提供了一种基于生命周期的方法

随着零售商招募更多的数据科学家,MLOps变得与DevOps一样重要,可以保持模型的最新性和可用性。MLOps将DevOps原则应用于ML模型和算法。领先的零售商使用MLOps来设计、测试和发布新模型,以改进客户细分、需求预测和库存管理。

从库存管理和优化开始,MLOps被证明可以有效解决零售业中成本最高、最具挑战性的问题。供应链的不确定性、长期的劳动力短缺和不断攀升的通货膨胀成本,使库存管理成为零售商成败的关键。

Macy、Walmart和其他企业正在使用MLOps来优化定价和库存管理,帮助零售商做出降低成本的决策,并保护自己免受持有过多库存的下行风险。

SecOps依靠AI和ML来保护每个身份和威胁面

SecOps确保数据中心和更广泛的IT基础设施保持安全和投诉。零信任安全假设任何用户或设备都不可信任,并且每个身份都必须经过验证,这是任何成功实施SecOps的基础。目标是减少日益复杂的网络攻击的攻击面和风险。

SecOps通过结合最成熟的技术来减少入侵和破坏,从而优化数据中心的安全性。采用零信任安全措施有助于零售商保护其客户、员工和供应商的身份,而微细分可以限制任何攻击的爆炸半径。

人工智能和数据中心技术的未来

边缘计算正在成为开发人工智能驱动的数据中心最有前途的技术之一。通过处理更靠近源头的数据,边缘计算减少了延迟,并提高了整体性能。当与人工智能结合时,该技术提供了实现实时分析和决策能力的潜力,使数据中心能够处理未来的关键任务程序。

Campana表示:“向5G的转变是这一转型的重要一步,并且正在推动基于人工智能的软件基础设施的创新浪潮。对于开始新数据中心的企业来说,值得考虑其采用5G和对终端用户硬件进行其他更新的时间表。”

而Gupta以为,数据智能自动化是继续进入严格监管行业的一种方式,因为人工智能和数据中心工具将被设计成自动满足合规要求。

“随着人工智能和自动化进一步嵌入数据中心,它们将能够满足最严格的合规协议。”

© 版权声明

相关文章