边缘与云：选择哪种人工智能基础设施？

如今，边缘计算一直是热门话题。被誉为近年来最令人兴奋的技术转变，关于其变革力量的讨论很多！

随着越来越强大的 AI/ML 算法重新定义“智能”以及更便宜、更强大的“边缘”设备的可用性，这种炒作在很大程度上是真实的。但是，如果要考虑边缘计算的历史，它会比最近的兴趣让我们相信的更早。

边缘与云：选择哪种人工智能基础设施？

事实上，计算和智能最初始于边缘，当时大多数应用程序几乎不存在高带宽网络连接。即使在 1990 年代后期，远程部署在工厂或现场的关键测量设备通常也具有处理传入传感器数据的专用计算能力。然而，这些设备中的算法在“智能”方面只是初级的：主要是信号处理或数据转换。

随着网络能力的提高和连接性的提高，基于云的计算在 2000 年代后期开始受到关注。与此同时，强大的人工智能算法作为一种从大量结构化和非结构化数据中解锁有意义信息的手段而备受关注。在短短十年内，云 AI 已成为 AI 应用程序的首选。

但是，向云的转变也带来了几个问题：数据上传和下载成本、网络可靠性和数据安全等等。与此同时，随着价格实惠但功能强大的边缘设备的兴起，边缘计算在处理能力和成本或占地面积之间的权衡正在减少。似乎我们现在又回到了考虑“边缘计算”作为构建智能应用程序的可行且有吸引力的选择。

随着关于边缘人工智能和云人工智能哪个更好的辩论越来越激烈，任何熟悉这两个框架的人都可能会回答“这要看情况了！”。原因是边缘和云基础设施不是竞争的，而是互补的框架。

在过去的几年里，两者都经历了巨大的发展和完善，特别是作为人工智能开发和部署的基础。与任何技术选择一样，选择实际上可归结为具体的应用:目标、价值驱动因素、经济性以及对功耗、尺寸和连接性的任何限制。因此，在尝试建立正确的基础设施之前，必须了解云和边缘人工智能的利弊。

当寻求灵活性、可扩展性和易于部署时，基于云的人工智能是一个有吸引力的选择。如今，大多数云服务提供商为人工智能模型的培训和部署提供了强大的框架，并提供了按需付费的包，几乎没有前期承诺或投资。云提供了几乎没有限制的计算和存储选项，使其特别适合大型人工智能模型。

但对于需要连续评估传感器或图像数据的实时应用程序来说，这可能会成为一个笨拙的选择，因为它们必须来回传输数据，从而导致巨大的成本。这种数据传输也使得云在很大程度上不适合需要闭环控制或即时行动的低延迟应用程序。

另一方面，边缘人工智能是自动报警或闭环控制的实时数据分析的合理选择。虽然边缘基础设施确实需要在边缘硬件上进行前期投资，但运营成本与云相比要低得多。

今天，有各种各样的边缘人工智能硬件选项可用，包括npu(神经处理单元)、TPU(张量处理单元)以及带有专用人工智能加速器的SOC(片上系统)和SoMs(模块上系统)。人工智能的低成本和低功耗硬件是一个活跃的研究领域，并有可能提供更好的选择。另一方面，基于人工智能的消费应用必须处理相当多样化的边缘设备(手机、平板电脑、个人电脑等)，这使得边缘部署成为一个潜在的令人生畏的前景。

因此，边缘基础设施可能不利于快速原型开发，也不容易扩展。虽然联合学习，AI模型的分布式训练的概念允许在边缘进行训练和部署，但云仍然是训练需要足够计算能力的大型模型的逻辑选择。

但解决方案不一定是非此即彼的选择。随着应用程序过渡到更多基于微服务的架构，它们可以分解为具有自己特定部署框架的更小的功能或微服务。因此，不必在云和边缘之间进行选择，重点可以放在针对特定应用程序优化使用两者。

例如，一个应用程序可能从云上的快速原型开始。随着它的发展，需要低延迟和实时决策的功能可以转移到边缘，而那些需要规模和灵活性的功能可以保留在云中。模型训练或再训练可以在云端集中管理，而边缘的一些联邦学习可以在本地提高准确性。同样，敏感数据可以在边缘处理，更通用的数据可以转移到云端。

组织、开发人员和从业者最好不要将云和边缘视为不同的替代方案，而是将其视为从边缘到云的连续统一体，中间有许多不同的基础设施选项。这包括不同类型的边缘——运营边缘、网络边缘、移动端点等，以及网络上不同类型的分布式处理——私有云、公共云、小云、雾计算等。

虽然复杂性可能是一个挑战，但找到正确的技术组合开始为组织提供一个独特的机会，以最大限度地提高人工智能的价值，同时最大限度地降低成本和风险。