人工智能和机器学习向边缘发展,为MTDC和高密度布线方案带来机遇 | 光通信 | 康宁

在本文中,康宁光通信与达拉斯的Citadel Analytics展开了合作,而后者一直在多租户数据中心(MTDC)中部署AI平台。

在互联网上通常有这样的一句话:“知识告诉你说应该把鸡蛋放进篮子,智慧则是叫你不要把所有鸡蛋都放进一个篮子” 。机器学习(ML)会引导我们认识鸡蛋并放进篮子,但是人工智能(AI)建议我们不要将其放入一个篮子。

撇开笑话而言,从语言翻译到对复杂疾病的诊断,AI和ML的应用非常广泛,远远不止于视觉领域。 为了让您了解AI和ML需要多少计算能力,百度在2017年展示了一种中文语音识别模型,在整个训练周期内,不仅需要4TB的培训数据,而且还需要2000亿亿次的运算。

我们需要把握一个平衡点,那就是既要满足AI和ML需求,还需要以最低的成本提供最高的服务质量。那么如何提供最高的服务质量呢?通过减少数据在终端设备和处理器之间传输的物理距离,以改善延迟对传输的影响。我们可以把边缘数据中心建设在更靠近创建和使用数据的地方,这样可以优化传输成本和服务质量。其次是寻求最低的成本。传输成本会随着传输的数据量、距离或“跳数”的增加而增加。 而AI和ML大大增加了传输的数据量,从而导致更高的传输成本。边缘数据中心靠近数据创建的地方,因此日益成为重要的解决方案,而一大部分边缘计算都部署在MTDC中。MTDC可以提供最低的本地数据中心部署风险,而且可以最快实现收益。

什么是AI、ML、MTDC?

在讨论AI,ML,边缘数据中心和MTDC之前,有必要仔细研究一下它们的概念,以确保每个人都在同一个理解层面上。

人工智能是计算机系统理论的延伸发展,它能够执行通常需要人类执行的智能任务,例如视觉感知,语音识别,决策和语言之间的翻译。如果利用玩具套娃来描述这些关系,那么 AI是最大的那个套娃,机器学习位于其中,而深度学习则位于机器学习套娃中。机器学习是AI的一种应用,它使系统能够自动学习并从经验中进行改进,而无需进行编程。

边缘数据中心是通过从核心数据中心分散一些对延迟较敏感的应用程序,使数据中心的计算和处理能力更接近创建数据的地方。

多租户数据中心(MTDC)也称为托管数据中心,用户可以通过租用空间来托管其设施。 MTDC提供了空间和网络设备,以最小的成本将用户连接到服务提供商。 用户可以租用空间、服务器机架或完整的专用模块,来满足其各种需求。

AI有那么厉害?

AI和ML是自电力出现以来我们所见过的最具革命性的技术。 它比互联网和移动革命的总和还要强大。 AI技术之所以如此强大和如此具有影响力,是因为它们可以快速、有效地理解大量数据。 我们生活在一个数据不断生成并且由数据驱动的世界中(市场分析师预测,如今存在的数据中有80%以上是在最近两年内创建的),如果没有能够理解这些数据的工具,我们将会淹没在这些数据中。

举个简单的例子,今年全世界将创造大约40兆字节的信息。 那就是40万亿GB的信息。 人类无法理解所有这些信息,即使每个人昼夜不停地工作,从理论上讲也是不可能的。

那么我们如何理解所有这些数据呢? 答案是使用AI和ML。 这些技术偏爱数据,数据就像是它们的氧气。 通过使用功能强大且经过适当培训的AI / ML模型,我们可以准确地处理大量信息,从而揭示非常有价值的数据来指导我们的行动。

核磁共振(MRI)的ML模型就是一个很好的例子。 他们针对已知的癌症或非癌症结果进行了测试(阳性和阴性结果), 这个过程被称为训练。之后将一组新的MRI加载到经过训练的模型中并进行分析。这些新的MRI被称为验证数据集。 该数据通过已经训练有素的模型运行,计算并显示结果,然后再根据为该模型选择的性能指标评估结果。 如果结果可接受,则对模型进行培训,并准备进行更多测试和验证。 如果验证数据不符合指标,则我们回过头来,要么重新设计模型,要么为它提供更多数据,以便为下一次验证测试提供更好的培训。 此阶段称为验证阶段。

 

   
     

 

人工智能的好处有时会带来额外的惊喜。 例如,Citadel Analytics处理过的大多数业务都是客户期望通过AI技术提高效率来实现销售增长或降低成本。但他们很快发现,通过AI可以大大提高员工的工作效率和愉悦性,最大的受益者居然是员工。一家懂得利用AI / ML的公司,其员工往往也对工作更加满意,这一点比不使用AI的公司高得多。

这很有意义,因为AI / ML就是要使“无聊”的东西自动化,并让您的员工在不降低效率的情况下做他们擅长和充满热情的事情。 使用AI技术带来的巨大好处是,使员工拥有更多快乐,并减少员工的流失。但是这一点许多企业一开始并不重视。

如何部署AI / ML并为其提供合理的布线方案

AI需要巨大的处理能力,这一直是一个问题。值得庆幸的是,像NVIDIA,Intel,AMD等公司正在缩小处理能力的差距。 这使BMW,沃尔玛,Target等公司以及更多公司都可以部署边缘AI功能。 这需要以安装功能强大的硬件为前提,这些硬件将使用预先训练的模型来处理本地数据。 这大大减少了等待时间和对实时带宽的需求。

但问题在于,没有人能真正做到边缘的AI / ML部署,因为虽然硬件的预训练模型可以处理数据,但它的能力不足以更新此模型,并使其功能更强大。

因此,混合方案便应用而生。

在混合方案设计中,边缘服务器将使用经过训练的模型来处理所有本地数据。 而这些“最适合的服务器”则可能位于不同的MTDC,从而实现网络和应用程序选择的灵活性。MTDC的光网络基础架构通常采用单模光纤来部署,目的是满足最终用户对未来扩展的需求。 对于部署AI / ML的公司,重要的是需要同时考虑现在和未来网络中的带宽需求。 Citadel Analytics通常有一个经验法则,即取期望带宽的平均值并乘以4倍,就是应该在其系统内部署的带宽。 在当前的AI / ML部署中,带宽尤其重要,是首要考量的因素。

带宽的增加也凸显了MTDC和最终用户对高密度解决方案的需求。 高密度方案可以使MTDC空间实现最大化收益,而最终用户可以更有效地利用他们投资的空间。由于基础架构会随着不同用户的需求而变化,因此寻找具有产品宽度(单模或多模,LC或MTP等)和扩展灵活性的产品供应商显得尤为重要。对于最终用户,降低成本的一种方法是增加密度并降低功耗。这可以通过并行光学器件和端口分离来实现,即通过使用分支线缆来实现将一个高速带宽端口分解为多个低带宽端口。比如使用一个40g并行收发器端口分解为4个单独的10g收发器端口,以实现高密度的线缆转换。

通过减小10公里以内的传输距离,通常可以将延迟减少45%。 这意味着什么?这将推动更多的和更小的区域性数据中心部署,使其更靠近产生数据的地方。 MTDC将成为这些较小数据中心的主要承载工具。 边缘数据中心将托管在这些互连密集型MTDC中,两者相互配合,为客户提供更全面的服务。 拥有互联的基础设施、生态系统和丰富的客户组合的MTDC,将能把握边缘计算发展的商业机遇。

期望

AI和ML技术将持续为采用者创收和提高生产率。未来我们将看到更多公司将应用程序运行在边缘MTDC。 对于这些公司而言,MTDC提供了较低的风险和较快的收益增长。 这将导致会出现更多的边缘区域数据中心,而不是像我们以前看到的那样集中的大型数据中心,同时也将带来更多的互联设施和更高密度的解决方案。