英特尔高层详解边缘计算战略：大模型浪潮带来AI部署新挑战

本报记者谭伦南京报道

【资料图】

就在一年前，当工信部宣布我国移动物联网连接数首次超出移动电话用户数之际，敏锐的全球科技巨头们已经意识到，一个新的市场已经诞生。对此，今年2月，国际电信咨询公司STL Partners在其发布的最新研报中也对该市场的估值给出了预测——2030年达到4450亿美元。

“这一市场将成为企业下一个10年的巨大发展机遇，其中很大一部分都来自于中国。”日前在南京举行的2023网络与边缘产业高层峰会上，英特尔公司高级副总裁、网络与边缘事业部总经理Sachin Katti向《中国经营报》等媒体记者再次援引了这一数据表示，中国已成为该市场在全球创新最多的土壤，而助力该土壤的生态成长繁茂，将成为英特尔未来重要的业务战略之一。

正如Sachin Katti所执掌的业务部门的名号，该市场就是“边缘计算”，意指远离网络核心计算设备或节点，而部署在终端本地的算力或者离用户距离较近的数据中心的计算算力。更为通俗的解释，便是各种工业、智慧城市、医疗、教育、零售等各种场景中终端设备的算力单元，而“物超人”中的移动物联网，正是边缘计算最主要的组成部分。

作为为全球网络节点与终端提供基础计算平台的供应商之一，早在2013年边缘计算概念被业界正式提出前，英特尔便意识到了该市场的未来价值，成为全球最早入局部署的巨头之一。十多年来，虽然历经多次业务架构调整，但边缘计算在英特尔业务版图中的地位始终未受动摇，并最终发展为目前英特尔的六大业务线之一，且归属于传统三大业务中，足见其重要性。

在接受记者采访时，Sachin Katti指出，随着当前大模型的爆发式增长，AI技术正在快速迁移到云端，在此过程中边缘也会发挥更加重要的作用来推动AI部署，因此，网络边缘侧比过去而言会受到更多重视，也将带来更大的市场。

软硬结合应对AI部署挑战

“在边缘的开发者当中，有86%的人都集中在基于AI的应用领域。而这些开发者也告诉我们，要在开发的时候就把AI的能力集成到他们的应用软件中。”在解释英特尔边缘业务的最新战略时，Sachin Katti强调了英特尔应对AI开发需求剧增的背景。

对此，英特尔边缘业务团队采取的策略是“软硬结合”。Sachin Katti指出，一方面，英特尔会提供大量的硬件选择，比如说CPU、加速器、GPU等，以达到一流的算力性能。同时，在软件方面，英特尔则致力在开发应用时做到降低复杂性。

身为一家传统意义上的芯片厂商，硬件历来是英特尔的强项所在。此前，英特尔推出了为边缘从零打造的首款片上系统级芯片——至强D系列处理器，其集成了AI和加密加速功能，以满足关键的网络和边缘算力及工作负载要求。

而在去年，英特尔还推出了第二代 IPU，这一产品序列是英特尔针对网络基础设施推出的计算加速平台，因而也被称为基础设施处理单元（即IPU），该系列包括多款芯片产品。据此前公布的截至2026年的IPU路线图显示，2023至2024年，英特尔将上市第三代400G IPU产品。此外，英特尔还推出了代号为Sapphire Rapids的第四代至强可扩展处理器的初始SKU，这些工具都是英特尔边缘业务中的。

但对于边缘场景应用的开发者而言，只有硬件的支撑显然不够，对此，英特尔根据数十万名开发者在过去三年多的反馈，开发了OpenVINO软件工具。在其最新版本中，增加了硬件自动发现和自动优化功能，以满足各行业场景对边缘AI推理的定制化需求。

“因为对于客户而言，仅仅靠硬件去获得边缘价值非常困难，所以我们在交付给客户硬件的时候，相应也会给客户交付所需要的软件，目的是希望通过这样一套基础设施，让客户更加容易部署我们的硬件，并管理好它们。”Sachin Katti表示，这也是软硬件相结合成为英特尔边缘业务价值定位的原因所在。

大模型落地要和行业结合

如果说软硬结合只是英特尔边缘AI战略的第一步，那进一步完成定制化工具则是英特尔面对大模型浪潮来临后的应对之策。

“大模型的落地要和行业结合起来。”英特尔中国区网络与边缘事业部首席技术官、英特尔高级首席 AI工程师张宇向记者指出，其实很多边缘设备都是在行业场景中进行落地，因此，边缘AI的部署，仍要围绕行业相关的大模型展开，从而去解决行业中一些针对性的问题。

在张宇看来，大模型部署使用过程中的挑战来自两大方面，一是训练，另一是推理。训练方面，英特尔日前发布了专门面向大模型训练的加速器Gaudi 2，其在第三方公开运用GPT 3大模型的评测中表现出了高性能，所以英特尔已将其引入中国市场，来帮助产业合作伙伴训练大模型。

而在推理方面，由于其大部分集中在边缘场景中进行，但边缘设备的算力、功耗、成本往往有限，不像数据中心可以无限增加设备。因此，如何在一个资源受限的情况下去完成推理，就需要根据特定行业的特定需求去做特定优化，使得简化之后的大模型既满足特定行业对准确度、功能的要求，同时其算力也能被边缘设备所承载，就成为英特尔的主要思路。

对此，张宇介绍，英特尔推出了多款硬件和软件，前者包括通用CPU、专用独立显卡加速器，以此满足人工智能模型推理对算力的要求。另一方面则来自OpenVINO这样的软件。

据其介绍，在最新的OpenVINO的版本中，英特尔增加了“Stable Diffusion”这一对大模型的支持工具，即潜在扩散模型，这是目前业界用最为广泛的以文生图的模型，用户给其提供一段文字描述，便可以生成一个相关图片。以服装设计为例，张宇介绍，已有一家国内服装设计厂商将使用该模型工具描述需求，生成了相应的服装图片，加快了服装设计流程。

“OpenVINO经过优化，已经在酷睿处理器平台、第四代至强可扩展处理器平台和独立显卡上都进行了运用，来实现Stable Diffusion模型的推理。这项工作目前已经完成，并已在业界进行推广。”张宇表示。

Sachin Katti则补充表示，不仅对于语言模型，任何计算模型在云端训练之后，通过英特尔提供的OpenVINO进行优化和压缩后，都可以更好地便于用户使用。“通过OpenVINO，可以进一步推动让AI更广泛地被使用。不只是在云端，也可以让在云端训练后的成果更加高效地在任何需要的地方被使用。”Sachin Katti表示。

参与构建中国产业生态

在边缘计算技术领域准备充分的英特尔，也对于充满前景的中国市场，投出了更多的期望值。

据STL Partners发布涵盖全球市场估值的同份报告指出，归功于中国对于边缘计算产业的重视，到2026年，全球26%的网络边缘站点将位于中国，东亚与太平洋地区也将拥有全球数量最多的网络边缘数据中心，超过2022年领先的北美地区。而据中国信通院发布的研报显示，2021年，我国边缘计算市场规模为436亿元，预计2024年将达1804亿元，近三年复合增速高达61%。

“我们将与整个中国的生态伙伴一起合作，帮助中国客户，使他们的运营更加精简，这就是我们的战略。”Sachin Katti表示，目前英特尔已在全球帮助客户完成了超过8.4万次成功的边缘部署，而中国是其重要的组成部分。

在本次峰会上，记者看到，包括在线教育、零售快消、智慧医疗、智能制造等在内的各类国内垂直行业厂商与英特尔合作推出的解决方案。张宇表示，英特尔致力通过推动包括中国边缘计算、网络在内的生态构建，使得行业共同发展。

公开信息显示，早在2016年11月，英特尔便参与了由华为、中国信通院、ARM等参与成立的中国边缘计算产业联盟（edge computing consortium，ECC），以致力于推动“政产学研用”各方产业资源合作，引领边缘计算产业的健康可持续发展。张宇透露，目前，该联盟发展至近300家成员单位。

“疫情之后，中国经济处于恢复期，我们也听到很多国内客户的心声，就是如何降本增效。所以我们在中国市场所做的工作就是以此为目的，来给用户一个更高效的，满足其业务需求，同时又能降低成本的解决方案。”张宇表示。

（编辑：张靖超校对：颜京宁）

关键词：