杰西·埃利斯(Jessie A Ellis)
8月 06, 2024 20:32
VAST Data 集成了 NVIDIA BlueField DPU,以优化 AI 工作负载、提高性能并增强数据安全性。
随着对复杂 AI 功能的需求不断升级,VAST Data 推出了 VAST 数据平台,该平台现在通过 NVIDIA BlueField DPU 进行了增强。根据 NVIDIA 技术博客的说法,这项创新是为了满足 AI 驱动的数据中心的严格要求,并优化 AI 工作负载和数据管理。
管理 AI 工作负载的挑战
优化 AI 工作负载需要管理大量非结构化数据,确保高速数据访问,并保持强大的数据安全性。传统的数据存储和处理系统经常会遇到延迟、效率低下和可扩展性问题,这可能会阻碍 AI 应用程序的性能。此外,对实时数据处理和严格安全性的需求增加了有效管理 AI 工作负载的复杂性。
NVIDIA BlueField DPU 的优势
BlueField-3 DPU 使组织能够满足现代 AI 工作负载的苛刻要求,确保更快的数据访问、强大的安全性和更高的整体效率。将 NVIDIA BlueField DPU 集成到 VAST 数据平台中代表了存储处理技术的重大飞跃。通过将基本存储操作卸载到 DPU,可以降低功耗和空间,同时增强存储网络带宽、提高性能并确保可扩展性。
提高存储效率、数据完整性和安全性
VAST Data 的最新产品将高密度存储与尖端的 BlueField DPU 技术相结合。这种强大的组合确保了卓越的性能,最大限度地提高了效率,并提供了最苛刻的 AI 环境所需的可扩展性。

在 VAST Data 的传统架构中,CNodes(计算节点)是负责运行存储协议和管理服务的 x86 服务器。VAST 的独特方法涉及将 NVIDIA BlueField DPU 集成到其平台中。这种集成将基本存储操作从 CPU 卸载到 DPU,从而增强了存储网络带宽并降低了功耗。卸载到 DPU 可以减少所需的专用 CNode 数量,因为 DPU 可以更有效地处理必要的计算任务。
同样,通过减少计算节点,也减少了对外部网络交换机的依赖性,从而减少了所需的交换机端口数量以及管理它们的复杂性和成本,从而简化了网络架构。BlueField DPU 通过卸载和隔离存储功能、协助并行数据服务以及在 AI 环境中提供块存储服务,显着增强了 I/O 操作的处理。其结果是更精简、更高效的基础设施,而实现相同性能水平所需的物理服务器更少。
NVIDIA BlueField DPU 以多种方式增强了 VAST 数据平台,包括:
- 提高 I/O 性能: BlueField 促进了 NVMe 存储访问,可以以超过 60 GB/s 的速度处理数据,从而优化数据密集型应用程序的访问速度。
- 更好的存储性能: BlueField DPU 支持高达 400 Gbps 的速率,可提高吞吐量并提高 I/O 效率。GPUDirect 存储和基于融合以太网的 RDMA (ROCE) 等功能可实现高效、低延迟的数据传输,这对于高速数据密集型应用程序至关重要。
- 服务质量: 每个 GPU 服务器都配备了专用的 BlueField-3 DPU,为 VAST 并行服务操作系统提供支持。这允许每个 DPU 读取和写入 VAST 数据平台的共享命名空间,而无需在容器之间协调 I/O,从而消除争用。
- 加速安全性: BlueField DPU卸载加密和深度数据包检测等关键安全任务,减少 CPU 上的计算负载,并提高整体系统性能。BlueField-3 还消除了处理 I/O 对内核驱动程序的要求。此方法可减少攻击面,并最大程度地减少基于主机的漏洞的潜在影响,尤其是在多租户环境中。
- 提高效率: BlueField DPU 显着增强了存储处理能力,降低了功耗和空间要求,同时提高了存储网络带宽。
结果
将 NVIDIA BlueField DPU 集成到 VAST 数据平台中取得了令人印象深刻的成果:
- 增强的性能: BlueField-3 从主 CPU 卸载计算密集型任务以提高性能,这对于 AI 应用程序至关重要。
- 服务质量: 通过在容器内运行共享命名空间,每个 GPU 服务器都有一个专用的 BlueField DPU,可以与数据节点直接通信,减少延迟和跳跃,从而简化 I/O 操作。
- 提高效率: 通过将功耗降低 77% 和机架空间需求,该平台为数据中心提供了更具可持续性的解决方案。
- 强大的安全性: 增强的安全功能可确保数据完整性并防止未经授权的访问。
这些进步使VAST数据平台成为推动人工智能驱动数据中心性能和效率的关键组成部分。该平台以最小的延迟和高安全性处理大量数据的能力尤其引人注目,为 AI 创新奠定了坚实的基础。
通过集成 BlueField,VAST 可加速运营、简化安全管理并增强监控能力。BlueField 提供改进的数据服务和强大的安全功能,包括用于实时洞察的高级遥测和快速异常检测。这种集成不仅优化了性能,而且减少了对大量硬件的需求,使系统更加高效和具有成本效益。BlueField DPU 是推动 VAST 数据平台高级性能和效率的关键组件,专为现代 AI 数据中心量身定制。
VAST Data 和 NVIDIA 之间的合作伙伴关系对于推进 AI 基础设施至关重要,并彻底改变了 AI 驱动的数据基础设施的格局。通过利用 BlueField-3 DPU,VAST Data 成功增强了其 AI 云架构,提供了前所未有的性能、安全性和效率。这种集成使 VAST Data 能够将关键网络、存储和安全任务从 CPU 卸载到 DPU,从而显著减少数据中心的占用空间和功耗。
总结
NVIDIA 和 VAST Data 合作开发了一个强大、可扩展且安全的 AI 基础设施,专为现代企业和服务提供商量身定制。这种集成解决方案可提高 AI 工作负载的性能,并简化大量 AI 系统的部署和管理。
此外,BlueField-3 DPU 使 VAST Data 能够采用零信任安全模型,确保数据隔离和强大的威胁防护。对于多租户环境来说,这是一项基本功能,在多租户环境中,安全高效的数据管理至关重要。DPU 还支持将存储和安全处理服务直接集成到 AI 服务器中,并实现服务质量 (QoS) 功能,用于协调 DNodes(数据节点)之间的 I/O,从而实现真正的线性可扩展性并消除数据服务的争用。
随着 AI 继续推动创新和重塑行业,VAST Data 和 NVIDIA 之间的合作体现了将先进的 DPU 技术整合到数据中心架构中的好处。
要了解有关制定新的 AI 和数据管理标准的合作伙伴关系和技术创新的更多信息,请访问 NVIDIA 技术博客。
图片来源:Shutterstock