Blackwell 架构 · 现已发售

NVIDIA DGX Spark

由 GB10 Grace Blackwell 超级芯片驱动的桌面 AI 超级计算机,提供高达 1 PetaFLOP FP4 性能,让您在桌面端体验数据中心级 AI 算力。

核心规格

紧凑设计,强大性能,专为 AI 开发者、研究人员和数据科学家打造

🧠

AI 性能

1 PetaFLOP

FP4 精度下高达 1 PetaFLOP 的 Tensor 性能,搭载第 5 代 Tensor Core 和第 4 代 RT Core

超级芯片

GB10

NVIDIA Grace Blackwell 架构,20 核 ARM CPU(10 × Cortex-X925 + 10 × Cortex-A725),TDP 仅 140W

💾

统一内存

128 GB

LPDDR5x 128 GB 统一系统内存,256-bit 位宽,273 GB/s 内存带宽,CPU/GPU 共享地址空间

💿

高速存储

4 TB

NVMe M.2 SSD 带自加密功能,满足大规模数据集和模型存储需求

🔌

高速连接

200 Gbps

ConnectX-7 网卡 @ 200 Gbps,4 × USB-C(40 GB/s),10 GbE RJ-45,WiFi 7,BT 5.4

📐

紧凑设计

1.2 kg

仅 150 × 150 × 50.5 mm,240W 电源,满载噪音仅 29 dB,安静如图书馆

🏢

多品牌 OEM

8+

华硕 Ascent GX10、戴尔 Dell Pro Max、惠普、联想 ThinkStation PGX、超聚变 FusionXpark 等 8+ 品牌可选

📦

企业软件

NVAIE

预装 NVIDIA AI Enterprise 套件,支持 NemoClaw Agent 开发平台,无缝接入 CUDA 生态

多品牌可选

NVIDIA 授权 8+ 全球领先厂商打造 DGX Spark 非公版,满足不同场景与预算需求

🔵

超聚变 FusionXpark™

国内首发非公版,搭载 GB10 超级芯片,预装 FusionXplay™ 应用市场与 FusionOne AI 优化,支持创作者印记定制,京东有售。

京东有售 FusionOne AI 定制签名
🟢

华硕 Ascent GX10

全球首款 DGX Spark 非公版,由华硕率先发布,极致散热设计与紧凑机身,面向专业开发者与科研团队。

全球首发 极致散热 专业设计
🟡

戴尔 Dell Pro Max

戴尔企业级 AI 工作站版本,集成戴尔全球服务网络与技术支持,适合企业批量部署与 IT 统一管理。

企业级服务 批量部署 全球支持
🔵

联想 ThinkStation PGX

联想 ThinkStation 系列 AI 工作站版本,兼容企业现有 IT 架构,提供完善的售后服务与升级通道。

ThinkStation 企业兼容 售后完善
🟣

惠普 / 微星 / 宏碁 / 技嘉

惠普、微星、宏碁、技嘉等品牌同步推出 DGX Spark 版本,覆盖消费级到专业级不同定位。

HP MSI Acer Gigabyte
🏪

中国区总代理

丽台科技、英迈中国、神州数码、紫光晓通为官方授权渠道,提供完整售前咨询与售后保障。

为什么选择 DGX Spark?

云端算力虽然强大,但网络时延影响交互效率,数据合规成本高昂,按时计费模式在高频使用场景下难以为继。DGX Spark 把算力与数据都留在身边,让开发者在本地掌握接近数据中心级别的 AI 能力。

  • 零网络延迟 — 所有推理和微调在本地完成,无需云端往返
  • 数据隐私安全 — 敏感数据不出本地,满足合规要求
  • 无持续成本 — 一次购买,无限使用,无需按小时付费
  • 统一软件栈 — 与数据中心 DGX 系统完全一致的软硬件生态
  • 双机互联 — 两台 Spark 互联可运行高达 4050 亿参数模型
推理最大模型 2000 亿
微调最大模型 700 亿
双机互联推理 4050 亿
内存带宽 273 GB/s
TDP 功耗 140 W

应用场景

从原型设计到生产部署,DGX Spark 覆盖 AI 开发生命周期的每一个环节

🎨

大模型原型设计

在桌面端快速开发、测试和验证 AI 模型与应用,无需等待云端资源排队,大幅缩短迭代周期。

PyTorch Hugging Face 快速迭代 本地调试
🔧

模型微调与定制

对开源大模型进行监督微调(SFT)、指令微调(DPO/RLHF),打造专属领域模型,无需上传数据到云端。

LoRA / QLoRA SFT DPO 700 亿参数
🚀

本地推理部署

借助 FP4 第 5 代 Tensor Core 高效推理,本地运行高达 2000 亿参数的大语言模型,零延迟响应。

vLLM Ollama TensorRT-LLM FP4
🤖

AI Agent 开发

使用 NVIDIA NemoClaw 开发多模态 AI Agent,集成 Ollama 推理引擎和 Telegram 等消息平台,构建自主智能体。

NemoClaw 多模态 Agent 工具调用 自主决策
📊

数据科学与分析

在桌面端进行高性能数据分析与机器学习,利用 128 GB 统一内存处理大规模数据集,无需分布式集群。

Pandas Scikit-learn Jupyter 128 GB 统一内存
🌐

边缘 AI 应用

支持 NVIDIA Isaac™(机器人)、Metropolis(智慧城市)、Holoscan(医疗影像)等边缘计算框架。

Isaac Sim Metropolis Holoscan 边缘部署

大模型支持

已在 DGX Spark 上验证的热门大模型,涵盖开源主流生态

模型名称 参数量 架构 工作负载 精度
Qwen3.5-35B-A3B 35B(激活 3B) MoE 推理 FP8
Llama 3.2 3B 3B Dense 微调 FP16
Qwen2.5-72B 72B Dense 推理 FP8
Mixtral 8x7B 47B(激活 14B) MoE 推理 FP8
Yi-1.5-34B 34B Dense 微调 FP16
ChatGLM3-6B 6B Dense 原型 FP16

准备好开启本地 AI 之旅了吗?

从 DGX Spark 到 Yaode AI,一站式 AI 开发与应用部署方案

免费试用 Yaode AI 访问 NVIDIA 官网 →
专属客服在线

联系我们

扫码添加客服微信或复制 QQ 号,专业团队全程为您服务

微信客服
专属顾问 1 对 1
QQ 客服
点击复制 QQ 号
二维码放大
点击任意位置关闭