近日 ,联想联想集团宣布基于联想问天WA7780 G3服务器 ,服务在行业内首次实现单机部署DeepSeek-R1/V3 671B大模型,器首以低于行业公认1TGB显存(实际768GB)承载多并发用户流畅体验 ,次实可以满足千人企业的现低血使用需求,为行业树立了企业级大模型部署新基准。地部

联想问天WA7780 G3大模型训推一体服务器
突破性能限制,满模型树立DeepSeek-R1大模型部署新基准
作为全球关注的联想焦点 ,众多企业正准备在本地化部署DeepSeek大模型 。服务然而,器首在落地实施过程中用户普遍面临以下关键决策难题 :单机能否部署满血版DeepSeek R1?次实所需最低配置是源码下载什么?如何确保高并发与吞吐量下的优质体验 ?如何避免采购陷阱?
联想此次突破为企业提供科学选型指南。针对行业公认1TB显存是现低血千亿参数大模型运行基线的背景下,联想研发团队通过专家并行优化、地部智能访存架构升级及PCIe 5.0全互联架构创新,满模型大幅提升了显存利用率,联想从而实现了性能的提升 。
据了解,联想WA7780 G3服务器在2月初已实现单机768GB GPU显存条件下部署DeepSeek 671B R1和V3满血模型 ,高防服务器并能满足中小企业的并发需求 。进而通过联想万全异构智算平台的访存优化 ,专家并行调用策略等技术优化手段 ,实现了单机一个月内并发能力增长10倍, 同时还提升了每路用户的TPOT 、TTFT等综合性能体验
持续优化升级,解决用户体验难题
联想的这一创新成果揭示了设备选型的新维度,亿华云也提醒企业审慎评估各种测试数据 ,摒弃对总吞吐量和总并发数等指标的片面追求 ,而应从用户体验出发