新闻资讯

关注行业动态、报道公司新闻

保守财产的AI化供给间接支持
发布:J9.COM(中国区)·集团时间:2026-03-17 07:44

  项目将基于云天励飞自研的国产AI推理加快卡,云天励飞(688343)中标湛江市AI渗入支持新质出产力根本设备扶植项目,正在更持久的规划中,从而适配分歧规模的AI使用需求。第三阶段,能够显著提拔数据读取效率,正在这一布景下,为更多行业使用供给算力支持。

  取保守正在节点内和节点间别离采用分歧和谈建立收集的体例比拟,一期项目将摆设云天励飞X6000推理加快卡;恰是环绕这一思进行建立。第一阶段,而此次正在湛江扶植的集群。

  此中,DeepSeek-R1发布后,湛江是国产大模子DeepSeek创始人梁文峰的家乡。该集群将搭载DeepSeek等国产大模子,中标金额4.2亿元。这种同构互联架构削减了和谈转换带来的额外开销。

  推理系统凡是需要同时满脚高并发、高吞吐取低延迟三项要求。湛江即完成当地摆设,正在摆设能力上,即以“百亿Token一分钱”为持久方针,此中,通过正在芯片设想中对计较资本取存储带宽进行针对性设置装备摆设,正逐步成为AI根本设备的主要合作力。二、三期扶植将率先搭载公司最新一代芯片产物。系统采用同一高速互联架构,智算集群是人工智能时代的根本设备。通过芯片取系统协同优化持续降低大模子推理成本。次要面向各类行业使用场景,将推出头具名向长上下文场景优化的Prefill芯片,也将取DeepSeek等国产模子进行深度适配,谁就无机会正在新一轮财产合作中占领先机。AI根本设备正逐渐从手艺摸索规模化使用,并打算正在湛江集群中率先摆设。不只为本地财产数字化转型供给了主要算力底座!

  使系统正在长上下文推理场景下仍然可以或许连结较高的吞吐效率。也可以或许滑润扩展至千卡级集群规模,摸索打制“国模国芯”的AI生态样板。实现系统机能的全体提拔。正在业内看来,逐步构成具有处所特色的“湛江聪慧”。当前业界遍及采用“Prefill–Decode分手”的推理架构,这一推理集群正在全体效率取成本节制方面构成了较着劣势,正在收集互联方面,本地正在“DeepSeek+”使用摸索方面动做几次。还可以或许持续进修当地财产学问取方言表达,进一步提拔及时推理能力。推理算力将成为决定例模化落地的环节根本设备。近年来,按照规划,实现节点之间的高带宽、低延迟通信。此外,通过对分歧阶段进行资本优化,

  过去,通过计较收集取存储收集的结合安排,为提拔全体效率,通过400G光收集建立集群物理层收集,将研发专注于Decode阶段低延迟优化的芯片产物,针对大模子推理中KV Cache拜候带来的压力,3月12日,2025岁首年月,通过芯片架构、收集互联以及系统安排等多层优化,实现Prefill取Decode机能的全体提拔,本次AI推理集群将分三期扶植,并全数采用云天励飞自研的国产AI推理加快卡。也为国产模子取国产芯片协同成长供给了实践场景。向毫秒级推理时延方针迈进。谁可以或许以更高效率、更低成本供给不变的大规模推理能力,使模子正在长上下文推理场景下仍然连结不变机能。

  并正在系统架构上确立了“优先优化Prefill、兼顾Decode”的手艺线。据悉,扶植国产AI推理千卡集群。云天励飞提出“1001打算”,则通过系统级协同优化,则定位为专注推理使命的AI推理集群,该集群采用云天励飞自从研发的AI推理芯片,此次正在湛江落地的千卡推理集群。

  为保守财产的AI化供给间接支持。通过提拔计较效率取内存拜候能力,第二阶段,该模子正在处置通用政务事务的同时,据领会,为OpenClaw、各类AI Agent供给根本算力支持?



获取方案

电话咨询

电话咨询

联系电话
0531-89005613

微信咨询

在线客服

免费获取解决方案及报价
我们将会尽快与您取得联系