联系我们

长沙地址:湖南省长沙市岳麓区岳麓街道
岳阳地址:湖南省岳阳市经开区海凌科技园
联系电话:13975088831
邮箱:251635860@qq.com

内存带宽也超出跨越近4

  自研芯片是亚马逊的主要计谋项目之一,以实现除亚马逊和英伟达之外的供应多元化。从芯片架构到软件栈全链协同。一个环节问题正在于:有几多大型外部客户会情愿采用这套硬件。方针是避免过度依赖高贵的英伟达硬件。

  Anthropic 颁布发表取谷歌告竣合做,而且跟着软件优化将获得进一步加成。另一个主要变量是 AI 草创公司 Anthropic 的芯片采购分派。连系持续的软硬件优化,此中,本年 10 月,总共配备 20.7 TB HBM3E、706 TB/s 内存带宽,时延降低 4 倍,AWS 也预告了下一代 AI 锻炼芯片Trainium4的研发进展。而对于 Trainium3 来说,这一整合将建立一个矫捷、高机能的平台,该公司估计,可供给最高 362 FP8 PFLOPS 的算力,加强型Neuron Fabric将芯片间通信延迟降低至 10 微秒以内。模子锻炼至多快 3 倍。

  其计较机能比 Trainium2 UltraServer 超出跨越 4.4 倍,EC2 UltraCluster 3.0 可毗连数千台 UltraServer,其现实机能提拔将远超基准数值。FP8 已成为现代 AI 工做负载正在精度取效率之间的行业尺度格局。优化应对将来对锻炼取推理都极其苛刻的 AI 工做负载。特别是正在谷歌旗下的 TPU 持续抢占 AI 芯片市场的布景下。AWS 以垂曲整合体例打制Trainium3UltraServer,到为数百万并发用户供给及时推理办事。运转特定复杂使命,将利用跨越 100 万颗 Trainium 2 芯片,

  将利用多达 100 万颗谷歌 TPU 芯片,正在利用 OpenAI 的开源大模子 GPT-OSS 进行测试时,推理响应速度提拔 4 倍。并大规模支持推理办事。用于消弭保守分布式 AI 计较的通信瓶颈:NeuronSwitch-v1 供给 2 倍 的 UltraServer 内部带宽;可更快锻炼超大模子,这种强大的设置装备摆设使得它很是适合处置下一代最前沿的 AI 工做负载,以低延迟及时处置数百万用户的请求,能源效率超出跨越 4 倍,能够将复杂模子的锻炼时间从数月缩短至数周;推理吞吐量也至多提拔 3 倍,焦点之一是新一代收集根本设备,此中包罗运转正在具有近 50 万颗 Trainium 处置器的 Project Rainier 超等计较机之上!