
硬件堆料更是硬核,256MB SRAM缓存配上144GB HBM3e内存,芯片间通信延迟压到1微秒。单个TDN72机柜塞进72颗芯片,一个标准机架就能部署288颗,实测每秒处理1000个Token的LLM推理任务稳如老狗。某云服务商偷偷测试后算了笔账:按每天10万用户使用量,这套系统每年能多赚3300万美元,电费账单还比英伟达方案少付八成。 手握1.76亿美元融资的Tensordyne正筹备D轮融资,目标要把Llama3.3-70B模型的机架吞吐量冲到300万Token/s。技术白皮书显示,他们的对数运算方案在视频生成Transformer测试中,不仅能耗降低22倍,连芯片面积都缩小25倍。有参与测试的开发者透露:“处理4K视频生成时,TDN的显存占用只有Blackwell的三分之一,这波真的赢麻了。”虽然目前Blackwell仍是市场主流,但TDN这套组合拳打出后,连英伟达工程师都在内部论坛讨论应对方案了。
金时资产提示:文章来自网络,不代表本站观点。