颠覆GPU霸权!24人团队用「硬连线」AI芯片跑出17000 token/s,英伟达这回真慌了?
Taalas发布HC1专用AI推理芯片,将Llama 3.1 8B硬编码进硅片,实现每秒17000 token的推理速度,远超英伟达H200/B200。这是AI推理从通用计算走向专用计算的重要标志,但能否撼动GPU霸权仍需时间检验。
Read our latest articles and insights
Taalas发布HC1专用AI推理芯片,将Llama 3.1 8B硬编码进硅片,实现每秒17000 token的推理速度,远超英伟达H200/B200。这是AI推理从通用计算走向专用计算的重要标志,但能否撼动GPU霸权仍需时间检验。
Google于2026年2月20日正式发布Gemini 3.1 Pro,在ARC-AGI-2基准测试中斩获77.1%高分,推理能力相比前代暴涨2倍以上。更值得关注的是,新模型的幻觉率腰斩——AI终于学会说"我不知道"了。这两个突破分别代表了AI在"聪明程度"和"可靠性"上的跨越式进展,可能成为大模型发展的重要转折点。
微软今日发布第二款自研AI芯片Maia 200,采用3纳米工艺,性价比比竞争对手高出30%,已部署于Copilot和GPT-5.2生产环境,AI推理成本大战正式打响。