颠覆GPU霸权!24人团队用「硬连线」AI芯片跑出17000 token/s,英伟达这回真慌了?
Taalas发布HC1专用AI推理芯片,将Llama 3.1 8B硬编码进硅片,实现每秒17000 token的推理速度,远超英伟达H200/B200。这是AI推理从通用计算走向专用计算的重要标志,但能否撼动GPU霸权仍需时间检验。
Read our latest articles and insights
Taalas发布HC1专用AI推理芯片,将Llama 3.1 8B硬编码进硅片,实现每秒17000 token的推理速度,远超英伟达H200/B200。这是AI推理从通用计算走向专用计算的重要标志,但能否撼动GPU霸权仍需时间检验。
2024年AI大模型格局发生历史性剧变,GPT-4垄断地位被彻底打破。Google Gemini、Claude 3、Meta Llama 3等70+新模型涌现,开启四强争霸新时代。多模态革命、200万token上下文、成本大幅下降,AI正从实验转向实用,重塑整个行业生态。