硬刚OpenAI!中国AI团队杀入全球前二,CodeBrain-1一战封神
今天下午,中国AI初创公司Feeling AI自主研发的CodeBrain-1模型,在全球权威基准测试Terminal-Bench 2.0上拿下了第二名的好成绩,仅次于OpenAI的Simple Codex。在Agentic AI的核心赛道上,中国团队终于有了与世界顶尖团队正面硬刚的实力。
Read our latest articles and insights
今天下午,中国AI初创公司Feeling AI自主研发的CodeBrain-1模型,在全球权威基准测试Terminal-Bench 2.0上拿下了第二名的好成绩,仅次于OpenAI的Simple Codex。在Agentic AI的核心赛道上,中国团队终于有了与世界顶尖团队正面硬刚的实力。
字节跳动最新推出的AI视频生成模型Seedance 2.0引发全网关注。作为一项突破性的「导演级AI」技术,它支持60秒内生成带原生音频的电影级多镜头视频,上线12小时生成量破百万条。但与此同时,其超强的真实感也引发了关于技术滥用的担忧。本文从产品体验、技术突破、产业影响和伦理争议等多个角度,深度解析这一现象级产品背后的故事。
华为诺亚方舟实验室发布了业界首个基于扩散语言模型的Agent(DLLM Agent),在保持准确率的前提下,某些复杂任务的执行速度提升了8倍!这标志着大语言模型生成范式开始出现新分支,或将推动AI Agent应用的进一步突破。
2026年开年,Self-Distillation技术成为AI圈热门关键词。MIT、ETH Zurich等顶尖机构密集发布相关研究,这项让大模型真正学会「持续学习」的技术,可能彻底改变模型迭代和应用的现有模式。
DeepSeek V4即将发布,这次不一样。专注编程领域、成本降低70倍、采用mHC架构,代码能力已接近Claude水平。国产大模型能在垂直领域与国际顶尖产品掰手腕吗?
2026年米兰冬奥会将迎来奥运史上首个官方大模型——基于阿里千问打造的"奥运AI助手"。这不仅是中国大模型首次亮相世界级体育赛事,更标志着AI技术大规模商业化落地的重要里程碑。
Anthropic今日推出Claude Opus 4.6极速模式,速度提升2.5倍但价格暴涨6倍,引发开发者社区热议。本文从技术和商业角度分析这一更新的意义与影响。
今天UIUC在ICLR 2026发布的Self-Aligned Reward (SAR)火了——用模型自身的困惑度来判断推理质量,一行代码搞定大语言模型的过度思考难题。实验显示,该方法不仅提升了准确率,还将推理长度缩短了30%-50%。
Anthropic刚刚发布了Claude Opus 4.6,最引人注目的是百万级上下文窗口和Agent Teams功能。本文深度解析这次更新的核心亮点、实际使用体验,以及对未来工作方式的影响。