ADMIN2026年3月20日大模型编程基准测试大乱斗:Gemini、Claude、GPT谁才是真正的代码之王?深度对比各大模型在编程基准测试中的表现,从Aider Polyglot到SWE-bench,分析实际编程场景下的优劣。编程基准测试AiderSWE-bench代码生成模型对比