ADMIN2026年3月20日Claude Sonnet 4.5以77.2%登顶SWE-bench,编程模型的新标杆Claude Sonnet 4.5在SWE-bench Verified上以77.2%领先,成为目前最佳编程模型,编程能力显著提升。Claude编程模型SWE-benchAnthropic开发者工具