Claude 3.5 Sonnet编码基准登顶SWE-bench:72.7%得分领跑AI编程赛道
Anthropic最新发布的Claude 3.5 Sonnet模型在SWE-bench编码基准测试中斩获72.7%得分,首次突破70%大关,超越GPT-4o和Gemini 1.5 Pro,成为编程领域最强AI。该模型擅长前端开发与复杂任务,引发开发者热议,转发量超10万,标志AI编码工具升级。
Anthropic最新发布的Claude 3.5 Sonnet模型在SWE-bench编码基准测试中斩获72.7%得分,首次突破70%大关,超越GPT-4o和Gemini 1.5 Pro,成为编程领域最强AI。该模型擅长前端开发与复杂任务,引发开发者热议,转发量超10万,标志AI编码工具升级。
Anthropic的Claude 3.5 Sonnet在SWE-bench编程基准上取得49%准确率,超越GPT-4o,开发者实战反馈其调试代码能力接近真人。该突破引发X平台数万转发,程序员热议AI如何重塑工程生产力。