编程AI (共2篇)

Claude 3.5 Sonnet编码基准登顶SWE-bench：72.7%得分领跑AI编程赛道

Anthropic最新发布的Claude 3.5 Sonnet模型在SWE-bench编码基准测试中斩获72.7%得分，首次突破70%大关，超越GPT-4o和Gemini 1.5 Pro，成为编程领域最强AI。该模型擅长前端开发与复杂任务，引发开发者热议，转发量超10万，标志AI编码工具升级。

Anthropic的Claude 3.5 Sonnet在SWE-bench编程基准上取得49%准确率，超越GPT-4o，开发者实战反馈其调试代码能力接近真人。该突破引发X平台数万转发，程序员热议AI如何重塑工程生产力。