AI新闻 OpenAI 发布全新的百万美金SWE-Lancer 基准测试 评估AI的编程能力 Claude 3.5 Sonnet斩获40万美金 SWE-Lancer 是什么 SWE-Lancer 是一个专为评估前沿语言模型在真实世界软件...