豆包大模型团队开源首个多语言类SWE数据集
21世纪经济报道 雷晨
2025-04-10 14:18
南方财经4月10日电,字节跳动豆包大模型团队宣布正式开源首个多语言类SWE数据集——Multi-SWE-bench,可用于评估和提升大模型“自动修Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言。其数据均来自GitHubissue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。目前,Multi-SWE-bench论文、代码和数据集已全部公开。(21世纪经济报道)