再见,Devin基于GPT4o,最强 - c#发展 - Powered by Discuz!NT Archiver

TUhjnbcbe - 2025/6/23 22:50:00

从事白癜风的临床研究 http://pf.39.net/bdfyy/tslf/170706/5522607.html
编辑：编辑部AI编码的桂冠又易主了，Genie超越Devin，成为了地表最强的「AI软件工程师」，Genie不是一个编程助手，而是一个能够自主思考的「同事」，与你并肩作战。

不知道你还是否记得首个「AI程序员」Devin，由10枚IOI金牌在手的创业团队CognitionAI开发，今年月上线。

它由GPT-4提供后端支持，能以文本形式接收自然语言指令，并自主编写代码。

刚刚上线时，虽然效果没法达到取代程序员，但依旧给人留下了深刻印象。

如今，5个月过去，「狂飙」的GenAI领域已然大不相同。不仅GPT-4迎来了下一代模型GPT-4o，新发布的Claude.5Sonnet、Codestral等模型都在编码方面性能优秀。

Devin的直接挑战者，是初创公司Cosine开发的自主AI工程师Genie。

Cosine发布的报告显示，在SWE-Bench中，Genie的得分为0.08%，轻松超越了分数为1.8%的Devin。

Cosine联合创始人兼CEOAlistairPullen表示：「（Genie）模型的能力不是一个基准测试分数能概括的：它从一开始就被训练成像人类软件工程师（SWE）一样思考和行动。」

我很高兴与大家分享，我们打造出了世界上最强的AI软件工程师，在SWE-Bench上取得了0.08%的成绩，领先于亚马逊和Cognition。

由于CEO声称Genie可以像人类软件工程师一样思考和行动，网友调侃道，「你的意思是它不能和女人说话，如果你打电话给它，它就会出汗？」

Genie是什么？它能做什么？

和Devin类似，Genie也可以在人类工程师的指导下自主完成各种编码任务，包括bug修复、功能构建、代码重构，以及通过全面测试进行代码验证。

除了自主运行，Genie也可以与用户协作。

目前Genie还处在内测阶段，可以在