OpenAI推出SWE-bench Verified

快讯零壹财经零壹财经 2024-08-14 阅读：4374

关键词：OpenAI AGI

8月14日讯，OpenAI推出更可靠的代码生成评估基准：SWE-bench Verified。公司在官网的一篇Blog中称：“随着我们的系统越来越接近AGI（通用人工智能），我们需要在越来越具有挑战性的任务中对它们进行评估”。该基准是对现有SWE-bench 的改进版本（子集），旨在更可靠地评估AI模型解决现实世界软件问题的能力。（每日经济新闻）

上一篇>香港金管局及数码港推出GenA.I.沙盒，推动金融业应用人工智能

下一篇>奇富科技Q2财报：创新AI应用场景金融提效拓宽行业价值