AI 生成的论文在 ICLR Workshop 2025 拿到了中上分数,这会对科研界带来什么影响?
更新于:2025-04-14 08:58:17

我的个人建议是,当你在自媒体上标题很怂人的AI新闻,点击原论文,看看abstract,然后搜索「limitation」,就基本了解清楚一项新技术它的长处和短板了。

首先看看limitation。

简单来说,ICLR分为workshop和主会场(同样的,ICML、NeurIPS也是一样),workshop的接受率通常在60-80%,而主会场只有20-30%,也就是说,其实workshop的要求并不太严格,团队也承认论文并不太可能被主会场接受,他们甚至大方承认,即使在workshop这个级别,表现也是不稳定的。

我们可以报告的第30页,在这里,他们展示了三篇AI生成的论文,以及review的结果。

其实点进去被reject的那些论文,你会发现,很多低级错误,例如引用丢失(详见:[1]

图文不符(详见:[2]

但比起上个版本,这个版本的AI-scientist还是有进步的。其实这是第二个版本了,从名字AI Scientist-v2就能看出,v2版本摆脱了对人类编写模版的依赖,由实验管理器代理引导渐进式代理树搜索,自己就能生成论文,且能通过workshop 的同行评审,也算是agent应用的新突破了。

而且,他们还是遵守了学术规范,撤回了提交到workshop的几篇文章,也算是值得肯定的一点。毕竟他们的目的是发表AI scientist的成果,而不是那几篇。

总的来说,是一个不错的PoC,也许可以为科研提速,但要在科研中「端到端」的使用AI生成论文,不加任何人类修改,是不太可能的,毕竟科研要求极其严谨的论证过程,数据需要极高的准确率,这都是当前大模型能力达不到的,毕竟幻觉问题依然是大模型的一个无法解决的问题。