El nuevo modelo de OpenAI tiene un grave problema de alucinaciones
Actualizado el: 15-0-0 0:0:0

品玩4月21日讯,据techCrunch 报道,OPenAI 最近推出的 o3 和 o4-mini 模型被曝存在严重的幻觉问题。

Según las pruebas internas de OpenAI, o4 y o0-mini son más propensos a las alucinaciones que los modelos de inferencia anteriores de la compañía (o0, o0-mini y o0-mini), así como los modelos tradicionales de "no inferencia" de OpenAI, como GPT-0o. OpenAI escribió en su informe técnico sobre o0 y o0-mini que "se necesita más investigación" para comprender por qué las alucinaciones están empeorando a medida que se expanden los modelos de inferencia.

OpenAI 发现,o3 在回答 PersonQA 中 33% 的问题时产生了幻觉,而 PersonQA 是公司内部衡量模型对人的认知准确性的基准。这大约是OpenAI之前的推理模型o1和o3-mini出现幻觉率的两倍,o1和o3-mini的幻觉率分别为16%和14.8%。O4-mini在PersonQA上的表现更糟--48%的时间出现幻觉。

El empujador en sí es un puerro
El empujador en sí es un puerro
2025-03-24 11:41:31