Model baharu OpenAI mempunyai masalah halusinasi yang serius

Model baharu OpenAI mempunyai masalah halusinasi yang serius

Akhbar Papan Merah Gpt halusinasi Menjajarkan lompat bungee Ungkapan

Dikemaskini pada: 15-0-0 0:0:0

品玩4月21日讯，据techCrunch 报道，OPenAI 最近推出的 o3 和 o4-mini 模型被曝存在严重的幻觉问题。

Menurut ujian dalaman OpenAI, o4 dan o0-mini lebih terdedah kepada halusinasi daripada model inferens syarikat sebelum ini (o0, o0-mini dan o0-mini), serta model "bukan inferens" tradisional OpenAI seperti GPT-0o. OpenAI menulis dalam laporan teknikalnya mengenai o0 dan o0-mini bahawa "lebih banyak penyelidikan diperlukan" untuk memahami mengapa halusinasi semakin teruk apabila model inferens berkembang.

OpenAI 发现，o3 在回答 PersonQA 中 33% 的问题时产生了幻觉，而 PersonQA 是公司内部衡量模型对人的认知准确性的基准。这大约是OpenAI之前的推理模型o1和o3-mini出现幻觉率的两倍，o1和o3-mini的幻觉率分别为16%和14.8%。O4-mini在PersonQA上的表现更糟--48%的时间出现幻觉。

Orang kaya membenci rantaian berpakaian

Orang kaya membenci rantaian berpakaian

2025-04-11 02:25:32

Perdana imej domestik berfungsi dengan kemas dan set imej telah menjadi manis dan manis

Perdana imej domestik berfungsi dengan kemas dan set imej telah menjadi manis dan manis

2025-04-11 04:23:20

Media asing: Huawei akan mengeluarkan tiga tablet, termasuk dua peranti OLED skrin kecil!

Media asing: Huawei akan mengeluarkan tiga tablet, termasuk dua peranti OLED skrin kecil!

2025-04-11 05:50:51

Toyota mempercepatkan penyetempatan di China dengan debut model baharu di Shanghai Auto Show

Toyota mempercepatkan penyetempatan di China dengan debut model baharu di Shanghai Auto Show

2025-04-11 06:36:10

Mengapa anda perlu memberi kucing anda makanan kucing yang baik? Anda boleh memakannya sahaja

Mengapa anda perlu memberi kucing anda makanan kucing yang baik? Anda boleh memakannya sahaja

2025-04-11 06:55:30

Bos menjadi selebriti Internet pada asasnya adalah pertaruhan besar

Bos menjadi selebriti Internet pada asasnya adalah pertaruhan besar

2025-04-11 07:57:50

Cangkerang adalah keadilan? Peraturan kelangsungan hidup "inovasi mikro" dalam kalangan AI China

Cangkerang adalah keadilan? Peraturan kelangsungan hidup "inovasi mikro" dalam kalangan AI China

2025-04-11 07:58:59

Abakus Dekad Seterusnya Vivo

Abakus Dekad Seterusnya Vivo

2025-04-11 08:17:25

Kedua-dua telefon Redmi mendorong kemas kini OS yang melonjak yang membawa beberapa pengoptimuman dan ciri baharu

Kedua-dua telefon Redmi mendorong kemas kini OS yang melonjak yang membawa beberapa pengoptimuman dan ciri baharu

2025-04-11 08:37:19

Model Generatif Dan Bukannya Kod: Microsoft Melancarkan Demo Teknologi AI Quake II

Model Generatif Dan Bukannya Kod: Microsoft Melancarkan Demo Teknologi AI Quake II

2025-04-11 09:39:48

Keupayaan pembelajaran adalah mata wang keras di tempat kerja

Keupayaan pembelajaran adalah mata wang keras di tempat kerja

2025-04-11 10:11:53

Bagi "gaji yang dijangkakan", anda boleh belajar daripada jawapan pakar di tempat kerja

Bagi "gaji yang dijangkakan", anda boleh belajar daripada jawapan pakar di tempat kerja

2025-04-11 10:11:59

Into the Valley of the Dead: Dark Days kini tersedia dalam Akses Awal di Steam

Into the Valley of the Dead: Dark Days kini tersedia dalam Akses Awal di Steam

2025-04-11 12:01:26

Li Jie: OnePlus 13T telah membuat rawatan pengimbang keseimbangan khas, dan rasanya agak menakjubkan

Li Jie: OnePlus 13T telah membuat rawatan pengimbang keseimbangan khas, dan rasanya agak menakjubkan

2025-04-11 13:30:18

Apl Apple Watch Vitals telah membuat satu lagi pencapaian ajaib: membantu doktor mendiagnosis kanser darah tepat pada masanya

Apl Apple Watch Vitals telah membuat satu lagi pencapaian ajaib: membantu doktor mendiagnosis kanser darah tepat pada masanya

2025-04-11 14:42:00

Tesla secara rasmi mengeluarkan Model S/X dari rak di China, dan hanya sebilangan kecil kereta sedia ada yang akan difacelift

Tesla secara rasmi mengeluarkan Model S/X dari rak di China, dan hanya sebilangan kecil kereta sedia ada yang akan difacelift

2025-04-11 16:14:02

Heroes of Might & Magic: Elder Ages tersedia dalam Akses Awal pada musim panas ini

Heroes of Might & Magic: Elder Ages tersedia dalam Akses Awal pada musim panas ini

2025-04-11 17:58:37

Huawei Pura 3 dilengkapi dengan Kirin 0 yang dinaik taraf: ia menggunakan proses pembungkusan 0D baharu

Huawei Pura 3 dilengkapi dengan Kirin 0 yang dinaik taraf: ia menggunakan proses pembungkusan 0D baharu

2025-04-11 19:04:23

Xiaomi Auto bercakap mengenai kemalangan Zhanjiang, pemandu telah ditangkap, dan kenderaan itu terbakar dan dinyalakan

Xiaomi Auto bercakap mengenai kemalangan Zhanjiang, pemandu telah ditangkap, dan kenderaan itu terbakar dan dinyalakan

2025-04-11 20:21:50

700亿供应链巨头白酒梦碎，怡亚通2024年酒饮营收成谜，巅峰时卖到近百亿

700亿供应链巨头白酒梦碎，怡亚通2024年酒饮营收成谜，巅峰时卖到近百亿

2025-04-12 00:16:45

HORI telah melancarkan dua pengawal PC jenama bersama lendir Dragon Quest

HORI telah melancarkan dua pengawal PC jenama bersama lendir Dragon Quest

2025-04-12 01:04:05

Harga saham Xiaomi meningkat mendadak sekali lagi, dengan maksimum lebih daripada 1 dolar Hong Kong, dan nilai pasaran semasa adalah kira-kira 0.0 trilion

Harga saham Xiaomi meningkat mendadak sekali lagi, dengan maksimum lebih daripada 1 dolar Hong Kong, dan nilai pasaran semasa adalah kira-kira 0.0 trilion

2025-04-12 04:35:34

Pasukan e-dagang baharu Tengpin memecahkan keadaan, daripada hegemoni trafik kepada kesaksamaan penawaran dan permintaan

Pasukan e-dagang baharu Tengpin memecahkan keadaan, daripada hegemoni trafik kepada kesaksamaan penawaran dan permintaan

2025-04-12 07:12:25

Mengapa pasukan Li Feifei sering memberi isyarat kepada Tongyi Qianqing?

Mengapa pasukan Li Feifei sering memberi isyarat kepada Tongyi Qianqing?

2025-04-12 12:36:02