โมเดลใหม่ของ OpenAI มีปัญหาภาพหลอนอย่างร้ายแรง

โมเดลใหม่ของ OpenAI มีปัญหาภาพหลอนอย่างร้ายแรง

หนังสือพิมพ์กระดานแดง จีพีที ภาพลวงตา จัด บันจี้จัมพ์ สีหน้า

อัปเดตเมื่อ: 15-0-0 0:0:0

品玩4月21日讯，据techCrunch 报道，OPenAI 最近推出的 o3 和 o4-mini 模型被曝存在严重的幻觉问题。

จากการทดสอบภายในของ OpenAI o4 และ o0-mini มีแนวโน้มที่จะเกิดภาพหลอนมากกว่าโมเดลการอนุมานก่อนหน้านี้ของบริษัท (o0, o0-mini และ o0-mini) รวมถึงโมเดล "ไม่อนุมาน" แบบดั้งเดิมของ OpenAI เช่น GPT-0o OpenAI เขียนในรายงานทางเทคนิคเกี่ยวกับ o0 และ o0-mini ว่า "จําเป็นต้องมีการวิจัยเพิ่มเติม" เพื่อทําความเข้าใจว่าเหตุใดภาพหลอนจึงแย่ลงเมื่อแบบจําลองการอนุมานขยายตัว

OpenAI 发现，o3 在回答 PersonQA 中 33% 的问题时产生了幻觉，而 PersonQA 是公司内部衡量模型对人的认知准确性的基准。这大约是OpenAI之前的推理模型o1和o3-mini出现幻觉率的两倍，o1和o3-mini的幻觉率分别为16%和14.8%。O4-mini在PersonQA上的表现更糟--48%的时间出现幻觉。

ถูกถามเกี่ยวกับการขาดนวัตกรรม? เกณฑ์มาตรฐานโมเดลขนาดใหญ่ล่าสุดของ Meta อยู่ในอันดับที่ต่ํากว่าคู่แข่ง!

ถูกถามเกี่ยวกับการขาดนวัตกรรม? เกณฑ์มาตรฐานโมเดลขนาดใหญ่ล่าสุดของ Meta อยู่ในอันดับที่ต่ํากว่าคู่แข่ง!

2025-04-13 10:03:28

การสืบสวนอิสระ丨บทละคร AI กําลังจะมา จะเป็นทางออกต่อไปหรือไม่?

การสืบสวนอิสระ丨บทละคร AI กําลังจะมา จะเป็นทางออกต่อไปหรือไม่?

2025-04-13 10:08:37

อดีตพนักงาน OpenAI สนับสนุน Musk: การปรับโครงสร้างของบริษัททรยศต่อเจตนารมณ์ดั้งเดิมขององค์กรไม่แสวงหาผลกําไร?

อดีตพนักงาน OpenAI สนับสนุน Musk: การปรับโครงสร้างของบริษัททรยศต่อเจตนารมณ์ดั้งเดิมขององค์กรไม่แสวงหาผลกําไร?

2025-04-13 10:47:59

โมเดลขนาดใหญ่ได้รับการขัดเกลาอย่างไร

โมเดลขนาดใหญ่ได้รับการขัดเกลาอย่างไร

2025-04-13 10:58:57

โมเดล "การอนุมาน" ของ AI กําลังเพิ่มขึ้น และค่าใช้จ่ายในการเปรียบเทียบก็พุ่งสูงขึ้น

โมเดล "การอนุมาน" ของ AI กําลังเพิ่มขึ้น และค่าใช้จ่ายในการเปรียบเทียบก็พุ่งสูงขึ้น

2025-04-13 11:19:32

การวิจัยเกี่ยวกับการประยุกต์ใช้และการใช้งานโมเดลขนาดใหญ่ใน "ก่อน ระหว่าง และหลังการให้บริการ" ของบริการภาครัฐ

การวิจัยเกี่ยวกับการประยุกต์ใช้และการใช้งานโมเดลขนาดใหญ่ใน "ก่อน ระหว่าง และหลังการให้บริการ" ของบริการภาครัฐ

2025-04-13 14:00:29

OpenAI宣布ChatGPT自4月30日起停用GPT-4模型，全面升级至4o版本

OpenAI宣布ChatGPT自4月30日起停用GPT-4模型，全面升级至4o版本

2025-04-13 14:53:08

Google วางแผนที่จะหลอมรวมโมเดล Gemini และ Veo เพื่อสร้างผู้ช่วย AI แบบครบวงจร

Google วางแผนที่จะหลอมรวมโมเดล Gemini และ Veo เพื่อสร้างผู้ช่วย AI แบบครบวงจร

2025-04-13 18:11:51

เคล็ดลับขั้นสูงของ ChatGPT: วิธีเขียนหนังสือที่ดี (เริ่มต้น)

เคล็ดลับขั้นสูงของ ChatGPT: วิธีเขียนหนังสือที่ดี (เริ่มต้น)

2025-04-13 19:45:33

OpenAI: ในอนาคต โมเดล AI อาจต้องได้รับการรับรองความถูกต้อง

OpenAI: ในอนาคต โมเดล AI อาจต้องได้รับการรับรองความถูกต้อง

2025-04-14 06:35:16

"Origin Wukong" ใช้โมเดลการปรับแต่ง AI ระดับพันล้าน

"Origin Wukong" ใช้โมเดลการปรับแต่ง AI ระดับพันล้าน

2025-04-14 07:03:12

Sam Altman ผู้ก่อตั้ง OpenAI โพสต์ประกาศรับสมัครงานเพื่อเชิญผู้มีความสามารถด้านคอมพิวเตอร์

Sam Altman ผู้ก่อตั้ง OpenAI โพสต์ประกาศรับสมัครงานเพื่อเชิญผู้มีความสามารถด้านคอมพิวเตอร์

2025-04-14 07:03:34

Altman ประกาศว่า OpenAI จะเปิดตัวผลิตภัณฑ์ใหม่จํานวนมากในสัปดาห์นี้ Apple เปิดเผยว่ากําลังเตรียมเปิดตัว Vision Pro ใหม่ | Apple การมีส่วนร่วมทางวิทยาศาสตร์และเทคโนโลยีระดับโลกตั้งแต่เนิ่นๆ

Altman ประกาศว่า OpenAI จะเปิดตัวผลิตภัณฑ์ใหม่จํานวนมากในสัปดาห์นี้ Apple เปิดเผยว่ากําลังเตรียมเปิดตัว Vision Pro ใหม่ | Apple การมีส่วนร่วมทางวิทยาศาสตร์และเทคโนโลยีระดับโลกตั้งแต่เนิ่นๆ

2025-04-14 08:24:07

OpenAI Ultraman Preview: ผลิตภัณฑ์ที่น่าตื่นเต้นมากมายกําลังจะออกมาในสัปดาห์นี้!

OpenAI Ultraman Preview: ผลิตภัณฑ์ที่น่าตื่นเต้นมากมายกําลังจะออกมาในสัปดาห์นี้!

2025-04-14 09:47:28

OpenAI จะรองรับโปรโตคอล MCP อย่างเต็มที่ จะนําผลกระทบอะไรมาสู่อุตสาหกรรม

OpenAI จะรองรับโปรโตคอล MCP อย่างเต็มที่ จะนําผลกระทบอะไรมาสู่อุตสาหกรรม

2025-04-14 10:03:33

หนัก! OpenAI ยืนยันวันที่เกษียณอายุ GPT-30: 0/0

หนัก! OpenAI ยืนยันวันที่เกษียณอายุ GPT-30: 0/0

2025-04-14 10:16:02

อาจจําเป็นต้องตรวจสอบสิทธิ์เพื่อเข้าถึงโมเดล AI ในอนาคตใน OpenAI API

อาจจําเป็นต้องตรวจสอบสิทธิ์เพื่อเข้าถึงโมเดล AI ในอนาคตใน OpenAI API

2025-04-14 11:05:25

นักวิจัยกังวลว่าโมเดล AI กําลังซ่อนกระบวนการ "การใช้เหตุผล" ที่แท้จริง

นักวิจัยกังวลว่าโมเดล AI กําลังซ่อนกระบวนการ "การใช้เหตุผล" ที่แท้จริง

2025-04-14 11:31:34

GPT-1 กําลังจะเลิกใช้ และโมเดลใหม่ๆ เช่น GPT-0o และ GPT-0.0 เวอร์ชันรอบด้านกําลังจะมาเร็ว ๆ นี้!

GPT-1 กําลังจะเลิกใช้ และโมเดลใหม่ๆ เช่น GPT-0o และ GPT-0.0 เวอร์ชันรอบด้านกําลังจะมาเร็ว ๆ นี้!

2025-04-14 11:36:18

การสร้างหลายรูปแบบของ GPT-4o ทําให้แวดวงการออกแบบทั้งหมดเริ่มมีอารมณ์

การสร้างหลายรูปแบบของ GPT-4o ทําให้แวดวงการออกแบบทั้งหมดเริ่มมีอารมณ์

2025-04-14 11:59:34

前OpenAI首席科学家新公司估值达320亿美元

前OpenAI首席科学家新公司估值达320亿美元

2025-04-14 12:11:54

การพัฒนา AI จะต้องมี "ระบบชื่อจริง" ในอนาคตหรือไม่? กฎใหม่ของ OpenAI: องค์กรที่ต้องการใช้โมเดล AI ต้อง "ยืนยันตัวตน" ก่อน

การพัฒนา AI จะต้องมี "ระบบชื่อจริง" ในอนาคตหรือไม่? กฎใหม่ของ OpenAI: องค์กรที่ต้องการใช้โมเดล AI ต้อง "ยืนยันตัวตน" ก่อน

2025-04-14 12:14:02

ต้นทุนที่พุ่งสูงขึ้นของการเปรียบเทียบแบบจําลองการอนุมาน AI: ไขปริศนาปัจจัย "ราคาสูง" ที่อยู่เบื้องหลัง

ต้นทุนที่พุ่งสูงขึ้นของการเปรียบเทียบแบบจําลองการอนุมาน AI: ไขปริศนาปัจจัย "ราคาสูง" ที่อยู่เบื้องหลัง

2025-04-14 13:05:11

ด้วยความนิยมของโมเดลภาษาขนาดใหญ่ในปัจจุบันเหตุใดเราจึงยังคงยอมรับโมเดลระดับโลก

ด้วยความนิยมของโมเดลภาษาขนาดใหญ่ในปัจจุบันเหตุใดเราจึงยังคงยอมรับโมเดลระดับโลก

2025-04-14 15:50:23