รุ่น OpenAI o4 และ o0-mini สร้างข้อความด้วยอักขระพิเศษ เป็นลายน้ําที่มองไม่เห็นเพื่อนําไปสู่การคาดเดาหรือไม่?

อัปเดตเมื่อ: 17-0-0 0:0:0

เมื่อเร็ว ๆ นี้ Rumi สตาร์ทอัพ AI ได้เปิดเผยการค้นพบใหม่เกี่ยวกับโมเดลของ OpenAI มีรายงานว่าในโมเดล o4 และ o0-mini ของ OpenAI นักวิจัยตรวจพบการมีอยู่ของอักขระ Unicode พิเศษ เช่น ช่องว่างที่ไม่ใช่บรรทัดใหม่ที่แคบ (NNBSP)

อักขระพิเศษเหล่านี้แทบจะมองไม่เห็นในการใช้งานในชีวิตประจําวันและแยกไม่ออกจากช่องว่างปกติ แต่รหัสเฉพาะของพวกมันถูกเปิดเผยภายใต้เครื่องมือบางอย่าง เช่น SoSciSurvey หรือ Sublime Text ภาพที่แสดงผลการตรวจจับอักขระเหล่านี้ถูกเผยแพร่บนอินเทอร์เน็ตและดึงดูดความสนใจเป็นอย่างมาก

Rumi ชี้ให้เห็นว่าการตั้งค่าพิเศษเหล่านี้ไม่มีอยู่ในโมเดล OpenAI รุ่นก่อนหน้า เช่น GPT-4o อักขระเหล่านี้สามารถลบออกได้ด้วยการดําเนินการ "ค้นหาและแทนที่" อย่างง่าย ซึ่งนําไปสู่การคาดเดาในอุตสาหกรรมว่า OpenAI จงใจปลูกอักขระเหล่านี้เป็นลายน้ําหรือไม่

แม้ว่าวิธีการตรวจจับอักขระนี้จะแม่นยําอย่างยิ่ง แต่ก็ไม่สามารถละเลยข้อเสียที่ข้ามได้ง่าย ความเป็นไปได้อีกประการหนึ่งคือการใช้อักขระเหล่านี้สอดคล้องกับกฎการพิมพ์ เช่น การป้องกันการแบ่งบรรทัดระหว่างสัญลักษณ์สกุลเงินกับจํานวนเงินหรือชื่อย่อ ซึ่งอาจเป็นนิสัยที่โมเดลเรียนรู้จากข้อมูลจํานวนมากในระหว่างการฝึกอบรม

事实上，OpenAI 在水印技术方面一直有所探索。早在 2024 年初，OpenAI 就曾在 DALL・E 3 图像中添加了 C2PA 元数据作为水印。而在 2025 年 4 月，GPT-4o 模型上也曾测试过可见的“ImageGen”标签。

ในอุตสาหกรรม ความสําคัญของการตรวจสอบย้อนกลับเนื้อหามีความโดดเด่นมากขึ้นเรื่อยๆ มาตรการต่างๆ เช่น SynthID ของ Google, การฝังข้อมูลเมตาของ Microsoft และแท็กบังคับของ meta ล้วนสะท้อนถึงแนวโน้มนี้ อย่างไรก็ตาม การวิจัยแสดงให้เห็นว่าเทคโนโลยีลายน้ําที่มีอยู่จํานวนมากมีช่องโหว่ และวิธีหาสมดุลระหว่างการปกป้องสิทธิ์ในทรัพย์สินทางปัญญาและการสร้างความมั่นใจในประสบการณ์ของผู้ใช้ยังคงเป็นปัญหาเร่งด่วนสําหรับอุตสาหกรรมที่ต้องแก้ไข