Baru-baru ini, syarikat permulaan AI Rumi mendedahkan penemuan baharu tentang model OpenAI. Dilaporkan bahawa dalam model o4 dan o0-mini OpenAI, penyelidik mengesan kehadiran aksara Unicode khas seperti ruang bukan baris baru yang sempit (NNBSP).
Watak khas ini hampir tidak dapat dilihat dalam penggunaan harian dan tidak dapat dibezakan daripada ruang biasa, tetapi kod uniknya didedahkan di bawah alat tertentu seperti SoSciSurvey atau Sublime Text. Gambar yang menunjukkan hasil pengesanan watak ini telah diedarkan di Internet dan menarik banyak perhatian.
Rumi menegaskan bahawa tetapan khas ini tidak wujud dalam model OpenAI terdahulu seperti GPT-4o. Watak-watak ini boleh dialih keluar dengan operasi "cari dan ganti" yang mudah, yang telah membawa kepada spekulasi dalam industri sama ada OpenAI sengaja menanam watak-watak ini sebagai tera air.
Walaupun kaedah pengesanan watak ini sangat tepat, kelemahannya yang mudah dipintas tidak boleh diabaikan. Kemungkinan lain ialah penggunaan aksara ini mematuhi peraturan tipografi, seperti menghalang pemisahan baris antara simbol mata wang dan jumlah atau inisial, yang mungkin merupakan tabiat yang dipelajari oleh model daripada sejumlah besar data semasa latihan.
事实上,OpenAI 在水印技术方面一直有所探索。早在 2024 年初,OpenAI 就曾在 DALL・E 3 图像中添加了 C2PA 元数据作为水印。而在 2025 年 4 月,GPT-4o 模型上也曾测试过可见的“ImageGen”标签。
Dalam industri, kepentingan kebolehkesanan kandungan menjadi semakin menonjol. Langkah-langkah seperti SynthID Google, pembenaman metadata Microsoft dan teg mandatori meta semuanya mencerminkan trend ini. Walau bagaimanapun, penyelidikan menunjukkan bahawa banyak teknologi tanda air sedia ada terdedah, dan cara mencari keseimbangan antara melindungi hak harta intelek dan memastikan pengalaman pengguna masih merupakan masalah mendesak untuk diselesaikan oleh industri.