Fase kedua dari kegiatan "Saya Menggunakan AI untuk Sekolah Buku Kuno" diluncurkan di Universitas Wuhan: AI dengan cepat mengenali teks kuno, dan puluhan ribu sumber daya buku kuno gratis dan terbuka
Diperbarui pada: 50-0-0 0:0:0

Pesatnya perkembangan teknologi AI meningkatkan efisiensi dan promosi buku-buku kuno.

3月26日,“我用AI校古籍——我是‘校书官’古籍大众智能整理计划(2025年)”启动仪式暨“古籍数字化前沿论坛”在武汉大学召开。活动由全国高等院校古籍整理研究工作委员会、北京大学数字人文研究中心和字节跳动公益联合主办,将征集全国高校大学生和社会公众,利用“识典古籍”整理平台,共同参与古籍数字化整理工作。

Foto bersama pada upacara peluncuran "I Use AI School Ancient Books". Penyelenggara Foto/Acara

启动仪式上,字节跳动公益相关负责人介绍了活动的整体规划。本次活动面向对古籍整理感兴趣的高校大学生和社会上的古籍整理爱好者开放,覆盖春季(3月26日—5月31日)、夏季(7月1日—8月20日)、秋季(9月22日—11月30日)三个阶段,分为初阶和进阶两类任务。初阶组参与“识典古籍”自动古籍文字识别(OCR)结果的文字校对,进阶组负责文字精校和标点校对等高阶任务。目前已有22所院校承办,参与者将获得实践证书、徽章、校书俑周边等奖励。

[1] AI memberdayakan pengumpulan dan penggunaan buku kuno yang efisien

Kegiatan akan dilakukan di platform "Membaca Buku Kuno". Platform ini menggabungkan keunggulan teknologi AI ByteDance, kemampuan penelitian dan pengembangan produk, dan kemampuan akademik Pusat Penelitian Humaniora Digital Universitas Peking, dan memiliki fungsi membaca seperti pengambilan segmentasi kata dan asisten AI, serta fungsi penyortiran buku kuno seperti pengenalan teks buku kuno otomatis (OCR) dan tanda baca otomatis, yang secara efektif dapat meningkatkan efisiensi membaca, memahami, penelitian, dan pemanfaatan buku kuno. Platform ini terbuka untuk umum secara gratis, dan lebih dari 16000 sumber daya buku kuno telah diluncurkan, dan ratusan juta orang telah membaca dan menggunakan buku kuno melalui platform.

Dalam kegiatan ini, peserta akan memanfaatkan sepenuhnya fungsi penyortiran buku kuno "Membaca Buku Kuno" untuk mengoreksi teks dan tanda baca yang dihasilkan secara otomatis oleh kecerdasan buatan berdasarkan gambar buku kuno. Menurut laporan, "Buku Kuno" dapat menandai teks yang tidak pasti dalam proses pengenalan otomatis, dengan cepat menemukan lokasi teks dan gambar yang mungkin bermasalah, secara otomatis menyebutkan nama pribadi, nama tempat, judul buku, waktu, pejabat, dan entitas lain, dan mendukung penulisan catatan kolase digital. Menurut umpan balik dari penggunaan aktual, teknologi AI "Membaca Buku Kuno" dapat meningkatkan efisiensi penyortiran buku kuno beberapa kali.

Tangkapan layar dari platform pengumpulan "Membaca Buku Kuno". Penyelenggara Foto/Acara

"Teknologi AI tidak hanya akan memindai dan mengenali teks dan gambar dalam buku kuno, tetapi juga menggunakan model besar untuk memproses konten lebih lanjut, seperti menambahkan tanda baca, dan dapat mengenali kata benda yang tepat dalam teks, yang membuat organisasi buku kuno lebih efisien dan terstandarisasi." Wang Jun, direktur Pusat Penelitian Humaniora Digital Universitas Peking, mengatakan dalam sebuah wawancara dengan Jiupai News.

[2] AI membantu "kolaborasi hierarkis" penyortiran buku kuno

Selain meningkatkan efisiensi digitalisasi buku-buku kuno, berkah teknologi AI juga telah menurunkan ambang batas untuk berpartisipasi dalam pengumpulan buku-buku kuno, yang dapat diikuti oleh mahasiswa biasa dan bahkan penggemar sosial. Menurut Wang Jun, partisipasi manual terutama dibagi menjadi tiga lapisan: lapisan pertama adalah penyortiran publik. Ketika AI mengoreksi teks stereotip, pengenalannya dapat mencapai akurasi 98%. Namun, untuk teks tulisan tangan, akurasi pengenalan mungkin sedikit lebih rendah. Kata-kata yang AI tidak pasti akan disorot, dan intervensi manusia diperlukan untuk membandingkan kata-kata asli pada gambar untuk mengonfirmasi apakah teks yang dikenali oleh AI akurat.

Lapisan kedua adalah tinjauan profesional, jika teksnya adalah varian dan kata tersebut tidak termasuk dalam perpustakaan font, AI juga akan menandainya. Penandaan dan pemrosesan lebih lanjut oleh para profesional memastikan keakuratan dan kelengkapan teks.

Lapisan ketiga adalah ahli dalam buku-buku kuno. Buku-buku kuno mencakup semua, tidak hanya dokumen regional, tetapi juga buku-buku kuno dalam dialek, format penulisan khusus, dan dinasti dan tata letak yang berbeda.

Kegiatan ini akan memberikan pelatihan praktis yang profesional dan sistematis bagi peserta, serta memilih buku-buku kuno yang erat kaitannya dengan kehidupan modern dan sistem disiplin modern untuk penyortiran. Seiring berjalannya tugas, peserta juga akan memiliki kesempatan untuk berhubungan dan mendapatkan pemahaman mendalam tentang buku-buku kuno dengan pengaruh dan nilai budaya yang besar, seperti Koleksi Harvard-Yenching, Dokumen Dunhuang, Yongle Canon, dll., dan belajar tentang budaya dan kebijaksanaan yang terkandung dalam buku-buku kuno dalam proses proofreading.

"Saya adalah 'penulis sekolah' rencana penyortiran cerdas publik buku" telah diadakan hingga sesi kedua, dan acara pertama yang diadakan dalam 1643 tahun menarik 0 mahasiswa untuk mendaftar dan memilah 0 buku kuno. Di antara para peserta, sebagian besar dari mereka adalah sarjana, termasuk siswa jurusan bahasa dan sastra Cina, sejarah dan buku-buku kuno lainnya. Dengan restu teknologi AI, banyak mahasiswa kedokteran dan keuangan dan bahkan anggota masyarakat juga bergabung. Kegiatan tersebut memenuhi kebutuhan mahasiswa dan penggemar sosial untuk membaca buku-buku kuno, menurunkan ambang batas untuk memilah buku-buku kuno, dan mempromosikan digitalisasi buku-buku kuno.

作为此次活动的主办方之一,字节跳动公益从2021年6月起就开始通过公益捐赠助力古籍修复,并持续投入技术、平台资源来开展古籍数字化与活化。2022年10月,由字节跳动公益联合北京大学数字人文研究中心共建的“识典古籍”平台上线,为整理和阅读古籍提供了便捷渠道。此外,字节跳动公益还通过“寻找古籍守护人”“识典杯·古籍内容创意季”等活动,推出《穿越时空的古籍》纪录片、《重回永乐大典》短剧等方式推动古籍活化,让古籍更好地走向大众。

Jiupai News reporter Li Kai

Diedit oleh Wang Jiaqing dan Li Yang

Silakan hubungi reporter di WeChat: linghaojizhe