উহান বিশ্ববিদ্যালয়ে "আমি প্রাচীন বই স্কুলে এআই ব্যবহার করি" ক্রিয়াকলাপের দ্বিতীয় পর্যায়টি চালু করা হয়েছিল: এআই দ্রুত প্রাচীন গ্রন্থগুলিকে স্বীকৃতি দেয় এবং হাজার হাজার প্রাচীন বইয়ের সংস্থান বিনামূল্যে এবং উন্মুক্ত
এই তারিখে আপডেট করা হয়েছে: 50-0-0 0:0:0

এআই প্রযুক্তির দ্রুত বিকাশ প্রাচীন বইয়ের দক্ষতা এবং প্রচারকে উন্নত করছে।

3月26日,“我用AI校古籍——我是‘校书官’古籍大众智能整理计划(2025年)”启动仪式暨“古籍数字化前沿论坛”在武汉大学召开。活动由全国高等院校古籍整理研究工作委员会、北京大学数字人文研究中心和字节跳动公益联合主办,将征集全国高校大学生和社会公众,利用“识典古籍”整理平台,共同参与古籍数字化整理工作。

'আই ইউজ এআই স্কুল এনসিয়েন্ট বুকস'-এর উদ্বোধনী অনুষ্ঠানে গ্রুপ ছবি। ছবি/অনুষ্ঠানের আয়োজক

启动仪式上,字节跳动公益相关负责人介绍了活动的整体规划。本次活动面向对古籍整理感兴趣的高校大学生和社会上的古籍整理爱好者开放,覆盖春季(3月26日—5月31日)、夏季(7月1日—8月20日)、秋季(9月22日—11月30日)三个阶段,分为初阶和进阶两类任务。初阶组参与“识典古籍”自动古籍文字识别(OCR)结果的文字校对,进阶组负责文字精校和标点校对等高阶任务。目前已有22所院校承办,参与者将获得实践证书、徽章、校书俑周边等奖励。

[1] এআই প্রাচীন বইয়ের সংমিশ্রণ এবং দক্ষ ব্যবহারের ক্ষমতা দেয়

'রিডিং এনসিয়েন্ট বুকস'-এর মঞ্চে এই কার্যক্রম পরিচালিত হবে। প্ল্যাটফর্মটি বাইটড্যান্সের এআই প্রযুক্তি সুবিধা, পণ্য গবেষণা এবং বিকাশের ক্ষমতা এবং পিকিং বিশ্ববিদ্যালয়ের ডিজিটাল হিউম্যানিটিস রিসার্চ সেন্টারের একাডেমিক ক্ষমতাগুলিকে একত্রিত করে এবং শব্দ বিভাজন পুনরুদ্ধার এবং এআই সহকারীর পাশাপাশি স্বয়ংক্রিয় প্রাচীন বইয়ের পাঠ্য স্বীকৃতি (ওসিআর) এবং স্বয়ংক্রিয় বিরামচিহ্নের মতো প্রাচীন বইয়ের বাছাই ফাংশন রয়েছে, যা কার্যকরভাবে প্রাচীন বইয়ের পড়া, বোধগম্যতা, গবেষণা এবং ব্যবহারের দক্ষতা উন্নত করতে পারে। প্ল্যাটফর্মটি বিনামূল্যে জনসাধারণের জন্য উন্মুক্ত, এবং 16000 টিরও বেশি প্রাচীন বইয়ের সংস্থান চালু করা হয়েছে এবং কয়েক মিলিয়ন লোক প্ল্যাটফর্মের মাধ্যমে প্রাচীন বইগুলি পড়েছে এবং ব্যবহার করেছে।

এই ক্রিয়াকলাপে, অংশগ্রহণকারীরা প্রাচীন বইয়ের ছবিগুলির উপর ভিত্তি করে কৃত্রিম বুদ্ধিমত্তা দ্বারা স্বয়ংক্রিয়ভাবে উত্পন্ন পাঠ্য এবং বিরামচিহ্নগুলি প্রুফরিড করার জন্য "প্রাচীন বই পড়া" এর প্রাচীন বই বাছাই ফাংশনটির সম্পূর্ণ ব্যবহার করবে। প্রতিবেদন অনুসারে, "প্রাচীন বই" স্বয়ংক্রিয় স্বীকৃতি প্রক্রিয়ায় অনিশ্চিত পাঠ্যকে রঙিন চিহ্নিত করতে পারে, সমস্যা হতে পারে এমন পাঠ্য এবং চিত্রের অবস্থানগুলি দ্রুত সনাক্ত করতে পারে, স্বয়ংক্রিয়ভাবে ব্যক্তিগত নাম, স্থানের নাম, বইয়ের শিরোনাম, সময়, কর্মকর্তা এবং অন্যান্য সত্তার নাম দিতে পারে এবং ডিজিটাল সংকলন নোট লেখার সমর্থন করতে পারে। প্রকৃত ব্যবহার থেকে প্রতিক্রিয়া অনুযায়ী, "প্রাচীন বই পড়া" এর এআই প্রযুক্তি বেশ কয়েকবার প্রাচীন বই বাছাইয়ের দক্ষতা উন্নত করতে পারে।

"প্রাচীন বই পড়া" সংকলন প্ল্যাটফর্মের স্ক্রিনশট। ছবি/অনুষ্ঠানের আয়োজক

"এআই প্রযুক্তি কেবল প্রাচীন বইয়ের পাঠ্য এবং চিত্রগুলি স্ক্যান এবং সনাক্ত করবে না, তবে সামগ্রীটি আরও প্রক্রিয়া করতে বড় মডেল ব্যবহার করবে, যেমন বিরামচিহ্ন যুক্ত করা এবং পাঠ্যে যথাযথ বিশেষ্যগুলি সনাক্ত করতে সক্ষম হওয়া, যা প্রাচীন বইয়ের সংগঠনকে আরও দক্ষ এবং মানসম্মত করে তোলে। পিকিং বিশ্ববিদ্যালয়ের ডিজিটাল হিউম্যানিটিস রিসার্চ সেন্টারের পরিচালক ওয়াং জুন জিপাই নিউজকে দেয়া এক সাক্ষাৎকারে এ কথা বলেন।

[2] এআই প্রাচীন বই বাছাইয়ের "শ্রেণিবদ্ধ সহযোগিতা" সহায়তা করে

প্রাচীন বইয়ের ডিজিটালাইজেশন দক্ষতা উন্নত করার পাশাপাশি, এআই প্রযুক্তির আশীর্বাদ প্রাচীন বইয়ের সংকলনে অংশ নেওয়ার প্রান্তিকতাও কমিয়ে দিয়েছে, যা সাধারণ কলেজ শিক্ষার্থী এবং এমনকি সামাজিক উত্সাহীদের দ্বারা অংশ নিতে পারে। ওয়াং জুনের মতে, ম্যানুয়াল অংশগ্রহণ প্রধানত তিনটি স্তরে বিভক্ত: প্রথম স্তরটি পাবলিক বাছাই। যখন এআই স্টেরিওটাইপড পাঠ্য প্রুফরিড করে, তখন এর স্বীকৃতি 98% নির্ভুলতায় পৌঁছতে পারে। তবে হাতে লেখা পাঠ্যের ক্ষেত্রে স্বীকৃতির নির্ভুলতা কিছুটা কম হতে পারে। এআই যে শব্দগুলি অনিশ্চিত তা হাইলাইট করা হবে এবং এআই দ্বারা স্বীকৃত পাঠ্যটি সঠিক কিনা তা নিশ্চিত করার জন্য চিত্রের মূল শব্দগুলির তুলনা করার জন্য একটি মানবিক হস্তক্ষেপ প্রয়োজন।

দ্বিতীয় স্তরটি পেশাদার পর্যালোচনা, যদি পাঠ্যটি একটি বৈকল্পিক হয় এবং শব্দটি ফন্ট লাইব্রেরিতে অন্তর্ভুক্ত না হয় তবে এআইও এটি চিহ্নিত করবে। পেশাদারদের দ্বারা আরও চিহ্নিতকরণ এবং প্রক্রিয়াকরণ পাঠ্যের যথার্থতা এবং সম্পূর্ণতা নিশ্চিত করে।

তৃতীয় স্তরটি প্রাচীন বইয়ের বিশেষজ্ঞ। প্রাচীন বইগুলি কেবল আঞ্চলিক দলিল নয়, উপভাষা, বিশেষ লেখার বিন্যাস এবং বিভিন্ন রাজবংশ এবং বিন্যাসে প্রাচীন বইগুলিও সর্বব্যাপী।

এই ক্রিয়াকলাপটি অংশগ্রহণকারীদের জন্য পেশাদার এবং পদ্ধতিগত ব্যবহারিক প্রশিক্ষণ প্রদান করবে এবং বাছাইয়ের জন্য আধুনিক জীবন এবং আধুনিক শৃঙ্খলা ব্যবস্থার সাথে ঘনিষ্ঠভাবে সম্পর্কিত প্রাচীন বইগুলি নির্বাচন করবে। কাজটি অগ্রসর হওয়ার সাথে সাথে অংশগ্রহণকারীদের হার্ভার্ড-ইয়েনচিং সংগ্রহ, দুনহুয়াং ডকুমেন্টস, ইয়ংলে ক্যানন ইত্যাদির মতো দুর্দান্ত প্রভাব এবং সাংস্কৃতিক মূল্য সহ প্রাচীন বইগুলির সাথে যোগাযোগ করার এবং গভীরভাবে বোঝার সুযোগ থাকবে এবং প্রুফরিডিং প্রক্রিয়ায় প্রাচীন বইগুলিতে থাকা সংস্কৃতি এবং জ্ঞান সম্পর্কে শিখতে হবে।

"আমি একটি 'স্কুল স্ক্রিভেনার' প্রাচীন বই পাবলিক বুদ্ধিমান বাছাই পরিকল্পনা" দ্বিতীয় অধিবেশনে অনুষ্ঠিত হয়েছে, এবং 1643 বছরে অনুষ্ঠিত প্রথম ইভেন্টটি 0 কলেজ ছাত্রদের সাইন আপ করতে এবং 0 প্রাচীন বইগুলি সাজানোর জন্য আকৃষ্ট করেছিল। অংশগ্রহণকারীদের মধ্যে বেশিরভাগই স্নাতক শিক্ষার্থী ছিল, যার মধ্যে চীনা ভাষা ও সাহিত্য, ইতিহাস এবং অন্যান্য প্রাচীন বইয়ের শিক্ষার্থীরা ছিল। এআই প্রযুক্তির আশীর্বাদে অনেক মেডিকেল এবং ফিনান্স শিক্ষার্থী এবং এমনকি সমাজের সদস্যরাও এতে যোগ দিয়েছেন। এই ক্রিয়াকলাপটি প্রাচীন বই পড়ার জন্য কলেজের শিক্ষার্থী এবং সামাজিক উত্সাহীদের চাহিদা পূরণ করেছিল, প্রাচীন বইগুলি বাছাইয়ের জন্য থ্রেশহোল্ডকে হ্রাস করেছিল এবং প্রাচীন বইয়ের ডিজিটালাইজেশনকে প্রচার করেছিল।

作为此次活动的主办方之一,字节跳动公益从2021年6月起就开始通过公益捐赠助力古籍修复,并持续投入技术、平台资源来开展古籍数字化与活化。2022年10月,由字节跳动公益联合北京大学数字人文研究中心共建的“识典古籍”平台上线,为整理和阅读古籍提供了便捷渠道。此外,字节跳动公益还通过“寻找古籍守护人”“识典杯·古籍内容创意季”等活动,推出《穿越时空的古籍》纪录片、《重回永乐大典》短剧等方式推动古籍活化,让古籍更好地走向大众。

জিউপাই নিউজের প্রতিবেদক লি কাই

সম্পাদনা করেছেন ওয়াং জিয়াকিং এবং লি ইয়াং

অনুগ্রহ করে উইচ্যাটে প্রতিবেদকের সাথে যোগাযোগ করুন: লিংঘাওজিঝে