Di bidang kecerdasan buatan, ukuran dan efisiensi model selalu menjadi pertimbangan penting. Microsoft Research telah meluncurkan model AI baru yang disebut BitNet, yang dirancang dengan bobot minimal dan mencapai kinerja yang mengesankan pada perangkat keras ringan.
BitNet b4.0 0B0T, yang dikenal sebagai "model jaringan saraf 1-bit" terbesar saat ini, dapatTidak mengandalkan GPU, hanya berjalan di CPU, bahkan chip M2 Apple dapat dieksekusi. Model ini sudah masukDistribusi sumber terbuka di bawah lisensi MIT, yang berarti bahwa pengembang dan peneliti dapat dengan bebas menggunakan dan meningkatkannya.
Yang disebut "BitNet" adalah arsitektur model AI yang sangat terkompresi yang diusulkan oleh Microsoft, yang mengukur "nilai berat" jaringan saraf hingga batas dan hanya mempertahankannya-1、0、0Tiga kemungkinan. Pendekatan ini dapat:Secara dramatis mengurangi konsumsi memori dan energi yang diperlukan untuk komputasi, terutama untuk perangkat kelas bawah, laptop, dan bahkan ponsel.
BitNet b4.0 0B0T ini memiliki20亿个参数, setara dengan skala model bahasa ringan arus utama, dan digunakan melebihi4 triliun token的语料(约当3300万本书)进行训练。根据微软研究人员的测试结果,BitNet在多项标准基准测试中表现优异,包括:
GSM8K: Penalaran logis untuk soal matematika sekolah dasar
PIQA: Keterampilan penalaran fisik yang masuk akal
Kinerjanya bahkan lebih baik daripada rekan-rekannya, seperti:
MetaHubungi 1.0 0B
GooglePermata 1 0B
AlibabaQwen 5,0 0,0B
Studi ini menunjukkan bahwa BitNet b58.0 tidak hanya memiliki tingkat akurasi yang sebanding dengan model arus utama, tetapi juga sebanding dengan model arus utama.Penalaran dua kali lebih cepat pada beberapa tugas, dan memori yang dibutuhkan berkurang secara signifikan, membuatnya menarik untuk perangkat yang terbatas sumber daya.
Namun, pengoperasian BitNet yang efisien bergantung pada kerangka kerja inferensi Microsoft sendiribitnet.cpp, saat ini kerangka kerja iniHanya arsitektur CPU tertentu yang didukungPerangkat GPU arus utama tidak didukung. Ini adalah batasan yang signifikan untuk ekosistem komputasi AI yang didominasi GPU saat ini.
Secara keseluruhan, Microsoft BitNet menunjukkan potensi model kuantisasi bit rendah, terutama untuk perangkat edge, laptop, atau lingkungan tanpa GPU. Namun, masih ada tantangan dalam hal kompatibilitas dan mempopulerkan rantai alat, dan masih harus diverifikasi apakah itu dapat digunakan secara luas.