品玩4月10日讯,据 Venturebeat 报道,英伟达发布了一款基于Meta公司旧型号Llama-3.1-405B-Instruct模型的全新完全开源大型语言模型Llama-3.1-Nemotron-Ultra-253B-v1。
Llama-3.1-Nemotron-Ultra-253B-v1是一个密集的2530亿个参数,旨在支持高级推理、指令跟踪和人工智能助手工作流。在今年 3 月举行的 Nvidia 年度 GPU 技术大会(GTC)上,它被首次提及。
মডেল কোডটি হাগিং ফেসে প্রকাশিত হয়েছে, ওজন এবং প্রশিক্ষণ পরবর্তী ডেটা প্রকাশ করা হয়েছে। মডেলটি "অনুমান চালু" এবং "অনুমান বন্ধ" উভয় মোডে দক্ষতার সাথে চালানোর জন্য ডিজাইন করা হয়েছে, যা বিকাশকারীদের অনুরোধ করা হলে অত্যন্ত জটিল অনুমান কার্য এবং আরও সোজা আউটপুটগুলির মধ্যে স্যুইচ করতে দেয়।