Meta推出Llama 4全新多模态模型 直追GPT-4o、Gemini 2.0
更新于:2025-04-09 12:08:24

Meta宣布推出全新一代大型自然语言处理模型Llama 4,并将推出两款主要版本:Llama 4 Scout和Llama 4 Maverick,并预告即将推出更大规模的Llama 4 Behemoth及提高推论性能的Llama 4 Reasoning。

Llama 4 Scout配备了170亿个参数 (109B总参数, 17B活跃参数),对应16种专业领域推论,主要针对文件内容摘要、用户行为分析及个性化互动等场景进行优化。相比之下,Llama 4 Maverick同样拥有170亿个参数 (400B总参数, 17B活跃参数),且对应128种专业领域推论,进一步强化了多语言理解、推论及长文内容分析的能力,适用于数字助理服务及聊天机器人等应用。两者都提供高效的推论速度,支持单GPU部署,并能在不同网络架构下灵活运行。

Llama 4 Maverick在编码、推论及图像基准测试的表现上,甚至能与OpenAI的GPT-4o和Google的Gemini 2.0竞争,并且在推论及编码处理方面,表现接近DeepSeek v3.1。

Llama 4新模型采用了混合专家架构(Mixture of Experts, MoE)尽早期融合技术,使Llama 4具备处理多模态的能力,不仅能理解文本,还能处理图像,为用户带来更全面的AI服务。MoE架构通过智能选择激活少量参数来进行推论,从而实现更快的反应速度和更低的运算成本。例如Llama 4 Scout在处理请求时,可能只会激活17亿参数中的一部分,而不会启动整个170亿参数的模型,这样可以大大提升计算效率。MoE模型能够有效地分配不同专家来处理不同类型的问题,无论是编程、创意写作还是其他复杂任务,这使得Llama 4在应对各种挑战时表现出色。

Llama 4目前已经在Cloudflare Workers AI平台推出,用户也可通过LLama官网、Hugging Face托管网站使用。开发者可以立即使用Llama 4 Scout进行各种应用开发。这样的平台支持使开发者无需担心基础设施、硬件或内存问题,直接通过API调用即可实现Llama 4的强大功能。

Meta同时宣布,未来将推出参数规模更为庞大的Llama 4 Behemoth,这款模型将拥有高达2880亿个参数,将与其他大型AI模型竞争,推动更多高性能应用的实现。Meta还将在5月推出Llama 4 Reasoning,这将进一步提升推论性能,具体细节预计会在首届LlamaCon开发者活动中公布。

数据源:Cloudflare

AI医生看病靠谱吗?
AI医生看病靠谱吗?
2025-03-26 23:06:56