Meta推出Llama 4全新多模态模型直追GPT-4o、Gemini 2.0

meta 十轮网科技资讯 gpt gemini 模型谷歌开源被谷歌深吸模态泄密 opus 超越马斯克上下文 mini

更新于：2025-04-09 12:08:24

Meta宣布推出全新一代大型自然语言处理模型Llama 4，并将推出两款主要版本：Llama 4 Scout和Llama 4 Maverick，并预告即将推出更大规模的Llama 4 Behemoth及提高推论性能的Llama 4 Reasoning。

Llama 4 Scout配备了170亿个参数 (109B总参数, 17B活跃参数)，对应16种专业领域推论，主要针对文件内容摘要、用户行为分析及个性化互动等场景进行优化。相比之下，Llama 4 Maverick同样拥有170亿个参数 (400B总参数, 17B活跃参数)，且对应128种专业领域推论，进一步强化了多语言理解、推论及长文内容分析的能力，适用于数字助理服务及聊天机器人等应用。两者都提供高效的推论速度，支持单GPU部署，并能在不同网络架构下灵活运行。

Llama 4 Maverick在编码、推论及图像基准测试的表现上，甚至能与OpenAI的GPT-4o和Google的Gemini 2.0竞争，并且在推论及编码处理方面，表现接近DeepSeek v3.1。

Llama 4新模型采用了混合专家架构（Mixture of Experts, MoE）尽早期融合技术，使Llama 4具备处理多模态的能力，不仅能理解文本，还能处理图像，为用户带来更全面的AI服务。MoE架构通过智能选择激活少量参数来进行推论，从而实现更快的反应速度和更低的运算成本。例如Llama 4 Scout在处理请求时，可能只会激活17亿参数中的一部分，而不会启动整个170亿参数的模型，这样可以大大提升计算效率。MoE模型能够有效地分配不同专家来处理不同类型的问题，无论是编程、创意写作还是其他复杂任务，这使得Llama 4在应对各种挑战时表现出色。

Llama 4目前已经在Cloudflare Workers AI平台推出，用户也可通过LLama官网、Hugging Face托管网站使用。开发者可以立即使用Llama 4 Scout进行各种应用开发。这样的平台支持使开发者无需担心基础设施、硬件或内存问题，直接通过API调用即可实现Llama 4的强大功能。

Meta同时宣布，未来将推出参数规模更为庞大的Llama 4 Behemoth，这款模型将拥有高达2880亿个参数，将与其他大型AI模型竞争，推动更多高性能应用的实现。Meta还将在5月推出Llama 4 Reasoning，这将进一步提升推论性能，具体细节预计会在首届LlamaCon开发者活动中公布。

数据源：Cloudflare