你最关心的问题
关于 Gemma 4 你需要了解的一切。
Gemma 4 基于 Apache 2.0 开源协议发布,提供完全的开发者自由——你可以商业使用、修改,并在任何地方部署,没有任何限制性障碍。
E2B 和 E4B 模型可在移动设备上运行(Android 手机、树莓派、NVIDIA Jetson Orin Nano)。26B MoE 和 31B Dense 模型可在消费级游戏显卡(量化版本)或单张 80GB H100/A100 GPU(fp16)上运行。
Gemma 4 是可以下载并在自有硬件上运行的开放权重模型,基于与 Gemini 3 相同的研究技术构建。Gemini 是通过 API 访问的 Google 专有模型。Gemma 4 非常适合隐私保护、离线使用和模型微调场景。
Gemma 4 31B 在 Arena AI 开源排行榜中位列第 3,表现超过参数量是其 20 倍的模型。虽然 GPT-4o 等闭源模型在原始能力上可能仍领先,但在可本地运行的模型中,Gemma 4 提供了无与伦比的单参数性能。
26B MoE(混合专家)每次推理只激活 3.8B 参数,推理速度更快、延迟更低。31B Dense 激活全部参数,提供最高的原始质量,是最佳的微调基础模型。
可以。所有 Gemma 4 模型都原生支持处理图像和视频。E2B 和 E4B 边缘模型还额外支持原生音频输入,可用于语音识别和理解。
Gemma 4 在超过 140 种语言上进行了原生训练,在多语言问答测试 MMMLU 中获得 85.2% 的高分。训练数据涵盖多元化的语言内容,具备强大的多语言理解能力。
模型权重可从 Hugging Face(google/gemma-4 集合)、Kaggle、Ollama(ollama pull gemma4)、LM Studio 和 Docker Hub(ai/gemma4)下载。也可在 Google AI Studio 中即时试用 26B 和 31B 模型。