谷歌推出的全新 Gemma 模型,是首批基于双子座模型相同研究技术打造的开源 LLMs。目前仅提供 2B 和 7B 两种规格,同时为聊天应用提供基础版和指令调优版。
该模型已获得众多深度学习框架支持,其轻量化设计足以在消费级硬件上运行。
本文将剖析 Gemma 模型的核心特性。我们将发现其中部分设计突破常规,谷歌似乎从 Llama 2 和 Mistral 7B 中汲取经验,最终打造出这款优秀的 7B 模型。文章后半部分将演示 Gemma 模型的实际应用:包括 QLoRA 微调、推理部署及量化处理。
Gemma:当 7B 意味着 8.5B 时
谷歌发布了一份技术报告,提供了关于这些模型的更多细节: