DiffusionGemma 26B评测：Google开源扩散模型图像生成新选择

AI绘画 2026-06-27 5 阅读

DiffusionGemma Google 开源模型 AI绘画扩散模型

Google的Gemma开源系列在2026年6月迎来了一位新成员——DiffusionGemma 26B-A4B。与此前专注于文本生成的Gemma模型不同，DiffusionGemma是一款面向图像生成的扩散模型，标志着Google在开源AI图像领域的全新布局。

DiffusionGemma 26B核心特性

DiffusionGemma 26B基于Google最新的扩散模型架构，关键参数如下：

与原版26B模型相比，A4B量化版本在保持图像质量几乎不变的前提下，将显存需求降低至约16GB VRAM，这意味着主流游戏显卡（如RTX 4070/4080）即可流畅运行。

在真实感场景测试中，DiffusionGemma 26B表现出了令人印象深刻的光影处理能力和细节还原度。人体肤色、材质纹理、自然光照等高频细节处理得相当到位，接近Midjourney V7和DALL-E 4的水平。

一个意外的亮点是DiffusionGemma的图像内文字渲染能力。在测试中，模型能够在生成的图像中准确呈现中英文文字，这在开源图像生成工具中实属罕见。

从写实摄影到二次元插画，从3D渲染到水墨风格，DiffusionGemma的风格适应能力非常广泛。得益于26B参数规模，模型对复杂风格指令的理解远超小参数模型。

vs Stable Diffusion 4：DiffusionGemma在细节保真度上更优，但社区生态（LoRA/ControlNet）远不如SD4成熟
vs Midjourney V7：MJ在艺术感和创意性上仍领先，但DiffusionGemma开源免费
vs DALL-E 4：DALL-E在指令跟随上更强，但DiffusionGemma可本地部署无审查
vs Seedream 5.0 Pro：Seedream在图层分离和精准编辑上更专业

在RTX 4090（24GB）上运行A4B量化版本，单张1024×1024图像生成时间约3-5秒，显存占用约14GB。对于开发者来说，部署体验相当流畅。

DiffusionGemma 26B是Google在开源AI绘画领域的一步重要布局。A4B量化版本的推出降低了使用门槛，Apache-2.0协议确保了商业可用性。虽然社区生态尚不及Stable Diffusion，但其基础图像质量已经达到了第一梯队水平。

优势：高质量图像生成、A4B量化可在消费级GPU运行、Apache-2.0商用友好
不足：社区生态（LoRA/插件）仍在建设初期、中文Prompt理解有待提升