开源生图模型Ideogram 4.0发布，优化文字排版功能

Ideogram 发布 9.3B 开源文生图模型

人工智能初创公司 Ideogram 近日发布了 Ideogram 4.0 开放权重文生图模型。该模型核心参数规模为 9.3B（ 93 亿）。业内测试数据显示，其在当前开源图像生成 AI 中性能表现靠前。

模型采用单流架构，文本与图像标志（tokens）在同一个自注意力序列中直接融合。底层架构接入了 Qwen3-VL-8B-Instruct 文本编码器，配合 34 层单流扩散 Transformer（DiT）与 Euler 流匹配采样器。这一结构重点优化了图像内的文字绘制能力。模型能够输出清晰准确的长文本，有效减少字母错乱与拼写错误，成品可直接用于海报与封面排版。