Free ImageGen

一个 免 API、没硬件门槛、更适合中文内容工作流的本地生图技能。

不用 GPU，不用云端图片服务，不用图片 API，也能直接生成：

📱 小红书封面
📊 小红书信息图 / 知识卡
📰 飞书 / 公众号文章图文卡组
🦞 OpenClaw 原生支持

如果你想做的是“内容表达型图片”，而不是写实大模型绘画，这个技能会比很多扩散模型更顺手。

它和扩散模型有什么不一样？

大多数文生图工具，强在：

写实感
氛围感
视觉奇观
一句话生成“看起来很厉害”的图

Free ImageGen 走的是另一条路：

✅ 免费：不按张收费，不走在线图片 API
✅ 纯本地：更适合隐私、可控、低成本工作流
✅ 没硬件门槛：不要求高配 GPU，不靠本地大模型显卡推理
✅ 中文友好：中英混排、中文标题、手机阅读都更稳
✅ 自由度高：agent 可以先判断分页、版式、风格，再交给 skill 执行
✅ 内容导向：更适合封面、信息图、图文卡组，而不是随机生成一张“好看图”

如果你要的是：

小红书封面
小红书干货图
飞书 / 公众号文章转图片
OpenClaw 的图文内容页
一整套由 agent 规划好的视觉卡组

那它通常会比扩散模型更稳、更便宜，也更适合中文内容生产。✨

先说清楚：创意来自哪里？

这套技能不会凭空替你变出“好创意”。

更准确地说：

🧠 创意来自人类
🤖 表达方案取决于 agent
🛠️ 最终落图质量，取决于 agent 对内容的理解、判断和设计能力
📦 skill 负责把这些判断稳定渲染出来

也就是说，它的价值不在“自己很聪明”，而在于：

不限制 agent 发挥
不把版式搞乱
不把中文弄坏
不要求额外硬件和图片 API

如果 agent 很强，这套技能会很强。如果 agent 判断一般，这套技能也不会替它“脑补成神图”。

这反而是它很适合 OpenClaw 的原因：

判断交给 agent
稳定执行交给 renderer

为什么它适合 OpenClaw / Agent 工作流？

因为它的分工很清楚：

👤 用户：给内容、给目标、给风格方向
🤖 agent：负责理解文章、判断分页、决定版式和表达方式
🛠️ skill：负责稳定渲染、本地导出、不乱、不重叠、不乱码

很多图片工具的问题是：

要么自由度太低，只会套模板
要么自由度太高，但不稳定

Free ImageGen 想做的是中间那条路：

让 agent 负责思考
让 renderer 负责执行

Quick Start

⚡ 1. 快速做一张封面图

python3 scripts/free_image_gen.py \
  --prompt "文字封面，标题 AI 产品设计原则，副标题 清晰层级 高识别度，主题：light，封面布局：hero_emoji_top，主视觉表情：💡" \
  --output /absolute/path/output/cover.png \
  --width 1080 \
  --height 1440

🧠 2. 快速做一张信息图

python3 scripts/free_image_gen.py \
  --prompt "信息图 机制卡 角标：三个关键点 标题：AI Agent 为什么突然火了 副标题：不是模型更强了，而是入口和体验变了 1. 门槛更低 2. 分发更广 3. 商业化更真实" \
  --output /absolute/path/output/infographic.png \
  --width 1080 \
  --height 1440

🧾 3. 给一篇文章，直接生成一整套图片

python3 scripts/free_image_gen.py \
  --prompt-file /absolute/path/article.md \
  --story-output-dir /absolute/path/output/article-story \
  --story-strategy auto \
  --width 1080 \
  --height 1440

适合先快速打草稿，看看自动拆页效果。

🪄 4. 最推荐：让 agent 自由会话后生成整套图片

这是最能发挥这套技能能力的方式。

你可以直接对 agent 说：

读完这篇文章，然后自己判断怎么分页、每页该用什么版式和风格。
我希望最终输出一套适合小红书发布的图片：
- 要有封面
- 内容忠于原文，不要写“文章里提到”这种元话语
- 该保留文章结构的页就保留
- 该转成机制卡、清单卡、对比卡的页就转
- 整体风格统一，手机阅读优先

先产出 story-plan.json，再调用 free-imagegen 渲染整套图片。

这条路的好处是：

✨ 更像 agent 在设计，而不是脚本在乱猜
✨ 更适合长文和复杂内容
✨ 更容易做出真正能发的小红书图文卡组

它特别适合什么类型的内容？

最适合：

中文标题很重的封面
知识型内容
工具盘点
工作流拆解
AI 产品观察
文章转图文卡组
OpenClaw / Agent 相关内容表达

不太适合：

写实摄影感图片
扩散模型那种细节丰富的自由绘画
局部重绘、抠图、修图

一句话说：

它更像一个面向中文内容表达的本地设计引擎，而不是一个追求视觉幻觉的扩散模型。

关于自由度

这套技能不是“只能套模板”。

你可以：

用内置版式快速做封面和信息图
让 agent 先规划整套图的分页和风格
直接让 agent 写 custom_svg 做自由创作

所以它的自由度来源不是“乱生成”，而是：

有结构时能稳
需要自由时也能放开

输出行为

默认行为已经尽量收干净了：

默认只输出 PNG
默认不额外保存 .svg
默认命名更整洁
想保留 SVG 源文件时，再显式加：--keep-svg

给 Agent 的接入资料

如果你想稳定接进 OpenClaw / Codex agent，优先看这些：

references/story-plan.schema.json
references/story-plan.template.json
references/story-plan.guide.md
references/story-plan.agent-prompt.md
references/custom-svg-best-practices.md
references/custom-svg.story-plan.sample.json

这几份文件的目标不是限制 agent，恰恰相反：

帮 agent 保持自由判断
同时让输出结构足够稳

一句话总结

如果你想要的是：

免费
纯本地
免 API
没硬件门槛
中文友好
小红书友好
agent 可控
能把文章变成一整套图

那这套技能就是为这个场景做的。🦞

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
agents		agents
references		references
scripts		scripts
.gitignore		.gitignore
README.md		README.md
SKILL.md		SKILL.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Free ImageGen

它和扩散模型有什么不一样？

先说清楚：创意来自哪里？

推荐使用场景

📱 1. 小红书封面

📊 2. 小红书信息图 / 知识卡

📰 3. 一篇文章拆成一整套图片

🎨 4. 自由创作图案 / SVG 页面

为什么它适合 OpenClaw / Agent 工作流？

Quick Start

⚡ 1. 快速做一张封面图

🧠 2. 快速做一张信息图

🧾 3. 给一篇文章，直接生成一整套图片

🪄 4. 最推荐：让 agent 自由会话后生成整套图片

它特别适合什么类型的内容？

关于自由度

输出行为

给 Agent 的接入资料

一句话总结

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Free ImageGen

它和扩散模型有什么不一样？

先说清楚：创意来自哪里？

推荐使用场景

📱 1. 小红书封面

📊 2. 小红书信息图 / 知识卡

📰 3. 一篇文章拆成一整套图片

🎨 4. 自由创作图案 / SVG 页面

为什么它适合 OpenClaw / Agent 工作流？

Quick Start

⚡ 1. 快速做一张封面图

🧠 2. 快速做一张信息图

🧾 3. 给一篇文章，直接生成一整套图片

🪄 4. 最推荐：让 agent 自由会话后生成整套图片

它特别适合什么类型的内容？

关于自由度

输出行为

给 Agent 的接入资料

一句话总结

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages