从 0 到 1 构建 Agent Skill:11 个开源项目复盘
— § 01 —- COLOPHON
- Source Serif 4 · JetBrains Mono · Forge Codex
- TOOLS
- Next 15 · MDX · framer-motion
独立开发者构建 11 个 AI Agent 工具的实战经验,从想法到发布的完整链路,包括 Claude Skill 设计模式与 Go CLI 实践
TL;DR: 过去几个月我构建了 11 个开源工具,涵盖 Claude Skill 与 Go CLI 两条线。这篇文章复盘每个项目的决策背景,提炼出可复用的设计模式。
§为什么要造这些工具
一句话:因为我自己需要。
我是一个科技博主,每周写公众号文章。每次发文章的流程是:
- ·用 Markdown 写内容
- ·手动复制到微信编辑器
- ·一点一点调格式
- ·上传封面图
- ·预览、发布
这个流程每次要花 30-60 分钟。于是我写了 md2wechat,一行命令把 Markdown 转成微信排版,直接推到草稿箱。
从此一发不可收拾。
§11 个项目的故事
Claude Skill 系列:6 个工具
md2wechat:起点项目
解决我自己的排版痛点。从 Skill 版本(给 Claude Code 用)到 Go CLI 轻量版(md2wechat-lite),迭代了两个版本。
最关键的决策是 38+ 主题。用户持续提主题需求,这个数字是需求驱动出来的。事后证明,可选主题是这个工具最大的差异化点。
agora:最复杂的项目
6 个审议室、31 位思想家、3 轮结构化辩论,一个完整的 Multi-Agent 系统。
最大的挑战在于人格设计。31 位思想家里,每一位的回答风格都要有辨识度。孙子讲势,马基雅维利讲权力,费曼讲类比,这些「性格」全靠 SKILL.md 里的角色描述来控制。
any2card:分享工具
把文章变成卡片图,方便在社交平台扩散内容。核心诉求:一键生成,不需要打开设计软件。
interactive-learning:学习工具
苏格拉底式学习路径生成器。用提问代替讲解,让用户在对话中建立认知。这是 11 个项目里唯一一个「我觉得应该存在」的工具,自己使用频率相对低。
readme-generator:文档工具
自动生成专业 README,含 16:9 信息图,底层使用 Playwright 截图。解决的问题是:开发者写代码很快,写文档很慢。
travel-guidebook:行程工具
通过并行 Agent 和高德 MCP 生成旅行手册 PDF。这个项目验证了 MCP 工具链在实际场景里的可用性。
Go CLI 系列:5 个工具
imgcli:最有挑战的项目
零 CGO 依赖做图片处理。Go 社区的图片库大多依赖 C 库(libpng、libjpeg)。选择纯 Go 实现,牺牲一点性能,换来真正的跨平台。
gcli:最实用的项目
在服务器上读邮件。听起来简单,实际上最大的坑是 OAuth。
Google 的 OAuth 流程需要浏览器,但服务器没有浏览器。解决方案:PKCE 模式加设备授权流程,用户在手机上完成授权,CLI 自动获取 token。
jina-cli:Agent 的眼睛
给 AI Agent 用的网页阅读工具。把任意 URL 转成干净的 Markdown,让 Agent 能读网页内容而不被 HTML 噪声干扰。
md2wechat-lite:轻量版本
md2wechat 的 Go 版本,不依赖 Node.js。对于只需要基础排版功能的用户,这个版本的安装成本更低。
theatre:叙事引擎
沉浸式历史叙事 Skill,见证者视角,支持多剧本。把历史事件变成第一人称体验,这是探索 AI 叙事可能性的实验项目。
§复盘:做对的事
一行安装是硬指标
安装步骤超过 3 步,大部分用户会放弃。
我的标准:README 的第一个代码块就是安装命令。不需要 clone 仓库,不需要配环境。
先给自己用,再给别人用
11 个项目里,9 个是先解决我自己的问题。自己不用的工具很难持续维护,这一点在 interactive-learning 上体现得最明显。
Go 的分发优势是真实的
单二进制文件,不需要运行时。用户不需要装 Node、Python 或任何东西。curl | bash 一步到位。
§复盘:做错的事
文档永远不够
每个项目发布后,最多的 issue 不是 bug,是「怎么用」。README 写了不代表用户会看,README 够清楚不代表 AI 能理解。
过早扩展配置项
md2wechat 的 38 个主题,其中 30 个很少有人用。早期应该先做 3 个打磨过的主题,而不是 38 个粗糙的主题。
缺少结构化测试
Agent Skill 很难写自动化测试,输出是 AI 生成的,每次都不一样。但解析逻辑和输出格式至少应该有覆盖。
§下一步
我还在持续构建新的工具。目前的方向:
- ·商业化验证:把成熟的 Skill 做成付费服务
- ·社区驱动:让用户提需求,投票决定优先级
- ·教程输出:帮助更多开发者构建自己的 Agent Skill
你可以在 技术工具一览 页面找到所有工具的安装命令和 GitHub 链接。
如果你也在做类似的事情,欢迎关注我的公众号「极客杰尼」或在 X 上找到我。
我是极客杰尼,独立开发者。每周分享 AI 实战经验。
§FAQ
问:怎么安装这些工具?
每个工具的安装方式不同。CLI 工具(imgcli、gcli 等)通过 curl | bash 安装预编译二进制;Claude Skill(md2wechat、agora 等)通过 npx skills add 安装。详细命令在每个工具的 GitHub README 首行。
问:这些工具在 Windows 上能用吗?
Go CLI 工具支持 Linux 和 macOS,暂不提供 Windows 预编译包,但可以在 WSL2 下运行。Claude Skill 系列跨平台,只要安装了 Claude Code 即可。
问:源码在哪里?
所有工具的源码都在 github.com/geekjourneyx,MIT 协议开源。
○