← 阅读全部文章

用 Codex 一天之内从零做出了一个可日常使用的 Mac 语音输入 App。这不是 demo，是真正能用的产品。这件事验证了一个更大的趋势：个人工具型软件正在进入「3D打印时代」，工具的所有权正在从软件商回归到个人手中。但造软件的门槛不是编程，是系统思维。

一天做了个 App，然后我意识到一件事

前两天我遇到一个很具体的问题：Mac 上的语音输入工具，要么准确率不够，要么会擅自改写我说的话，要么隐私策略不透明。

市面上的选择不少。Wispr Flow 体验不错但不够稳定，Typeless 识别能力强但会「替你做主」—— 它觉得你想说的和你实际说的不一样。

我的需求很简单：按住说话，松开上屏，别改我的原文。

所以我做了一件以前不太可能做的事：让 Codex 从零帮我写一个。

从 2 月 18 号开始，到 19 号，一天时间。产出的不是一个 demo，而是一个我用了一整天的 Mac App —— VerbatimFlow。支持全局热键、多引擎切换（Apple 语音识别、本地 Whisper、OpenAI 云端）、术语词典、失败录音重试。按住说话，松开转写，能用。

语音输入只是一个例子。同样的模式可以套在很多场景上——文件格式转换、数据清洗、工作流自动化、信息整理。这些事情以前你得找现成工具，现在你可以让 AI 按你的需求从零搭一个。

做完 VerbatimFlow 之后我意识到一个更大的问题：

如果我一天就能造出一个自己满意的语音输入工具，那我为什么还要去买别人的？

软件的 3D 打印时代

这让我想到 3D 打印。

以前你想要一个手机壳，你得去买。有工厂专门生产手机壳，有品牌做设计，有渠道做分销。整个产业链因为一个手机壳而存在。

但如果 3D 打印机成本足够低、普及率足够高，每个人都能打印出自己想要的手机壳——那生产手机壳的工厂就没有存在的必要了。

当然，3D 打印普及了十多年，并没有真的消灭工厂。因为实物制造有材料强度、生产效率和一致性的硬约束。但软件不一样。软件的边际复制成本是零，不存在「材料」瓶颈。一旦 AI 能帮你写出来，你就直接拥有了它，不需要「生产线」。

所以我觉得，软件领域的变化会比 3D 打印激进得多。

2026 年，不管是 Codex 还是 Claude Code，AI 编程工具的能力已经到了一个临界点：一个有想法的人，不需要会写代码，一天之内可以做出一个可用的软件产品。不是玩具，不是概念验证，是真正能日常使用的东西。

这意味着什么？

个人工具型软件的所有权，正在从软件商回归到个人手中。

以前的软件产业有三层：基础设施（云服务、操作系统）、中间层（各种 SaaS 产品、工具软件）、终端用户。中间层是最厚的，也是最赚钱的——你付月费用某个语音输入工具，付订阅费用各种 AI Wrapper，每个月给十几个 SaaS 产品交租。

但如果终端用户可以自己造工具呢？

你想要一个语音输入工具？让 AI 帮你做一个。你想要一个特定的数据看板？让 AI 帮你做一个。你想要一个适合你工作流的自动化脚本？让 AI 帮你写一个。

当然，不是所有软件都会被替代。Figma 的价值不是画图功能，是团队实时协作和设计生态；Salesforce 的护城河不是 CRM 界面，是几十年积累的客户数据和业务流程；医疗和金融软件卖的不只是功能，还有合规认证和法律责任。这些靠网络效应、数据壁垒和合规门槛建立的产品，不会因为你能自己写代码就消失。

但那些「帮你解决某个具体问题」的工具型软件呢？语音输入、文件转换、数据清洗、笔记整理、自动化脚本——这一整个品类，正在失去存在的必要。

我们很可能进入这样一个格局：底层是基础设施——算力、模型能力、数据；顶层是用户自己用 AI 造的东西；中间那一层工具型软件，会越来越薄。

软件产业的三层结构正在改变

将来我们买的不是工具软件，我们买的是算力、模型能力和数据。

不是编程门槛，是系统思维门槛

但我不想给你一个「人人都能做 App」的错觉。

VerbatimFlow 这个项目，我全程没有写一行代码。但我做的事情比写代码难得多。

举个例子。

当我想要兼顾速度和准确率的时候，我自然想到了云端模型。但云端模型意味着我的语音数据要传出去——那隐私怎么办？

所以我同时保留了本地 Whisper 引擎。本地的好处是隐私安全，坏处是准确率和速度都差一点。

那如果用户选择了云端模型，隐私怎么保障？我的判断是：传输链路必须加密（OpenAI API 本身就是 HTTPS），而 OpenAI 的服务器我选择信任——只要数据在传输过程中不被窃听，这是一个合理的隐私权衡。

这个决策过程跟编程一点关系都没有。它是系统架构师的思维：你在做权衡、画边界、定义什么可以接受、什么不可以。

再比如，macOS 的权限系统是个大坑。你以为给了权限就能用，但实际上系统把权限绑在「应用身份」上，不是你看到的「同名 App」上。每次重新构建，签名变了，系统就认为你是另一个应用，之前的权限全部失效。

这种问题，你不踩进去根本不知道。但你需要有一种能力——在使用过程中敏锐地抓到问题在哪，然后知道该怎么描述它、怎么让 AI 去解决它。

还有热键的状态机问题。用户按住说话、松开停止——听起来简单得不能再简单。但实际上 macOS 的键盘事件偶尔会丢失，导致「按下后不释放」。我们试了纯事件驱动，不行；试了单信号 watchdog，也不稳。最后用了双信号源交叉验证加防抖机制，才稳定下来。

回过头看，功能开发的时间远不到一半，大部分精力花在了稳定性和回归治理上。

这就是「从 demo 到产品」的真实距离。AI 能帮你写代码，但不能替你做这些判断。

这跟你有什么关系

你可能不需要做一个语音输入 App。但你一定有某个「现有工具不够好」的场景。

以前的解法是：忍着用，或者花时间找替代品。

现在的解法是：你可以自己造一个。

不是说你明天就能做出一个复杂的商业级应用。但一个解决你自己具体问题的工具——一个适合你工作流的自动化脚本、一个按你的规则整理信息的小工具、一个你一直想要但市面上没有的桌面应用——这些事情的门槛已经低到了一天。

关键不在于你会不会编程。关键在于你能不能想清楚这几件事：

你要解决的真问题是什么（不是「我要一个语音输入工具」，而是「我要忠实转写，不要替我改写」）
你能接受什么权衡（速度 vs 准确率、隐私 vs 便利、稳定性 vs 功能丰富度）
你怎么判断它够用了（不是功能最多，而是核心场景稳定可用）

这些能力有一个名字：系统思维。

它不是编程课教你的。它是你在反复做决策、做权衡、踩坑复盘的过程中练出来的。我在 MAPS 课程里把这套方法论拆解过——不是教你写代码，而是教你怎么想清楚问题、怎么跟 AI 协作把想法变成可用的系统。

工具型软件的 3D 打印时代已经来了。打印机越来越便宜、越来越强。但决定你能「打印」出什么的，从来不是打印机的性能，是你脑子里的设计图。

决定你能造出什么的，是设计图，不是打印机

VerbatimFlow 的完整复盘文档（包括架构设计、踩坑记录和验收标准）我放在了 AI 精英圈里。把这份文档交给 AI，你就能复刻出一个几乎一样的语音输入工具。

本期推荐
这篇说的"系统思维比编程重要"，MAPS 课程不教写代码，教的是怎么想清楚问题、怎么跟 AI 协作把想法变成可用的系统。
→ 看看 MAPS 课程

Axton 的 AI 实践工具箱
MAPS 课程 · 从方法论到可交付系统
精英圈 PRO · 深度实践者社群
免费入门课 · 零门槛开始

这篇文章解决了你的一个“点”

但真正的竞争力，来自于将无数个“点”连接成“系统”的能力。旗舰课程 MAPS™ 训练营 专为此而设，带你从解决零散问题，到构建一个能为你持续创造价值的AI强大引擎。

点击了解系统化解决方案

软件的 3D 打印时代来了 ｜ AI精英周刊 038

一天做了个 App，然后我意识到一件事

软件的 3D 打印时代

不是编程门槛，是系统思维门槛

这跟你有什么关系

Responses

这篇文章解决了你的一个“点”

AI 精英周刊

精英圈 PRO 会员专享 Newsletter，深度阅读、高级分享、拒绝碎片！

Join Our Free Trial

软件的 3D 打印时代来了｜ AI精英周刊 038