软件的 3D 打印时代来了 | AI精英周刊 038
用 Codex 一天之内从零做出了一个可日常使用的 Mac 语音输入 App。这不是 demo,是真正能用的产品。这件事验证了一个更大的趋势:个人工具型软件正在进入「3D打印时代」,工具的所有权正在从软件商回归到个人手中。但造软件的门槛不是编程,是系统思维。
一天做了个 App,然后我意识到一件事
前两天我遇到一个很具体的问题:Mac 上的语音输入工具,要么准确率不够,要么会擅自改写我说的话,要么隐私策略不透明。
市面上的选择不少。Wispr Flow 体验不错但不够稳定,Typeless 识别能力强但会「替你做主」—— 它觉得你想说的和你实际说的不一样。
我的需求很简单:按住说话,松开上屏,别改我的原文。
所以我做了一件以前不太可能做的事:让 Codex 从零帮我写一个。
从 2 月 18 号开始,到 19 号,一天时间。产出的不是一个 demo,而是一个我用了一整天的 Mac App —— VerbatimFlow。支持全局热键、多引擎切换(Apple 语音识别、本地 Whisper、OpenAI 云端)、术语词典、失败录音重试。按住说话,松开转写,能用。
语音输入只是一个例子。同样的模式可以套在很多场景上——文件格式转换、数据清洗、工作流自动化、信息整理。这些事情以前你得找现成工具,现在你可以让 AI 按你的需求从零搭一个。
做完 VerbatimFlow 之后我意识到一个更大的问题:
如果我一天就能造出一个自己满意的语音输入工具,那我为什么还要去买别人的?
软件的 3D 打印时代
这让我想到 3D 打印。
以前你想要一个手机壳,你得去买。有工厂专门生产手机壳,有品牌做设计,有渠道做分销。整个产业链因为一个手机壳而存在。
但如果 3D 打印机成本足够低、普及率足够高,每个人都能打印出自己想要的手机壳——那生产手机壳的工厂就没有存在的必要了。
当然,3D 打印普及了十多年,并没有真的消灭工厂。因为实物制造有材料强度、生产效率和一致性的硬约束。但软件不一样。软件的边际复制成本是零,不存在「材料」瓶颈。一旦 AI 能帮你写出来,你就直接拥有了它,不需要「生产线」。
所以我觉得,软件领域的变化会比 3D 打印激进得多。
2026 年,不管是 Codex 还是 Claude Code,AI 编程工具的能力已经到了一个临界点:一个有想法的人,不需要会写代码,一天之内可以做出一个可用的软件产品。不是玩具,不是概念验证,是真正能日常使用的东西。
这意味着什么?
个人工具型软件的所有权,正在从软件商回归到个人手中。
以前的软件产业有三层:基础设施(云服务、操作系统)、中间层(各种 SaaS 产品、工具软件)、终端用户。中间层是最厚的,也是最赚钱的——你付月费用某个语音输入工具,付订阅费用各种 AI Wrapper,每个月给十几个 SaaS 产品交租。
但如果终端用户可以自己造工具呢?
你想要一个语音输入工具?让 AI 帮你做一个。你想要一个特定的数据看板?让 AI 帮你做一个。你想要一个适合你工作流的自动化脚本?让 AI 帮你写一个。
当然,不是所有软件都会被替代。Figma 的价值不是画图功能,是团队实时协作和设计生态;Salesforce 的护城河不是 CRM 界面,是几十年积累的客户数据和业务流程;医疗和金融软件卖的不只是功能,还有合规认证和法律责任。这些靠网络效应、数据壁垒和合规门槛建立的产品,不会因为你能自己写代码就消失。
但那些「帮你解决某个具体问题」的工具型软件呢?语音输入、文件转换、数据清洗、笔记整理、自动化脚本——这一整个品类,正在失去存在的必要。
我们很可能进入这样一个格局:底层是基础设施——算力、模型能力、数据;顶层是用户自己用 AI 造的东西;中间那一层工具型软件,会越来越薄。

将来我们买的不是工具软件,我们买的是算力、模型能力和数据。
不是编程门槛,是系统思维门槛
但我不想给你一个「人人都能做 App」的错觉。
VerbatimFlow 这个项目,我全程没有写一行代码。但我做的事情比写代码难得多。
举个例子。
当我想要兼顾速度和准确率的时候,我自然想到了云端模型。但云端模型意味着我的语音数据要传出去——那隐私怎么办?
所以我同时保留了本地 Whisper 引擎。本地的好处是隐私安全,坏处是准确率和速度都差一点。
那如果用户选择了云端模型,隐私怎么保障?我的判断是:传输链路必须加密(OpenAI API 本身就是 HTTPS),而 OpenAI 的服务器我选择信任——只要数据在传输过程中不被窃听,这是一个合理的隐私权衡。
这个决策过程跟编程一点关系都没有。它是系统架构师的思维:你在做权衡、画边界、定义什么可以接受、什么不可以。
再比如,macOS 的权限系统是个大坑。你以为给了权限就能用,但实际上系统把权限绑在「应用身份」上,不是你看到的「同名 App」上。每次重新构建,签名变了,系统就认为你是另一个应用,之前的权限全部失效。
这种问题,你不踩进去根本不知道。但你需要有一种能力——在使用过程中敏锐地抓到问题在哪,然后知道该怎么描述它、怎么让 AI 去解决它。
还有热键的状态机问题。用户按住说话、松开停止——听起来简单得不能再简单。但实际上 macOS 的键盘事件偶尔会丢失,导致「按下后不释放」。我们试了纯事件驱动,不行;试了单信号 watchdog,也不稳。最后用了双信号源交叉验证加防抖机制,才稳定下来。
回过头看,功能开发的时间远不到一半,大部分精力花在了稳定性和回归治理上。
这就是「从 demo 到产品」的真实距离。AI 能帮你写代码,但不能替你做这些判断。
这跟你有什么关系
你可能不需要做一个语音输入 App。但你一定有某个「现有工具不够好」的场景。
以前的解法是:忍着用,或者花时间找替代品。
现在的解法是:你可以自己造一个。
不是说你明天就能做出一个复杂的商业级应用。但一个解决你自己具体问题的工具——一个适合你工作流的自动化脚本、一个按你的规则整理信息的小工具、一个你一直想要但市面上没有的桌面应用——这些事情的门槛已经低到了一天。
关键不在于你会不会编程。关键在于你能不能想清楚这几件事:
- 你要解决的真问题是什么(不是「我要一个语音输入工具」,而是「我要忠实转写,不要替我改写」)
- 你能接受什么权衡(速度 vs 准确率、隐私 vs 便利、稳定性 vs 功能丰富度)
- 你怎么判断它够用了(不是功能最多,而是核心场景稳定可用)
这些能力有一个名字:系统思维。
它不是编程课教你的。它是你在反复做决策、做权衡、踩坑复盘的过程中练出来的。我在 MAPS 课程 里把这套方法论拆解过——不是教你写代码,而是教你怎么想清楚问题、怎么跟 AI 协作把想法变成可用的系统。
工具型软件的 3D 打印时代已经来了。打印机越来越便宜、越来越强。但决定你能「打印」出什么的,从来不是打印机的性能,是你脑子里的设计图。

VerbatimFlow 的完整复盘文档(包括架构设计、踩坑记录和验收标准)我放在了 AI 精英圈里。把这份文档交给 AI,你就能复刻出一个几乎一样的语音输入工具。
本期推荐
这篇说的"系统思维比编程重要",MAPS 课程不教写代码,教的是怎么想清楚问题、怎么跟 AI 协作把想法变成可用的系统。
→ 看看 MAPS 课程
Responses