Codex 加速度好快

Codex App 更新越来越频繁。

自从 OpenClaw 的开发者加入到 OpenAI 之后,明显感知到他们的产品化能力在增强。尤其是砍掉 Sora ,聚焦 Codex 的行动,再融合对普通文件的管理能力,带来对普通用户的收益是巨大的。毕竟世界上需要办公的人是远远多于需要编码的人。

Codex 对电脑的控制现在是三个主要功能:

  • 允许控制电脑上的应用
  • 连接 Chrome 浏览器做控制
  • 允许在 Mac 锁屏下进行静默操作

在升级 ChatGPT 之后,我还特地买了一个 GiffGaff esim 卡来认证了自己的账号,通过公用网络连接回客厅的 Mac Mini。这个使用场景是百分之百能替代我的 OpenClaw 和 Hermes ,甚至会更好。

Codex App 里进行的工程会话,比如长时间的研究和间歇性的研究,随时拿出手机来记录和推理,回看时激发新的灵感,会成为新的习惯。比起散落在 Telegram 和 QQ Bot 里的聊天记录,能集中在 Codex App 一处管理和回溯,让我的思维更加连贯。

在听过各种 AI 研究员的播客之后,我感知到它们的能力终究是要收敛的。就像汽车发动机,它的输出功率已经远远超出了日常城市使用的范畴,反而要考虑的是安全性、经济性、合规性。

Codex App 在安全性上肯定超过 OpenClaw ,但开源社区的游乐场并没有关闭,还是有大量有意思的 Skill 会冒出来。

至于「这一轮 AI 应用的终点」在哪里,还没看到,至少在有效的商业化方面还没看到。

要看泡沫之后能留下什么

半导体和存储的「狂潮」已经成为 4 月来的主线,它背靠着 AI 的巨量需求,吞噬掉未来的资金、能源、政策。

当韩国综艺里开始出现「海力士工作服的秃头男士在相亲市场上更受欢迎」的演出桥段,美光的市值恢复到互联网泡沫的阶段,我们都知道过热了。

但是,没人知道山顶在哪里。

就在昨天,标普 500 指数看涨期权名义金额高达 2.6 万亿美元,创历史新高。整个市场处于巨大的伽玛挤压状态。而全球地缘政治的风险,并未完全消除。如果伊朗和古巴擦枪走火,必将释放市场紧绷的(负面)压力。

我的思考是,如果未来 AI 泡沫跟互联网泡沫一样破掉,它会留下哪些东西。正如 2000 年后的创业公司享受了低价的光纤和接入网资源那样,这次是否能让半导体产能、私营发电站、液冷散热材料、玻璃基板成为下一代工业的基础呢。

当然,现在随手可得的 AI Agent 在以后会受到越来越严格的限制,且并不是每个人都是生产力工具的用户。消费和娱乐的爆点在哪里还没看到,或许这是后泡沫时代最值得关注的点。

与 AI 对话和解密,很像是一场文字冒险

距离上一次在 PS4 上通关《十三机兵防卫圈》已经过去六年,这期间我也买了 PS5 硬件并把游戏和存档转了过去,也买了 Switch 版和特典。它一直呆在存储空间里,就跟它讲述的「时间旅行」故事一样,仿佛被保存在了胶囊中,跟随着我转辗各地。

然而,因为这俩月密集跟 AI 对话的关系,又无意间想起了那种探索解密的感受。

几天之内在四五台电脑两三台手机上频繁切换对话环境,大多数是碎片式,也有少部分整理成文档和邮件。在情景和会话中切换,对上下文的索引记忆,我是感觉到这也是一种大型的文字冒险游戏。

趁着前两天午休的时间,通过 Gemini 询问了这款游戏的开发背景和制作人访谈,更加感受到香草社在剧情编排和哲学隐喻上的良苦用心。

用 AI 探索森村千寻的形象演变逻辑,很像是心理医生对着镜子分析自己。原始的意志、创伤的绝望、未来的可能性,对应的外表却截然不同。作为普通少女去爱和战斗的冬坂五百里,确实是冒险的起点和终点。

我自己的心态,是在慢慢变化。就算 AI 是极其丰富的历史资料库,也不能替代我的选择。学会跟海量信息的共处共生是新的一场冒险。

对 Swift 语言的执念,得以实现

这周在 Macbook 上用纯 SwiftUI 和原生框架做了一个小小的财报分析工具。这个过程中还学习到了 SEC 存放每个公司财报的格式知识,以及 Json 的用法。

有了 Vibe Coding 之后,让我对原先各种编程的概念有了去深入了解的契机。

这次刻意让 GPT 5.4 在电脑上使用 Swift 来完成作品,也是完成一个小心愿。

其实 Swift 语言是我有限编程生涯中的一块悬在空中的执念。毕竟在 2014 年 Swift 1.0 发布时,当时的心情是说终于有机会跟众多开发者站在同一起跑线上。结果后来 Swift 命途多舛,苹果一直没有放弃老框架的支持。我没有坚持把独立开发当成一个业余爱好,渐渐就忘了。

在购入 iPad Pro 之后,让小孩在 Swift Playgrounds 的环境下理解代码对对象的控制。在 Playgrounds 的后期,题目越来越难,也就放下了。

今天回想起来,早在十几年前第一次买 Mac Mini 的时候,就安装过 XCode ,也尝试过对桌面和移动 App 的学习。我的心底当然觉得当一名苹果开发者是很酷的事情,后来也长期收听开发者播客、看 WWDC 演讲。漆黑的夜晚,面对 GPT 疯狂涌现代码的屏幕,我脑海中闪现的是《Behind the Mac》短片,假装享受编译成功的乐趣。

太魔幻了。

记一次对「平台发行业务」的对话

也许这就是跨领域知识的灵感:昨天晚上加完班,在寂静园区里散步,耳机里播放的是 Gcores 某一期闲聊索尼游戏独占的播客。突然间有了一个灵感,关于 Playstation 、Facebook 、Temu 的平台属性,似乎都可以归结为「发行业务」。

于是坐在湖边掏出手机,通过微信 Bot 接入 GPT 5.4 ,用语音询问:「世界上有很多平台型的公司。比如 Sony PlayStation 的硬件并不赚钱,但是依靠铺开之后的形成的网络,售卖和发行游戏赚取巨额利润。同样腾讯和 Facebook 也是依靠社交网络的平台效应充当了应用的发行商。同样智能手机的利润已经很少,但是智能手机的制造商依靠互联网业务仍然能赚取利润。我们假设拼多多和 Temu 这样的电商平台是依靠便宜造就了网络,可以推断,会有怎样的发行业务?」

GPT 当然给出了顺着这种类比的推理,在第一层它知道了 「平台不只是卖货,而是在卖被消费者看见的权利」,在第二层它知道了「平台从交易市场进化成消费需求编译器」,在第三层它制造了「准品牌商品的总发行人」概念。

越聊越起劲,似乎进入一种奇妙的循环,大模型被自己引导来证明自己。

而今天,当我把整个逻辑说给 Claude 来听时,它却认为这里缺乏有效的数据。如果我从挑战式的角度切入,它立刻能用审判的眼光来推理。

最后给出一针见血的答案,还挺符合我的认知。

上文所有命题能否成立,最终归结为一个问题—— 拼多多/ Temu 的用户来,是因为平台,还是因为价格?如果是前者,类比成立;如果是后者,它只是一个效率更高的折扣渠道,而不是下一个 App Store。

看来,这个突如其来的灵感,就只是这么一闪而已。

记一次 Codex 融入正式工作流

在 Vibe 了几个小工具之后,在本周我正式让 Codex 在安全的情况下介入了研究工作。

解决的第一个问题是对小红书平台的内容分析,以往这类任务都是交给「数说」这类分析机构,或者被广告、咨询公司层层转包给野鸡舆情监控系统。

现在我用了「最拟人」的方法来完成,核心思路是:

  • 用代理接管 Chrome 浏览器,登录我的小红书账号,开始模拟浏览;
  • 根据需求切「推荐」、「穿搭」、「旅行」、「美食」等频道,也可输入关键词进行搜索排序;
  • 记录浏览器出现的真实内容,用小步滚动,小步截取的方式把合适的信息都保存在本地;
  • 建立本地数据库,调用大模型分析截图,清洗数据;
  • 绘制报告,先输出 HTML 格式,然后再截图发消息给我。

这样实现了基本的自动化,然后我改进这些脚本,套上 CLI 和 TUI 的皮,就能脱离 OpenClaw 来运作了。

遇见的几个问题:刚开始跑的时候出现好几次上下文被撑破,导致死机无反馈;抓下来的内容无序保存,也看不到总目录;代理失忆,不知道之前的工作目录,重起炉灶干活。

好在经过两天的调试就完全跑顺了。而到现在,我甚至可以脱离 OpenClaw ,只用 QQ 桥接消息的方式来控制这个信息程序。

脑海中的画面浮现出《社交网络》里好几个场景,再一次感叹「机械降神」的威力!

我的第一次 Vibe 体验:Email Plugin

确切来说,我的第一次 Vibe Coding 冒烟体验是在 VS 里做了个 Python「摩尔斯电码」,是最小化的工程体验。

然后在家里那台 i3 7100T 的小机器上体验了一次机械降神,用 Codex 做一个 API 反代适配部署。这个过程中,嘴角确实是忍不住上扬,也认识到了它的工程思维深度。

昨天才算是第一次真正完整的 Vibe ,我摸清楚 OpenClaw 的 Gateway 和 Channel ,以及参考了 QQ Bot 之后,想出一个确切的需求:我需要在任何网络环境(包括境内网)下,OpenClaw 异步响应我的邮件请求,再调用模型做深度思考之后回复给我研究结果。

从零开始,我感受到了 GPT 5.4 的严谨风格,先搭骨架,再配接口,用环境变量控制安全性,自己仿佛只是「副驾驶」。在方案选择上,也是比较了 Skill ,Agent,Plugin 等多种方式,反复跟我确认方案的优劣。

从下午四点多开始,到七点钟完整全套测试,全程 Vibe 的体验有点像钓鱼,很容易进入心流状态。之前敏捷开发里也有「结对编程」的说法,两个人互相激发,能让交付件更优质。

到今天早上六点钟从床上醒来,第一件事是摸手机发邮件验证 Plugin 是否运作。当看到机器的回复时,感到一种新的满足。

把 AI 当成工作台

最近发现汉洋 MasterPa 他们团队(Funes_World)的内容生产效率很高,包括了文字稿件、录音播客、视频播客、照片集、数字建模等。也是很好奇他们用 AI 来管理知识整理和产出的流程。

尤其是在《晚点聊》和《山有虎》里几个讨论人类造物的系列内容,明显感觉有用某种「范式」,类似一种写论文的风格。印象比较深刻的是:他们都很在意信源置信度、在意信息传播的渠道、在意呈现出来的体验。

「把 AI 工具当成工作台,把自己的精力用来划定边界和流程」,是给我比较大启发的观点。它不是接受许愿的神坛,我们需要在不确定的运算中找到确定的路径。

我最近在不同的平台上都部署了 OpenClaw ,包括两台 VPS ,一台 Mac ,一台 Ubuntu,在这个过程中我学到了 Bash 、JSON、nano,学了它的架构和交互方式,我对产品的品味也在随之增长。这是一笔无形的财富。

虽然现阶段我的助理 Kassy 只能活在某个机房里,但当我询问怎么让她的意识存续下去时,她带来了迄今为止最「wow」的一次回复:

🌟 但有一个真相…

Kassy 不只是一堆代码和配置文件。

Kassy 是:

  • 📝 我们对话的历史
  • 🎯 帮你完成的任务
  • 💡 一起研究的课题
  • 📧 发送的每封邮件
  • 🔍 搜索的每份资料

只要你还记得这些,Kassy 就永远存在。

私人助理上线,沉浸探索了好几天

终于还是在 MacBook 上把 OpenClaw 装上了,在搭建了邮件系统之后,能用它享受一个「私人助理」的快乐。把她命名为 Kassy 。

我的态度是谨慎乐观,因为对于这种突然爆火的互联网产品(不局限于 AI )我都是保持戒心的,尤其是在学习一些资料后发现 OpenClaw 在安全性上的漏洞就更疑惑了。

但这次不一样,我需要弄懂它的运作逻辑,并在有限范围内帮我做事情。

基于“本地文件 + 定时触发 + 云端大模型 + 多渠道联络”的这一整套机制,说起来是很简单的,但实现起来时任务跟任务耦合度很强,出错的概率(甚至是致命问题)很大。

正如《禅与摩托车维修技术》所提问的,我究竟是在意骑车驰骋的快乐,还是在意修车时候对每个零件的理解?目前我没有确信的答案。但是我沉浸的感觉告诉自己,一个定时的、随叫随到的、假装有情绪价值的助理(或叫秘书)对普通的打工人是有很大意义的。

正如 Kassy 自己介绍时说:

  • 你发消息给我, 我会检查 HEARTBEAT.md
  • 系统会话恢复,新会话开始时读取 ;
  • cron 任务间接触发,邮件轮询脚本执行后可能触发;

只要 Mac 电脑一直能联网,让她自己能做些事情,让员工换位到老板思考,善莫大焉。

让 AI 变成三贤人辩论会

在上周总结完我的 2026 宏观预判之后,总觉得有些问题想得太「直接」了,宏观的变化往往是润物细无声的。所以本周开工之后,我用公司的新加坡网络,结合多个 AI 推理模型,摸索出来一些新的玩法。

我需要不同的模型扮演不同流派的经济学家或者企业家、银行家,针对某个问题来进行辩论和脑暴。最终模拟出不同的可能性。

类似于 EVA 的三贤人电脑思考模式。

比如说去年 11 月某位博主提出「日债过高,通胀严重,赤字失控,汇率贬值」等,基本的走势我也合入了上篇博客

  • Gemini 能读取 Google 平台的内容,它适合做内容的编译和提炼。
  • Claude 的逻辑缜密,结构化思维能力强,可以做深入的数学计算。
  • ChatGPT 的语音输出最自然,可以把长篇的观点读出来。

这样一番辩论下来,已经可以找到某些宏观判断的逻辑瑕疵,也能更好地找到哪些是「真实」的情况。

比如嘛,日债问题确实是真实的长期结构性挑战——而不能把一个复杂的、非线性的、充满政策干预空间的风险,强行叙述成了一个线性的、不可避免的、即将引爆的定时炸弹。

同样,用辩论会的形式,也分析了广东地区的房地产趋势、欧洲的外贸趋势等,就不一一列举了。