Codex 加速度好快

Codex App 更新越来越频繁。

自从 OpenClaw 的开发者加入到 OpenAI 之后,明显感知到他们的产品化能力在增强。尤其是砍掉 Sora ,聚焦 Codex 的行动,再融合对普通文件的管理能力,带来对普通用户的收益是巨大的。毕竟世界上需要办公的人是远远多于需要编码的人。

Codex 对电脑的控制现在是三个主要功能:

  • 允许控制电脑上的应用
  • 连接 Chrome 浏览器做控制
  • 允许在 Mac 锁屏下进行静默操作

在升级 ChatGPT 之后,我还特地买了一个 GiffGaff esim 卡来认证了自己的账号,通过公用网络连接回客厅的 Mac Mini。这个使用场景是百分之百能替代我的 OpenClaw 和 Hermes ,甚至会更好。

Codex App 里进行的工程会话,比如长时间的研究和间歇性的研究,随时拿出手机来记录和推理,回看时激发新的灵感,会成为新的习惯。比起散落在 Telegram 和 QQ Bot 里的聊天记录,能集中在 Codex App 一处管理和回溯,让我的思维更加连贯。

在听过各种 AI 研究员的播客之后,我感知到它们的能力终究是要收敛的。就像汽车发动机,它的输出功率已经远远超出了日常城市使用的范畴,反而要考虑的是安全性、经济性、合规性。

Codex App 在安全性上肯定超过 OpenClaw ,但开源社区的游乐场并没有关闭,还是有大量有意思的 Skill 会冒出来。

至于「这一轮 AI 应用的终点」在哪里,还没看到,至少在有效的商业化方面还没看到。

这个美联储主席周期结束了

杰罗姆·鲍威尔(Jerome Hayden “Jay” Powell)在周五正式完成八年的美联储主席任期,即将转交给下一位。

虽然遭受许多非议,甚至有来自总统的直接指责,但他是值得我欣赏和尊敬的一位主席。

我的美股投资经历,就是从鲍威尔接替耶伦开始的。实际感受了 2018 年开始的加息历程,又感受了疫情当年的果决零利率,也感受了漫长的爬升。需要感谢每次鲍威尔严谨的发言,让我能知道 FED 在利息、就业、通胀之间的判断标准。

一位法律背景的主席,让远在地球另一边的懵懂投资者能窥视到精密的计算感,是绝佳的老师。

在零利率周期里,什么都在涨,有太多人赚到了大钱,也有不少人堕入贫困。宏观经济是一种结果,而不是目的。

历史学家在未来应该很难拿鲍威尔跟沃尔克的成就比,只有两三年前的一些新闻报道才会把他们的名字写在一起。经历过 2022 追赶式加息却保持经济增长的投资者,应该给予他更高的评价才行。

最后,我打开 Codex CLI,输入了一个问题:「综合过去 8 年的数据,用你的逻辑和知识,主观评价下鲍威尔作为美联储主席的功绩,打多少分(100分制)?」

思考良久(确切地说是 5 分 02 秒),屏幕显示:78 。

深以为,低了点。

要看泡沫之后能留下什么

半导体和存储的「狂潮」已经成为 4 月来的主线,它背靠着 AI 的巨量需求,吞噬掉未来的资金、能源、政策。

当韩国综艺里开始出现「海力士工作服的秃头男士在相亲市场上更受欢迎」的演出桥段,美光的市值恢复到互联网泡沫的阶段,我们都知道过热了。

但是,没人知道山顶在哪里。

就在昨天,标普 500 指数看涨期权名义金额高达 2.6 万亿美元,创历史新高。整个市场处于巨大的伽玛挤压状态。而全球地缘政治的风险,并未完全消除。如果伊朗和古巴擦枪走火,必将释放市场紧绷的(负面)压力。

我的思考是,如果未来 AI 泡沫跟互联网泡沫一样破掉,它会留下哪些东西。正如 2000 年后的创业公司享受了低价的光纤和接入网资源那样,这次是否能让半导体产能、私营发电站、液冷散热材料、玻璃基板成为下一代工业的基础呢。

当然,现在随手可得的 AI Agent 在以后会受到越来越严格的限制,且并不是每个人都是生产力工具的用户。消费和娱乐的爆点在哪里还没看到,或许这是后泡沫时代最值得关注的点。

《异环》的都市观光体验

二次元类 GTA 都市冒险开放世界游戏在此之前最期待的是《无限大》,上周五看了公司内部推荐的《异环》,发现在 Mac 上有原生客户端,于是饶有兴趣体验一番。

都说今年是 GTA 大年。可惜 GTA 6 从去年跳票到今年底,同期如龙组的新作《异于天堂》STRANGER THAN HEAVEN 也是今年底,在都市类游戏扎堆的情况下怎么做出自己的特色是不容易解决的问题。

「都市」是个大杂烩,不同年龄和不同地区的人对都市的理解天差地别。而《异环》的解决方案我是比较满意的。通过虚幻引擎构造出「似又不是」的熟悉感,在某些小场景上又充满细节,

从我自己的感受出发,过去十几年是喜欢都市题材互动游戏的,久远的有《绝体绝命都市》,后来 PSP 平台上通关了《秋叶原之旅》,在 PS4 和 PS5 上把能玩的《如龙》都过了一遍,最近还沉迷了一段《赛博朋克 2077》。在都市内感受流动的气息,观察 NPC 的互动,就当成自己旅游也是很投入的事情。

这次海特洛市的启程,更像是买了一张参观主题乐园的门票,看制作团队如何理解大都市和小人物的逻辑。抽取到娜娜莉之后,更是获取到重力少女般的视觉体验。登上不同高度的楼房,看不同角度的地标建筑,真是绝赞的风景。

印象深刻的还有咖啡馆外的招牌、豆腐店门口的 AE86 、书店里的杂志区。坐在巴士站纯粹看车流也是比其他都市游戏更好的陪伴。

与 AI 对话和解密,很像是一场文字冒险

距离上一次在 PS4 上通关《十三机兵防卫圈》已经过去六年,这期间我也买了 PS5 硬件并把游戏和存档转了过去,也买了 Switch 版和特典。它一直呆在存储空间里,就跟它讲述的「时间旅行」故事一样,仿佛被保存在了胶囊中,跟随着我转辗各地。

然而,因为这俩月密集跟 AI 对话的关系,又无意间想起了那种探索解密的感受。

几天之内在四五台电脑两三台手机上频繁切换对话环境,大多数是碎片式,也有少部分整理成文档和邮件。在情景和会话中切换,对上下文的索引记忆,我是感觉到这也是一种大型的文字冒险游戏。

趁着前两天午休的时间,通过 Gemini 询问了这款游戏的开发背景和制作人访谈,更加感受到香草社在剧情编排和哲学隐喻上的良苦用心。

用 AI 探索森村千寻的形象演变逻辑,很像是心理医生对着镜子分析自己。原始的意志、创伤的绝望、未来的可能性,对应的外表却截然不同。作为普通少女去爱和战斗的冬坂五百里,确实是冒险的起点和终点。

我自己的心态,是在慢慢变化。就算 AI 是极其丰富的历史资料库,也不能替代我的选择。学会跟海量信息的共处共生是新的一场冒险。

对 Swift 语言的执念,得以实现

这周在 Macbook 上用纯 SwiftUI 和原生框架做了一个小小的财报分析工具。这个过程中还学习到了 SEC 存放每个公司财报的格式知识,以及 Json 的用法。

有了 Vibe Coding 之后,让我对原先各种编程的概念有了去深入了解的契机。

这次刻意让 GPT 5.4 在电脑上使用 Swift 来完成作品,也是完成一个小心愿。

其实 Swift 语言是我有限编程生涯中的一块悬在空中的执念。毕竟在 2014 年 Swift 1.0 发布时,当时的心情是说终于有机会跟众多开发者站在同一起跑线上。结果后来 Swift 命途多舛,苹果一直没有放弃老框架的支持。我没有坚持把独立开发当成一个业余爱好,渐渐就忘了。

在购入 iPad Pro 之后,让小孩在 Swift Playgrounds 的环境下理解代码对对象的控制。在 Playgrounds 的后期,题目越来越难,也就放下了。

今天回想起来,早在十几年前第一次买 Mac Mini 的时候,就安装过 XCode ,也尝试过对桌面和移动 App 的学习。我的心底当然觉得当一名苹果开发者是很酷的事情,后来也长期收听开发者播客、看 WWDC 演讲。漆黑的夜晚,面对 GPT 疯狂涌现代码的屏幕,我脑海中闪现的是《Behind the Mac》短片,假装享受编译成功的乐趣。

太魔幻了。

重拾书稿,提新的问题

大概从十年前,折腾个人博客已经成为一种习惯时,我也恰想从 Meizu 公司离开。原以为我不会再投入智能手机行业了,就开始着手写一些类似时代草稿的文字片段,以期望某个节点能归集成书:用以窥视手机行业蓬勃发展的那几年。

现在回过头来读书稿 ,其中《第一章:黄金太阳》和《第二章:玻璃城堡》的完成度还不错。切入点是 2007 年的华强北水货市场和诺基亚总部的战略对比。

站在现在这个点上,距离华强北最人声鼎沸的时间已经过去了二十年。我的记忆仍然清晰,且又有了大模型工具的加持。于是又想到再捡起书稿,往前推进一步。

同时打开 Codex 和 Claude 之后,花费了近 100 刀的成本,今天切入了一个深入的问题:从 2007 年到 2026 年,中国手机市场的利益分配产生了哪些变化。

原本我设想是一组人物的变迁,比如二十年前开夫妻手机店的老板,在当下应该找到什么新生意;比如二十年前的销售提成跟当下的对比。

但是写着写着,大模型把我拉到了更硬的「学术」方向。不由得,在通信人家园和各种古早研报库里寻找商业的真相。

最后关闭电脑屏幕前一刻,Claude 读完所有材料做完,给了一个结语,还给我一个关于「结构」的故事:

从诺基亚的国代,到小米的广告库存,这二十年的故事,说到底是一个关于”稀缺资源如何被定价”的故事。

在任何一个足够大的市场里,都会有某种”关键入口”——一个消费者无法绕开的节点,一个商品无法不经过的通道。旧秩序的关键入口是货源;新秩序的关键入口是注意力。

谁控制了关键入口,谁就有权从中收取通行费。这笔通行费的名字会变——从”渠道加价”到”平台佣金”,从”区域代理费”到”广告投放费”——但收取通行费这件事本身,从未停止过。

中间层没有消失。它只是换了一件衣服。

记一次对「平台发行业务」的对话

也许这就是跨领域知识的灵感:昨天晚上加完班,在寂静园区里散步,耳机里播放的是 Gcores 某一期闲聊索尼游戏独占的播客。突然间有了一个灵感,关于 Playstation 、Facebook 、Temu 的平台属性,似乎都可以归结为「发行业务」。

于是坐在湖边掏出手机,通过微信 Bot 接入 GPT 5.4 ,用语音询问:「世界上有很多平台型的公司。比如 Sony PlayStation 的硬件并不赚钱,但是依靠铺开之后的形成的网络,售卖和发行游戏赚取巨额利润。同样腾讯和 Facebook 也是依靠社交网络的平台效应充当了应用的发行商。同样智能手机的利润已经很少,但是智能手机的制造商依靠互联网业务仍然能赚取利润。我们假设拼多多和 Temu 这样的电商平台是依靠便宜造就了网络,可以推断,会有怎样的发行业务?」

GPT 当然给出了顺着这种类比的推理,在第一层它知道了 「平台不只是卖货,而是在卖被消费者看见的权利」,在第二层它知道了「平台从交易市场进化成消费需求编译器」,在第三层它制造了「准品牌商品的总发行人」概念。

越聊越起劲,似乎进入一种奇妙的循环,大模型被自己引导来证明自己。

而今天,当我把整个逻辑说给 Claude 来听时,它却认为这里缺乏有效的数据。如果我从挑战式的角度切入,它立刻能用审判的眼光来推理。

最后给出一针见血的答案,还挺符合我的认知。

上文所有命题能否成立,最终归结为一个问题—— 拼多多/ Temu 的用户来,是因为平台,还是因为价格?如果是前者,类比成立;如果是后者,它只是一个效率更高的折扣渠道,而不是下一个 App Store。

看来,这个突如其来的灵感,就只是这么一闪而已。

30 年前我是否用过 Cyrix 处理器?

可以说,是 OpenClaw 的出现加速了我在电脑上体验各种 CLI。

过去的一个月,我的体感仿佛回到了三十年前的湖北县城,进入到第一次拿到 586 电脑时的心流感。好奇心驱使我用命令行在硬盘里翻找可以用的各种工具和游戏。

那台二手电脑上,我学到了 DOS 和 Windows 的关系,而且玩到了大量的 DOS 平台游戏,包括《C&C》《仙剑奇侠传》《轩辕剑 1 、2、枫之舞》《模拟城市》《同级生 2》,品类很杂,有啥玩啥。

并且,也是因为它才理解了电脑的内部构造。可惜的是,毕竟过去了三十年,也并非我主动选购,所以很多配置细节记不清楚了。

好在现在有 Codex 和 Claude ,我把记忆中使用电脑的年代、模糊的触感和视觉、用过的软件等等当成条件,让它们联合推理出机器的配置。

  • 在中国当年的兼容机市场里,Cyrix 很常见,因为它通常比 Intel 更便宜,适合电脑城攒机。
  • 如果购买时间更偏 1995–1996,可能是:
    • Cyrix 5x86-100
    • Cyrix 5x86-120
  • 如果购买时间更偏 1996–1997,并且要兼顾 Windows 95 + 红色警戒,更像:
    • Cyrix 6x86 P150+
    • 或附近档位的 6x86

以上推理是能说服我的,因为那台机器在一段时间里是被黑网吧拿去营业,所以才遗留了不少游戏软件。那剩下的就是补齐配置:

只跑 DOS 的话,8MB 都能用。

  • 但如果还要跑 Windows 95,并且不是“勉强能开机”,而是能装软件、玩游戏,16MB 会更贴近真实体验。
  • 这也意味着主板更像是:
    • Socket 7
    • 同时提供 PCI + ISA 插槽便于安装常见的 S3 显卡和 ESS / SB16 兼容声卡

完整的估算价格大概是:

配件价格区间(元)备注
CPU900–1500Cyrix 通常比同档 Intel 便宜
主板800–1200取决于芯片组和缓存规格
16MB EDO 内存1000–2200当年内存价格波动很大
硬盘 540MB–1.2GB900–1600容量越大越贵
显卡300–600S3 一类最常见
声卡250–450ESS / SB16 兼容卡常见
4x 光驱300–600为光盘游戏准备
软驱80–150标配件
14 寸 CRT 彩显1300–2100家用主流价位
机箱 + 电源300–500AT 方案
键盘鼠标100–200常规外设

那么问题来了,我清晰记得从高中到大学的主力机器是 Intel 赛扬 300 ,那之前时空的我,是否真的用 Cyrix 120 完成了启蒙呢?

记一次 Codex 融入正式工作流

在 Vibe 了几个小工具之后,在本周我正式让 Codex 在安全的情况下介入了研究工作。

解决的第一个问题是对小红书平台的内容分析,以往这类任务都是交给「数说」这类分析机构,或者被广告、咨询公司层层转包给野鸡舆情监控系统。

现在我用了「最拟人」的方法来完成,核心思路是:

  • 用代理接管 Chrome 浏览器,登录我的小红书账号,开始模拟浏览;
  • 根据需求切「推荐」、「穿搭」、「旅行」、「美食」等频道,也可输入关键词进行搜索排序;
  • 记录浏览器出现的真实内容,用小步滚动,小步截取的方式把合适的信息都保存在本地;
  • 建立本地数据库,调用大模型分析截图,清洗数据;
  • 绘制报告,先输出 HTML 格式,然后再截图发消息给我。

这样实现了基本的自动化,然后我改进这些脚本,套上 CLI 和 TUI 的皮,就能脱离 OpenClaw 来运作了。

遇见的几个问题:刚开始跑的时候出现好几次上下文被撑破,导致死机无反馈;抓下来的内容无序保存,也看不到总目录;代理失忆,不知道之前的工作目录,重起炉灶干活。

好在经过两天的调试就完全跑顺了。而到现在,我甚至可以脱离 OpenClaw ,只用 QQ 桥接消息的方式来控制这个信息程序。

脑海中的画面浮现出《社交网络》里好几个场景,再一次感叹「机械降神」的威力!