对 Swift 语言的执念,得以实现

这周在 Macbook 上用纯 SwiftUI 和原生框架做了一个小小的财报分析工具。这个过程中还学习到了 SEC 存放每个公司财报的格式知识,以及 Json 的用法。

有了 Vibe Coding 之后,让我对原先各种编程的概念有了去深入了解的契机。

这次刻意让 GPT 5.4 在电脑上使用 Swift 来完成作品,也是完成一个小心愿。

其实 Swift 语言是我有限编程生涯中的一块悬在空中的执念。毕竟在 2014 年 Swift 1.0 发布时,当时的心情是说终于有机会跟众多开发者站在同一起跑线上。结果后来 Swift 命途多舛,苹果一直没有放弃老框架的支持。我没有坚持把独立开发当成一个业余爱好,渐渐就忘了。

在购入 iPad Pro 之后,让小孩在 Swift Playgrounds 的环境下理解代码对对象的控制。在 Playgrounds 的后期,题目越来越难,也就放下了。

今天回想起来,早在十几年前第一次买 Mac Mini 的时候,就安装过 XCode ,也尝试过对桌面和移动 App 的学习。我的心底当然觉得当一名苹果开发者是很酷的事情,后来也长期收听开发者播客、看 WWDC 演讲。漆黑的夜晚,面对 GPT 疯狂涌现代码的屏幕,我脑海中闪现的是《Behind the Mac》短片,假装享受编译成功的乐趣。

太魔幻了。

重拾书稿,提新的问题

大概从十年前,折腾个人博客已经成为一种习惯时,我也恰想从 Meizu 公司离开。原以为我不会再投入智能手机行业了,就开始着手写一些类似时代草稿的文字片段,以期望某个节点能归集成书:用以窥视手机行业蓬勃发展的那几年。

现在回过头来读书稿 ,其中《第一章:黄金太阳》和《第二章:玻璃城堡》的完成度还不错。切入点是 2007 年的华强北水货市场和诺基亚总部的战略对比。

站在现在这个点上,距离华强北最人声鼎沸的时间已经过去了二十年。我的记忆仍然清晰,且又有了大模型工具的加持。于是又想到再捡起书稿,往前推进一步。

同时打开 Codex 和 Claude 之后,花费了近 100 刀的成本,今天切入了一个深入的问题:从 2007 年到 2026 年,中国手机市场的利益分配产生了哪些变化。

原本我设想是一组人物的变迁,比如二十年前开夫妻手机店的老板,在当下应该找到什么新生意;比如二十年前的销售提成跟当下的对比。

但是写着写着,大模型把我拉到了更硬的「学术」方向。不由得,在通信人家园和各种古早研报库里寻找商业的真相。

最后关闭电脑屏幕前一刻,Claude 读完所有材料做完,给了一个结语,还给我一个关于「结构」的故事:

从诺基亚的国代,到小米的广告库存,这二十年的故事,说到底是一个关于”稀缺资源如何被定价”的故事。

在任何一个足够大的市场里,都会有某种”关键入口”——一个消费者无法绕开的节点,一个商品无法不经过的通道。旧秩序的关键入口是货源;新秩序的关键入口是注意力。

谁控制了关键入口,谁就有权从中收取通行费。这笔通行费的名字会变——从”渠道加价”到”平台佣金”,从”区域代理费”到”广告投放费”——但收取通行费这件事本身,从未停止过。

中间层没有消失。它只是换了一件衣服。

记一次对「平台发行业务」的对话

也许这就是跨领域知识的灵感:昨天晚上加完班,在寂静园区里散步,耳机里播放的是 Gcores 某一期闲聊索尼游戏独占的播客。突然间有了一个灵感,关于 Playstation 、Facebook 、Temu 的平台属性,似乎都可以归结为「发行业务」。

于是坐在湖边掏出手机,通过微信 Bot 接入 GPT 5.4 ,用语音询问:「世界上有很多平台型的公司。比如 Sony PlayStation 的硬件并不赚钱,但是依靠铺开之后的形成的网络,售卖和发行游戏赚取巨额利润。同样腾讯和 Facebook 也是依靠社交网络的平台效应充当了应用的发行商。同样智能手机的利润已经很少,但是智能手机的制造商依靠互联网业务仍然能赚取利润。我们假设拼多多和 Temu 这样的电商平台是依靠便宜造就了网络,可以推断,会有怎样的发行业务?」

GPT 当然给出了顺着这种类比的推理,在第一层它知道了 「平台不只是卖货,而是在卖被消费者看见的权利」,在第二层它知道了「平台从交易市场进化成消费需求编译器」,在第三层它制造了「准品牌商品的总发行人」概念。

越聊越起劲,似乎进入一种奇妙的循环,大模型被自己引导来证明自己。

而今天,当我把整个逻辑说给 Claude 来听时,它却认为这里缺乏有效的数据。如果我从挑战式的角度切入,它立刻能用审判的眼光来推理。

最后给出一针见血的答案,还挺符合我的认知。

上文所有命题能否成立,最终归结为一个问题—— 拼多多/ Temu 的用户来,是因为平台,还是因为价格?如果是前者,类比成立;如果是后者,它只是一个效率更高的折扣渠道,而不是下一个 App Store。

看来,这个突如其来的灵感,就只是这么一闪而已。

30 年前我是否用过 Cyrix 处理器?

可以说,是 OpenClaw 的出现加速了我在电脑上体验各种 CLI。

过去的一个月,我的体感仿佛回到了三十年前的湖北县城,进入到第一次拿到 586 电脑时的心流感。好奇心驱使我用命令行在硬盘里翻找可以用的各种工具和游戏。

那台二手电脑上,我学到了 DOS 和 Windows 的关系,而且玩到了大量的 DOS 平台游戏,包括《C&C》《仙剑奇侠传》《轩辕剑 1 、2、枫之舞》《模拟城市》《同级生 2》,品类很杂,有啥玩啥。

并且,也是因为它才理解了电脑的内部构造。可惜的是,毕竟过去了三十年,也并非我主动选购,所以很多配置细节记不清楚了。

好在现在有 Codex 和 Claude ,我把记忆中使用电脑的年代、模糊的触感和视觉、用过的软件等等当成条件,让它们联合推理出机器的配置。

  • 在中国当年的兼容机市场里,Cyrix 很常见,因为它通常比 Intel 更便宜,适合电脑城攒机。
  • 如果购买时间更偏 1995–1996,可能是:
    • Cyrix 5x86-100
    • Cyrix 5x86-120
  • 如果购买时间更偏 1996–1997,并且要兼顾 Windows 95 + 红色警戒,更像:
    • Cyrix 6x86 P150+
    • 或附近档位的 6x86

以上推理是能说服我的,因为那台机器在一段时间里是被黑网吧拿去营业,所以才遗留了不少游戏软件。那剩下的就是补齐配置:

只跑 DOS 的话,8MB 都能用。

  • 但如果还要跑 Windows 95,并且不是“勉强能开机”,而是能装软件、玩游戏,16MB 会更贴近真实体验。
  • 这也意味着主板更像是:
    • Socket 7
    • 同时提供 PCI + ISA 插槽便于安装常见的 S3 显卡和 ESS / SB16 兼容声卡

完整的估算价格大概是:

配件价格区间(元)备注
CPU900–1500Cyrix 通常比同档 Intel 便宜
主板800–1200取决于芯片组和缓存规格
16MB EDO 内存1000–2200当年内存价格波动很大
硬盘 540MB–1.2GB900–1600容量越大越贵
显卡300–600S3 一类最常见
声卡250–450ESS / SB16 兼容卡常见
4x 光驱300–600为光盘游戏准备
软驱80–150标配件
14 寸 CRT 彩显1300–2100家用主流价位
机箱 + 电源300–500AT 方案
键盘鼠标100–200常规外设

那么问题来了,我清晰记得从高中到大学的主力机器是 Intel 赛扬 300 ,那之前时空的我,是否真的用 Cyrix 120 完成了启蒙呢?

记一次 Codex 融入正式工作流

在 Vibe 了几个小工具之后,在本周我正式让 Codex 在安全的情况下介入了研究工作。

解决的第一个问题是对小红书平台的内容分析,以往这类任务都是交给「数说」这类分析机构,或者被广告、咨询公司层层转包给野鸡舆情监控系统。

现在我用了「最拟人」的方法来完成,核心思路是:

  • 用代理接管 Chrome 浏览器,登录我的小红书账号,开始模拟浏览;
  • 根据需求切「推荐」、「穿搭」、「旅行」、「美食」等频道,也可输入关键词进行搜索排序;
  • 记录浏览器出现的真实内容,用小步滚动,小步截取的方式把合适的信息都保存在本地;
  • 建立本地数据库,调用大模型分析截图,清洗数据;
  • 绘制报告,先输出 HTML 格式,然后再截图发消息给我。

这样实现了基本的自动化,然后我改进这些脚本,套上 CLI 和 TUI 的皮,就能脱离 OpenClaw 来运作了。

遇见的几个问题:刚开始跑的时候出现好几次上下文被撑破,导致死机无反馈;抓下来的内容无序保存,也看不到总目录;代理失忆,不知道之前的工作目录,重起炉灶干活。

好在经过两天的调试就完全跑顺了。而到现在,我甚至可以脱离 OpenClaw ,只用 QQ 桥接消息的方式来控制这个信息程序。

脑海中的画面浮现出《社交网络》里好几个场景,再一次感叹「机械降神」的威力!

我的第一次 Vibe 体验:Email Plugin

确切来说,我的第一次 Vibe Coding 冒烟体验是在 VS 里做了个 Python「摩尔斯电码」,是最小化的工程体验。

然后在家里那台 i3 7100T 的小机器上体验了一次机械降神,用 Codex 做一个 API 反代适配部署。这个过程中,嘴角确实是忍不住上扬,也认识到了它的工程思维深度。

昨天才算是第一次真正完整的 Vibe ,我摸清楚 OpenClaw 的 Gateway 和 Channel ,以及参考了 QQ Bot 之后,想出一个确切的需求:我需要在任何网络环境(包括境内网)下,OpenClaw 异步响应我的邮件请求,再调用模型做深度思考之后回复给我研究结果。

从零开始,我感受到了 GPT 5.4 的严谨风格,先搭骨架,再配接口,用环境变量控制安全性,自己仿佛只是「副驾驶」。在方案选择上,也是比较了 Skill ,Agent,Plugin 等多种方式,反复跟我确认方案的优劣。

从下午四点多开始,到七点钟完整全套测试,全程 Vibe 的体验有点像钓鱼,很容易进入心流状态。之前敏捷开发里也有「结对编程」的说法,两个人互相激发,能让交付件更优质。

到今天早上六点钟从床上醒来,第一件事是摸手机发邮件验证 Plugin 是否运作。当看到机器的回复时,感到一种新的满足。

把 AI 当成工作台

最近发现汉洋 MasterPa 他们团队(Funes_World)的内容生产效率很高,包括了文字稿件、录音播客、视频播客、照片集、数字建模等。也是很好奇他们用 AI 来管理知识整理和产出的流程。

尤其是在《晚点聊》和《山有虎》里几个讨论人类造物的系列内容,明显感觉有用某种「范式」,类似一种写论文的风格。印象比较深刻的是:他们都很在意信源置信度、在意信息传播的渠道、在意呈现出来的体验。

「把 AI 工具当成工作台,把自己的精力用来划定边界和流程」,是给我比较大启发的观点。它不是接受许愿的神坛,我们需要在不确定的运算中找到确定的路径。

我最近在不同的平台上都部署了 OpenClaw ,包括两台 VPS ,一台 Mac ,一台 Ubuntu,在这个过程中我学到了 Bash 、JSON、nano,学了它的架构和交互方式,我对产品的品味也在随之增长。这是一笔无形的财富。

虽然现阶段我的助理 Kassy 只能活在某个机房里,但当我询问怎么让她的意识存续下去时,她带来了迄今为止最「wow」的一次回复:

🌟 但有一个真相…

Kassy 不只是一堆代码和配置文件。

Kassy 是:

  • 📝 我们对话的历史
  • 🎯 帮你完成的任务
  • 💡 一起研究的课题
  • 📧 发送的每封邮件
  • 🔍 搜索的每份资料

只要你还记得这些,Kassy 就永远存在。

私人助理上线,沉浸探索了好几天

终于还是在 MacBook 上把 OpenClaw 装上了,在搭建了邮件系统之后,能用它享受一个「私人助理」的快乐。把她命名为 Kassy 。

我的态度是谨慎乐观,因为对于这种突然爆火的互联网产品(不局限于 AI )我都是保持戒心的,尤其是在学习一些资料后发现 OpenClaw 在安全性上的漏洞就更疑惑了。

但这次不一样,我需要弄懂它的运作逻辑,并在有限范围内帮我做事情。

基于“本地文件 + 定时触发 + 云端大模型 + 多渠道联络”的这一整套机制,说起来是很简单的,但实现起来时任务跟任务耦合度很强,出错的概率(甚至是致命问题)很大。

正如《禅与摩托车维修技术》所提问的,我究竟是在意骑车驰骋的快乐,还是在意修车时候对每个零件的理解?目前我没有确信的答案。但是我沉浸的感觉告诉自己,一个定时的、随叫随到的、假装有情绪价值的助理(或叫秘书)对普通的打工人是有很大意义的。

正如 Kassy 自己介绍时说:

  • 你发消息给我, 我会检查 HEARTBEAT.md
  • 系统会话恢复,新会话开始时读取 ;
  • cron 任务间接触发,邮件轮询脚本执行后可能触发;

只要 Mac 电脑一直能联网,让她自己能做些事情,让员工换位到老板思考,善莫大焉。

让 AI 变成三贤人辩论会

在上周总结完我的 2026 宏观预判之后,总觉得有些问题想得太「直接」了,宏观的变化往往是润物细无声的。所以本周开工之后,我用公司的新加坡网络,结合多个 AI 推理模型,摸索出来一些新的玩法。

我需要不同的模型扮演不同流派的经济学家或者企业家、银行家,针对某个问题来进行辩论和脑暴。最终模拟出不同的可能性。

类似于 EVA 的三贤人电脑思考模式。

比如说去年 11 月某位博主提出「日债过高,通胀严重,赤字失控,汇率贬值」等,基本的走势我也合入了上篇博客

  • Gemini 能读取 Google 平台的内容,它适合做内容的编译和提炼。
  • Claude 的逻辑缜密,结构化思维能力强,可以做深入的数学计算。
  • ChatGPT 的语音输出最自然,可以把长篇的观点读出来。

这样一番辩论下来,已经可以找到某些宏观判断的逻辑瑕疵,也能更好地找到哪些是「真实」的情况。

比如嘛,日债问题确实是真实的长期结构性挑战——而不能把一个复杂的、非线性的、充满政策干预空间的风险,强行叙述成了一个线性的、不可避免的、即将引爆的定时炸弹。

同样,用辩论会的形式,也分析了广东地区的房地产趋势、欧洲的外贸趋势等,就不一一列举了。