大概今年春节前后,开始尝试使用智能体,从此 token 消耗量开始一路狂飙。
最初,我使用 Cherry Studio 只是当做能接入各种 LLM 模型的入口,方便聊天。能从硅基流动访问 GLM、Kimi、DeepSeek 这些模型,也能通过 DMXAPI 或者之前的 DeerAPI 访问 Claude 和 GPT,统一聊天入口而已。
而今年春节前后开始的小龙虾、Hermes 这些智能体的出现,我曾经也装过 OpenClaw、CodeX、OpenCode、AtomCode 这样一些智能体工具,最终还是选择了 Cherry Studio 这个看似冷门的工具。
首先,Cherry Studio 本来只是当做聊天助手,在 25 年选择入口工具的时候击败了 ChatBox 等工具,变成了我的常用 AI 入口。确实有一部分原因是因为使用惯性吧。
其次,Cherry Studio 的智能体实质上就是 Claude Code,这得益于今年 4 月 1 日那次 Claude Code 源码泄露事件。从那后大概半个月,国内的各种 xxxxCode 软件都突然变的好用了。所以从智能体本身来说,其实各种 xxxxCode 之间并没有本质差别。要各种技能,基本上 Cherry Studio 也都能装。
第三,Cherry Studio 确实是最方便配置不同渠道 API 的。我常用的模型有 GLM、DeepSeek、Kimi、Opus,提供商也有 4、5 家,Cherry Studio 在配置上最方便。
目前最为欠缺的能力是 Agent 调用 Agent 的能力。我知道在一个智能体里做出自动创建子智能体是一个方法,但各个智能体实际上是需要演进的,不是一成不变的。子智能体的演进并不方便,有时候上下文超了,还会覆盖掉不同的 md 文件段落,这就很蛋疼。希望未来什么时候 Cherry Studio 能支持各智能体之间调用吧,那样就会突然灵活起来。
目前,在 Cherry Studio 里,我常用的助手对话是 10 个,常用的智能体是 20 个,我的智能体都是拆开的。为不同的智能体配备了不同能力的 LLM。有的智能体在开发的时候会用 GLM 5.2 或者 DeepSeek pro 版本,在 python 和流程固定后,就改用 DeepSeek flash 重复执行了。
另外,我手动建立了本地 svn,并且不准智能体操作 svn,只允许操作 git。这样智能体用 git 做版本管理,我手动 svn 兜底。
好了,大概就是这样。
今天拿GLM 5.2跑了一下几个小工作流。
明显比之前强了好多啊。特别编程这块,我感觉已经进入第一梯队了。居然能淘汰掉一些GPT 5.5的工作。除了文笔略逊一些,各方面的好强啊。
太神奇了,太神奇了。
今天看了一份 Anthropic 的报告,是针对 Claude Code 的使用数据统计。里面有一项数据我很感兴趣:
实际上,使用智能体的人,新手和老手之间差异很大,但老手和精通者之间差异很小。
也就是说,对于一个事情,如果是知识类的事情,只要大概掌握全貌,有个通识教育之后,就能迅速进入全部掌握的状态。这其实是对整个人类教育体系的颠覆。
我们过去你看,上大学是通识教育,研究生开始钻研,博士生开始精通。但借助了 AI 之后,本科生与研究生和博士生的差距,瞬间就被 AI 缩小了。可能博士生还是有一定优势,但研究生跟本科生在知识储备上几乎没差异了。
以后工作上大概只有三个级别:蓝领、本科和博士。
怎么说呢?AI 带来的第三次工业革命,我们已经深入其中了。历史车轮滚滚向前,谁他娘的都回不了头。
其实我更担心什么?剥削。
以前,无产阶级还能通过出卖自己的知识达到中产阶级。现在老板只要经过通识教育,生产资料将不再外泄,阶层很可能固化得比以前更严重。
这个问题各国政府可能已经有预料到,但是真正能付诸实践的、或者说能避免恶劣情况发生的政策或举措,至今还没有出台。
不过就业情况已经烂成这个鬼样子了,总得想点办法。
还是那句话,历史车轮滚滚向前,谁他娘的都回不了头。
这半年以来,Claude Code、CodeX 等工具普及开来,越来越多人参与到了这场史无前例的全员开发中来。
虽然远离商业开发已经数年,但这半年也用 AI 开发了一些小东西,有一些自己的小感悟。
能用 Agent 做软件了,不少项目经理跃跃欲试。这本身没有错,但有的需求,实际上放在智能体里实现才是最佳实践。
是的,做的新软件也可以用 API 调用大模型,但总归没有智能体里好用。工具调用、MCP、全局记忆等等,再实现一次轮子又是何必。
最典型的就是类似写文章、润色系统这种需求——明显需要大模型介入的,那就不要单独做软件,而是考虑做成一个完善的 Agent,然后用微信、飞书等方式对接出来。实现功能才是关键,不要为了开发而开发。
总有一些人,拿着 Claude Code、CodeX 就认为天下无敌了。像模像样地写了个看上去很满意的全盘需求文档,结果丢进去全自动开发完,实际上是很难把控结果的。
即便到了今天(2026 年 6 月 14 日),这种开发方法能做出来的东西都很辣眼睛。不要看一些 Up 主丢了个简单需求给 Fable 5,然后做出来一个看上去完成度不错的软件就觉得很棒。那些东西是没有详细展示的,自己试试就知道问题有多少。
商业化的程序开发,从使用 Claude Code 开始,就有详细的计划和执行之分,还有类似 SuperPowers 等把控开发过程的 skill。还需要开发者告知框架和方向(比如制定软件设计模式)。不是写个用户需求文档就能简单制作的。
目前简单告知需求直接完成的,仍然还停留在做 Demo 的水平。能用的商业落地,还是需要程序员介入——可能不需要那么多程序员了,但知道框架设计的程序员依然要。
近半年来不少公司裁程序员,实际上并不是 AI 来了才裁的,是因为本来业务不够了,想裁总得找个由头。正好有这个 AI 的风口来了,顺势裁员而已。
AI 时代确实不需要苦力码农了,但程序员还是需要的。
曾经有个修车的段子:有个人去修车,结果就是拧紧一颗螺栓,要了 200 块。车主很生气,觉得不值得。修车工说,知道拧哪价值 199,拧的价格 1 元。
这和用 AI 编程差不多吧,知道如何指挥 AI 才是价值。不过企业短期内应该还没办法量化如何确认人才和面试人才,人才市场还处于混沌吧。
AI算力,中美对比(26年6月)
我写的算力对比是基于当前26年6月中旬。
目前各个自媒体对于中美这个算力的基础设施没有一个正确的认识。写个博客记录一下。
目前这个英伟达B200公布的FP4算力是9 PFLOPS,而华为昇腾950公布的这个FP4的算力是1.56 PFLOPS。
在功耗上,B200是1000瓦,而华为昇腾950是600瓦。
那么粗略的算,就是在相同耗电的情况下,中国的算力是美国算力的1/3左右。
这还只是在 FP4 推理上,其实华为昇腾 950 大概在其他方面的推理能力很可能要远远低于这个英伟达当前的技术。乐观点看,可能有些东西的差距在10倍左右。
目前来看,黄仁勋老黄他最担心的应该是 Deepseek 它全流程跑通了整个 AI 的流程。其实从新华社的官方宣传来看,目前 Deepseek V4 也只是后训练用了昇腾的芯片组,在推理上用了昇腾的 910C。对吧?它只是能相对低成本的去实现大语言模型的推理。
原因应该还是在光刻机上,没有最新的工艺,华为设计再好,发挥不出来。最近搞了个什么韬定律,其实和英特尔的Intel7,拿10纳米画饼、7纳米的饼,不是一回事吗?
国内各个做软件大模型的厂子,其实基本上也没有用什么国产芯片,用的不还是英伟达那套,自己想办法搞的卡而已。所以我看来哈,软件层面可能中美的差距目前3~6个月。但硬件层面,其实还卡在光刻机上。啥时候突破了?啥时候?就能抹平这个硬件上3~10倍的差距。
任重道远哟。