科普一下什么是缓存命中 / 读缓存?
考虑到 AI 按照 Token 数计费,如果你要和 AI 多轮对话,倘若每次都重复输入重复内容(例如一个长文档或者一个角色设定),这在账单上很浪费。
因此 AI 开发者设计了类似于电脑缓存一类的东西,持续一段时间(例如 5 分钟、10 分钟)。
例如你 5 分钟内追问,系统判断这就是缓存里的已存内容,那么 AI 就不需要再动用额外算力,这就是所谓的“缓存命中”。
一般大模型(or 中转站),如果命中了缓存,就会非常便宜,例如 D 指导,命中后只输入需要 1/10 的价格。
有点像你考语文,阅读理解题,你只精读一次,不需要每道题都再全读一次,最后考完试你光速就忘了🤣

周末了,聊点轻松的。
作为一个研究各种节日的爱好者,全世界都纪念 5.1,为什么这个地图里,偏偏【英美澳加】不放 5.1 假期呢?
事实上,五一劳动节的起源就来自老美。
它是为了纪念 1886 年芝加哥工人大罢工,争取 8 小时工作制。
明面上各国都有理由:
老美:改成 9 月初,纪念另一次工人运动;
加拿大:和美国一样;
带英:和5 月初另外一个银行假期撞了,所以干脆放本国的银行假;
澳洲:各州不一样,更强调纪念澳洲本土的 8 小时运动。
沙特:比较特殊,他们强调只放穆斯林假。
但是英美澳加放一起,就令人玩味了。工人运动,你细品。所以这个 5.1 假还真的和意识形态有些关系。
尽管大家都没明说,五眼联盟(中的四眼)保持了奇妙的默契。
英文有个单词,叫做 tacit,就很好地描述了这种心态。
不过也有好处,考虑到老美也特别喜欢旅游,人口又多,老美和世界 5.1 错峰放假,也能让出国旅行的家人们,能够减少点人流拥挤🙃

@0xSunNFT 还是分词器的问题,这个数字数一直是 LLM 弱项,例如 strawberry 里有几个 r 这种,尤其是 Claude 的中文分词器做的是尤为一般
其实大模型收“翻译税”的问题,主要还是在于:
-训练集对非英文语言的采集比例;
-分词器对非英文语言的优化程度。
比方说,同样一段话,A 社 Claude 英文消耗的 token 是 1,中文的话就是 1.7。
说白了,就是他们的分词器优先能把英文识别成高频单词,而中文只能拆得更细、更碎一点(浪费 Token)。
比方说“推特”这个词,低效的分词器就会把它拆成“推”加“特”;
但如果你是针对中文优化过的分词器,它就会直接把“推特”作为一个词整体。
所以说,反过来,如果你用 DeepSeek 或者是 Kimi,他们对于中文语料的采集更多,所以分词器能更高效地把中文拆成单个 token,这样他们就更省钱。
因此,这些国产大模型在处理中文时,消耗的 token 甚至比英文还要更少,还能反向收“翻译补贴”。

蚂蚁团队背景的 RWA 公链 Pharos 明天就要上主网了,Pharos 上的各种基建也开始了投石问路。
目前进展比较快的就是 Faroo,主打 Pharos 流动性质押。
如果类比一下 Monad,当时 Monad TGE 前,社区先推的是 Monad 的流动性质押项目 aPriori。
Pharos 作为一条 EVM 兼容 L1,和 ETH 一样也有流动性质押(Lido、EtherFi)。
根据 Pharos 前段发布的 RealFi 联盟(Chainlink、L0、Re7、Faroo 等等),目前看锁定 Pharos 流动性质押头把交椅的应该是 @Farooxyz 。
Faroo 也可以说是 Pharos 公链的底座之一,RealFi Alliance 官方背书、掌控流动性命脉。
深挖了一下 Faroo 的背景,它是由 Bifrost 参与孵化的项目。两个项目很多路演、参会都是一起做的,技术上也有直接的继承关系(后面会讲)。
相比新项目 Faroo,显然 Bifrost 大家都熟,毕竟是曾经 Polkadot 时代的早期平行链之一。
那么 Faroo 和 Bifrost 的技术上是什么联系呢?
Bifrost 有一套技术叫 SLP(Staking Liquidity Protocol)。
现在波卡上最大的流动性质押代币 vDOT,就是 Bifrost 通过 SLP 这套技术做出来的,算是久经检验。
这次 Faroo 同样继承了这套技术,它允许 Pharos 的 PROS 代币先跨到 Bifrost 链上,然后通过 SLPx 变成 LST,再把 LST 跨到 Pharos 上。
这样做的话,直觉上好像变绕了,为什么不模仿 Lido 在 Pharos 本链上,直接通过智能合约铸造呢?
主要还是 SLPx 这套技术是现成的,原生就支持跨链。协议安全新由波卡这条链的节点来保证,所以 Faroo 作为 Bifrost 的关联项目,原生就继承了这套现成的、经过时间检验的技术。
说来,这也算是 Bifrost 开始试图摆脱波卡平行链这个刻板印象,进行全链收益的一个尝试吧。
另外,因为 Pharos 本身主打的就是 RWA。所以生态内项目都或多或少和 RWA 有些联系。
Faroo 作为 Pharos 生态的流动性质押协议,它把 Staking 与 RWA 收益融合,即 Hybrid Yield 概念。
三个产品各司其职:
$stPHRS:流动性质押代币,原生加密质押奖励+底层 RWA 现金流收益,是整套体系的核心;
$tbPHRS:锚定链上国债收益,提供美元本位收益,对应真实世界资产(国债、信贷等)的利息;
LP Vault:自动化做市策略金库,捕捉链上交易活跃带来的手续费收益。
不过这块目前披露的信息还不多,所以等后面有更多信息(例如RWA是什么资产底层、多少APR)时候再来更新后续分享。



最近 AI 用得多了,反而对人脑体会更深了:我们有时活得累,本质上就是人脑 Token 消耗过多。
很多思考任务其实毫无价值,都是垃圾任务:
- 数据线买 1m 还是 1.5m
- 微信回"好的"还是"好滴"
- 导航主路线还是备选(差 2 分钟)
但每天 100 个这种决策叠加起来,到晚上你和模型一样就一起降智了😂。
类似于你老用 Max Thinking 跑一个谷歌翻译都能做的翻译。
很多地方都在隐形得消耗你的人脑 token:
- 外卖好评返现(为 2 块钱写 30 字)
- 凑券省 5 块钱(研究 10 分钟)
- 做家务还要听播客(一心两用)
- 各种过度规划 J 人行为(浪费 2 小时规划下周末半天儿)
主要是这些任务又瘠薄不值钱,选错的最大代价无非是:5 块钱+ 10 分钟 + 轻微不爽。
你热量没消耗多少,token 全烧光了。
这里我最佩服乔布斯,永远穿黑色高领毛衣。每天思考穿衣打扮这一块节约好多 Token,有点像那种显卡,直接把模型焊死在里面了😂。
人想活得轻松,就尼玛要少做决策。
做决策只选错代价高、且未来重复频率低的。例如,要不要接这个 offer、要不要搬家、A 轮估值让多少。好算力都用在刀刃儿上。
最后,每天睡满满的一觉,就是人脑刷新额度。张雪峰老师天天超频跑各种人生决策任务,他能不累么?
再多说两句。大家最瞧不起的中心化金融,香港甚至被称为“遗址”。
但是这个遗址里边有一个神奇的岗位,叫做 RO。
他们在公司里面不用干太多活儿,主要负责签字和监督。
这有点儿类似于 DeFi 里的多签的 Signers 。
想成为 RO 的要求极为严格,既要考试,又要经验,甚至还得看你的社会口碑。
RO 工资高,活儿少。
但是万一出了事,他们真的要谢罪,香港证监会真的狠狠罚款➕抓人。
反观阿拉 DeFi,之前 Drift 多签负责人,好像就是被解雇了而已。
这特么是惩罚么?简直是恩赐解脱。
甚至有一个项目被盗,还能梅开二度,去发新项目。例如当年的 Cream。
这次 $rsETH 犯下的大错,估计团队依然是全身而退。
——分割线——
可以犯错的人,犯了错,毫无惩罚,经常美美隐身,全身而退。
试问:
人家凭什么要认真审?
人家凭什么要学习鉴别朝鲜社工?
人家凭什么要做内部渗透,攻防演练?
痛😓太痛了。

再多说两句。大家最瞧不起的中心化金融,香港甚至被称为“遗址”。
但是这个遗址里边有一个神奇的岗位,叫做 RO。
他们在公司里面不用干太多活儿,主要负责签字和监督。
这有点儿类似于 DeFi 里的多签的 Signers 。
想成为 RO 的要求极为严格,既要考试,又要经验,甚至还得看你的社会口碑。
RO 工资高,活儿少。
但是万一出了事,他们真的要谢罪,香港证监会真的狠狠罚款➕抓人。
反观阿拉 DeFi,之前 Drift 多签负责人,好像就是被解雇了而已。
甚至有一个项目被盗,还能梅开二度,去发新项目。例如当年的 Cream。
这特么是惩罚么?简直是恩赐解脱。
可以犯错的人,犯了错,毫无惩罚,经常美美隐身,全身而退。
试问:
人家凭什么要认真审?
人家凭什么要学习鉴别朝鲜社工?
人家凭什么要做内部渗透,攻防演练?
痛😓太痛了。

Kelp DAO 昨天被黑客通过 LayerZero 跨链桥恶意无锚增发了 2 亿美金以太坊 Staking 代币。
因为 $rsETH 是多链资产,所以黑客欺骗了跨链桥,伪造出“在其他链上已经存入资产”的假象(当然实际上他没存),利用漏洞恶意在 ETH 主网上增发了 116,500 个 rsETH。
然后,黑客把这些无锚代币存进了各种借贷协议里,例如 Aave 和 Morpho,最终借走了真正的以太坊 $ETH 。
所以这件事情现在比较尴尬的一点是:Aave 责任最小,却承担了最大的损失🤦。
尽管尚不明确 Kelp 和 LayerZero 究竟谁的责任更大,但根据 LayerZero 过往的口碑来看,大概率是 Kelp 项目方这边的责任大概率更大一些(并非指控,仅为推测)。
与此同时,对于项目方而言,他们底层的以太坊,也就是 Staked ETH,并没有被黑客直接偷走或换走。
所以项目这个责任更大的一方,反而承受了更小的财务损失。
而且这个 KelpDAO,确切地说,是 Kernel 协议下面的一个子产品。
Kernel 这个协议,目前 $Kernel 尽管上了币安,市值也就 2,200 万美元左右,看起来完全不像赔得起的样子🥲。
而且 Kernel 项目方之前就出过漏洞。
2025 年时,rsETH 就曾被天量增发过一次,但幸好上一次没有造成实际损失。
我有一句名言:一个 DeFi 项目出过一次问题,那它大概率还会出第二次、第三次、第四次问题。
对于 Aave 来说,它过去几乎没有出过什么问题。
而且显然,项目方和 LayerZero 大概率既不愿意掏钱,也未必掏得出钱。
因此尽管这一次同样责任最小,但苦果却落在 AAVE 身上。
这其实就是一种公地悲剧。
万幸的是,Aave 有一个 Umbrella 池。你可以把它理解成一个保险池。
不过,它里面承保的资产是彼此分隔的。
而这次黑客借走的资产几乎全是 WETH。针对 WETH 的保险池,目前大概也就 5,600 万美元左右;和实际大约 2 亿+美元 的亏损相比,仍然有较大差距。
事实上,Aave 的 Umbrella 池 也从未赔付过。因为自从 Aave 上线Umbrella 以来,还从未发生过需要它出险的安全事故。
所以这一次,Aave 可能还是要靠自己的营收慢慢扛。
有些人造谣说 Aave 有很大风险,但我认为 Aave 是能扛住这次损失的。虽然会非常肉痛,但应该还是扛得住。
---分割线---
我现在有两个感受:
第一个感受:我对跨链 DeFi 产生了前所未有的失望。
我认为跨链只能走官方桥,不能走第三方桥。这个领域太容易出问题了。
甚至我觉得,大额跨链都应该引入人工审核机制。比如说,10w 美金以下自动处理,超过 10w 美金就必须进入人工审核。
第二个感受是:在 DeFi 这个巨大的套娃里,责任与风险,其实并不对等。最吊诡的是,责任最大、闯祸最多的人,往往没有承担对应的财务损失。
目前钱还没进龙卷风,希望这件事最终能得到妥善解决吧。




Claude 要求 KYC 这事,也没有必要过度担心。
我仔细读了一下政策,看起来主要是:
-使用一些实验性质的功能时,才会要求 KYC。
-账户异常的时候需要 KYC。
-如果还按之前的模式正常用常规功能,大概率是不会弹的。
另外得感谢加密货币。
各种交易所已经养活了一个庞大、成熟且廉价的 KYC 产业链,一个 KYC 的账号也就 10 块-50 块不等。
尤其是尼日利亚 Claude 甚至比普通 Claude 还便宜。而恰好尼日利亚又盛产 KYC。
只不过每每想到,由于有一个中国的哥们儿眼巴巴要上 Claude,导致远在天边的尼日利亚的一个急需用钱的穷哥们儿再也注册不了 Claude,心里还挺愧疚的😂。

我完全不同意这个比喻。
好友爆哥有一句非常经典的话:我和我 5000 年前祖先的基因基本上没有差距,而 GPT-3 到 GPT-4 再到 GPT-5,简直就是三个物种。
AI 隔代的差距,远远大于人类隔代的差距。
如果我以龙珠的战力系统来举例:一个成年男性的战斗力可能是 5,1928 年老奶奶战斗力是 3。化肥战力 2,拖拉机战力 10。这些在数量级上是一致的。
但是 AI 的战斗力可能是 100,再过几年可能会达到 500 甚至 1,000。
两者数值上已经不是同一数量级了,所以“这次不一样”。
AI 会极大地抹平战五渣的人类在其中起到的作用,到时候人类工作,必然可有可无。
说回正题,我觉得现代人类吃喝玩乐加在一起,每天的任务无非是搜集:
1. 2000 大卡热量
2. 10 度电
3. 晚上能睡觉的地方
它是有个临界值的,哪怕你身家 10 亿美金,你顶多比普通人多消耗个 3x、5x,不可能 30x、50x。
拖拉机和化肥,因为战力较低,达不到临界值,并不能给几十亿人提供这种等级的低保。
现代社会,例如中国,目前能够让城镇老头老太,退休之后,啥活不干,天天跳舞,顿顿肉饭。
但是 AI 时代,战力高了,这是完全有可能实现的。
无非就是把范围,从退休改成青年,把城镇改成全民。
一旦超过那个临界值,人人低保,你确实没必要再工作。
当然了,王兴兴是宇树的老板,他是干机器人的。他说这话,非常激进,显然是为自己的机器人叙事撑腰。
你要是王兴,他手底下全都是人类,各种美团小哥,他肯定不说这话。
但是综合而言吧,5 到 10 年,那肯定是有点夸张了。我个人愚见:10 - 20 年差不多,人类工作没有意义。
没办法,AI 阻止工作,这事儿是力大砖飞。
没有技巧,全特么是数值。






















































