发布日期:2026-05-25 23:29点击次数:

DeepSeek近动作每每潮州设备保温工程。
先是5月22日,彭博社爆出他们正在进700亿元东谈主民币的融资,投前估值达450亿好意思元。
同天,DeepSeek官宣V4-Pro API降价75——把促销价平直焊死成正价。
边向投资东谈主要钱,边向树立者让利。这操作,若干有点让东谈主模糊。
那么问题来了,DeepSeek到底要靠什么成绩,而况还要赚好多好多钱?
毕竟,AGI可不是能口嗨出来的。
这恰是x博主@bookwormengr近研究的个狠问题。
他在长文《DeepSeek's 10 trillion USD grand strategy》中建议个相配斗胆的判断:DeepSeek实在的星辰大海,可能不是编程套餐,不是语音助手,而是参与塑造个价值10万亿好意思元别的AI硬件生态,并在这个生态里冲击万亿好意思元估值。
仔细读完@bookwormengr的这篇万字长文,你会发现:梁文锋不是子,他是棋手。
邮箱:215114768@qq.com而况是手,他下的是盘价值10万亿好意思元的棋。
能人之旅 场反共鸣的期间长征回来DeepSeek的成长轨迹,用「能人之旅」来描写不为过。
在总计东谈主齐在堆Dense模子、卷参数目的期间,DeepSeek去啃难训的MoE(混模子),用少的设想量撬动的智能。
别东谈主用PPO作念强化学习,他们从旨趣启程,发明了低廉的GRPO算法。
别东谈主还在连系RLHF的天花板,他们还是跑通了RLVR(基于可考证励的强化学习),把理才智拉上了新台阶。
MLA、DSA(解耦寥落瞩眼力)、mHC(流形敛迹相连)、CSA和HCA——这些齐不是论文里的花拳绣腿,每项齐在修起同个问题:怎样在有限的硬件条件下,榨出大的AI算力?
能人从来不是驱动就知谈我方的责任。他在路上不休斗争、不休发现,终找到了我方的终宿命。
DeepSeek的宿命,从来齐不是API套餐。
谈兴味的数学题 KV Cache的私密让咱们从个具体的数字驱动讲这个故事。
开kvcache.ai的在线设想器,输入100万token凹凸文、8bit KV精度、16bit索引精度,你会看到组让东谈主瞠主见对比:DeepSeek V4仅需5.48GBHBM。
比较之下,其他顶开源模子则动辄需要60GBHBM。
瞩目潮州设备保温工程,DeepSeek V4是个1.6万亿参数的模子,体量巨大于其他开源模子,KV Cache占用却惟一它们的头。
这意味着DeepSeek不错把缓存掷中的价钱定到个令东谈主发指的低位——V4-Pro缓存掷中价仅0.025元/百万Token,不到Claude Sonnet 4.6同类价钱的3,而况不错捏续缓存数小时。
降价后,输入缓存未掷中3元/百万Token,输出6元/百万Token,沿路是原价的四分之。
梁文锋两年前就说过DeepSeek的订价形而上学:咱们的原则是不贴钱,也不赚取暴利。
当今看来,他说的是真话——当你的KV Cache惟一别东谈主的十分之,你的成本便是别东谈主的头。
但的问题是:这个红利到底流向了何处?
十万亿好意思元的棋盘 硬件生态的重构谜底藏在三个缩写里:SSD、LPDDR、HBM。
层:SSD与NAND闪存。KV Cache被压缩到小之后,不错地卸载(offload)到SSD上,等需要时再快速加载回HBM。
DeepSeek在Dual Path论文中还门化了从SSD加载KV Cache的速率。这平直减少了对腾贵HBM的依赖。
谁是SSD和NAND闪存的大玩?DeepSeek每压缩分KV Cache,就在为NAND和SSD创造个庞杂的新商场。
二层:LPDDR内存。SGLang团队发表的研究标明,LPDDR不错行为「权重暂存区」——模子权重先放在LPDDR里,需要时再流式传输到HBM中,大幅缓解HBM的容量压力。
DeepSeek的MoE架构适配这个案:数目多、权重不错4bit量化,流式加载相配。
谁在作念LPDDR?国产速率只过期0.5代,密度过期1代,追逐的脚步还是很近。
三层:GPU/ASIC的减压。Engram模块用LPDDR中的哈希查表替代Transformer的前向传播设想,铝皮保温本色上是用每比特成本低的「内存读取」替代每比特成本的「GPU运算」。
这对AI芯片意旨要害——由于EUV光刻机受限,国产GPU在原始FLOPs上过期。但淌若你能用多的低廉内存来替代少的腾贵算力,那这种「换谈车」就变得理了。
再加上TileLang——DeepSeek投资的跨硬件内核编译框架,不错让套设想代码同期跑在多种硬件平台上,非常于绕过了「CUDA护城河」。国产芯片厂商,齐有可能因此获取生态层面的冲破。
当今你明显了吗?DeepSeek作念的每项期间改进,齐在指向同个向:缩小对顶硬件的依赖,让现存的存储、芯片、网罗生态变得敷裕用,致使好用。
@bookwormengr算了笔大账:大家AI关联股票的总市值早已远10万亿好意思元。
淌若DeepSeek能匡助构建个等量的AI硬件生态,它我方在这盘棋里拿到1万亿好意思元的估值,乎逻辑。
不赚快钱的逻辑回头看DeepSeek的总计「不作念」——不作念多模态(V4.1才驱动试水图像和音频)、不作念语音模子、不作念模子、API降再降——就说得通了。
不是「不会成绩」,而是「暂时不屑于赚这种钱」。
@bookwormengr建议了个精彩的类比:OpenAI拿到了AMD和Cerebras的股权认购权证,只须实现算力采购里程碑就不错廉价买入股票。这本色上是「用应许换股权」——你帮我造芯片,我给你订单,咱们起把蛋糕作念大。
DeepSeek不错复制这个形状。
只不外它濒临的不是AMD和Cerebras,而是整条国产AI硬件产业链。
梁文锋是量化基金诞生,被称为「Jim Simmon的赤诚粉丝」。这么个东谈主,不行能不懂本钱运作的精妙之处。
事实上,融资音问传出前,他还是在2026年4月完成了次枢纽的股权诊治——通过平直与蜿蜒捏股设施公司约84.29的股权,表决权。
宁德时间投DeepSeek——它要锁定将来AI数据中心的储能订单。京东、网易入局,各有各的政策诉求。
国大基金下场,是把DeepSeek定位成了国AI基础智商。
这些投资者看到的,不是个API的小贸易。他们看到的,是个可能重塑大家AI硬件样式的政策支点。
终责任 大领域强化学习与AGI但淌若你合计DeepSeek的极度是「作念AI硬件生态的发动机」,那可能如故低估了梁文锋。
据彭博社报谈,梁文锋在投资者会议上明确表态:DeepSeek的主要主见是动期间规模,追求AGI。
硬件生态是妙技,AGI才是主见。
逻辑是这么:当多硬件采取变得可用、当算力需求本人被期间改进大幅压低,DeepSeek就能以低的成本启动大领域的锻真金不怕火——至极是强化学习(RL)后锻真金不怕火和递归自我更变(RSI)。
大领域RL意味着模子需要生成海量的理轨迹——万亿token的生成量,设想成本其。而100万凹凸文的长程任务,要求轨迹本人也敷裕长。
淌若莫得致的硬件率化,这种锻真金不怕火根柢跑不起来。
RSI则加斗胆——让AI我方设想实验、现实实验、分析服从、更变自身。这是个试错密度的流程,对算力的需求是底洞。
但淌若DeepSeek通过重构硬件生态把算力成本下来,这条路就变得可行。
从MoE到MLA,从DSA到CSA,从Engram到TileLang,从KV Cache压缩到LPDDR流式加载——总计这些改进,终鸠集聚到同个极度:让AGI的锻真金不怕火从「不起」形成「得起」。
梁文锋与DeepSeek的星辰大海,从来不是海面上的浪花,而是洋流本人。
本文开头:新智元
风险辅导及责条件 商场有风险,投资需严慎。本文不组成个东谈主投资建议,也未辩论到个别用户非常的投资主见、财务情景或需要。用户应试虑本文中的任何主见、不雅点或论断是否符其特定情景。据此投资,包袱得意。 相关词条:铁皮保温 塑料挤出机 钢绞线 玻璃卷毡厂家 保温护角专用胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。
18632699551