为特朗普“敲响警钟”的浙江青年企业家梁文锋告诉我们什么
——兼说特朗普上台10天来中美人工智能竞争势态
李 锦
春节前后,世界上最有影响的企业新闻,莫过于浙江大模型创业公司深度求索公司(DeepSeek)梁文锋带来的人工智能冲击波。在外网被不少人称为“神秘的东方力量”。美国总统特朗普认为DeepSeek的出现“给美国相关产业敲响了警钟”。全世界都在讨论中国的DeepSeek,从特朗普到马斯克再到普京。没想到,中美最高级别的科技决战竟然以如此形式出现。此事成为春节期间的舆情焦点。
我想起15年前在浙江推出杭州汽轮机厂的国企经验与“大脑国家论”,觉得从手足国家到大脑国家,得有百年之遥。没有想到同样在浙江的梁文锋把科技创新的梦实现得这么快。
我惊诧于这件事情的突然火山爆发,在特朗普上台10天时间,这个舆情影响了整个世界。我想探究的,这是一种什么样的思维创新模式,这简直太神奇了。当整个中国为科技创新投入不足而不安而忧愁时,梁文锋现象提供一个新的视角。中国进入“大脑国家”,很重要的,可能是思维的创新与开放。
“神秘的东方力量”的出现 这股“神秘的东方力量”的出现,很突然。最早引起我注意的是,1月20日李强总理听取专家与企业家意见时,浙江的年轻人梁文锋,1985年出生的,而且是2023年成立公司,并不知道他的做法多么了不起。
当天的世界经济论坛2025年年会开幕,DeepSeek发布其最新开源模型DeepSeek-R1,这一模型在技术上实现了重要突破——用纯深度学习的方法让AI自发涌现出推理能力。该模型延续了其高性价比的优势。
1月21日,特朗普在当选总统第二天就宣布“星际之门”计划,特朗普的这一决策标志着美国再次进入了以AI为核心的新一轮科技和产业竞赛。此举不仅反映了特朗普政府对人工智能技术的重视,更折射出美国对全球科技竞争格局的深远谋划。计划通过大量的资本投入,建设起全球领先的AI基础设施,以期在未来四年内通过这一计划创造10万个就业岗位。该计划由三方力量共同参与——美国的开放人工智能研究中心(OpenAI)、日本软银集团(Softbank)和美国甲骨文公司(Oracle)。每一方的参与都不仅仅是资金层面的支持,更是战略布局上的深度合作。 这是特朗普上台后最早引起我们关注的新闻之一。 仅仅过去6天,1月27日,美国股市开盘即大幅下跌,科技板块尤为惨重。美国芯片巨头英伟达一夜市值蒸发5900亿美元,合4.3万亿人民币,纳斯达克综合指数跌3.07%,台积电、博通公司、超微半导体等科技股也遭遇集体暴跌。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。 市场分析认为,核心原因是中国人工智能初创公司DeepSeek的最新突破,动摇了美国科技行业的“无敌”地位。
NVIDIA(英伟达)公司的创始人兼首席执行官黄仁勋认为,任何新兴力量的出现,都是对行业生命力的最佳印证。他们以开源策略和场景化芯片设计展现的锐意,恰如我们当年用 GPU颠覆传统计算架构时的锋芒。这种评价,值得关注。
特朗普“给美国相关产业敲响了警钟”的反应 27日,当天晚上,美国总统特朗普在佛罗里达州迈阿密发表讲话时,对中国人工智能初创公司“DeepSeek搅动纳斯达克”一事表示,DeepSeek的出现“给美国相关产业敲响了警钟”,美国“需要集中精力赢得竞争”。特朗普同时表示,他认为,DeepSeek的模型高效且经济,其出现是一种积极的发展。 据悉,DeepSeek应用程序已取代竞争对手OpenAI的ChatGPT,成为美国苹果应用商店下载量最大的免费应用程序。据报道,DeepSeek开发的模型在多项测试中的表现都优于OpenAI,且设计成本不到600万美元。 从官方的背景看,新华社的文章称,近来,中国人工智能(AI)领域,特别是大型语言模型技术迅猛发展。多方评论指出,中国AI技术的快速发展,让美国打压政策尽显尴尬。这些,也没有引起国内的关注。这里,我们只是作为背景材料了解罢了。 正月初二,就是昨天凌晨,奇安信XLab实验室监测发现,针对DeepSeek(深度求索)线上服务的攻击烈度突然升级,其攻击指令较1月28日暴增上百倍。XLab实验室观察到,至少有2个僵尸网络参与攻击,共发起了两波次攻击。每次中国优秀的明星产品或企业崛起之时,总会遭到一些境外不法势力的暗中阻击。上一次是《黑神话:悟空》全球上线后,遭遇了海外60个僵尸网络大规模攻击,而这次DeepSeek上线以来,也遭遇了包括僵尸网络在内的多轮攻击,攻击方式一直在进化和复杂化。梁文锋与(DeepSeek)此时的压力山一样大。 这几天,中美两国乃至全球围绕中国的DeepSeek 展开了一场激烈的争吵,而争论的核心焦点在于:DeepSeek 究竟是谁创造的?可以肯定,DeepSeek 是以梁文锋为首的中国 “科技少年班集体” 的作品。也有观点是,DeepSeek 存在 “违规蒸馏” 行为,使用了美国公司的专有模型来进行自我培训。然而,从其可识别性来看,特征十分清晰,并且美国目前并不具备与之类似的产品。无论是在性能、成本方面,还是在社会大众的认可度上,DeepSeek 都展现出了创新性大模型产品的特质。美国有这样的东西吗?并没有。
中美竞争的走势怎样,有待观察。
我想起14年前提出的“大脑国家论” 这里想说一件事情,是2010年我对浙江科技企业的调查。
我在2010年跟踪富士康的“十三跳”,写了10多篇批评中国经济发展方式的文章。搜狐网在首页发表我的文章 《地方政府帮富士康“抓壮丁”是昏了头》,当天发出,有1861839人阅读,549人评论。我觉得进入新世纪第二个十年中国,中国经济面临转型升级的关键时刻,中国经济振兴的核心问题,要科技创新,对代工经济模式要敢于揭露。我是一个深刻的批判者,更应该是一个负责的建设者,我在现实中找到了一个破解难题的国有企业样板。我们的《杭州汽轮形成全新的自主创新发展模式》一文长达九千余字,中国工业报用了整整一个版来刊登。原机械工业部老部长孙光远已84岁高龄,拿着放大镜看了一上午,连声说好,称赞从这个调查里看到了中国工业现代化的标准。
2010年8月8日,中央政治局委员、国务院副总理张德江在这次调查报告上作出批示:“杭州汽轮动力集团经过引进、消化、吸收、创新,实现了后来居上,从卖产品到提供全方位系统解决服务方案,实现了新的飞跃。其经验宝贵,值得工业系统特别是机械制造业学习借鉴。”在杭汽轮的调研与富士康事件的思考基础上,我将调研上升至理论层面,提出了酝酿已久的“大脑国家理论”。我借用身体的不同部位来比喻国家发展与创新程度的高低。
“大脑”是指挥“躯干”与“手脚”的。 我认为,所谓“大脑国家”就是以技术创新为基本战略,以生产知识与输出知识为主的国家,共同特征是创新投入高,科技进步贡献率高达70% 以上,自主创新能力强,且创新产出高。美国、德国、日本等国家属于此列。处于第二层级的“躯干国家”,经济有一定基础,也形成独立性,但创新能力不强,缺乏核心技术。在应对很多国际经济问题时往往没有足够的话语权,经常会受到“大脑国家”的牵制。“手脚国家”则更低一级,只能按照“大脑国家”和“躯干国家”的意志为这个整体提供原材料和初级加工。一旦危机来袭,受冲击往往最大。就目前总体情况来看,我国仍然处在“躯干国家”的地位。富士康现象则是代工现象,是“手脚国家”。(以上一段,是我的“大脑国家论”原文,一字未改)在党的十八大以后,提出科技兴国,那是后话了。
我将“大脑国家”理论扩展至企业间的对比。在我看来,杭汽轮公司正是“大脑企业”的代表,展示了中国转变经济发展方式走向“大脑国家”的正确方向。这一理论将成为中国经济转型升级的一面旗帜,引导更多的企业走向转型升级的道路。当时,只是一个方向,提出也是不容易的。因为我的任务是“破解国家难题”,我做到了。 我也只能做到这样。
没有想到中美局部对决来得这么快 14年前,我在浙江提出了酝酿已久的“大脑国家理论”。这只是中国人的一种梦想。同样是在杭州,我看到“大脑国家理论”的实现。这个,来得太快了。 按照特朗普的思路,中美决战,大概率不会在真正的战场上了,而是在科技战场。然而,在科技、金融这两场战争的决战层面,科技战又是胜利的关键。在科技战方面的“上甘岭”就是人工智能! 全世界都知道,在人工智能领域,美国是领跑者,中国是跟跑者。事实上,美国已经把整个国家的国运都赌在了人工智能方面,从而试图巩固自己在科技领域的霸权地位。 事实上,在这场大国的终极对决中,国际上的一些资本已经开始站队了。在特朗普上台第一天,日本人孙正义表态要在4年时间里投资5000亿美元在美国的人工智能领域就是非常清楚的站队,该计划叫“星际之门”。该计划由OpenAI、软银集团和甲骨文公司联合发起,旨在支持美国的人工智能(AI)发展,要投资于人工智能基础设施建设。他没有那么多钱,是一种虚张声势。 所谓的“星际之门”计划,就是基于OpenAI在AI领域的遥遥领先,然后立足于美国在人工智能芯片领域的技术优势,由软银来作为投资方聚集全球资金,投资人工智能硬件和软件的基础设施。如此一来,有了足够强大的算力,Open AI就能获得其他国家无法获得的优势。 然而,特朗普还没高兴三天,中国就给让人工智能的竞争破局了,把中美之间直接拉到了一个竞争水平线上。
我们知道,中美在人工智能对决还不到时候。美国势必对中国科技企业的打压,从封杀华为到限制中芯国际,再到如今对DeepSeek 的无端质疑,其背后不仅是对中国技术崛起的恐惧,更是维护其全球科技霸权的战略考量。
梁文锋现象最重要的经验是什么? 很显然,我们目前和美国比算力是比不过的。梁文峰团队是独辟蹊径,走了一条和Open AI完全不同的路子。OpenAI是最早的AI模型规则制定者,它定下来的AI模型四个环节被认为是人工智能的铁律,包括:预训练、有监督微调、奖励建模和强化学习。就是说,Open AI模型的四大环节是不可少的,预训练出来的模型必须得在监督下不断微调,然后持续进行训练的。但是,梁文峰团队的模型直接将四个环节改成了三个环节,把有监督微调给去掉了,换句话会所就是DeepSeek不是在“老师”监督下来完成训练,而是自己自动训练,即无监督式微调(SFT)。 如该公司开发的DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,双方的成本至少是10倍的差距。不仅如此,我们更应该看到,Open AI已经募集了143亿美元,花了十年才做到的事情,现在DeepSeek仅仅用了一年多时间,花了几百万美元就做到了。这个比较,是否科学,还需要考虑。我个人理解,很多成本的东西,美国人已经花了。科学技术的发展是一个接续不断的过程。人类的进步需要无数个像梁文锋这样的团队,也需要更多如美国硅谷般的创新力量。梁文锋的做法是在巨人肩上的努力,这一点,我们应当承认。 从实际情况看, 大家似乎突然意识到,原来人工智能根本不需要那么多芯片,甚至都不需要那么高端的芯片,因为中国的大模型训练出来的DeepSeek,其性能与美国最先进的AI相媲美。成本低当然意味着AI芯片需求的大幅减少,所以市值严重溢价的英伟达就开始暴跌了。 人工智能的竞争,归根结底还是能源和成本的竞争。然而,现在的情况是,DeepSeek问世后,意味着中国的AI成本将是美国的十分之一不到。美国“星际之门”计划投资5000亿美元,中国不到500亿美元就追上了。起码,从表面看,是这样。 DeepSeek是一家名不见经传的小公司,全称杭州深度求索人工智能基础技术研究有限公司,2023年7月17日才刚刚成立,一共才成立了一年半时间。说起来DeepSeek,在以前几乎没人知道,但说起来他的实控人,投资圈知道梁文峰是做量化交易的,其创办的幻方量化基金目前的管理资金规模超过百亿,2021年还一度突破千亿元规模,所以他的第一桶金是干量化交易挣的。我们都知道,现在股价是遏制量化交易发展的,他在2023年转型了,就搞了DeepSeek,结果一年多时间就震惊环宇。 当然,梁文锋的故事也是一个关于青年企业家成长、奋斗与创新的传奇。他的成功为我们提供了宝贵的启示和借鉴。在未来的科技发展中,我们需要更加注重培养跨学科、复合型人才,推动各个领域之间的深度融合和创新发展。 这场破局,将带来一场人类的AI革命,无论你愿不愿意,都将被卷入其中。我们真的看不懂梁文锋现象最重要东西在哪里,应该是突破性的科技创新。一个做量化交易的,在2023年才转型,就一下子就直接在地球上“爆炸”了!这其中的交界处思维是怎么沟通的,跨学科、复合型人才是怎样成功的。这里的重要元素,谁能讲清这个问题? 这场破局,是建立在前人,尤其是高科技最发达的美国的创新创造基础之上而产生的。也就是说,DeepSeek 是站在巨人的肩膀上,通过对既有技术的整合与发展才得以问世。怎样站在巨人的肩膀上,做出超越巨人的成就,这个,谁能讲清? 这场破局,告诉我们进入 2024 年,利用强化学习(Reinforcement Learning, RL)训练模型生成思维链(Chain of Thought, CoT) 成为 AI 训练的新焦点。新的训练范式采用两阶段方法,先训练传统预训练模型,使其具备基础能力。其次,通过强化学习(RL) 增强模型的推理能力。这种训练方式成功,这里的重要元素,谁能讲清? 这场破局告诉我们,创新开放思维是一种灵活、包容和富有创造力的思考方式。它使我们能够接受新观点、尝试新方法,并从失败中学习。创新思维帮助我们超越传统的限制,拓展视野,找到更多机会和解决问题的途径。梁文锋的思维革命,是怎样一个过程。谁能讲清? 今天是正月初三,从28日至今天,才4天时间。事态还在发展。特朗普讲“敲响警钟”,也才过去三天时间,特朗普上台也才10天时间。这种“神秘东方力量”冲击波仍然在发酵、发展。 梁文锋思维是什么形态,中国怎样走向“大脑国家”,我们期待新的信息告诉我们。 (编辑:思雅) |