【李锦评说】特朗普上台10天来中美人工智能竞争势态

　　为特朗普“敲响警钟”的浙江青年企业家梁文锋告诉我们什么

　 ——兼说特朗普上台10天来中美人工智能竞争势态

　　李锦

　　春节前后，世界上最有影响的企业新闻，莫过于浙江大模型创业公司深度求索公司（DeepSeek）梁文锋带来的人工智能冲击波。在外网被不少人称为“神秘的东方力量”。美国总统特朗普认为DeepSeek的出现“给美国相关产业敲响了警钟”。全世界都在讨论中国的DeepSeek，从特朗普到马斯克再到普京。没想到，中美最高级别的科技决战竟然以如此形式出现。此事成为春节期间的舆情焦点。

　　我想起15年前在浙江推出杭州汽轮机厂的国企经验与“大脑国家论”，觉得从手足国家到大脑国家，得有百年之遥。没有想到同样在浙江的梁文锋把科技创新的梦实现得这么快。

　　我惊诧于这件事情的突然火山爆发，在特朗普上台10天时间，这个舆情影响了整个世界。我想探究的，这是一种什么样的思维创新模式，这简直太神奇了。当整个中国为科技创新投入不足而不安而忧愁时，梁文锋现象提供一个新的视角。中国进入“大脑国家”，很重要的，可能是思维的创新与开放。

　　“神秘的东方力量”的出现

　　这股“神秘的东方力量”的出现，很突然。最早引起我注意的是，1月20日李强总理听取专家与企业家意见时，浙江的年轻人梁文锋，1985年出生的，而且是2023年成立公司，并不知道他的做法多么了不起。

　　当天的世界经济论坛2025年年会开幕，DeepSeek发布其最新开源模型DeepSeek-R1，这一模型在技术上实现了重要突破——用纯深度学习的方法让AI自发涌现出推理能力。该模型延续了其高性价比的优势。

　　1月21日，特朗普在当选总统第二天就宣布“星际之门”计划，特朗普的这一决策标志着美国再次进入了以AI为核心的新一轮科技和产业竞赛。此举不仅反映了特朗普政府对人工智能技术的重视，更折射出美国对全球科技竞争格局的深远谋划。计划通过大量的资本投入，建设起全球领先的AI基础设施，以期在未来四年内通过这一计划创造10万个就业岗位。该计划由三方力量共同参与——美国的开放人工智能研究中心（OpenAI）、日本软银集团（Softbank）和美国甲骨文公司（Oracle）。每一方的参与都不仅仅是资金层面的支持，更是战略布局上的深度合作。这是特朗普上台后最早引起我们关注的新闻之一。

　　仅仅过去6天，1月27日，美国股市开盘即大幅下跌，科技板块尤为惨重。美国芯片巨头英伟达一夜市值蒸发5900亿美元，合4.3万亿人民币，纳斯达克综合指数跌3.07%，台积电、博通公司、超微半导体等科技股也遭遇集体暴跌。此外，人工智能领域的衍生品，如电力供应商也受到重创。美国联合能源公司股价下跌21%，Vistra的股价下跌29%。

　　市场分析认为，核心原因是中国人工智能初创公司DeepSeek的最新突破，动摇了美国科技行业的“无敌”地位。

　　NVIDIA（英伟达）公司的创始人兼首席执行官黄仁勋认为，任何新兴力量的出现，都是对行业生命力的最佳印证。他们以开源策略和场景化芯片设计展现的锐意，恰如我们当年用 GPU颠覆传统计算架构时的锋芒。这种评价，值得关注。

　　 特朗普“给美国相关产业敲响了警钟”的反应

　　27日，当天晚上，美国总统特朗普在佛罗里达州迈阿密发表讲话时，对中国人工智能初创公司“DeepSeek搅动纳斯达克”一事表示，DeepSeek的出现“给美国相关产业敲响了警钟”，美国“需要集中精力赢得竞争”。特朗普同时表示，他认为，DeepSeek的模型高效且经济，其出现是一种积极的发展。

　　据悉，DeepSeek应用程序已取代竞争对手OpenAI的ChatGPT，成为美国苹果应用商店下载量最大的免费应用程序。据报道，DeepSeek开发的模型在多项测试中的表现都优于OpenAI，且设计成本不到600万美元。

　　从官方的背景看，新华社的文章称，近来，中国人工智能（AI）领域，特别是大型语言模型技术迅猛发展。多方评论指出，中国AI技术的快速发展，让美国打压政策尽显尴尬。这些，也没有引起国内的关注。这里，我们只是作为背景材料了解罢了。

　　正月初二，就是昨天凌晨，奇安信XLab实验室监测发现，针对DeepSeek（深度求索）线上服务的攻击烈度突然升级，其攻击指令较1月28日暴增上百倍。XLab实验室观察到，至少有2个僵尸网络参与攻击，共发起了两波次攻击。每次中国优秀的明星产品或企业崛起之时，总会遭到一些境外不法势力的暗中阻击。上一次是《黑神话：悟空》全球上线后，遭遇了海外60个僵尸网络大规模攻击，而这次DeepSeek上线以来，也遭遇了包括僵尸网络在内的多轮攻击，攻击方式一直在进化和复杂化。梁文锋与（DeepSeek）此时的压力山一样大。

　　这几天，中美两国乃至全球围绕中国的DeepSeek 展开了一场激烈的争吵，而争论的核心焦点在于：DeepSeek 究竟是谁创造的？可以肯定，DeepSeek 是以梁文锋为首的中国 “科技少年班集体” 的作品。也有观点是，DeepSeek 存在 “违规蒸馏” 行为，使用了美国公司的专有模型来进行自我培训。然而，从其可识别性来看，特征十分清晰，并且美国目前并不具备与之类似的产品。无论是在性能、成本方面，还是在社会大众的认可度上，DeepSeek 都展现出了创新性大模型产品的特质。美国有这样的东西吗？并没有。

　　中美竞争的走势怎样，有待观察。

　　我想起14年前提出的“大脑国家论”

　　这里想说一件事情，是2010年我对浙江科技企业的调查。

　　我在2010年跟踪富士康的“十三跳”，写了10多篇批评中国经济发展方式的文章。搜狐网在首页发表我的文章《地方政府帮富士康“抓壮丁”是昏了头》，当天发出，有1861839人阅读，549人评论。我觉得进入新世纪第二个十年中国，中国经济面临转型升级的关键时刻，中国经济振兴的核心问题，要科技创新，对代工经济模式要敢于揭露。我是一个深刻的批判者，更应该是一个负责的建设者，我在现实中找到了一个破解难题的国有企业样板。我们的《杭州汽轮形成全新的自主创新发展模式》一文长达九千余字，中国工业报用了整整一个版来刊登。原机械工业部老部长孙光远已84岁高龄，拿着放大镜看了一上午，连声说好，称赞从这个调查里看到了中国工业现代化的标准。

　　2010年8月8日，中央政治局委员、国务院副总理张德江在这次调查报告上作出批示：“杭州汽轮动力集团经过引进、消化、吸收、创新，实现了后来居上，从卖产品到提供全方位系统解决服务方案，实现了新的飞跃。其经验宝贵，值得工业系统特别是机械制造业学习借鉴。”在杭汽轮的调研与富士康事件的思考基础上，我将调研上升至理论层面，提出了酝酿已久的“大脑国家理论”。我借用身体的不同部位来比喻国家发展与创新程度的高低。

　　“大脑”是指挥“躯干”与“手脚”的。

　　我认为，所谓“大脑国家”就是以技术创新为基本战略，以生产知识与输出知识为主的国家，共同特征是创新投入高，科技进步贡献率高达70% 以上，自主创新能力强，且创新产出高。美国、德国、日本等国家属于此列。处于第二层级的“躯干国家”，经济有一定基础，也形成独立性，但创新能力不强，缺乏核心技术。在应对很多国际经济问题时往往没有足够的话语权，经常会受到“大脑国家”的牵制。“手脚国家”则更低一级，只能按照“大脑国家”和“躯干国家”的意志为这个整体提供原材料和初级加工。一旦危机来袭，受冲击往往最大。就目前总体情况来看，我国仍然处在“躯干国家”的地位。富士康现象则是代工现象，是“手脚国家”。（以上一段，是我的“大脑国家论”原文，一字未改）在党的十八大以后，提出科技兴国，那是后话了。

　　我将“大脑国家”理论扩展至企业间的对比。在我看来，杭汽轮公司正是“大脑企业”的代表，展示了中国转变经济发展方式走向“大脑国家”的正确方向。这一理论将成为中国经济转型升级的一面旗帜，引导更多的企业走向转型升级的道路。当时，只是一个方向，提出也是不容易的。因为我的任务是“破解国家难题”，我做到了。我也只能做到这样。

　　 没有想到中美局部对决来得这么快

　　14年前，我在浙江提出了酝酿已久的“大脑国家理论”。这只是中国人的一种梦想。同样是在杭州，我看到“大脑国家理论”的实现。这个，来得太快了。

　　按照特朗普的思路，中美决战，大概率不会在真正的战场上了，而是在科技战场。然而，在科技、金融这两场战争的决战层面，科技战又是胜利的关键。在科技战方面的“上甘岭”就是人工智能！

　　全世界都知道，在人工智能领域，美国是领跑者，中国是跟跑者。事实上，美国已经把整个国家的国运都赌在了人工智能方面，从而试图巩固自己在科技领域的霸权地位。

　　事实上，在这场大国的终极对决中，国际上的一些资本已经开始站队了。在特朗普上台第一天，日本人孙正义表态要在4年时间里投资5000亿美元在美国的人工智能领域就是非常清楚的站队，该计划叫“星际之门”。该计划由OpenAI、软银集团和甲骨文公司联合发起，旨在支持美国的人工智能（AI）发展，要投资于人工智能基础设施建设‌。他没有那么多钱，是一种虚张声势。

　　所谓的“星际之门”计划，就是基于OpenAI在AI领域的遥遥领先，然后立足于美国在人工智能芯片领域的技术优势，由软银来作为投资方聚集全球资金，投资人工智能硬件和软件的基础设施。如此一来，有了足够强大的算力，Open AI就能获得其他国家无法获得的优势。

　　然而，特朗普还没高兴三天，中国就给让人工智能的竞争破局了，把中美之间直接拉到了一个竞争水平线上。

　　我们知道，中美在人工智能对决还不到时候。美国势必对中国科技企业的打压，从封杀华为到限制中芯国际，再到如今对DeepSeek 的无端质疑，其背后不仅是对中国技术崛起的恐惧，更是维护其全球科技霸权的战略考量。

　　 梁文锋现象最重要的经验是什么？

　　很显然，我们目前和美国比算力是比不过的。梁文峰团队是独辟蹊径，走了一条和Open AI完全不同的路子。‌OpenAI是最早的AI模型规则制定者，它定下来的AI模型四个环节被认为是人工智能的铁律，包括：预训练、有监督微调、奖励建模和强化学习。就是说，Open AI模型的四大环节是不可少的，预训练出来的模型必须得在监督下不断微调，然后持续进行训练的。但是，梁文峰团队的模型直接将四个环节改成了三个环节，把有监督微调给去掉了，换句话会所就是DeepSeek不是在“老师”监督下来完成训练，而是自己自动训练，即无监督式微调（SFT）‌。

　　如该公司开发的DeepSeek-V3训练成本仅557.6万美元，而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元，双方的成本至少是10倍的差距。不仅如此，我们更应该看到，Open AI已经募集了143亿美元，花了十年才做到的事情，现在DeepSeek仅仅用了一年多时间，花了几百万美元就做到了。这个比较，是否科学，还需要考虑。我个人理解，很多成本的东西，美国人已经花了。科学技术的发展是一个接续不断的过程。人类的进步需要无数个像梁文锋这样的团队，也需要更多如美国硅谷般的创新力量。梁文锋的做法是在巨人肩上的努力，这一点，我们应当承认。

　　从实际情况看，大家似乎突然意识到，原来人工智能根本不需要那么多芯片，甚至都不需要那么高端的芯片，因为中国的大模型训练出来的DeepSeek，其性能与美国最先进的AI相媲美。成本低当然意味着AI芯片需求的大幅减少，所以市值严重溢价的英伟达就开始暴跌了。

　　人工智能的竞争，归根结底还是能源和成本的竞争。然而，现在的情况是，DeepSeek问世后，意味着中国的AI成本将是美国的十分之一不到。美国“星际之门”计划投资5000亿美元，中国不到500亿美元就追上了。起码，从表面看，是这样。

　　DeepSeek是一家名不见经传的小公司，全称杭州深度求索人工智能基础技术研究有限公司，2023年7月17日才刚刚成立，一共才成立了一年半时间。说起来DeepSeek，在以前几乎没人知道，但说起来他的实控人，投资圈知道梁文峰是做量化交易的，其创办的幻方量化基金目前的管理资金规模超过百亿，2021年还一度突破千亿元规模，所以他的第一桶金是干量化交易挣的。我们都知道，现在股价是遏制量化交易发展的，他在2023年转型了，就搞了DeepSeek，结果一年多时间就震惊环宇。

　　当然，梁文锋的故事也是一个关于青年企业家成长、奋斗与创新的传奇。他的成功为我们提供了宝贵的启示和借鉴。在未来的科技发展中，我们需要更加注重培养跨学科、复合型人才，推动各个领域之间的深度融合和创新发展。

　　这场破局，将带来一场人类的AI革命，无论你愿不愿意，都将被卷入其中。我们真的看不懂梁文锋现象最重要东西在哪里，应该是突破性的科技创新。一个做量化交易的，在2023年才转型，就一下子就直接在地球上“爆炸”了！这其中的交界处思维是怎么沟通的，跨学科、复合型人才是怎样成功的。这里的重要元素，谁能讲清这个问题？

　　这场破局，是建立在前人，尤其是高科技最发达的美国的创新创造基础之上而产生的。也就是说，DeepSeek 是站在巨人的肩膀上，通过对既有技术的整合与发展才得以问世。怎样站在巨人的肩膀上，做出超越巨人的成就，这个，谁能讲清？

　　这场破局，告诉我们进入 2024 年，利用强化学习（Reinforcement Learning, RL）训练模型生成思维链（Chain of Thought, CoT）成为 AI 训练的新焦点。新的训练范式采用两阶段方法，先训练传统预训练模型，使其具备基础能力。其次，通过强化学习（RL）增强模型的推理能力。这种训练方式成功，这里的重要元素，谁能讲清？

　　这场破局告诉我们，创新开放思维是一种灵活、包容和富有创造力的思考方式。它使我们能够接受新观点、尝试新方法，并从失败中学习。创新思维帮助我们超越传统的限制，拓展视野，找到更多机会和解决问题的途径。梁文锋的思维革命，是怎样一个过程。谁能讲清？

　　今天是正月初三，从28日至今天，才4天时间。事态还在发展。特朗普讲“敲响警钟”，也才过去三天时间，特朗普上台也才10天时间。这种“神秘东方力量”冲击波仍然在发酵、发展。

　　梁文锋思维是什么形态，中国怎样走向“大脑国家”，我们期待新的信息告诉我们。

(编辑：思雅)