一、“中国成功进行了原子弹试验,这是‘自由世界’最黑暗、最富悲剧性的一天”
1964年10月16日,在罗布泊沙漠的深处,在一阵宛如太阳般耀眼的闪光过后,面对着远方缓缓升起的蘑菇云,参与596工程的同志们沸腾了,原本安静的人群一下子成了欢乐的海洋。而在太平洋彼岸的美国,当中国原子弹横空出世的消息传到白宫的椭圆形办公室里之后,时任美国总统约翰逊却陷入了沉默,在沉默良久之后,他终于用一种充满沮丧的口气,无可奈何地承认了那个令美帝国主义者痛苦不已的事实:
美国总统林登·约翰逊
时隔60年以后,大洋彼岸的又有一群美国人,他们也经历了一次和当年约翰逊一样的至暗时刻。
当地1月23日,在美国匿名职场论坛TB(TeamBlind)上,一名Meta公司员工发布的一篇帖子一石激起千层浪。在这篇题为《Meta的生成式人工智能部门陷入了恐慌》的文章中,这位Meta公司员工用一种悲哀中又带着几分戏谑的语气如是写道:
其实不光扎克伯格的Meta,我估计这会儿山姆·奥尔特曼的OpenAI公司也挺焦虑的。因为OpenAI训练出来的 GPT-4o模型的成本高达1亿美元,这个数字几乎是深度求索训练同类模型成本的近20倍。
虽然Mate和OpenAI在AI这块花了比深度求索多得多的钱,但是最后他们搞出来的大语言模型却并没有展现出比DeepSeek更强的技术竞争力。毫不夸张地说,在这场没有硝烟的AI革命中,中国再次复现了“两弹一星”的奇迹——既用最低的成本、最高的效率,在最严苛的技术封锁下,完成了对西方霸权的弯道超车。
今天美国宣布对华禁运高端显卡,就相当于当年中苏交恶。苏联撤走对华援助专家,妄图通过这种方式来迫使我们知难而退,但是以邓稼先和于敏为代表的中国科学家却选择迎难而上,最终创造了震惊世界的科技奇迹。
我现在看深度求索搞出来的DeepSeek模型,很是有种看于敏他们当年搞出来的中国氢弹的感觉。在于敏的团队提出“于敏构型”之前,全世界都是以美国人最先提出的“泰勒-乌拉姆构型”(简称TU构型)作为指导原理开发核聚变武器的,因为氢弹最早就是美国人搞出来的嘛,完了苏联和英国也是跟着美国那一套学的。
TU构型没有想象中的那么复杂,但是有一个缺点——试错成本太高,以当时中国的国力来说很难承受。如果要通过科学实验的方式来确认这一技术路径的可行性,我们至少要花费3年的时间、并付出数亿人民币的成本,这对于当时就吃饭都成普遍问题的中国来说是不可接受的。
此后,为了验证方案可行性,他带领团队来到了中科院上海华东计算机研究所,动用了当时国内最先进的、同时也是唯一一台能以每秒5万次的运算速度进行计算的电子计算机。两个月后,于敏设想的模型在计算机验算中取得了成功,人类的氢弹理论研究由此在西方模式之外延伸出了一条东方道路。从此之后,美国的TU构型不再是解开制造氢弹难题的唯一方程式,中国的于敏构型犹如长坂坡阵前的常山赵子龙,单枪匹马,从80万曹军的重重包围之中,浴血杀出。
有关TU构型和于敏构型二者的区别,我就这个问题问了一下DeepSeek,完了它给了我一个我觉得很有意思的回答:
而于敏构型的思路则和TU构型大相径庭,DeepSeek管这叫“中式四两拨千斤”。于敏构型对于材料和计算的精度要求极高,相当于用绣花针雕微缩景观。利用这种技术造氢弹,燃料利用量要比TU构型高得多,而且不依赖复杂的冷却设备。所以,我们基于于敏构型搞出来的中国第一颗氢弹就比美国的“常春藤麦克”轻巧得多,爆炸当量虽然达到了300万吨TNT,但是总重却仅有3吨。
不仅如此,我们还是在五常之中同时最少搞出氢弹的国家。美国用了8年零6个月,苏联用了4年,英国用了4年零7个月,法国用了8年零6个月,而中国只用了2年零8个月。此外,和主导了我国原子弹工程的邓稼先等人不同,于敏是完全土生土长的中国科学家,他系北大研究生毕业,从未出国留学,但研究水平高得吓。甚至就连钱三强老爷子都曾对于敏做出过这样的评价:“于敏填补了我国原子核理论的空白。”
我为什么要在这里花这么长的篇幅向大家介绍这段往事呢?因为我在出这期节目的过程中看到了《科技日报》在今年1月中旬刊登的一篇报道《深度求索大模型:“花小钱办大事”》,其中有很多细节,让我越看越觉得有种历史照进当下的深深感慨:
包括创始人梁文锋在内,深度求索团队规模仅有139人,而且这些研究人员基本上都是国内顶尖高校的应届毕业生,又或者是还没毕业的博四、博五的实习生,也还有一些毕业才几年的年轻人。在接受采访的过程中,梁文锋特别提到,他们搞DeepSeek-V2模型的时候没有用到海外回来的人,全都是咱中国本土培养出来的苗子。而反观山姆·奥尔特曼的OpenAI呢?整个团队仅人员规模就达到了1200人,人员构成复杂,美国本土培养出来的人才并不占绝对多数,其中甚至还有不少华人面孔。
三、从于敏到梁文锋,从氢弹到AI,一代中国人有一代中国人的使命和担当
《金玉满堂》
做菜如此,做人做事也一样。老子说,治大国如烹小鲜,我相信其中的一些哲学道理用来评价中美两国的治国理政和发展道路也是适用的。
《横空出世》
梁文锋听罢,一言不发,只是径直走出伞外,任凭滂沱大雨如何下。梁文锋的眼神中写满了坚毅和不屈,那就是中国的人工智能科研工作者在面对美国同行时最直截了当的回答。
不只是陆光达,在那么多为了让祖国的人工智能技术早日赶超世界先进水平的中国科研团队里头,他们之中也应该会诞生一个冯石将军。每当聊起中美两国的人工智能竞赛,这个冯石就会以一种虽然粗糙,但却极富生命力的话语来激励大家:
“中国的大语言模型比美国的落后,中国人用美国的ChatGPT还得看人家的脸色。这口气窝囊啊,我忘不了我们中国的科研工作者被美国算力霸权挤兑欺凌的模样,他们挣扎着、哀叹着,还要忍受润人殖子们的冷嘲热讽。广大中国的普通网民更是可怜啊,人家封锁你大陆的IP地址,你付了钱也不能大大方方地用,被美国抓到了还要封你的号。”
一代人有一代人的使命。