本報特約記者 陳 山
中國人工智慧(AI)企業DeepSeek(深度求索)釋出的開源大模型在過去一周多時間裏火遍全球,它掀起的巨大沖擊波不僅讓美國科技界深受震動,在AI領域砸下重金的五角大廈也受到波及。多家美國媒體註意到,美軍對於DeepSeek的態度充滿矛盾:既擔心所謂的「個人數據泄露」,也對DeepSeek提出的AI發展新道路感到興奮。

DeepSeek推出了開源的生成式大模型

美軍想用移動式核電廠為AI大模型提供電力。(圖源:美國【陸軍時報】)
美軍緊急釋出禁令
美國「防務一號」網站稱,中國DeepSeek推出了開源的生成式大模型,它僅需要耗費OpenAI等美國AI公司訓練大模型所用時間和資金的一小部份,就實作了足以匹敵美國頂尖AI模型的效果。DeepSeek的創新引起白宮、華爾街和矽谷的「集體哀號」。美國總統川普也宣稱「這是我們行業的警鐘,我們需要專註於與中國的競爭」。
報道稱,基準測試結果表明,DeepSeek的大模型在推理密集型任務中極具競爭力,在數學和編碼等領域始終保持頂級效能,但在非推理任務和事實查詢準確性方面,與OpenAI最先進的產品仍有明顯差距。
即便如此,DeepSeek大模型方便好用和低成本的特性仍獲得包括五角大廈工作人員在內的美國各界人士的好評。彭博社援引知情人士的話稱,從2024年秋季起,美國軍事人員就已開始在工作電腦上下載DeepSeek較早版本的程式碼。如今DeepSeek大模型大受歡迎之後,美國海軍率先釋出禁令。隨後美國防部資訊系統局也采取行動禁止使用該模型。五角大廈宣稱,該禁令的原因是DeepSeek大模型的來源和使用涉及所謂的「安全和道德問題」。「防務一號」網站提到,美國軍方擔心,美國的個人數據廣泛泄露本身就是嚴重的「國家級漏洞」,對手在發生沖突時可能會利用它,「類似DeepSeek這樣功能強大的模型激增,可能會使這種趨勢變得更糟」。
對於美國針對DeepSeek的各種小動作,中國常駐聯合國代表傅聰於台北時間2月4日在紐約聯合國總部舉行的記者會上表示,「永遠不要低估中國科研人員的聰明才智。DeepSeek引發全球轟動和一些人的焦慮恐慌,說明技術遏制和技術限制無法奏效,這是全世界、特別是美國需要學習的一課。」傅聰表示,「我們不需要更多禁令,中美作為在當今AI領域最領先的兩個國家,不能不合作。只有共同合作發展,才能彌合數位和智慧鴻溝,特別是幫助全球南方在AI發展行程中平等受益。」
移動式核子反應爐計畫受影響
「防務一號」網站註意到,盡管美國軍方以「個人數據泄露」為由限制使用DeepSeek大模型,但後者所開辟出的全新技術路線,對於部署在相對偏遠、難以獲得穩定網路服務地區的美軍而言是一個好訊息,它們將在任務中有希望得到強大的AI工具幫助。對於渴望獲得最佳AI功能同時還要控制支出的五角大廈來說,也將從中受益匪淺。
美國【防務新聞】網站4日提到,美軍近年大力投資AI領域,希望利用AI協助美軍提高部署效率。例如美國海軍陸戰隊3日釋出的一項修訂版航空戰略,其重點就是使用自動系統、無人機和AI驅動的軟體,「以確保其戰鬥機群能夠在激烈的戰區中生存」。但五角大廈官員警告說,美國缺乏支持大規模AI基礎設施所需的能源資源和計算能力,「解決這個問題並不容易」。報道提到,盡管美國國防部有一個雄心勃勃的願景,即在一系列軍事任務中使用AI協助數據收集、情報分析、戰役和後勤等任務,但根據美國主流的大模型技術路線,執行這些AI程式所需要的海量電力和算力基礎設施「超出了五角大廈的能力」。報道提到,美國主流AI大模型所需要的龐大資源,從川普政府推動的「星際之門」計劃就可見一斑——OpenAI、軟銀和甲骨文等科技巨頭不久前宣布將共同投資5000億美元,在美國各地建設新的AI基礎設施,旨在確保美國在全球AI競爭中的領先地位。
美國防部負責研究和工程的副部長辦公室高級計算副主任羅伊·坎貝爾承認,很多時候美軍的海外基地不具備訓練AI所需的計算能力,「在某些情況下,為了解決前線作戰基地無法處理的問題,必須將這些數據傳輸回美國本土並使用國防部超級計算中心才能得到結果。」這種做法無疑極大降低了效率,而且還對通訊穩定提出了很高的要求。
【防務新聞】透露,美軍的解決思路之一是發展移動式核子反應爐為前線基地的AI大模型提供電力。五角大廈戰略能力辦公室負責開發移動核子反應爐工作的傑夫·瓦克斯曼透露,為應對AI和高功率計算等技術給電網帶來的巨大壓力,美軍於2019年啟動了「人員攜行式核子反應爐」計畫,理論上可以利用核能為AI計算獲取穩定的電力供應。但只需要較少芯片和能耗就能匹敵美國頂尖AI模型的DeepSeek突然出現後,西方分析師普遍認為,如果相關技術得到廣泛套用,可能會降低AI套用整體電力需求,因此存在較多安全隱患的美軍移動式核子反應爐的未來發展之路,很可能受到影響。
「美軍不需要通用大模型」
「防務一號」網站還提到,DeepSeek的突破提供了構建更高效工具的機會,這同樣有利於美軍。因為美國主流的「越大越好」的AI大模型發展思路(獲得更多訓練數據、生成更大的模型、構建更大的數據中心)正在擠壓美軍真正需要的邊緣計算計畫。
報道稱,美國AI大模型的效能並不一定能證明構建和驅動它們所需的大量資源是合理的。美國國防部正在沿著兩條AI技術路徑發展:需要大量計算資源的大模型,以及可以在斷網時執行於小型平台上的AI。長期以來,美國研究人員將主要註意力投入到通用大模型上,忽視了專業領域的較小型AI模型。但在美軍的實際工作中,並不需要通用大模型的復雜功能,主要需求集中在幾個特殊領域。
報道舉例稱,前線部隊會面臨各種需要AI介入的需求,包括利用AI從無人機或衛星照片數據中篩選特定型別的車輛、解析他們遇到的某種電磁訊號特征,甚至只是了解當地的經濟、天氣、人口或消費者數據,「以便在密集的城市環境中規劃更有效和安全的行動」。在這些場景中,美軍需要的是依托相對較小數據執行的AI模型,其算力「不需要大量的伺服器或GPU作為支持」。相反,由於前線地區情況多變,可能充滿敵方電磁幹擾,或者是在電力供應不足且通訊較弱的前沿小型基地,因此DeepSeek這樣只需要相對較少的算力和電力資源的高效工具,其實才更符合五角大廈的需要。
【防務新聞】則提到,針對AI能力不足問題的另一個潛在解決方案是提高處理器的效率。美國海軍研究中心空間技術副主任史蒂文·邁爾表示,他帶領的團隊正在探索使用更高效的神經形態處理器,其效率可比標準處理器高100倍,「神經形態處理器占用的空間更少,工作速度更快,能耗更低」。