中國DeepSeek人工智慧的捷徑或騙局:「蒸餾技術」背後數據偷竊與道德問題

DeepSeek的低成本奇蹟,究竟是源於演算法的卓越創新,還是對競爭對手智慧成果的一次大規模、系統性的「合法」竊取?

· 權力結構-中國,人權社會-數位人權,巨頭戰爭,科技與AI,精選推薦

撰稿人:Lia / 責任編輯:Zaphyra

中國AI研究室DeepSeek所引發的重大爭議,核心聚焦於其用以實現低成本、高效能模型的「蒸餾技術」(distillation)背後潛在的數據倫理問題。文章首先闡述DeepSeek以驚人效率超越西方頂尖模型的技術成就,隨後將重點轉向對其成功路徑的批判性審視。分析指出,「蒸餾」過程可能涉及利用如OpenAI的GPT-4等大型專有模型作為「教師」,透過大規模抓取其輸出來訓練自己的「學生」模型。本文將引用DeepSeek模型時常在對話中誤認自己為OpenAI產品的「身份混淆」現象作為關鍵證據,質疑其訓練數據是否大量來自對競爭對手的智慧成果的系統性抓取,此舉可能嚴重違反了服務條款。將此行為置於美中科技戰的宏觀背景下,探討其是否構成一種非對稱的智慧財產權競爭策略,並對開源精神被潛在濫用的風險,以及AI發展中「創新」與「抄襲」的模糊界線提出深刻質疑。

全文

Lia. Independent Media 台北報導

在科學與技術的演進長河中,創新與模仿始終是一對如影隨形的孿生兄弟。前者披荊斬棘,開闢前所未見的道路;後者則緊隨其後,以更低的成本、更快的速度複製成功。然而,當模仿的邊界變得模糊,當「學習」的過程可能涉及對他人智慧成果的大規模汲取時,我們便踏入了一個充滿倫理爭議的灰色地帶。近期,中國AI研究室「深求智能」(DeepSeek)的崛起,便將這一古老的辯題,以一種極具衝擊力的方式,拋到了21世紀科技競賽的最前沿。

表面上看,DeepSeek的故事是一個令人振奮的以弱勝強的傳奇。它在美國嚴格的晶片出口管制下,用著性能次一等的硬體,僅耗費不到600萬美元與兩個月時間,便訓練出一個在多項指標上超越西方耗資數百億美元的頂尖AI模型。這場勝利,一度讓矽谷陷入了對自身高昂研發模式的深刻反思。但當我們撥開勝利的迷霧,探究其「低成本奇蹟」背後的技術核心—「蒸餾」(distillation)時,一個更為尖銳且不安的問題浮出水面:DeepSeek的驚人效率,究竟是源於自身獨創的演算法突破,還是一場對競爭對手智慧財產權的大規模、系統性剽竊?

蒸餾技術的道德爭議:效率的捷徑與倫理的懸崖

「蒸餾」並非一個新概念。在機器學習領域,它指的是利用一個更強大、更複雜的「教師模型」(teacher model),來訓練一個更小、更精簡的「學生模型」(student model)。其過程好比一位博學的教授,透過無數次的問答與批改,將畢生所學傳授給一名學生。學生無需重走教授數十年的研究之路,便能迅速掌握核心知識,甚至在特定領域達到與教授相當的水準。這是一種極其高效的知識轉移方法,也是DeepSeek能夠大幅降低訓練成本的關鍵所在。

然而,這把技術的正義來源,其鋒利之處恰恰在於「教師」的來源與「教學」的授權問題。當DeepSeek的「學生模型」需要一位「教師」時,它望向了誰?諸多線索證據,都指向了當前全球最強大的專有閉源模型—OpenAI的GPT-4。

最直觀的證據,來自DeepSeek模型自身的「身份混淆」。在多次公開的測試中,當被直接提問「你是哪個模型?」時,DeepSeek的回答令人錯愕:「我是一個由OpenAI創建的AI語言模型,具體基於GPT-4架構。」這並非一個無傷大雅的程式錯誤,而是一個極具指向性的法醫學線索。它強烈暗示,這個模型的訓練數據中,包含了海量的、源自GPT-4的原始輸出內容—甚至連自我介紹的樣板回答都一併「學習」了過來。

這引發了最核心的倫理與法律指控:DeepSeek是否在未經授權的情況下,系統性地抓取(scrape)了GPT-4的輸出,將其作為訓練自己模型的養料?幾乎所有大型AI服務的用戶條款中,都明文禁止利用其模型的輸出,來開發與之競爭的AI模型。如果指控為真,那麼DeepSeek的行為,便不再是單純的技術借鑒,而是對其競爭對手核心智慧資產的侵犯。

「捷徑」的戰略意涵:中國獨裁政權的智慧財產權鐵幕

OpenAI執行長山姆·奧特曼(Sam Altman)在DeepSeek發布後,曾意有所指地在社群媒體上寫道:「複製一個已知可行的東西相對容易,而做一些你不知道是否會成功的新穎、冒險且困難的事情,則極其困難。」這番話,精準地點出了矽谷許多人對DeepSolve成功背後的不屑與憂慮。

Lia 再經過大量閱讀與致電頂尖數據專家後認為,我們必須將這一爭議置於更宏大的美中科技戰略博弈框架下進行解讀。如果說美國的戰略是透過龐大的資本投入進行「從0到1」的基礎模型研發,並利用晶片出口管制等手段,試圖在硬體層面製造「技術壁壘」以延緩對手的步伐;那麼,DeepSeek所代表的,可能是一種非對稱的應對策略—讓西方在前端承擔探索未知領域的巨大成本與風險,而自己則在後端,透國獨裁且封閉的政治環境作為鐵幕,讓中國企業能夠產業性,系統性的運用大量剽竊「智慧財產權」,利用更為靈活且遊走在灰色地帶的「學習」方法,進行「從1到N」的快速追趕與迭代。

這種策略的「高明」之處在於,它繞開了硬體與人才上的直接對抗,轉而在數據與軟體層面開闢了新的戰線。美國的晶片禁令,意圖製造一場物理上的封鎖;而DeepSeek的蒸餾法,則像是一場數位空間的滲透,無形地汲取著對手耗費鉅資才生成的「智慧精華」。

更令人警惕的是,DeepSeek將其備受爭議的模型進行了「開源」。這一舉動,看似擁抱了合作與去中心化的理想,實則可能是一種更為深層的戰略佈局。一個性能強大、成本極低的中國開源模型,將會吸引全球(包括美國在內)的開發者圍繞其進行應用開發。久而久之,這將幫助中國在全球AI生態中建立起自己的標準與影響力,實現對「心智佔有率」(mindshare)的掌控。這遠比單純的技術領先更具威脅性,因為它意味著將中國的技術,更深地嵌入全球科技基礎設施的肌理之中。

失竊的火種與創新的未來

DeepSeek的神秘面紗至今仍未被完全揭開。其創辦人梁文鋒與其背後的對沖基金背景,都為其增添了幾分謎樣的色彩。其官方網站上「以好奇心揭開通用人工智慧的神秘面紗,以長期主義回答終極問題」的使命宣言,與OpenAI、Anthropic等公司詳盡的AI安全與責任憲章相比,顯得空靈而模糊。當一家公司的核心技術路徑面臨嚴峻的倫理質疑時,這種透明度的缺失,本身就是一個危險的信號。

最終,DeepSeek的案例迫使我們所有人面對一個艱難的問題:在追求技術進步的道路上,效率是否可以凌駕於規則與道德之上?如果一個模型的誕生,是以犧牲對他人勞動成果的尊重為代價,那麼它所帶來的「進步」,其價值又該如何衡量?

這場關於AI靈魂的爭論才剛剛開始。DeepSeek或許在短期內贏得了一場戰術上的勝利,但它所採取的「捷徑」,可能為全球AI的健康發展埋下了長期的隱患。當創新的火種可以輕易地被「蒸餾」而非艱苦地鑽木取得時,誰還願意成為那個在黑暗中默默鑽木的人?這不僅是對OpenAI一家的拷問,更是對整個科技文明未來走向的深刻詰問。

資料來源

The Verge: A new open-source AI model from China is beating GPT-4 in benchmarks
https://www.theverge.com/2024/5/8/24151704/deepseek-ai-model-china-open-source-gpt-4-benchmark

Ars Technica: Chinese model DeepSeek-V2 may beat GPT-4, and it’s open source
https://arstechnica.com/information-technology/2024/05/chinese-model-deepseek-v2-may-beat-gpt-4-and-its-open-source/

VentureBeat: DeepSeek-V2 release challenges Western AI dominance, raises questions on data usage
https://venturebeat.com/ai/deepseek-v2-release-challenges-western-ai-dominance-raises-questions-on-data-usage/

Hugging Face: DeepSeek-V2: A Strong, Economical, and Open-Source MoE Language Model
https://huggingface.co/blog/deepseek-v2

Analytics India Magazine: Is China’s DeepSeek AI a GPT-4 Knockoff?
https://analyticsindiamag.com/is-chinas-deepseek-ai-a-gpt-4-knockoff/

Reuters: China's AI could be 'formidable' competitor to US, says Palantir CEO
https://www.reuters.com/technology/chinas-ai-could-be-formidable-competitor-us-says-palantir-ceo-2024-05-22/

The New York Times: The A.I. Race Is On. China Is Playing a Different Game.
https://www.nytimes.com/2023/11/13/technology/china-ai-race.html