美國醞釀AI「登月計劃」,陶哲軒領銜62頁報告重磅發佈!

新智元報道

編輯:Aeneas 好睏

【新智元導讀】就在剛剛,陶哲軒領銜的一份62頁報告出爐了,總結和預測了AI對半導體、超導體、宇宙基礎物理學、生命科學等領域帶來的巨大改變。如果這些預測在幾十年後能夠實現,美國醞釀的AI「登月計劃」就將成真。

就在剛剛,陶哲軒領銜的一份AI技術對全球研究潛在影響的技術報告發布了。

這份報告長達62頁,總結了AI對材料、半導體設計、氣候、物理、生命科學等領域已經做出的改變,以及預測它們在未來可能由AI產生的改變。

報告地址:https://www.whitehouse.gov/wp-content/uploads/2024/04/AI-Report_Upload_29APRIL2024_SEND-2.pdf

除了總結AI工具已經改變的科學領域的小插曲,陶哲軒等人還發出了三個呼籲——

1.必須賦予人類科學家更多的權能;

2.所有人必須負責任地使用AI工具;

3.國家層面需要共享基本的AI資源。

一旦必要的AI基礎設施到位,新的科學「登月計劃」將成爲可能

衆所周知,AI——可以幫助研究人員從數據中獲得更多洞見,並確定最可能的解決方案;可以幫助處理日常任務,從而讓研究人員能夠專注於核心研究;可以幫助實現實驗室流程的自動化;可以幫助完成以前很難實現的模擬;可以通過多模態基礎模型將多種形式的數據彙集在一起,並在不同科學分支之間創造新的協同效應。

而當資源到位,並可以提供算力、安全的數據共享服務、開源的AI模型以及其他關鍵基礎設施的訪問時,我們就可以開始規劃那些十分複雜且規模巨大的「登月式」科研項目。

這些項目可能包括:

- 一個模擬人類細胞複雜性的基礎模型,允許在計算機上(而不是在試管或活體內),對疾病和實驗性治療進行研究;

- 一個詳細的整個地球模型,使用傳統和AI模型來描述地球系統的組成部分,同時也不斷地用高度多樣化的實時數據進行更新;

- 通過系統收集、處理和AI輔助分析現有數據和文獻,以及自動化實驗室合成和測試可行的候選物,來發現實用的室溫超導體。

隨着共享AI資源基礎設施的出現,全新的合作形式將從規模效應中獲得實質性的好處,也就是說,隨着項目規模的擴大,單位成本會降低、效率會提高。

與此同時,這種合作也可以減少不同團隊之間的重複工作,提高研究效率。

AI即將顛覆的學科領域

目前人類科學發展到這個階段,已經到達了臨界點。在許多領域,我們都面臨着巨大的障礙,而這些障礙一旦能克服,這些領域的進展都將邁入新的階段。

令人興奮的是,這些目前靠我們自己已經很難再推進太多的突破,靠AI很可能會被解決!

當然,爲了實現這些設想,我們還面臨一些必須考慮的潛在風險,並且還需要實現目標所需的資源。

AI設計半導體,讓美國穩坐第一

如今,支撐起全球經濟和國家安全的現代電子設備,都需要依靠「芯片」來運行。

隨着這些芯片功能的增強,它們的複雜性也在不斷增加——當前最先進的芯片,已經包含了高達數百億個組件。

由於需要龐大的工程資源和複雜的基礎設施,目前只有規模最大的公司纔有能力製造這些高端芯片。而AI則可以在顯著提升芯片設計質量的同時,減少所需的時間和人數。

當然,這些AI工具並不是要取代設計師,而是通過提高設計師的工作效率來幫助緩解專業芯片設計師短缺的問題。

現在,已經有很多專爲芯片設計師開發的AI輔助工具,可以讓初級設計師解決那些原本需要高級設計師花費大量時間來處理的問題。

同時,還有一些芯片設計AI智能體還能總結錯誤報告和設計文檔,或者基於簡單的英語提示爲其他設計自動化工具生成腳本。

https://arxiv.org/pdf/2311.00176

甚至,正在開發中的AI,還能夠設計出比傳統方法更快或更小的電路.

通過利用強化學習技術,AI在探索可能的電路配置時會收到正面的「獎勵」和負面的「懲罰」,從而使其能夠調整其設計策略,最終找到那些具有理想特性的電路設計方法。

隨着半導體技術的快速進步,每次更迭都需要重新設計數千種標準設計單元,從而適應新的製造工藝。對許多製造商而言,這一過程可能需要投入高達80人月的勞動力。

相比之下,結合了生成式AI用於數據聚類和強化學習用於糾正設計規則錯誤,能夠自動化這一設計過程,將所需的工作量減少超過一千倍。

論文地址:https://dl.acm.org/doi/pdf/10.1145/3569052.3578920

與此同時,FPGA的應用使得在最新的AI驅動放置和佈線技術上能夠快速迭代,實現了超過三倍的效率提升。

在芯片設計的創建過程中,必須對設計進行多種分析,以確保它們符合規定的標準和製造過程的約束。

在以往,爲了精確掌握「寄生」特性,需要先製作電路的佈局圖,這一步驟往往會使設計週期的每一次迭代增加數天的手動工作。

現在,整個設計迭代過程可以在幾分鐘內完成,從而快速得到符合預期規格的電路。

很快,更強大的LLM將會化身成「芯片設計助手」——它們不僅能回答問題、評估和驗證設計,還能執行一些常規設計任務。

此外,AI技術將極大提升設計師的工作效率,可能增加十倍甚至更多。設計師只需把自己的注意力集中在算法和系統層面,而更細節的設計層面交給AI就可以了。

而且,AI的合成與分析工具將極大縮短設計週期,使得從高層次的設計描述到完成驗證的佈局只需幾小時,而現在這一過程需要幾周時間。

PCAST預計,通過將這些前沿技術融入芯片製造過程,美國將繼續保持在半導體設計領域的領先地位,並有效緩解該領域的嚴重勞動力短缺問題。

甚至實現美國半導體行業的宏偉目標——開發出全新的平臺、方法和工具,使得芯片的生產只需現在所需人力的十分之一。

揭示宇宙的基礎物理學:1分鐘模擬超算的1個月

關於宇宙,這些謎題始終未曾解答。

是什麼「暗物質」將星系結合在一起?

又是什麼「暗能量」推動所有星系間的距離加速膨脹?

最近觀測到的那些古老的星系,有什麼意義?

這些對於宇宙的基礎理解,卻能讓我們實現技術上的飛躍。

比如,可能我們很難想象出一個比廣義相對論更抽象、更不切實際的基礎理論了,然而,它卻是全球定位系統GPS的基礎,解決了我們此前從未預想到的定位和導航問題,而其中的經濟利益,以千億美元計。

而如今,對於AI已經成爲物理學家和宇宙學家實驗和觀測中工作中的重要工具,用於設計、實現和分析大多數步驟。

某些對AI的應用建立在目前的方法上,通過計算模擬,來比較和測試理論與數據,比如如果一個理論是正確的,數據看起來會是什麼樣。

通過條件密度估計對新物理學進行無監督分佈內異常檢測

對於超級計算機,這些模擬可能是最困難的任務,因爲它們需要計算每一個粒子、恆星或星系行爲的每一步。

但AI的好處是,它可以從這些模擬中學習更大的模型。這樣,科學家就可以縮短這些超算的任務,讓它能夠在不到一分鐘的時間內,看到一臺超算一個月工作量的近似值。

通過AI,研究人員可以掃描數百萬種可能的理論,每一種都有我們字宙的不同初始圖像,他們就能看到,哪一種更能解釋我們實際用望遠鏡觀察到的數據。

而到2030年末,我們就能用AI分析Nancy Grace Roman望遠鏡十年的數據。

Nancy Grace Roman太空望遠鏡

通過AI對數據進行分析,科學家們很可能會發現驚人的證據,證明我們的字宙不會在指數膨脹的冷寂中終結,而是會重複地發生大爆炸,循環重啓。

AI具有在複雜數據集中發現模式的能力,變量的數量遠超人類可以跟蹤的數量。

如果有新發現打破了常規規律,就會脫穎而出。

已經有粒子物理學家舉辦過比賽,來尋找搜索這些「異常」的最佳方法,後者很可能指向新的物理髮現。而比賽的獲勝者都是基於AI做出的發現。

通過拉格朗日深度學習生成宇宙流體動力學的有效物理定律,在混合模擬中預測暗物質超密度、恆星質量、電子動量密度等

這些AI方法,很可能使我們在下一代CERN和費米實驗室加速器實驗中,發現一些極其罕見、意想不到的粒子,這將有助於構建統一理論,該理論將引力與其他力相結合。

基礎物理學和宇宙學,都是基於對數據進行統計分析,因此需要深入瞭解數據解釋中的概率,這一要求也推動了AI在處理概率嚴謹性上的發展。

因爲,我們需要AI做的,不僅是提供最有可能的答案(「那是一張貓的照片」),而是開發能夠提供一系列可能答案、並且提供每個答案正確可能性的AI系統(「有69%的可能性那是一隻貓,22%的可能性是土豚,8%的可能性是氣球,百分之一的可能性是冰箱」)。

物理學家正在尋找一種將量子物理學與廣義相對論統一起來的理論

對於一個關鍵數字的測量,它會給出一組可能值,例如68%、95%或99.9%的概率。

評估不確定性,對於基礎物理學至關重要,而嚴格遵循概率的AI,也將爲許多其他科學領域帶來變革,對於科學意外的應用也意義重大。

或許20年後,科學家會用AI看到量子計算機與黑洞之間的類比,開啓一種全新的測試廣義相對論的臺式方法,以及一種強大的新時序技術。

新材料:超導體、冷原子、拓撲絕緣體、超導量子比特

曾經,人類生活質量的重大改善,是由青銅、鐵、混凝土、鋼這些材料科學的進步推動的。

今天,我們生活在硅、碳氫化合物和硝酸鹽的時代。不久的將來,可能就是納米材料、生物聚合物和量子材料的時代。

而AI的輔助,會打開許多以往只存在於想象中的可能,包括室溫超導、大規模量子計算機架構。

機器人正在勞倫斯伯克利國家實驗室的A-Lab中合成材料

如今,科學家已經成功地用深度學習模型發現了多種材料。

比如,某私營公司的跨學科研究團隊,使用AI設計出了數百萬種新材料,近半數AI預測出來的新材料,都具備足夠的穩定性,可以在實驗室中生長。

另外,AI也可用於改進現有材料,優化材料成分,減少對環境有害的物質。

用於預測材料拓撲性質的密度泛函理論示例

爲了設計和開發新材料,來解決重大的社會挑戰,美國國家科學基金會(NSF)已經投資了7250萬美元。

具體來說,以下幾個遇到阻礙的材料領域,很有望被AI解決。

超導體

去年夏天的室溫超導熱,讓全社會都感受到了奇點臨近的興奮。

對於磁共振成像儀、粒子加速器、某些實驗性的量子計算技術、全國電力網來說,超導體都是必不可少的,因爲它能夠無損耗地傳輸電能。

然而,超導體面臨三個問題。

第一,就是目前已知的超導體必須冷卻到接近接近絕對零度,也即零下273攝氏度,這就需要使用液氮,導致設備極其昂貴。

第二,與銅等傳統導體不同,現有的超導體並不具有可塑性, 會隨着時間失去超導性。

第三,前驅材料的成本,還是加工成導線的成本,也都十分昂貴。

從前,我們的嘗試都是依賴組合化學方法,需要篩選大量的材料組合。

爲了得到常溫常壓超導,人類已經努力了100多年

因此,許多至關重要的材料的發現,都是出於偶然,期間經歷了大量試驗和錯誤。

變量如此之多,讓材料價格低廉的要求如此之難,使得超導體的發現幾乎不可能用傳統方法解決。

而AI,將在3個領域帶來改變。

首先,AI模型預測能力,使我們能夠通過連接並利用現有材料、處理條件和性能方面的大量數據,來發現新材料。

從這個數據集中,可以確定化學、物理和工程中材料的模式,爲研究人員提供新方法。

基於GNoME的發現,顯示了基於模型的過濾和DFT如何充當數據飛輪,來改進預測

其次,人工智能模型可以預測性能(例如,預測量子比特的相於時間、熱電材料的效率或超導體的臨界溫度),從而減少對可行候選材料實驗的測試的浪費。

第三,通過將過程信息與材料組成相結合,可以在材料設計方面設定實際限制,加快新材料應用的商業化過程。

除了超導體這種「硬」材料,聚合物、流體這些「軟」材料,因爲材料科學中複雜的結構-性能關係,同樣需要龐大的數據級和預測能力。

而且,量子計算機的基本構建部分,如冷原子、拓撲絕緣體或超導量子比特,都可以靠AI改進或生成。

具有4個量子比特的超導芯片

生命科學

美國國家科學技術委員會認爲,由AI驅動的工具、分析和結果,將從根本上改變我們探索和理解生命的基本組成部分的方式,還會影響到包括農業和醫學的生命系統。

揭開細胞功能之謎

解讀細胞內部複雜的運作機制,是幾個世紀以來一直困擾生物學家的難題,因爲細胞的結構極其複雜且互相關聯。

而AI就爲此提供了強大的工具。

比如,AI爲蛋白質提供了新的視角。

基於AI的蛋白質摺疊預測系統,可以利用機器學習算法預測了數百萬種蛋白質的結構。

基於大規模深度學習的結構建模範圍從單體蛋白質擴展到蛋白質組裝

這些系統從已知蛋白質和結構的數據中學習,也從基礎化學知識如原子間距離的物理約束中學習。

最近,研究人員還利用AI來破解蛋白質的功能,包括蛋白質如何相互作用,從而揭示細胞信號轉導、代謝和基因調控等分子機制。

人工智能工具也被用來設計蛋白質,以實現與受體和其他目標特異性結合的目標。

AI驅動的蛋白質設計,已經在開發疫苗和新型藥物方面取得了成功。其中一些設計方法,正是使用了「擴散模型」和圖像生成系統的填充和描邊技術。

使用三軌神經網絡準確預測蛋白質結構和相互作用

構建生物科學基礎模型

構建生物信息學仿真工具,一個很有潛力的方法是構建面向整體細胞建模的多模態、多層次生物科學基礎模型。

AI方法使科學家能夠對多種類型的數據進行多模態表徵,或者「嵌入」,包括蛋白質序列和結構、DNA、RNA表達數據、臨牀觀察、成像數據和來自電子健康記錄的數據等。

使用RFAA進行一般生物分子建模

例如,開發集成大型數據集的基礎模型EVO,結合DNA、RNA和蛋白質數據,來闡明細胞整體功能背後的相互作用。

這種多模態、多層次的模型,可以提供從原子到生理學的各種尺度的結果預測,以及分子和行爲的生成。

生物科學基礎模型,有望使科學家探究健康與疾病的本質,例如建立癌症模型,並探索細胞相互作用,以及癌症背後的網絡如何在模擬中被破壞或「治癒」。

AI將指導藥物研發,在開始昂貴耗時的實驗之前,AI就可以通過虛擬篩選潛在的治療化合物,減少不必要的浪費。

五點建議

爲了實現以上技術進步,PACST委員會提出了以下五點建議。

建議1:廣泛公平地共享基礎AI資源

廣泛支持易於訪問的共享模型、數據集、基準和計算能力,對於確保學術研究人員、國家和聯邦實驗室以及較小的公司和非營利組織能夠使用AI爲國家創造利益至關重要。

在美國,最有希望的一個試點項目是——國家人工智能研究資源(NAIRR),PCAST建議儘快將NAIRR擴展到特別工作組設想的規模,並獲得全額資助。

完整規模的NAIRR,連同行業合作伙伴關係以及聯邦和州的其他AI基礎設施,可以作爲美國或國際層面AI基礎設施項目的基石,從而促進高影響力的研究。

建議2:擴大對聯邦數據集的安全訪問

PCAST強烈建議擴大現有的安全數據訪問試點計劃,並制定聯邦數據庫管理指南,從而加入入最先進的隱私保護技術。

這包括允許獲批的研究人員有限度、安全地訪問聯邦數據集,以及允許向NAIRR等資源中心發佈經過匿名化處理的數據集。

此外,PCAST還希望能進一步執行此類授權,包括共享在聯邦資助的研究數據上訓練的AI模型,並提供足夠的資源來支持所需的行動。

建議3:支持AI領域的基礎和應用研究,其中包括學術界、工業界、國家和聯邦實驗室以及聯邦機構之間的合作

聯邦資助的學術研究與私營部門研究之間的界限是模糊的。許多研究人員會在學術機構、非營利組織和私營公司之間流動。在這之中,私營公司目前支持了相當大比例的AI研發。

爲了能夠充分利用AI在科學領域的潛在優勢,就必須支持各種有前景、有成果的假設和方法的研究。

因此,資助機構需要在如何與產業界合作以及哪些研究人員可以得到支持方面放寬姿態,以便促進創新研究以及不同部門之間的協作。

建議4:在科學研究過程的所有階段採用負責任、透明和值得信賴的AI使用原則

在科學研究中,使用AI可能會產生不準確、有偏見、有害或無法復現的結果。因此,從項目的初始階段,就應該對這些風險進行管理。

PCAST建議,聯邦資助機構可以更新其負責任研究行爲準則,要求研究人員提供負責任的AI使用計劃。爲了最大限度地減輕研究人員的額外行政負擔,在列舉主要風險後,機構應提供風險緩解的示範流程。

與此同時,國家科學基金會(NSF)和國家標準與技術研究所(NIST)等機構應繼續支持負責任和值得信賴的AI的科學基礎研究。

其中包括,衡量AI準確性、可重複性、公平性、彈性和可解釋性等屬性的標準基準;監測這些屬性並在基準不在定義範圍內時進行調整的AI算法;以及評估數據集中的偏差,並區分合成數據和真實世界數據的工具。

建議5:鼓勵採用創新方法將AI輔助集成到科學工作流程之中

科學事業是一個很好的「沙盒」,我們可以在其中練習、研究和評估人與AI助手之間新的協作範式。

不過,這裡的目標並不是追求自動化程度的最大化,而是要讓人類研究人員在負責任地利用AI輔助的同時,實現高質量的科學研究。

資助機構應該重視這些新工作流的出現,並設計靈活的程序、評估指標、資助模式和挑戰性問題,鼓勵以新的AI輔助方式組織和執行科學項目的戰略性實驗。

此外,這些工作流的實施也爲來自各個學科的研究人員提供了機會,從而推進了在人機協作領域的知識。

更廣泛地說,我們還需要更新資助機構、學術界和學術出版業的激勵機制,來支持更廣泛的科學貢獻。比如,策劃高質量和廣泛可用的數據集,是無法通過傳統研究生產力指標得到充分認可的。

參考資料:

https://mathstodon.xyz/@tao/112355788324104561