取消
清空記錄
歷史記錄
清空記錄
歷史記錄
摩爾定律已經(jīng)相當快了。根據(jù)其定義,每隔兩年左右,計算機芯片中晶體管的數(shù)量就會增加一倍,速度和效率就會大幅提升。但深度學習時代的計算需求增長速度甚至更快——這種速度可能無法持續(xù)。
國際能源署預測,到 2026 年,人工智能消耗的電量將是 2023 年的 10 倍,而當年的數(shù)據(jù)中心消耗的能源將與日本相當。計算硬件公司 Lightmatter 的創(chuàng)始人兼首席執(zhí)行官尼克哈里斯 (Nick Harris)表示:“人工智能所需的 [計算能力] 每三個月就會翻一番——這比摩爾定律預測的要快得多。它將摧毀企業(yè)和經(jīng)濟體?!?/p>
最有希望的解決方法之一是不再使用可靠的電子(電子在計算領域已經(jīng)占據(jù)了 50 多年的主導地位)來處理信息,而是使用光子流(微小的光束)。最近的研究結果表明,對于現(xiàn)代人工智能的某些基本計算任務而言,基于光的“光學計算機”可能具有優(yōu)勢。
劍橋大學物理學家娜塔莉亞·伯洛夫 (Natalia Berloff)表示,光學計算的發(fā)展“為人工智能等需要高速、高效處理的領域的突破鋪平了道路” 。
最佳光學 理論上,光具有誘人的潛在優(yōu)勢。首先,光信號比電信號可以攜帶更多信息——它們具有更大的帶寬。光頻率也比電頻率高得多,因此光學系統(tǒng)可以在更短的時間內以更少的延遲運行更多的計算步驟。 然后還有效率問題。除了相對浪費的電子芯片的環(huán)境和經(jīng)濟成本外,它們運行時的溫度也很高,以至于只有一小部分晶體管(所有計算機核心的微型開關)可以隨時處于活動狀態(tài)。理論上,光學計算機可以同時運行更多操作,處理更多數(shù)據(jù),同時消耗更少的能量。斯坦福大學電氣工程師戈登·韋茨斯坦(Gordon Wetzstein) 說:“如果我們能夠利用這些優(yōu)勢,這將開辟許多新的可能性?!?/p> 鑒于其潛在優(yōu)勢,研究人員長期以來一直試圖將光用于人工智能,這是一個計算需求很大的領域。例如,在 20 世紀 80 年代和 90 年代,研究人員使用光學系統(tǒng)構建了一些最早的神經(jīng)網(wǎng)絡。加州理工學院的 Demetri Psaltis 和兩位同事利用這些早期的光學神經(jīng)網(wǎng)絡 (ONN) 之一創(chuàng)建了一個巧妙的面部識別系統(tǒng)。他們將受試者(實際上是其中一位研究人員)的圖像存儲為光折變晶體中的全息圖。研究人員使用全息圖來訓練 ONN,然后 ONN 可以識別研究人員的新圖像并將其與同事區(qū)分開來。 但光也有缺點。至關重要的是,光子通常不會相互作用,因此一個輸入信號很難控制另一個信號,而這正是普通晶體管的本質。晶體管的工作性能也非常好。它們現(xiàn)在被安裝在硬幣大小的芯片上,數(shù)量達數(shù)十億,是數(shù)十年來不斷改進的產(chǎn)物。 但近年來,研究人員發(fā)現(xiàn)了光學計算的殺手級應用:矩陣乘法(matrix multiplication)。 一些簡單的數(shù)學 矩陣或數(shù)字數(shù)組的乘法過程支撐著大量重型計算。具體來說,在神經(jīng)網(wǎng)絡中,矩陣乘法是網(wǎng)絡在舊數(shù)據(jù)上訓練和在訓練好的網(wǎng)絡中處理新數(shù)據(jù)的基本步驟。而光可能比電更適合矩陣乘法。 2017 年,麻省理工學院的 Dirk Englund 和 Marin Solja?i? 領導的研究小組描述了如何在硅芯片上構建光學神經(jīng)網(wǎng)絡,這種人工智能計算方法因此而爆發(fā)。研究人員將他們想要相乘的各種量編碼成光束,然后將光束通過一系列組件,這些組件會改變光束的相位(即光波的振蕩方式),每次相位改變都代表一個乘法步驟。通過反復分裂光束、改變相位并重新組合,他們可以讓光有效地進行矩陣乘法。在芯片的末端,研究人員放置了光電探測器來測量光束并顯示結果。 研究人員訓練他們的實驗設備識別口語元音,這是神經(jīng)網(wǎng)絡的常見基準任務。借助光的優(yōu)勢,它可以比電子設備更快、更高效地完成這一任務。其他研究人員已經(jīng)知道光有潛力用于矩陣乘法;2017 年的論文展示了如何將其付諸實踐。 康奈爾大學光子學專家Peter McMahon表示,這項研究“重新激發(fā)了人們對光神經(jīng)網(wǎng)絡的極大興趣。這項研究影響巨大?!?/p> 好主意 自 2017 年那篇論文發(fā)表以來,該領域穩(wěn)步發(fā)展,各類研究人員紛紛研制出新型光學計算機。Englund 和幾位合作者最近推出了一種名為 HITOP 的新型光學網(wǎng)絡,它結合了多項進步。最重要的是,它旨在隨著時間、空間和波長的增加而擴大計算吞吐量。前麻省理工學院博士后、現(xiàn)就職于南加州大學的Zaijun Chen表示,這有助于 HITOP 克服光學神經(jīng)網(wǎng)絡的一個缺點:將數(shù)據(jù)從電子元件傳輸?shù)焦鈱W元件需要大量能量,反之亦然。但通過將信息打包到光的三維空間中,Chen 表示,它可以更快地通過 ONN 傳輸更多數(shù)據(jù),并將能量成本分攤到多次計算中。這降低了每次計算的成本。研究人員報告說,HITOP 可以運行比以前基于芯片的 ONN 大 25,000 倍的機器學習模型。 需要明確的是,該系統(tǒng)還遠遠不能與之前的電子系統(tǒng)相媲美;HITOP 每秒可執(zhí)行約 1 萬億次操作,而先進的 Nvidia 芯片可以處理 300 倍的數(shù)據(jù), Chen說,他希望擴大該技術的規(guī)模,使其更具競爭力。但光學芯片的效率令人信服。“這里的關鍵是我們將能源成本降低了 1,000 倍,”陳說。 其他研究小組也開發(fā)出了具有不同優(yōu)勢的光學計算機。去年,賓夕法尼亞大學的一個研究小組描述了一種新型 ONN,它具有不同尋常的靈活性。這種基于芯片的系統(tǒng)將激光照射到組成電子芯片的半導體部分,從而改變半導體的光學特性。激光有效地映射了光信號的傳輸路徑,從而映射了光信號的計算路徑。這讓研究人員可以輕松地重新配置系統(tǒng)的功能。這與大多數(shù)其他基于芯片的系統(tǒng)(光學和電氣)有著鮮明的區(qū)別,這些系統(tǒng)的路徑都是在制造廠精心設計的,很難改變。 “我們擁有的東西非常簡單,”這項研究的主要作者Tianwei Wu說?!拔覀兛梢灾匦戮幊?,動態(tài)改變激光模式。”研究人員利用該系統(tǒng)設計了一個成功區(qū)分元音的神經(jīng)網(wǎng)絡。大多數(shù)光子系統(tǒng)在構建之前都需要進行訓練,因為訓練必然涉及重新配置連接。但由于這個系統(tǒng)很容易重新配置,研究人員在將模型安裝在半導體上后對其進行了訓練。他們現(xiàn)在計劃增加芯片的尺寸,并在不同顏色的光中編碼更多信息,這應該會增加它可以處理的數(shù)據(jù)量。 即使是在 90 年代創(chuàng)建了面部識別系統(tǒng)的 Psaltis 也對這一進步感到驚嘆?!芭c實際發(fā)生的事情相比,我們 40 年前最瘋狂的夢想也微不足道?!?/p>