美國科學(xué)家在最新一期《自然》雜志發(fā)表論文稱(chēng),他們開(kāi)發(fā)了首塊可擴展的基于深度神經(jīng)網(wǎng)絡(luò )的光子芯片,每秒可對20億張圖像進(jìn)行直接分類(lèi),而無(wú)需時(shí)鐘、傳感器或大內存模塊,有望促進(jìn)人臉識別、自動(dòng)駕駛等領(lǐng)域的發(fā)展。
研究人員開(kāi)發(fā)的芯片可以在不到1納秒的時(shí)間內檢測和分類(lèi)圖像,不需要單獨的處理器或存儲單元。
模仿人腦工作的深度神經(jīng)網(wǎng)絡(luò )現在通常為計算機視覺(jué)、語(yǔ)音識別等提供支持。目前數字芯片上的消費級圖像分類(lèi)技術(shù)每秒可執行數十億次計算,速度足以滿(mǎn)足大多數應用,但更復雜的圖像,如識別運動(dòng)物體、3D物體或人體顯微細胞分類(lèi)仍面臨不少障礙。
首先,這些系統通常使用基于數字時(shí)鐘的平臺,如圖形處理單元(GPU)來(lái)實(shí)現,這將它們的計算速度限制在時(shí)鐘頻率上,計算必須逐個(gè)進(jìn)行。其次,傳統電子設 備將內存和處理單元分開(kāi),數據穿梭耗費時(shí)間。此外,原始圖像數據通常需要轉換為數字電子信號,耗時(shí)較長(cháng),而且需要大內存單元來(lái)存儲圖像和視頻,引發(fā)潛在的 隱私問(wèn)題。
鑒于此,賓夕法尼亞大學(xué)電氣和系統工程副教授弗瑞茲·阿發(fā)雷托尼等人開(kāi)發(fā)出一款可擴展芯片,每秒可對近20億張圖像進(jìn)行分類(lèi)。這是第一個(gè)完全在集成光子設 備上以可擴展方式實(shí)現的深度神經(jīng)網(wǎng)絡(luò ),整個(gè)芯片大小只有9.3平方毫米,消除了傳統計算機芯片中的4個(gè)主要耗時(shí)障礙:光信號到電信號的轉換、將輸入數據轉 換為二進(jìn)制格式、大存儲模塊以及基于時(shí)鐘的計算。
阿發(fā)雷托尼解釋說(shuō),該芯片上的光學(xué)神經(jīng)元通過(guò)光線(xiàn)相互連接,形成一個(gè)由許多“神經(jīng)元層”組成的深層網(wǎng)絡(luò )。信息通過(guò)“神經(jīng)元層”傳遞,每一步都對圖像分類(lèi), 使快速處理信息成為可能,最新芯片可在半納秒內完成整個(gè)圖像分類(lèi),而傳統數字計算機芯片在同樣時(shí)間內只能完成一個(gè)計算步驟。
研究人員表示,可通過(guò)添加更多神經(jīng)層來(lái)擴展這一深層網(wǎng)絡(luò ),使芯片能以更高分辨率讀取更復雜圖像中的數據。此外,任何可轉換為光的信號,如音頻和語(yǔ)音,都可使用這項技術(shù)幾乎瞬間進(jìn)行分類(lèi)。