在全球范 圍內,程序員短缺。如果人工智能(AI)會(huì )寫(xiě)代碼——只要人類(lèi)告訴AI想通過(guò)程序做什么,將帶來(lái)許多便利。根據發(fā)表在最新一期《科學(xué)》雜志上的研究,一款 名為“阿爾法扣”(AlphaCode)的新AI系統正在讓人類(lèi)離這一愿景更近一步。該系統來(lái)自“深度思維”研究實(shí)驗室,整體性能相當于經(jīng)過(guò)幾個(gè)月到一年 培訓的新手程序員。
在測試 中,“阿爾法扣”通過(guò)預測代碼段并創(chuàng )建數百萬(wàn)個(gè)潛在的解決方案,實(shí)現“接近人類(lèi)水平的性能”,還能在競爭中解決以往未發(fā)現的自然語(yǔ)言問(wèn)題。在生成了過(guò)多方 案后,“阿爾法扣”會(huì )將它們篩選為最多10個(gè)方案,所有這些方案都是在“沒(méi)有任何關(guān)于計算機代碼結構的內置知識的情況下”生成的。
在Codeforce競爭性編碼平臺最近的編碼模擬評估中,“阿爾法扣”在每個(gè)問(wèn)題的第10代解決方案中平均排名前54.3%,而其中66%的問(wèn)題第一次提交就得到了解決。
美國卡內基·梅隆大學(xué)博世人工智能中心教授齊科·科爾特說(shuō):“無(wú)論‘阿爾法扣’在多大程度上‘真正’理解了這項任務(wù),它在前所未見(jiàn)的編碼挑戰中表現得非常出色?!?/p>
“阿爾法扣”并不是唯一會(huì )編碼的AI模型,但其性能超越了“前輩”Codex——OpenAI研究實(shí)驗室于2021年發(fā)布的系統。GitHub也有自己的流行AI編程工具Copilot。然而,在解決復雜的競爭性問(wèn)題方面,這兩款AI都未表現出與人類(lèi)匹敵能力。
深度思維 公司表示,經(jīng)過(guò)培訓,“阿爾法扣”解決了約34%的指定問(wèn)題。為進(jìn)一步測試它的能力,公司讓它參加了在線(xiàn)編碼比賽。在至少有5000人參加的比賽中,“阿 爾法扣”的表現超過(guò)了45.7%的程序員。研究人員還將其與訓練數據庫中的程序進(jìn)行了比較,發(fā)現它沒(méi)有復制大段代碼或邏輯,這表明它有驚人的創(chuàng )造力。
除了提高總體生產(chǎn)率外,“阿爾法扣”還可讓新一代開(kāi)發(fā)人員更容易地進(jìn)行編程。其未來(lái)有一天可能會(huì )改變人們的編程理念,即人類(lèi)主要是為了制定問(wèn)題,然后由AI來(lái)解決問(wèn)題。