国产在线视频精品视频,国产亚洲精品久久久久久青梅 ,国产麻豆精品一区,国产真实乱对白精彩久久,国产精品视频一区二区三区四

您當(dāng)前的位置:聚焦>正文

用光纖存儲和處理數(shù)據(jù),MIT打造出一款超級通用大語言模型

2023-08-27 03:36:13 來源: 搜狐數(shù)碼


(資料圖)

你有沒有想過,用光來訓(xùn)練人工智能,讓它能夠像人一樣說話、寫作、創(chuàng)作?聽起來很酷吧?其實(shí),這不是科幻小說里的情節(jié),而是美國麻省理工學(xué)院(MIT)的研究人員正在做的事情。他們發(fā)明了一種新的技術(shù),可以利用光來實(shí)現(xiàn)大型語言模型。什么是語言模型呢?簡單來說,就是一種可以根據(jù)上下文生成自然語言文本的人工智能技術(shù)。比如,你可以用語言模型來和它聊天、寫文章、做作業(yè)、唱歌等等。語言模型越大,就越聰明,越能理解和表達(dá)人類的語言。

但是,要訓(xùn)練一個大型的語言模型,可不是一件容易的事情。你需要用很多很多的數(shù)據(jù)來喂它,讓它學(xué)習(xí)和記憶。這些數(shù)據(jù)都要存儲在電子芯片上,然后用電流來傳輸和處理。這樣做有兩個問題:第一,電子芯片的空間有限,不能存儲太多的數(shù)據(jù);第二,電流的速度有限,不能傳輸和處理太快的數(shù)據(jù)。所以,要訓(xùn)練一個大型的語言模型,你需要用很多很多的電子芯片,然后把它們連接起來,形成一個超級計(jì)算機(jī)。這樣做不僅很貴,而且很慢,還很費(fèi)電。

那么,有沒有更好的辦法呢?MIT的研究人員說:有!他們提出了一種新的方法,利用光來實(shí)現(xiàn)大型語言模型。他們設(shè)計(jì)了一種基于光的神經(jīng)網(wǎng)絡(luò),可以在光纖中存儲和處理數(shù)據(jù),而不是在電子芯片上。這種方法有很多優(yōu)點(diǎn):第一,光纖的空間很大,可以存儲很多很多的數(shù)據(jù);第二,光的速度很快,可以傳輸和處理很快很快的數(shù)據(jù)。所以,用光纖來訓(xùn)練一個大型的語言模型,你只需要用很少很少的光纖,然后把它們連接起來,形成一個光子計(jì)算機(jī)。這樣做不僅很便宜,而且很快,還很省電。

那么,他們是怎么做到的呢?他們用了一種叫做“可變光學(xué)延遲線”的設(shè)備,它可以在光纖中暫時存儲光信號。你可以把光信號想象成一種特殊的數(shù)據(jù),它可以攜帶信息,并且可以被改變和操作。他們通過調(diào)節(jié)光纖中的一些小東西,比如反射鏡、透鏡、分束器等等,他們可以對光信號進(jìn)行各種各樣的操作,比如編碼、解碼、加權(quán)、激活等等。這些操作就相當(dāng)于神經(jīng)網(wǎng)絡(luò)中的功能。

他們還用了一種叫做“相干性”的物理特性,它可以使不同波長的光信號之間產(chǎn)生干涉效應(yīng)。你可以把干涉效應(yīng)想象成一種特殊的運(yùn)算,它可以把兩個或多個光信號合并成一個,或者把一個光信號復(fù)制成多個。這樣,他們就可以在不增加硬件復(fù)雜度的情況下,擴(kuò)展系統(tǒng)的規(guī)模和并行度。

他們用自己的系統(tǒng)構(gòu)建了一個簡單的語言模型,并在一些基準(zhǔn)任務(wù)上進(jìn)行了測試。他們發(fā)現(xiàn),他們的系統(tǒng)可以達(dá)到與電子芯片相當(dāng)甚至更好的性能,同時速度更快、功耗更低。他們估計(jì),如果將他們的系統(tǒng)擴(kuò)展到數(shù)百億個參數(shù)的規(guī)模,它可以比目前最先進(jìn)的電子芯片快1000倍,同時功耗降低1000倍。

這項(xiàng)研究發(fā)表在《自然·光子學(xué)》雜志上。該研究團(tuán)隊(duì)由MIT微納米技術(shù)實(shí)驗(yàn)室(MTL)和MIT計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究人員組成。他們表示,他們的方法為開發(fā)更強(qiáng)大而高效的大型語言模型提供了一個新的方向,并且有望推動其他基于光的人工智能應(yīng)用。

責(zé)任編輯:

相關(guān)閱讀
圖說新聞
Copyright @ 2008-2015 www.tzykw.com.cn All Rights Reserved 投資月刊 版權(quán)所有 聯(lián)系郵箱:527 8229@qq.com