国产在线视频精品视频,国产亚洲精品久久久久久青梅 ,国产麻豆精品一区,国产真实乱对白精彩久久,国产精品视频一区二区三区四

加載中...
您的位置:首頁 >金融 > 正文

國產(chǎn)大模型離ChatGPT還有多遠(yuǎn)?-焦點(diǎn)消息

2023-05-12 19:17:42 來源:環(huán)球老虎財(cái)經(jīng)app


(相關(guān)資料圖)

自CHATGPT問世已經(jīng)過去了半年時(shí)間,國內(nèi)大廠們已經(jīng)紛紛入局,國產(chǎn)ChatGPT產(chǎn)品爭(zhēng)相面世。但目前為止,相關(guān)產(chǎn)品幾乎都是在弱人工智能的基礎(chǔ)上演化而來,離強(qiáng)人工智能尚有距離。為什么“學(xué)習(xí)能力”一向很強(qiáng)的國內(nèi)廠商,這一次沒有快速追趕上ChatGPT呢?

2022年11月,OpenAI的一記“驚雷”點(diǎn)燃了國內(nèi)外巨頭的競(jìng)爭(zhēng)欲。

經(jīng)過幾個(gè)月的“角逐”,國內(nèi)第一批ChatGPT產(chǎn)品已經(jīng)面世。但是,不管是打響國內(nèi)ChatGPT第一槍的百度“文心一言”,還是三六零(行情601360,診股)、阿里以及科大訊飛(行情002230,診股)緊急孵化的各個(gè)大模型,似乎都有些“雷聲大雨點(diǎn)小”的意味。

要知道,ChatGPT的爆火,是因?yàn)槠浔憩F(xiàn)出了近乎于人類的語言表達(dá)能力、超強(qiáng)的學(xué)習(xí)能力以及語義理解能力,不僅能夠通過微軟的工程師測(cè)試,還能夠撰寫學(xué)術(shù)期刊論文等等。但這些,似乎都沒有在任意一款國產(chǎn)ChatGPT產(chǎn)品上體現(xiàn)……

為什么國產(chǎn)大模型,這一次沒有追上ChatGPT?

現(xiàn)實(shí)差距

國內(nèi)的AI機(jī)器人(行情300024,診股)、AI識(shí)圖技術(shù)已然“爐火純青”,相關(guān)產(chǎn)品也曾一度風(fēng)靡海外。

然以AI機(jī)器人、AI識(shí)圖以及視頻識(shí)別技術(shù)等一系列專用人工智能,統(tǒng)稱為弱人工智能,這些弱人工智能產(chǎn)品能夠回答簡(jiǎn)單的問題,完成系統(tǒng)預(yù)設(shè)好的指令,并與其他家電產(chǎn)品聯(lián)網(wǎng),營造智能家居系統(tǒng)。

相對(duì)于弱人工智能,ChatGPT代表的是一種強(qiáng)人工智能,用戶只要對(duì)其發(fā)出比較具體的提示語,對(duì)其提出相關(guān)要求,ChatGPT就可以寫程序、做翻譯、寫論文、參加考試甚至進(jìn)行文化創(chuàng)作,最重要的是,還能“胡說八道”。

“胡說八道是只有人類才能產(chǎn)生的行為”,三六零創(chuàng)始人周鴻祎曾經(jīng)如是評(píng)價(jià)過。強(qiáng)人工智能能夠覆蓋弱人工智能的所有功能,還能夠完成弱人工智能所不能完成的任務(wù)。

也就是說,ChatGPT的誕生,完全可以傾覆弱人工智能的全部成果。因此,ChatGPT才會(huì)引起全球科技巨頭的警覺。

而當(dāng)下國產(chǎn)ChatGPT產(chǎn)品形成于“臨時(shí)抱佛腳”,帶有很重的弱人工智能“影子”。

由此可見,從弱人工智能到強(qiáng)人工智能并不是一次簡(jiǎn)單的“復(fù)制粘貼”,而是一次重大的科技飛躍,甚至可以被評(píng)價(jià)為時(shí)代變遷的開端。

體系互異

一個(gè)從大環(huán)境角度出發(fā)的答案,是兩國的創(chuàng)新機(jī)制不同。

具體而言,ChatGPT是典型的硅谷式創(chuàng)新產(chǎn)物。清華大學(xué)公共管理學(xué)教授梁正表示,這個(gè)創(chuàng)新生態(tài)體系有幾個(gè)關(guān)鍵的步驟,首先要有創(chuàng)新性的機(jī)制,一些企業(yè)聚集了一批理想主義的技術(shù)天才,走了一條不尋常的道路,最后再由大公司進(jìn)行投入和資源整合,完成商業(yè)化。

在這個(gè)過程中,隱藏著三個(gè)體系:一是研究型大學(xué),有一批科學(xué)家在做探索性的工作;二是使命導(dǎo)向的實(shí)驗(yàn)室體系,以國家的使命驅(qū)動(dòng)前沿研究;三是硅谷,基于創(chuàng)新創(chuàng)業(yè)和風(fēng)險(xiǎn)投資的商業(yè)生態(tài)。這三者相互疊加,密切聯(lián)動(dòng),先從0-1突破,在通過大公司注資完成從1-2的工作,從而形成從科研到產(chǎn)業(yè)化的良性循環(huán)。

ChatGPT的誕生,就是微軟重金投資了一家看起來非同尋常的公司——OpenAI,這家公司曾經(jīng)無產(chǎn)品、無體系,但有一個(gè)技術(shù)天才,完成了一個(gè)又一個(gè)的構(gòu)想,還受到了大資金的青睞,十年后,ChatGPT轟動(dòng)了全球。

而國內(nèi)的創(chuàng)新體系大致為,高等學(xué)府中的科學(xué)家做探索性的工作-這些科學(xué)家被高薪聘請(qǐng)到大公司-最后以大公司為背景,對(duì)這些探索性研究成果進(jìn)行投入和落地。

這種體系很穩(wěn),且我國在人工智能方面的研究看似也從未停歇。早在2018年,中國人工智能方面的論文在總量和被引論文數(shù)量上就排在了世界第一,專利數(shù)量排名第二,中國人工智能企業(yè)數(shù)量位列世界第二,中國人工智能領(lǐng)域的投融資占到了全球的60%,成為全球最“吸金”的國家。

然而,盡管我國人工智能相關(guān)論文數(shù)量已經(jīng)形成了一定的規(guī)模,論文被引用的次數(shù)也頗多,但距離真正的成果還有一定的距離。

不單是研發(fā)差距,風(fēng)投的投資思維差異也是影響創(chuàng)新積極性的因素之一。國內(nèi)的風(fēng)投思維仍是“不投沒譜的事情”,根據(jù)梁正教授的說法,巨頭們可能不愿意做獲利前景太遠(yuǎn)的事情,很少有人像微軟一樣,會(huì)押注一家“非盈利”的小公司。

一項(xiàng)傾覆世界的研發(fā)成果誕生,可能還需要很多個(gè)“臨門一腳”才能完成。OpenAI為做出ChatGPT也耗費(fèi)了大量的人力、物力、財(cái)力和時(shí)間成本。因此,國產(chǎn)大模型想要趕超ChatGPT,尚需時(shí)間。

語言殊途

除了環(huán)境因素,擺在國產(chǎn)大模型面前的還有現(xiàn)實(shí)因素。

相關(guān)學(xué)術(shù)論文顯示,ChatGPT是融合了Transformer和強(qiáng)化學(xué)習(xí)兩項(xiàng)技術(shù)。

拆分來看,所謂Transfoemer架構(gòu)是一種基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu),被廣泛應(yīng)用于自然語言處理領(lǐng)域。這一架構(gòu)能使得ChatGPT能夠通過分析輸入的語料來理解人類語言的語法、語義,并按照語法生成流暢且擁有較強(qiáng)理解力的應(yīng)答。

在此基礎(chǔ)之上,ChatGPT使用的強(qiáng)化學(xué)習(xí)技術(shù),通過外界設(shè)定的獎(jiǎng)懲規(guī)則,自主學(xué)習(xí),最終在某項(xiàng)具體任務(wù)中達(dá)到甚至超越人類的表現(xiàn)。

強(qiáng)化學(xué)習(xí)模型最知名的應(yīng)用就是DeepMind團(tuán)隊(duì)開發(fā)的圍棋機(jī)器人AlphaGo,其在2017年打敗了人類最頂尖的騎手柯潔。DeepMind團(tuán)隊(duì)還開發(fā)出另一項(xiàng)顛覆性的研究——AlphaFold數(shù)據(jù)庫,在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)上遠(yuǎn)遠(yuǎn)超越人類,并在2022年宣布預(yù)測(cè)出地球上幾乎所有的蛋白質(zhì)結(jié)構(gòu)。

簡(jiǎn)言之,就是ChatGPT需要先理解人類的語法、語義,再通過收集大量資料、不停完成訓(xùn)練、反復(fù)學(xué)習(xí)才能夠達(dá)到當(dāng)前類似于人類,甚至超越人類的表現(xiàn)。

而國產(chǎn)ChatGPT在這兩項(xiàng)技術(shù)方面都略遜一籌,一方面是數(shù)據(jù)庫容量,而更重要的是中、英兩種語言結(jié)構(gòu)的天然差異。

當(dāng)前的ChatGPT是基于英文的,英文能夠讓ChatGPT通過詞綴、詞性、標(biāo)點(diǎn)符號(hào)等,更加方便的將相同詞綴的詞匯構(gòu)成并列。如以ing結(jié)尾的詞匯,可以被ChatGPT快速并列為進(jìn)行時(shí)態(tài)的詞匯。而中文的正在進(jìn)行時(shí)表達(dá)則相對(duì)多元。

另外,英文句子的結(jié)構(gòu)是網(wǎng)狀的,理論上,在語法正確的情況下,一句英文可以由一萬個(gè)詞匯組成,一個(gè)句子中能夠有N個(gè)謂語、非謂語、從句等等。

反觀中文,一些詞匯能當(dāng)動(dòng)詞也能當(dāng)名詞,一個(gè)詞匯的褒貶含義還需要結(jié)合上下文理解,標(biāo)點(diǎn)符號(hào)代表的含義也多有不同,學(xué)習(xí)起來并不容易。

除此之外,強(qiáng)人工智能代表的是人類知識(shí)的集大成者,而大多頂尖的學(xué)術(shù)類論文、文獻(xiàn)、資料等都是英文。這也意味著ChatGPT的學(xué)習(xí)知識(shí)庫遠(yuǎn)比國內(nèi)的大模型要豐富,

芯片掣肘

先天條件遇到門檻,硬實(shí)力還遭遇了“卡脖子”。

據(jù)了解,ChatGPT的訓(xùn)練過程需要耗費(fèi)大量的計(jì)算資源和時(shí)間,這需要企業(yè)具備強(qiáng)大的計(jì)算能力和相應(yīng)的設(shè)備。

資料顯示,ChatGPT的總算力消耗約為3640PF-days(即假如每秒計(jì)算一千萬億次,需要計(jì)算3640天),需要7至8個(gè)投資規(guī)模30億、算力500P的數(shù)據(jù)中心才能支撐運(yùn)行。

支撐這些算力的,就是英偉達(dá)研發(fā)的全球頂尖的A100和H100智能芯片。有聲音認(rèn)為,即便是部署1萬塊英偉達(dá)A100顯卡,也要持續(xù)不間斷運(yùn)算10年才能達(dá)到當(dāng)前ChatGPT這樣的算力高度。

但目前,這兩款芯片在全球具有不可替代性,而英偉達(dá)A100和H100已經(jīng)被限制出口中國。

為了繼續(xù)占領(lǐng)中國市場(chǎng),英偉達(dá)已經(jīng)針對(duì)中國推出了中國特供版A800,但這兩款芯片存在明顯的性能差距。H100芯片的中國特供版也即將研發(fā)完畢,很快就能在中國上市。但芯片上的差距總是牽一發(fā)而動(dòng)全身,單個(gè)芯片功能不足造成的時(shí)間差將導(dǎo)致國內(nèi)AI花費(fèi)更多的時(shí)間解析同樣的數(shù)據(jù)。

有了芯片,還需要帶動(dòng)芯片的超級(jí)計(jì)算機(jī)。2020年,微軟購買了28.5萬個(gè)CPU和1萬個(gè)GPU,聯(lián)合OpenAI打造了一臺(tái)AI超級(jí)計(jì)算機(jī)。根據(jù)2022年的全球超級(jí)計(jì)算機(jī)排名顯示,這臺(tái)超級(jí)計(jì)算機(jī)位列全球前五名。

雖然,我國的神威·太湖之光、天河-2A超級(jí)計(jì)算機(jī)也擠進(jìn)了前十名,但有關(guān)分析顯示,這兩款超級(jí)計(jì)算機(jī)主要是用來做科研的,幾乎不可能用來給科技公司做AI大模型的訓(xùn)練。

或許當(dāng)前國內(nèi)的大模型還處于微創(chuàng)新階段,談趕超ChatGPT為時(shí)尚早,但在巨頭們的百舸爭(zhēng)流下,有望形成兩強(qiáng)格局。

關(guān)鍵詞:

推薦內(nèi)容