加載中...

您的位置：首頁 >金融 > 正文

國產(chǎn)大模型離ChatGPT還有多遠(yuǎn)？-焦點(diǎn)消息

2023-05-12 19:17:42 來源：環(huán)球老虎財(cái)經(jīng)app

(相關(guān)資料圖)

自CHATGPT問世已經(jīng)過去了半年時(shí)間，國內(nèi)大廠們已經(jīng)紛紛入局，國產(chǎn)ChatGPT產(chǎn)品爭(zhēng)相面世。但目前為止，相關(guān)產(chǎn)品幾乎都是在弱人工智能的基礎(chǔ)上演化而來，離強(qiáng)人工智能尚有距離。為什么“學(xué)習(xí)能力”一向很強(qiáng)的國內(nèi)廠商，這一次沒有快速追趕上ChatGPT呢？

2022年11月，OpenAI的一記“驚雷”點(diǎn)燃了國內(nèi)外巨頭的競(jìng)爭(zhēng)欲。

經(jīng)過幾個(gè)月的“角逐”，國內(nèi)第一批ChatGPT產(chǎn)品已經(jīng)面世。但是，不管是打響國內(nèi)ChatGPT第一槍的百度“文心一言”，還是三六零(行情601360,診股)、阿里以及科大訊飛(行情002230,診股)緊急孵化的各個(gè)大模型，似乎都有些“雷聲大雨點(diǎn)小”的意味。

要知道，ChatGPT的爆火，是因?yàn)槠浔憩F(xiàn)出了近乎于人類的語言表達(dá)能力、超強(qiáng)的學(xué)習(xí)能力以及語義理解能力，不僅能夠通過微軟的工程師測(cè)試，還能夠撰寫學(xué)術(shù)期刊論文等等。但這些，似乎都沒有在任意一款國產(chǎn)ChatGPT產(chǎn)品上體現(xiàn)……

為什么國產(chǎn)大模型，這一次沒有追上ChatGPT？

現(xiàn)實(shí)差距

國內(nèi)的AI機(jī)器人(行情300024,診股)、AI識(shí)圖技術(shù)已然“爐火純青”，相關(guān)產(chǎn)品也曾一度風(fēng)靡海外。

然以AI機(jī)器人、AI識(shí)圖以及視頻識(shí)別技術(shù)等一系列專用人工智能，統(tǒng)稱為弱人工智能，這些弱人工智能產(chǎn)品能夠回答簡(jiǎn)單的問題，完成系統(tǒng)預(yù)設(shè)好的指令，并與其他家電產(chǎn)品聯(lián)網(wǎng)，營造智能家居系統(tǒng)。

相對(duì)于弱人工智能，ChatGPT代表的是一種強(qiáng)人工智能，用戶只要對(duì)其發(fā)出比較具體的提示語，對(duì)其提出相關(guān)要求，ChatGPT就可以寫程序、做翻譯、寫論文、參加考試甚至進(jìn)行文化創(chuàng)作，最重要的是，還能“胡說八道”。

“胡說八道是只有人類才能產(chǎn)生的行為”，三六零創(chuàng)始人周鴻祎曾經(jīng)如是評(píng)價(jià)過。強(qiáng)人工智能能夠覆蓋弱人工智能的所有功能，還能夠完成弱人工智能所不能完成的任務(wù)。

也就是說，ChatGPT的誕生，完全可以傾覆弱人工智能的全部成果。因此，ChatGPT才會(huì)引起全球科技巨頭的警覺。

而當(dāng)下國產(chǎn)ChatGPT產(chǎn)品形成于“臨時(shí)抱佛腳”，帶有很重的弱人工智能“影子”。

由此可見，從弱人工智能到強(qiáng)人工智能并不是一次簡(jiǎn)單的“復(fù)制粘貼”，而是一次重大的科技飛躍，甚至可以被評(píng)價(jià)為時(shí)代變遷的開端。

體系互異

一個(gè)從大環(huán)境角度出發(fā)的答案，是兩國的創(chuàng)新機(jī)制不同。

具體而言，ChatGPT是典型的硅谷式創(chuàng)新產(chǎn)物。清華大學(xué)公共管理學(xué)教授梁正表示，這個(gè)創(chuàng)新生態(tài)體系有幾個(gè)關(guān)鍵的步驟，首先要有創(chuàng)新性的機(jī)制，一些企業(yè)聚集了一批理想主義的技術(shù)天才，走了一條不尋常的道路，最后再由大公司進(jìn)行投入和資源整合，完成商業(yè)化。

在這個(gè)過程中，隱藏著三個(gè)體系：一是研究型大學(xué)，有一批科學(xué)家在做探索性的工作；二是使命導(dǎo)向的實(shí)驗(yàn)室體系，以國家的使命驅(qū)動(dòng)前沿研究；三是硅谷，基于創(chuàng)新創(chuàng)業(yè)和風(fēng)險(xiǎn)投資的商業(yè)生態(tài)。這三者相互疊加，密切聯(lián)動(dòng)，先從0-1突破，在通過大公司注資完成從1-2的工作，從而形成從科研到產(chǎn)業(yè)化的良性循環(huán)。

ChatGPT的誕生，就是微軟重金投資了一家看起來非同尋常的公司——OpenAI，這家公司曾經(jīng)無產(chǎn)品、無體系，但有一個(gè)技術(shù)天才，完成了一個(gè)又一個(gè)的構(gòu)想，還受到了大資金的青睞，十年后，ChatGPT轟動(dòng)了全球。

而國內(nèi)的創(chuàng)新體系大致為，高等學(xué)府中的科學(xué)家做探索性的工作-這些科學(xué)家被高薪聘請(qǐng)到大公司-最后以大公司為背景，對(duì)這些探索性研究成果進(jìn)行投入和落地。

這種體系很穩(wěn)，且我國在人工智能方面的研究看似也從未停歇。早在2018年，中國人工智能方面的論文在總量和被引論文數(shù)量上就排在了世界第一，專利數(shù)量排名第二，中國人工智能企業(yè)數(shù)量位列世界第二，中國人工智能領(lǐng)域的投融資占到了全球的60%，成為全球最“吸金”的國家。

然而，盡管我國人工智能相關(guān)論文數(shù)量已經(jīng)形成了一定的規(guī)模，論文被引用的次數(shù)也頗多，但距離真正的成果還有一定的距離。

不單是研發(fā)差距，風(fēng)投的投資思維差異也是影響創(chuàng)新積極性的因素之一。國內(nèi)的風(fēng)投思維仍是“不投沒譜的事情”，根據(jù)梁正教授的說法，巨頭們可能不愿意做獲利前景太遠(yuǎn)的事情，很少有人像微軟一樣，會(huì)押注一家“非盈利”的小公司。

一項(xiàng)傾覆世界的研發(fā)成果誕生，可能還需要很多個(gè)“臨門一腳”才能完成。OpenAI為做出ChatGPT也耗費(fèi)了大量的人力、物力、財(cái)力和時(shí)間成本。因此，國產(chǎn)大模型想要趕超ChatGPT，尚需時(shí)間。

語言殊途

除了環(huán)境因素，擺在國產(chǎn)大模型面前的還有現(xiàn)實(shí)因素。

相關(guān)學(xué)術(shù)論文顯示，ChatGPT是融合了Transformer和強(qiáng)化學(xué)習(xí)兩項(xiàng)技術(shù)。

拆分來看，所謂Transfoemer架構(gòu)是一種基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu)，被廣泛應(yīng)用于自然語言處理領(lǐng)域。這一架構(gòu)能使得ChatGPT能夠通過分析輸入的語料來理解人類語言的語法、語義，并按照語法生成流暢且擁有較強(qiáng)理解力的應(yīng)答。

在此基礎(chǔ)之上，ChatGPT使用的強(qiáng)化學(xué)習(xí)技術(shù)，通過外界設(shè)定的獎(jiǎng)懲規(guī)則，自主學(xué)習(xí)，最終在某項(xiàng)具體任務(wù)中達(dá)到甚至超越人類的表現(xiàn)。

強(qiáng)化學(xué)習(xí)模型最知名的應(yīng)用就是DeepMind團(tuán)隊(duì)開發(fā)的圍棋機(jī)器人AlphaGo，其在2017年打敗了人類最頂尖的騎手柯潔。DeepMind團(tuán)隊(duì)還開發(fā)出另一項(xiàng)顛覆性的研究——AlphaFold數(shù)據(jù)庫，在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)上遠(yuǎn)遠(yuǎn)超越人類，并在2022年宣布預(yù)測(cè)出地球上幾乎所有的蛋白質(zhì)結(jié)構(gòu)。

簡(jiǎn)言之，就是ChatGPT需要先理解人類的語法、語義，再通過收集大量資料、不停完成訓(xùn)練、反復(fù)學(xué)習(xí)才能夠達(dá)到當(dāng)前類似于人類，甚至超越人類的表現(xiàn)。

而國產(chǎn)ChatGPT在這兩項(xiàng)技術(shù)方面都略遜一籌，一方面是數(shù)據(jù)庫容量，而更重要的是中、英兩種語言結(jié)構(gòu)的天然差異。

當(dāng)前的ChatGPT是基于英文的，英文能夠讓ChatGPT通過詞綴、詞性、標(biāo)點(diǎn)符號(hào)等，更加方便的將相同詞綴的詞匯構(gòu)成并列。如以ing結(jié)尾的詞匯，可以被ChatGPT快速并列為進(jìn)行時(shí)態(tài)的詞匯。而中文的正在進(jìn)行時(shí)表達(dá)則相對(duì)多元。

另外，英文句子的結(jié)構(gòu)是網(wǎng)狀的，理論上，在語法正確的情況下，一句英文可以由一萬個(gè)詞匯組成，一個(gè)句子中能夠有N個(gè)謂語、非謂語、從句等等。

反觀中文，一些詞匯能當(dāng)動(dòng)詞也能當(dāng)名詞，一個(gè)詞匯的褒貶含義還需要結(jié)合上下文理解，標(biāo)點(diǎn)符號(hào)代表的含義也多有不同，學(xué)習(xí)起來并不容易。

除此之外，強(qiáng)人工智能代表的是人類知識(shí)的集大成者，而大多頂尖的學(xué)術(shù)類論文、文獻(xiàn)、資料等都是英文。這也意味著ChatGPT的學(xué)習(xí)知識(shí)庫遠(yuǎn)比國內(nèi)的大模型要豐富，

芯片掣肘

先天條件遇到門檻，硬實(shí)力還遭遇了“卡脖子”。

據(jù)了解，ChatGPT的訓(xùn)練過程需要耗費(fèi)大量的計(jì)算資源和時(shí)間，這需要企業(yè)具備強(qiáng)大的計(jì)算能力和相應(yīng)的設(shè)備。

資料顯示，ChatGPT的總算力消耗約為3640PF-days（即假如每秒計(jì)算一千萬億次，需要計(jì)算3640天），需要7至8個(gè)投資規(guī)模30億、算力500P的數(shù)據(jù)中心才能支撐運(yùn)行。

支撐這些算力的，就是英偉達(dá)研發(fā)的全球頂尖的A100和H100智能芯片。有聲音認(rèn)為，即便是部署1萬塊英偉達(dá)A100顯卡，也要持續(xù)不間斷運(yùn)算10年才能達(dá)到當(dāng)前ChatGPT這樣的算力高度。

但目前，這兩款芯片在全球具有不可替代性，而英偉達(dá)A100和H100已經(jīng)被限制出口中國。

為了繼續(xù)占領(lǐng)中國市場(chǎng)，英偉達(dá)已經(jīng)針對(duì)中國推出了中國特供版A800，但這兩款芯片存在明顯的性能差距。H100芯片的中國特供版也即將研發(fā)完畢，很快就能在中國上市。但芯片上的差距總是牽一發(fā)而動(dòng)全身，單個(gè)芯片功能不足造成的時(shí)間差將導(dǎo)致國內(nèi)AI花費(fèi)更多的時(shí)間解析同樣的數(shù)據(jù)。

有了芯片，還需要帶動(dòng)芯片的超級(jí)計(jì)算機(jī)。2020年，微軟購買了28.5萬個(gè)CPU和1萬個(gè)GPU，聯(lián)合OpenAI打造了一臺(tái)AI超級(jí)計(jì)算機(jī)。根據(jù)2022年的全球超級(jí)計(jì)算機(jī)排名顯示，這臺(tái)超級(jí)計(jì)算機(jī)位列全球前五名。

雖然，我國的神威·太湖之光、天河-2A超級(jí)計(jì)算機(jī)也擠進(jìn)了前十名，但有關(guān)分析顯示，這兩款超級(jí)計(jì)算機(jī)主要是用來做科研的，幾乎不可能用來給科技公司做AI大模型的訓(xùn)練。

或許當(dāng)前國內(nèi)的大模型還處于微創(chuàng)新階段，談趕超ChatGPT為時(shí)尚早，但在巨頭們的百舸爭(zhēng)流下，有望形成兩強(qiáng)格局。

国产在线视频精品视频,国产亚洲精品久久久久久青梅 ,国产麻豆精品一区,国产真实乱对白精彩久久,国产精品视频一区二区三区四

國產(chǎn)大模型離ChatGPT還有多遠(yuǎn)？-焦點(diǎn)消息

推薦內(nèi)容

今日推薦

焦點(diǎn)圖

百億私募三季度增持40家上市...

創(chuàng)業(yè)板迎來開板13周年 1206...

538家公司前三季度凈利潤翻倍...

乳業(yè)企業(yè)愛上氣泡概念相繼...

熱點(diǎn)新聞

精彩文章

【世界新視野】廣州海事“海晏...

国产在线视频精品视频,国产亚洲精品久久久久久青梅 ,国产麻豆精品一区,国产真实乱对白精彩久久,国产精品视频一区二区三区四

國產(chǎn)大模型離ChatGPT還有多遠(yuǎn)？-焦點(diǎn)消息

推薦內(nèi)容

今日推薦

焦點(diǎn)圖

百億私募三季度增持40家上市...

創(chuàng)業(yè)板迎來開板13周年 1206...

538家公司前三季度凈利潤翻倍...

乳業(yè)企業(yè)愛上氣泡概念 相繼...

熱點(diǎn)新聞

精彩文章

【世界新視野】廣州海事“海晏...

推薦閱讀

國產(chǎn)大模型離ChatGPT還有多遠(yuǎn)？-焦點(diǎn)消息

乳業(yè)企業(yè)愛上氣泡概念相繼...