國產(chǎn)大模型離ChatGPT還有多遠(yuǎn)?-焦點(diǎn)消息
2023-05-12 19:17:42 來源:環(huán)球老虎財(cái)經(jīng)app
(相關(guān)資料圖)
自CHATGPT問世已經(jīng)過去了半年時(shí)間,國內(nèi)大廠們已經(jīng)紛紛入局,國產(chǎn)ChatGPT產(chǎn)品爭(zhēng)相面世。但目前為止,相關(guān)產(chǎn)品幾乎都是在弱人工智能的基礎(chǔ)上演化而來,離強(qiáng)人工智能尚有距離。為什么“學(xué)習(xí)能力”一向很強(qiáng)的國內(nèi)廠商,這一次沒有快速追趕上ChatGPT呢?
2022年11月,OpenAI的一記“驚雷”點(diǎn)燃了國內(nèi)外巨頭的競(jìng)爭(zhēng)欲。
經(jīng)過幾個(gè)月的“角逐”,國內(nèi)第一批ChatGPT產(chǎn)品已經(jīng)面世。但是,不管是打響國內(nèi)ChatGPT第一槍的百度“文心一言”,還是三六零(行情601360,診股)、阿里以及科大訊飛(行情002230,診股)緊急孵化的各個(gè)大模型,似乎都有些“雷聲大雨點(diǎn)小”的意味。
要知道,ChatGPT的爆火,是因?yàn)槠浔憩F(xiàn)出了近乎于人類的語言表達(dá)能力、超強(qiáng)的學(xué)習(xí)能力以及語義理解能力,不僅能夠通過微軟的工程師測(cè)試,還能夠撰寫學(xué)術(shù)期刊論文等等。但這些,似乎都沒有在任意一款國產(chǎn)ChatGPT產(chǎn)品上體現(xiàn)……
為什么國產(chǎn)大模型,這一次沒有追上ChatGPT?
現(xiàn)實(shí)差距
國內(nèi)的AI機(jī)器人(行情300024,診股)、AI識(shí)圖技術(shù)已然“爐火純青”,相關(guān)產(chǎn)品也曾一度風(fēng)靡海外。
然以AI機(jī)器人、AI識(shí)圖以及視頻識(shí)別技術(shù)等一系列專用人工智能,統(tǒng)稱為弱人工智能,這些弱人工智能產(chǎn)品能夠回答簡(jiǎn)單的問題,完成系統(tǒng)預(yù)設(shè)好的指令,并與其他家電產(chǎn)品聯(lián)網(wǎng),營造智能家居系統(tǒng)。
相對(duì)于弱人工智能,ChatGPT代表的是一種強(qiáng)人工智能,用戶只要對(duì)其發(fā)出比較具體的提示語,對(duì)其提出相關(guān)要求,ChatGPT就可以寫程序、做翻譯、寫論文、參加考試甚至進(jìn)行文化創(chuàng)作,最重要的是,還能“胡說八道”。
“胡說八道是只有人類才能產(chǎn)生的行為”,三六零創(chuàng)始人周鴻祎曾經(jīng)如是評(píng)價(jià)過。強(qiáng)人工智能能夠覆蓋弱人工智能的所有功能,還能夠完成弱人工智能所不能完成的任務(wù)。
也就是說,ChatGPT的誕生,完全可以傾覆弱人工智能的全部成果。因此,ChatGPT才會(huì)引起全球科技巨頭的警覺。
而當(dāng)下國產(chǎn)ChatGPT產(chǎn)品形成于“臨時(shí)抱佛腳”,帶有很重的弱人工智能“影子”。
由此可見,從弱人工智能到強(qiáng)人工智能并不是一次簡(jiǎn)單的“復(fù)制粘貼”,而是一次重大的科技飛躍,甚至可以被評(píng)價(jià)為時(shí)代變遷的開端。
體系互異
一個(gè)從大環(huán)境角度出發(fā)的答案,是兩國的創(chuàng)新機(jī)制不同。
具體而言,ChatGPT是典型的硅谷式創(chuàng)新產(chǎn)物。清華大學(xué)公共管理學(xué)教授梁正表示,這個(gè)創(chuàng)新生態(tài)體系有幾個(gè)關(guān)鍵的步驟,首先要有創(chuàng)新性的機(jī)制,一些企業(yè)聚集了一批理想主義的技術(shù)天才,走了一條不尋常的道路,最后再由大公司進(jìn)行投入和資源整合,完成商業(yè)化。
在這個(gè)過程中,隱藏著三個(gè)體系:一是研究型大學(xué),有一批科學(xué)家在做探索性的工作;二是使命導(dǎo)向的實(shí)驗(yàn)室體系,以國家的使命驅(qū)動(dòng)前沿研究;三是硅谷,基于創(chuàng)新創(chuàng)業(yè)和風(fēng)險(xiǎn)投資的商業(yè)生態(tài)。這三者相互疊加,密切聯(lián)動(dòng),先從0-1突破,在通過大公司注資完成從1-2的工作,從而形成從科研到產(chǎn)業(yè)化的良性循環(huán)。
ChatGPT的誕生,就是微軟重金投資了一家看起來非同尋常的公司——OpenAI,這家公司曾經(jīng)無產(chǎn)品、無體系,但有一個(gè)技術(shù)天才,完成了一個(gè)又一個(gè)的構(gòu)想,還受到了大資金的青睞,十年后,ChatGPT轟動(dòng)了全球。
而國內(nèi)的創(chuàng)新體系大致為,高等學(xué)府中的科學(xué)家做探索性的工作-這些科學(xué)家被高薪聘請(qǐng)到大公司-最后以大公司為背景,對(duì)這些探索性研究成果進(jìn)行投入和落地。
這種體系很穩(wěn),且我國在人工智能方面的研究看似也從未停歇。早在2018年,中國人工智能方面的論文在總量和被引論文數(shù)量上就排在了世界第一,專利數(shù)量排名第二,中國人工智能企業(yè)數(shù)量位列世界第二,中國人工智能領(lǐng)域的投融資占到了全球的60%,成為全球最“吸金”的國家。
然而,盡管我國人工智能相關(guān)論文數(shù)量已經(jīng)形成了一定的規(guī)模,論文被引用的次數(shù)也頗多,但距離真正的成果還有一定的距離。
不單是研發(fā)差距,風(fēng)投的投資思維差異也是影響創(chuàng)新積極性的因素之一。國內(nèi)的風(fēng)投思維仍是“不投沒譜的事情”,根據(jù)梁正教授的說法,巨頭們可能不愿意做獲利前景太遠(yuǎn)的事情,很少有人像微軟一樣,會(huì)押注一家“非盈利”的小公司。
一項(xiàng)傾覆世界的研發(fā)成果誕生,可能還需要很多個(gè)“臨門一腳”才能完成。OpenAI為做出ChatGPT也耗費(fèi)了大量的人力、物力、財(cái)力和時(shí)間成本。因此,國產(chǎn)大模型想要趕超ChatGPT,尚需時(shí)間。
語言殊途
除了環(huán)境因素,擺在國產(chǎn)大模型面前的還有現(xiàn)實(shí)因素。
相關(guān)學(xué)術(shù)論文顯示,ChatGPT是融合了Transformer和強(qiáng)化學(xué)習(xí)兩項(xiàng)技術(shù)。
拆分來看,所謂Transfoemer架構(gòu)是一種基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu),被廣泛應(yīng)用于自然語言處理領(lǐng)域。這一架構(gòu)能使得ChatGPT能夠通過分析輸入的語料來理解人類語言的語法、語義,并按照語法生成流暢且擁有較強(qiáng)理解力的應(yīng)答。
在此基礎(chǔ)之上,ChatGPT使用的強(qiáng)化學(xué)習(xí)技術(shù),通過外界設(shè)定的獎(jiǎng)懲規(guī)則,自主學(xué)習(xí),最終在某項(xiàng)具體任務(wù)中達(dá)到甚至超越人類的表現(xiàn)。
強(qiáng)化學(xué)習(xí)模型最知名的應(yīng)用就是DeepMind團(tuán)隊(duì)開發(fā)的圍棋機(jī)器人AlphaGo,其在2017年打敗了人類最頂尖的騎手柯潔。DeepMind團(tuán)隊(duì)還開發(fā)出另一項(xiàng)顛覆性的研究——AlphaFold數(shù)據(jù)庫,在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)上遠(yuǎn)遠(yuǎn)超越人類,并在2022年宣布預(yù)測(cè)出地球上幾乎所有的蛋白質(zhì)結(jié)構(gòu)。
簡(jiǎn)言之,就是ChatGPT需要先理解人類的語法、語義,再通過收集大量資料、不停完成訓(xùn)練、反復(fù)學(xué)習(xí)才能夠達(dá)到當(dāng)前類似于人類,甚至超越人類的表現(xiàn)。
而國產(chǎn)ChatGPT在這兩項(xiàng)技術(shù)方面都略遜一籌,一方面是數(shù)據(jù)庫容量,而更重要的是中、英兩種語言結(jié)構(gòu)的天然差異。
當(dāng)前的ChatGPT是基于英文的,英文能夠讓ChatGPT通過詞綴、詞性、標(biāo)點(diǎn)符號(hào)等,更加方便的將相同詞綴的詞匯構(gòu)成并列。如以ing結(jié)尾的詞匯,可以被ChatGPT快速并列為進(jìn)行時(shí)態(tài)的詞匯。而中文的正在進(jìn)行時(shí)表達(dá)則相對(duì)多元。
另外,英文句子的結(jié)構(gòu)是網(wǎng)狀的,理論上,在語法正確的情況下,一句英文可以由一萬個(gè)詞匯組成,一個(gè)句子中能夠有N個(gè)謂語、非謂語、從句等等。
反觀中文,一些詞匯能當(dāng)動(dòng)詞也能當(dāng)名詞,一個(gè)詞匯的褒貶含義還需要結(jié)合上下文理解,標(biāo)點(diǎn)符號(hào)代表的含義也多有不同,學(xué)習(xí)起來并不容易。
除此之外,強(qiáng)人工智能代表的是人類知識(shí)的集大成者,而大多頂尖的學(xué)術(shù)類論文、文獻(xiàn)、資料等都是英文。這也意味著ChatGPT的學(xué)習(xí)知識(shí)庫遠(yuǎn)比國內(nèi)的大模型要豐富,
芯片掣肘
先天條件遇到門檻,硬實(shí)力還遭遇了“卡脖子”。
據(jù)了解,ChatGPT的訓(xùn)練過程需要耗費(fèi)大量的計(jì)算資源和時(shí)間,這需要企業(yè)具備強(qiáng)大的計(jì)算能力和相應(yīng)的設(shè)備。
資料顯示,ChatGPT的總算力消耗約為3640PF-days(即假如每秒計(jì)算一千萬億次,需要計(jì)算3640天),需要7至8個(gè)投資規(guī)模30億、算力500P的數(shù)據(jù)中心才能支撐運(yùn)行。
支撐這些算力的,就是英偉達(dá)研發(fā)的全球頂尖的A100和H100智能芯片。有聲音認(rèn)為,即便是部署1萬塊英偉達(dá)A100顯卡,也要持續(xù)不間斷運(yùn)算10年才能達(dá)到當(dāng)前ChatGPT這樣的算力高度。
但目前,這兩款芯片在全球具有不可替代性,而英偉達(dá)A100和H100已經(jīng)被限制出口中國。
為了繼續(xù)占領(lǐng)中國市場(chǎng),英偉達(dá)已經(jīng)針對(duì)中國推出了中國特供版A800,但這兩款芯片存在明顯的性能差距。H100芯片的中國特供版也即將研發(fā)完畢,很快就能在中國上市。但芯片上的差距總是牽一發(fā)而動(dòng)全身,單個(gè)芯片功能不足造成的時(shí)間差將導(dǎo)致國內(nèi)AI花費(fèi)更多的時(shí)間解析同樣的數(shù)據(jù)。
有了芯片,還需要帶動(dòng)芯片的超級(jí)計(jì)算機(jī)。2020年,微軟購買了28.5萬個(gè)CPU和1萬個(gè)GPU,聯(lián)合OpenAI打造了一臺(tái)AI超級(jí)計(jì)算機(jī)。根據(jù)2022年的全球超級(jí)計(jì)算機(jī)排名顯示,這臺(tái)超級(jí)計(jì)算機(jī)位列全球前五名。
雖然,我國的神威·太湖之光、天河-2A超級(jí)計(jì)算機(jī)也擠進(jìn)了前十名,但有關(guān)分析顯示,這兩款超級(jí)計(jì)算機(jī)主要是用來做科研的,幾乎不可能用來給科技公司做AI大模型的訓(xùn)練。
或許當(dāng)前國內(nèi)的大模型還處于微創(chuàng)新階段,談趕超ChatGPT為時(shí)尚早,但在巨頭們的百舸爭(zhēng)流下,有望形成兩強(qiáng)格局。
關(guān)鍵詞:
推薦內(nèi)容
- 國產(chǎn)大模型離ChatGPT還有多遠(yuǎn)?-焦點(diǎn)消息
- 山東泰山時(shí)隔7年重啟球迷開放日,球迷:球隊(duì)一定
- 【世界新視野】廣州海事“海晏”青年志愿者開展水
- 重慶市交通執(zhí)法港航海事支隊(duì)三大隊(duì)開展防災(zāi)減災(zāi)宣
- 朝天門海事處積極開展“防災(zāi)減災(zāi)日”聯(lián)合安全檢查
- 廣州海事保障第十五屆廣州南沙媽祖文化旅游節(jié)順利
- 全球速讀:湛江海事助企避免10萬余元損失獲贈(zèng)錦旗
- “AI孫燕姿”翻唱已獲數(shù)百萬人駐足 網(wǎng)友直呼太上頭
- 陳夢(mèng)送生日蛋糕,林詩棟陪伴左右,王楚欽烤肉店慶
- 英國男子在普吉島暴打嘟嘟車司機(jī)后飛車逃跑 當(dāng)前
- 以案釋法 | 排污單位應(yīng)當(dāng)按照排污許可證規(guī)定和
- 安裝的投影儀可播放未授權(quán)影片,一酒店遭起訴!法
- 天天觀點(diǎn):降!降!降!油價(jià)下調(diào)倒計(jì)時(shí)!
- 人事任免!淄博一地最新公布 全球報(bào)道
- 在岸人民幣兌美元16:30收盤報(bào)6.9506 -消息
- 何超蓮白T黑褲簡(jiǎn)約出鏡,全素顏被指水腫明顯,再
- 消防進(jìn)家園 平安到永遠(yuǎn) 世界熱推薦
- 全球快播:兩斤小龍蝦下肚,35歲男子上吐下瀉被“
- 淄博一社區(qū)推出外賣小哥進(jìn)小區(qū)專用自行車,居民:
- 澳女子觀摩英國王加冕禮被認(rèn)作反君主制人士關(guān)了13
- 環(huán)球簡(jiǎn)訊:三個(gè)“與眾不同”助力共同締造安全江夏
- 世界觀天下!杭州首個(gè)汽車領(lǐng)域的中本一體化七年制
- “小魚兒”帶動(dòng)農(nóng)戶們實(shí)現(xiàn)共富 錢塘區(qū)馬口魚目前
- 熱點(diǎn)聚焦:汶川地震15周年微紀(jì)錄片:《汶川·重生》
- 天天熱資訊!上海證券交易所啟動(dòng)科創(chuàng)50ETF期權(quán)新
- 環(huán)球今熱點(diǎn):5月12日機(jī)構(gòu)調(diào)研這些股票
- 雪松國際信托董事長(zhǎng):加快催收回款 持續(xù)做好投資
- 焦點(diǎn)報(bào)道:5月12日機(jī)構(gòu)最看好的10只股票
- 全球熱訊:中國船級(jí)社大連分社舉辦大連轄區(qū)散貨船
- 環(huán)球觀焦點(diǎn):淮安航務(wù)中心淮安船閘組織開展防災(zāi)減
- 徐州航務(wù)中心解臺(tái)船閘開展防災(zāi)減災(zāi)宣傳活動(dòng)
- 哈爾濱太平海事處聯(lián)合五家客運(yùn)公司開展2023年水上
- 太子地產(chǎn)集團(tuán)總裁李建勛(Edward Lee)接受CIR采
- 科學(xué)“救”是有力量!防災(zāi)減災(zāi)日,鄭州科技館開展
- 興化:警校聯(lián)動(dòng)開展應(yīng)急演練
- 山東學(xué)生身高全國第一?高于全國平均,但輸給了這
- 打造“四季如春”營商環(huán)境 讓投資興業(yè)者“如沐春
- @惠州初中應(yīng)屆畢業(yè)生 報(bào)讀中職、技工院校也需填
- 環(huán)球消息!珍稀劇種西秦戲讓更多大學(xué)生“種草”傳
- 濰坊聚焦重點(diǎn)任務(wù)和關(guān)鍵環(huán)節(jié) 全力提升法治政府建
今日推薦
- 山東泰山時(shí)隔7年重啟球迷開放日,球
- 陳夢(mèng)送生日蛋糕,林詩棟陪伴左右,
- 在岸人民幣兌美元16:30收盤報(bào)6.9506
- 興化:警校聯(lián)動(dòng)開展應(yīng)急演練
- 天天熱點(diǎn)!遼寧省臺(tái)安縣發(fā)布大風(fēng)黃
- 四川2023年5月1日-7日煤炭?jī)r(jià)格運(yùn)行
- 焦點(diǎn)快播:李國慶:簽約孟羽童保底
- 環(huán)球微頭條丨恐怖黎明流浪中的戰(zhàn)士_
- 穩(wěn)增長(zhǎng)促轉(zhuǎn)型重要引擎!數(shù)字經(jīng)濟(jì)ETF
- 天天要聞:理想汽車公布一季度財(cái)報(bào)
焦點(diǎn)圖
熱點(diǎn)新聞
- 深圳激活“沉睡”政務(wù)數(shù)據(jù) 打造中
- 抓緊申報(bào)!廣州市發(fā)布2021年度對(duì)外
- 粵港澳賽區(qū)參賽隊(duì)獨(dú)攬獎(jiǎng)金 華為軟
- 就業(yè)形勢(shì)喜人!北大匯豐商學(xué)院2022
- 你見過“賺錢”類App的廣告嗎?遇上
- 深圳:6000萬元消費(fèi)券即將發(fā)放餐飲
- “中國質(zhì)造”吸引外貿(mào)企業(yè)振翅高飛
- 廣州市版權(quán)產(chǎn)業(yè)發(fā)展處于全國領(lǐng)先地
- 留抵退稅政策落地、紅利加速釋放
- 第五屆進(jìn)博會(huì)籌備工作有序推進(jìn) 簽