環(huán)球今日報丨“史詩級產(chǎn)品”!GPT-4來了:看圖玩??悸蓭?,能力超90%人類
2023-03-15 15:13:08 來源:超電實驗室
(資料圖)
能打敗GPT的只有OpenAI自己!
CHATGPT火遍全球才四個月,OpenAI就帶來了更強大的GPT-4。
目前來看主要特點是:
邏輯推理更強,能代替你考律師證
文字輸入更多,限制提升至 2.5 萬字
識圖能力,甚至可以給你講個笑話
更聰明,很難PUA它了
更安全,忽悠它越獄更難了
除此之外,更重要的是,OpenAI還開放了GPT-4的API,這意味著基于GPT-4會衍生出各種各樣的APP和花樣功能。
微軟營銷主管在GPT-4發(fā)布后第一時間證實,微軟的新必應(yīng)已經(jīng)用上了GPT-4。
此外,基于GPT-4的軟件也開始涌現(xiàn)出來,有幫助盲人和低視力用戶提升視覺能力的。
來源:Open AI
也有基于GPT-4打造的教育、編程軟件,他們甚至開始用GPT-4打起廣告招募學員了...
來源:Open AI
而GPT-4的商業(yè)前景并不止這些,玩梗講故事、寫代碼、考試等,各種專業(yè)和學術(shù)水準,直接和人類相當!
01
能力超90%人類
你能想象10秒生成一個網(wǎng)站,速成一篇論文,標準化考試始終名列前茅的大佬嗎?GPT-4就是傳說中“別人家的孩子”。
與ChatGPT所用的模型相比,GPT-4不僅能夠處理圖像內(nèi)容,且回復(fù)的準確性有所提高。
而且一本正經(jīng)胡說八道的情況,基本不會再出現(xiàn)了。
通俗來講,GPT-4提高了ChatGPT的核心技術(shù),相比此前版本,具有更廣泛的一般知識和解決問題的能力,使得聊天軟件能夠以更高的準確度解決更難的問題。
OpenAI表示,新模型產(chǎn)生的錯誤答案更少,將更少地偏離談話軌道,更少地談?wù)摻稍掝},甚至在許多標準化測試中比人類表現(xiàn)得更好?!爱斎蝿?wù)的復(fù)雜性達到足夠的閾值時,差異就會出現(xiàn)”,GPT-4更可靠、更有創(chuàng)意,并且能夠處理更細微的指令?!?/P>
表現(xiàn)究竟有多好?
考試基本全過
據(jù)OpenAI 透露,GPT-4 通過了所有基礎(chǔ)考試,而且還是高分通過。
比如,GPT-4在模擬律師資格考試的成績在考生中排名前 10% 左右,在 SAT 閱讀考試中排名前7%左右,在SAT數(shù)學考試中排名前11% 左右。
來源:Open AI
相比之下,原先的最強產(chǎn)品GPT-3.5 ,真實得分在倒數(shù)10%左右,GPT-4 的強大可想而知。而且滿分為800分的 SAT Math,它從590 分提升到了700 分。
來源:Open AI
看圖玩梗
OpenAI 花了 6 個月的時間使用對抗性測試程序和 ChatGPT 的經(jīng)驗教訓對 GPT-4 進行迭代調(diào)整 ,從而在真實性、可控性等方面取得了有史以來最好的結(jié)果。
GPT-4使用了第四代大型語言模型,與之前的GPT系列相比,GPT4最重大的突破就是實現(xiàn)了多模態(tài)化。
具體來說,就是可以接受文本和圖像形式的提問了,新能力與純文本設(shè)置并行,允許用戶指定任何視覺或語言任務(wù)。
不光能識圖還能根據(jù)文本創(chuàng)造的語境來理解圖片,通過穿插的文本和圖像組成的輸入,它能夠生成自然語言、代碼等文本輸出。此外,還能一秒識梗,還能解釋梗在哪里,為什么會有這個梗。
它的讀圖能力不僅能用于理解幽默,還可以用于進行更學術(shù)的應(yīng)用。處理更復(fù)雜的圖像信息,包括表格、考試題目截圖、論文截圖。
比如在提供一張柱狀圖時,它可以從中抓取關(guān)鍵信息,做出總結(jié)并進行進一步的計算分析;而當提供一些論文的截圖時,它還能處理圖片中的文字和圖中圖,精煉其中的要點,并歸納出論文圖片里的主旨大意。
來源:Open AI
不過Open AI表示,目前圖像輸入仍處于研究預(yù)覽階段,暫不公開。但Open AI公司已經(jīng)在其官網(wǎng)上為大家展示了些圖像輸入的例子。
比如當用戶問到這張圖片有什么好笑的,它是這么回答:
來源:Open AI
GPT:圖片顯示了一個“閃電電纜”適配器的包,有三個面板。
1:智能手機,VGA接口(一個大的,藍色的,通常用于電腦顯示器)插入充電端口。
2:“閃電電纜”適配器的包裝上有一個VGA連接器的圖片。
3:VGA連接器的特寫,末端有一個小的Lightning連接器(用于給iphone和其他蘋果設(shè)備充電)。
這幅圖的幽默之處在于,把一個大而過時的VGA接口,插入一個小而現(xiàn)代的智能手機充電端口是荒謬的。
再比如,當用戶問你能解釋一下這個圖片的梗嗎?
GPT-4:這張圖片是把兩件不相關(guān)的事情結(jié)合在一起的笑話:來自太空的地球圖片和雞塊。
這個表情包中的幽默來自于文字和圖像的意外并置,文本設(shè)定了對地球宏偉形象的期望,但這個形象實際上卻是炸雞塊。
雖然一本正經(jīng)解釋梗的感覺有點怪,但GPT-4顯然是理解了圖片之后才能有這番解釋出現(xiàn),就是GPT系列模型進步最大的地方,
除此之外,GPT-4 的長度限制提升到 32K tokens,即能處理超過 25000 個單詞的文本,并且可以使用長格式內(nèi)容創(chuàng)建、擴展對話、文檔搜索和分析等。
OpenAI 還貼心地發(fā)布了 GPT-4 開發(fā)者視頻,手把手教你如何自己當程序員、檢查錯誤信息、報稅。
關(guān)于“胡編亂造”和“有害答案”
OpenAI稱,該公司花費6個月的時間,利用對抗性測試程序和ChatGPT的經(jīng)驗教訓迭代調(diào)整GPT-4,從而在真實性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來最好的結(jié)果。
在公司內(nèi)部的對抗性真實性評估中,GPT-4的得分比最新的GPT-3.5高出40%,相應(yīng)的“不允許內(nèi)容請求的傾向”降低了 82%,根據(jù)政策響應(yīng)敏感請求(如醫(yī)療建議和自我傷害)的頻率提高了29%。
Open AI也表示“至少對我們而言,GPT-4訓練運行前所未有地穩(wěn)定,成為首個能夠提前準確預(yù)測其訓練性能的大型模型?!?/P>
該模型在多種語言方面均表現(xiàn)出優(yōu)越性。OpenAI稱,在測試的26種語言中,GPT-4在24種語言方面的表現(xiàn)均優(yōu)于GPT-3.5以及其他大語言模型語言性能表現(xiàn)。其中還包括了像拉脫維亞語、威爾士語、斯瓦希里語這些冷門到邪門的語言。
來源:Open AI
其中GPT-4的中文能夠達到80.1%的準確性,而GPT-3.5的英文準確性僅為70.1%,目前GPT-4英文準確性提高到了85.5%。
也需要改進
當然Open AI的新孩子也并不全然都是優(yōu)點,在推特上就有用戶連夜寫出了自己的一份心得測評說,GPT-4還是和以前一樣,不太會幻想未來;仍然回避一些敏感的話題。
此外,GPT4對于這種非文本輸入的處理能力還是有限,比如GPT-4在GRE數(shù)學部分上只取得了55分,在SAT的數(shù)學部分上只有52.6分的成績。
02
通用人工智能時代來了
在ChatGPT憑借一己之力,在極短的時間內(nèi)引爆全球AI產(chǎn)業(yè)變革的時候,微軟、谷歌等科技巨頭有了危機感,準備先下手為強,搶奪市場。
來源:Open AI
微軟大張旗鼓的表示新版必應(yīng)已搭載GPT-4,谷歌也發(fā)布了Big Bard,其內(nèi)部正在測試一款名為“Apprentice Bard“的 AI 模型,它基于一種”突破性的對話技術(shù)”——LaMDA ,可提供問答搜索能力。甚至連布林本人都親自來改代碼了,只為與ChatGPT競爭。
首富馬斯克也想分一杯羹,馬老板頻頻與一位曾在OpenAI短暫工作的兩年的員工建立聯(lián)系,試圖成立AI實驗室,開發(fā)出ChatGPT的替代品。
針對微軟和OpenAI的合作,谷歌也完全復(fù)制了這個模式,支持了一家由前OpenAI員工組成的初創(chuàng)公司——Anthropic,打造了一款ChatGPT的最強競品,目前還在優(yōu)化構(gòu)建方面。
在中國市場,也有一些大語言模型可以期待,比如百度的文心一言,將會在明天發(fā)布。原美團聯(lián)合創(chuàng)始人王慧文的創(chuàng)業(yè)公司“光年之外”也是如火如荼。
隨著這些AI大模型的落地,我們距離通用人工智能也越來越近了。
關(guān)鍵詞:
推薦內(nèi)容
- 環(huán)球今日報丨“史詩級產(chǎn)品”!GPT-4來了:看圖玩
- 富德生命人壽懷化中支開展2023年“3.15國際消費者
- 客戶確診癌癥-富德生命人壽常德中支快賠20.8萬暖
- 2023年富德生命人壽“福起?聞笙籟”音樂會將在長
- 當前動態(tài):【悅·廣水】廣水木搭橋村:胭脂紅鮮桃
- 組圖|巴東:峽江桃花開,笑迎賓客來
- 天天速讀:武漢新增22家省級放心消費示范單位
- 環(huán)球快訊:(相約春天賞櫻花)1.4億元專項獎勵+ 1
- 孝南新進村:法治陣地添新景,法治文化潤民心
- 當前熱文:國聯(lián)發(fā)展集團以91.05億競得民生證券34.
- 天天百事通!國聯(lián)發(fā)展集團拍得民生證券34.71億股
- 重點聚焦!突發(fā)!又一翹楚級CFO出事!“華晨系”上
- 奶酪博士虛假宣傳惡意競爭被罰10萬,產(chǎn)品還未拆封
- 世界報道:飛豬:近一周簽證搜索量同比增長886%
- 注冊制股票購買資格是什么?注冊制股票對散戶有影
- 打新股的門檻是什么?打新股中簽需要準備多少錢?
- 可轉(zhuǎn)債權(quán)限可以轉(zhuǎn)移嗎?可轉(zhuǎn)債上市后多久可轉(zhuǎn)換成
- 今日關(guān)注:民生證券股權(quán)競拍價突破90億
- 【世界聚看點】91.05億元!民生證券股份有限公司3
- 馬斯克、木頭姐齊發(fā)聲:硅谷銀行危機與1929年有很
- 揚州航務(wù)中心邵伯二號船閘大修提前竣工
- 當前關(guān)注:多年隱患一朝解,南通交通聯(lián)合如東水利
- 【世界獨家】長航公安荊州派出所:夯實基礎(chǔ)隊列訓
- 世界微資訊!粵西地區(qū)直徑最大頂管施工項目首段頂
- 環(huán)球報道:廈門市委書記崔永輝調(diào)研港口工作并主持
- 【速看料】“土坑酸菜”一周年,涉事公司插旗菜業(yè)
- 天天熱頭條丨八戒金服APP侵害用戶權(quán)益被通報 曾
- 全球動態(tài):接親現(xiàn)場親友團拆掉門框被指低俗接親,
- 每日快播:老太太水果攤邊狂“順”砂糖橘,網(wǎng)友:
- 【報資訊】扎克伯格的Meta公司宣布再裁1萬人,股
- 全球快資訊丨美容祛疤效果不佳,退一賠十還是退一
- 世界消息!武漢市江漢市場監(jiān)管局2023年度免費食品
- 每日速讀!今年前兩月中國進口煤炭6064萬噸 同比
- 天天新消息丨超27萬人次圍觀,民生證券股權(quán)拍賣最
- 熱頭條丨長江宜昌航道局:開展反恐防暴演練 提升
- 10小時完成航標調(diào)整!長江宜昌航道局積極助力地方
- 世界要聞:立足發(fā)展 深耕市場——長江航道測量中
- 智慧化升級!在陽邏港步行10分鐘,所見工人一個巴
- 天天實時:武漢青山海事3天查處3起AIS使用違法行為
- 信息:湖南武岡挖出“龍爪”石?村委會:形狀奇特