【資料圖】
近期,快手自研的大型人工智能模型“快意”(KuaiYii)在AI綜合中文評估基準(zhǔn)CMMLU的榜單中嶄露頭角。據(jù)悉,該模型的13B版本KwaiYii-13B在five-shot和zero-shot項(xiàng)目下的中文向均位列第一名,尤其在人文學(xué)科、中國特定主題等方面表現(xiàn)突出,平均分超過61分。根據(jù)快手在GitHub頁面公布的信息,快意是其AI團(tuán)隊(duì)獨(dú)立研發(fā)的大規(guī)模語言模型。目前,該模型已經(jīng)覆蓋了預(yù)訓(xùn)練模型(KwaiYii-Base)和對話模型(KwaiYii-Chat)??煲獾闹饕攸c(diǎn)包括:首先,KwaiYii-13B-Base預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力,在大部分權(quán)威的中/英文Benchmark上取得了同等模型尺寸下的最佳效果。例如,該模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前處于同等模型規(guī)模的領(lǐng)先水平。其次,KwaiYii-13B-Chat對話模型具備出色的語言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學(xué)邏輯、代碼編寫、多輪對話等廣泛任務(wù)。人工評估結(jié)果顯示,KwaiYii-13B-Chat超過了主流的開源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學(xué)解題上接近ChatGPT(3.5)同等水平。