阿里云通義千問開源!70億參數(shù)模型上線魔搭社區(qū)


(資料圖)

8月3日,AI模型社區(qū)魔搭ModelScope上架兩款開源模型Qwen-7B和Qwen-7B-Chat,阿里云確認其為通義千問70億參數(shù)通用模型和對話模型,兩款模型均開源、免費、可商用。在多個權(quán)威測評中,通義千問7B模型取得了遠超國內(nèi)外同等尺寸模型的效果,成為當(dāng)下業(yè)界最強的中英文7B開源模型。

阿里云表示,開源大模型可以幫助用戶簡化模型訓(xùn)練和部署的過程,用戶不必從頭訓(xùn)練模型,只需下載預(yù)訓(xùn)練好的模型并進行微調(diào),就可快速構(gòu)建高質(zhì)量的模型。

據(jù)御龍?zhí)煜铝私?,Qwen-7B是支持中、英等多種語言的基座模型,在超過2萬億token數(shù)據(jù)集上訓(xùn)練,上下文窗口長度達到8k。Qwen-7B-Chat是基于基座模型的中英文對話模型,已實現(xiàn)與人類認知對齊。開源代碼支持對Qwen-7B和Qwen-7B-Chat的量化,支持用戶在消費級顯卡上部署和運行模型。

用戶既可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺訪問和調(diào)用Qwen-7B和Qwen-7B-Chat,阿里云為用戶提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的全方位服務(wù)。

據(jù)悉,在今年4月,阿里云推出了自研大模型通義千問,引發(fā)井噴式的市場需求。此次小型化模型版本開源,有望抹平模型使用門檻,讓海量中小企業(yè)和AI開發(fā)者更早、更快地用上通義千問。這一舉動也讓阿里云成為國內(nèi)首個加入大模型開源行列的大型科技企業(yè)。

相關(guān)內(nèi)容