国产在线视频精品视频,国产亚洲精品久久久久久青梅 ,国产麻豆精品一区,国产真实乱对白精彩久久,国产精品视频一区二区三区四

您的位置:焦點(diǎn)>正文

北大兔展聯(lián)合實(shí)驗(yàn)室發(fā)布中文法律大模型 ChatLaw,為大眾提供普惠法律服務(wù)

2023-07-06 00:24:17 來(lái)源:創(chuàng)業(yè)邦

引言

30歲,突然被裁員是怎樣一種體驗(yàn)?

雖然某些公司給了員工安慰——例如N+1的賠償。但遭遇非法裁員時(shí),我們只有握緊法律武器才能捍衛(wèi)自己的權(quán)益。


(資料圖片)

然而,由于法律領(lǐng)域存在較高知識(shí)壁壘。當(dāng)普通人想使用法律武器開(kāi)始維權(quán)時(shí),往往在第一步就會(huì)卡住。

即使查到了法條,訴訟所需要的大量流程性文書(shū)也是一個(gè)難題。

如何讓復(fù)雜的法律知識(shí)變得簡(jiǎn)單易懂?垂直領(lǐng)域的大語(yǔ)言模型或許是個(gè)有效的解。

最近,由北京大學(xué)信息工程學(xué)院袁粒課題組 與 北大-兔展AIGC聯(lián)合實(shí)驗(yàn)室 聯(lián)合發(fā)布的中文法律大模型產(chǎn)品ChatLaw,就為普通人提供了獲取普惠法律服務(wù)的途徑。

用戶(hù)通過(guò)簡(jiǎn)單對(duì)話(huà),即可獲得較為專(zhuān)業(yè)的法律建議。

甚至提供專(zhuān)業(yè)的法律文書(shū)。

與此同時(shí),它在網(wǎng)頁(yè)上即可使用,沒(méi)有次數(shù)限制,還能讀取文件和音頻,提供專(zhuān)業(yè)法律文書(shū)、推薦法律援助,對(duì)普通人維權(quán)相當(dāng)友好。

目前,ChatLaw已經(jīng)開(kāi)放Demo供大家試用,并且計(jì)劃將一部分模型在GitHub上開(kāi)放。

ChatLaw表現(xiàn)如何

讓我們先來(lái)看看ChatLaw的表現(xiàn)。

先進(jìn)入ChatLaw的主頁(yè)面。用戶(hù)可以選擇對(duì)應(yīng)模式,直接向模型提出具體的法律問(wèn)題。

問(wèn)題的表述不需要具備太強(qiáng)專(zhuān)業(yè)性,即使是樸素的自然語(yǔ)言,模型也能給出相關(guān)建議和案例。

當(dāng)模型判斷用戶(hù)的描述不夠具體時(shí),它會(huì)向用戶(hù)要求上傳文件,并根據(jù)用戶(hù)提供的信息進(jìn)行事實(shí)歸納和分析。

不僅僅是歸納事實(shí),ChatLaw還會(huì)基于事實(shí)生成具體的法律建議,甚至是法律文書(shū)。

當(dāng)用戶(hù)需要進(jìn)一步支持時(shí),模型還會(huì)向用戶(hù)推薦周邊的法律援助中心。

這樣的能力甚至引發(fā)了律師的感慨。

總結(jié)下來(lái),ChatLaw主要有兩大特點(diǎn):

1.智能性

2.準(zhǔn)確性

這背后其實(shí)對(duì)應(yīng)了ChatLaw的兩大核心技術(shù),“先驗(yàn)知識(shí)約束”和“調(diào)度模型”。

先驗(yàn)知識(shí)約束:避免模型幻覺(jué)

語(yǔ)言模型能讓復(fù)雜的知識(shí)變好懂。通過(guò)多輪對(duì)話(huà),用戶(hù)可以無(wú)限逼近事實(shí),從模型里獲取準(zhǔn)確且專(zhuān)業(yè)的建議。

但語(yǔ)言模型無(wú)法回避的問(wèn)題,是幻覺(jué)。

幻覺(jué)表現(xiàn)在模型上,是生成的內(nèi)容具有偏誤信息。例如對(duì)ChatGPT進(jìn)行法律提問(wèn),往往會(huì)得到含糊,甚至不正確的回答。這一現(xiàn)象的本質(zhì)是,ChatGPT數(shù)據(jù)集中并未包含中國(guó)法律,它不具備中國(guó)法律知識(shí)。

模型幻覺(jué)是無(wú)法回避的問(wèn)題,尤其在最為嚴(yán)肅的法律領(lǐng)域。簡(jiǎn)單地用法律對(duì)話(huà)數(shù)據(jù)做微調(diào),不足以支撐在真正法律場(chǎng)景落地。在涉及法律問(wèn)題時(shí),即使是像GPT4這樣最先進(jìn)的模型,也會(huì)出現(xiàn)幻覺(jué)和偏誤。為了確保模型生成的穩(wěn)健性,需要從模型訓(xùn)練階段就開(kāi)始介入和干預(yù)。

ChatLaw基于超過(guò)2億的判例文書(shū)原始文本,以及340萬(wàn)條法律法規(guī)和地方政策,構(gòu)建了大規(guī)模法律知識(shí)庫(kù)。同時(shí),通過(guò)與北大國(guó)際法學(xué)院、行業(yè)知名律師事務(wù)所進(jìn)行合作,團(tuán)隊(duì)確保知識(shí)庫(kù)能及時(shí)更新,同時(shí)保證數(shù)據(jù)的專(zhuān)業(yè)性和可靠性。

在訓(xùn)練階段,ChatLaw團(tuán)隊(duì)將這些法律數(shù)據(jù)大規(guī)模注入模型,并對(duì)這些知識(shí)進(jìn)行特殊處理和加強(qiáng),以確保模型在后續(xù)推理中具備法律先驗(yàn)知識(shí)并保持穩(wěn)健。同時(shí),他們也在推理時(shí)引入多個(gè)模塊,將通識(shí)模型、專(zhuān)業(yè)模型和知識(shí)庫(kù)融為一體。通過(guò)在推理中進(jìn)行約束,ChatLaw能夠確保模型生成正確的法律法規(guī),盡可能減少模型幻覺(jué)。

團(tuán)隊(duì)將這一整套的技術(shù)方案被定義為“先驗(yàn)知識(shí)約束”,并將模型訓(xùn)練的論文已經(jīng)同步發(fā)到了arXiv上。

為了驗(yàn)證模型生成法律內(nèi)容的準(zhǔn)確性。他們團(tuán)隊(duì)特地整理了過(guò)去十年的中國(guó)國(guó)家司法考試試題,并建立了一個(gè)包含2000個(gè)問(wèn)題的司法考試測(cè)試集。通過(guò)ELO機(jī)制進(jìn)行檢驗(yàn),ChatLaw模型在測(cè)試集上成功擊敗GPT4,獲得最高分。這充分說(shuō)明了“先驗(yàn)知識(shí)約束”的有效性,讓百億級(jí)參數(shù)量的模型也能在專(zhuān)業(yè)問(wèn)題上保持準(zhǔn)確。

調(diào)度模型:提升模型智能

法律咨詢(xún)是高度復(fù)雜的場(chǎng)景。其流程標(biāo)準(zhǔn)化,但每個(gè)案件事實(shí)卻是復(fù)雜多變的。這意味著,模型的智能度是至關(guān)重要的要素。為了提升模型智能度,同時(shí)增強(qiáng)模型的延展性。ChatLaw提出了“調(diào)度模型”的概念。用針對(duì)性微調(diào),訓(xùn)練了一個(gè)專(zhuān)用調(diào)度模型。

ChatLaw為調(diào)度模型準(zhǔn)備了一個(gè)極其豐富的模型&插件庫(kù)。通過(guò)對(duì)用戶(hù)提問(wèn)進(jìn)行語(yǔ)義理解,來(lái)對(duì)子模型和插件進(jìn)行調(diào)度并重組,最終呈現(xiàn)出多個(gè)模態(tài)的輸入和輸出。

基于這套體系,ChatLaw模型將文件、音頻、文字整合在一起,同時(shí)支持法律援助、法律文書(shū)、思維導(dǎo)圖等多樣化輸出。這使產(chǎn)品具有高度的延展性。

例如,當(dāng)模型判斷用戶(hù)的描述不夠具體時(shí),它會(huì)向用戶(hù)要求上傳文件,并根據(jù)用戶(hù)提供的信息進(jìn)行歸納和分析。

調(diào)度模型給予了產(chǎn)品更大的可能性。通過(guò)針對(duì)訓(xùn)練,調(diào)度模型可以接入市場(chǎng)上所有主流LLM,和符合規(guī)范的業(yè)務(wù)接口能力。這使得大規(guī)模覆蓋法律工作場(chǎng)景成為可能。

下一步:為政企提供大模型時(shí)代下的數(shù)字化升級(jí)

基于對(duì)“先驗(yàn)知識(shí)約束”和“調(diào)度模型”兩項(xiàng)關(guān)鍵技術(shù)的沉淀,北大-兔展AIGC聯(lián)合實(shí)驗(yàn)室已經(jīng)掌握了一整套大模型時(shí)代的產(chǎn)品方法論,并能在多個(gè)行業(yè)和領(lǐng)域進(jìn)行復(fù)用遷移。除本次發(fā)布的ChatLaw之外,整個(gè)團(tuán)隊(duì)也啟動(dòng)了多個(gè)行業(yè)模型的訓(xùn)練。在未來(lái)兩個(gè)月,團(tuán)隊(duì)會(huì)在多個(gè)領(lǐng)域推出ChatKnowledge系列。包括政務(wù)、金融等多個(gè)領(lǐng)域的大模型產(chǎn)品,讓垂直領(lǐng)域復(fù)雜的知識(shí)變好懂,覆蓋更多用戶(hù)需求。

除了通過(guò)支持多模態(tài)的多輪對(duì)話(huà)讓復(fù)雜知識(shí)變簡(jiǎn)單,北大-兔展AIGC聯(lián)合實(shí)驗(yàn)室將于近期繼續(xù)發(fā)布cv多模態(tài)大模型,用ai生成輔助說(shuō)明圖片和視頻,結(jié)合數(shù)字人,實(shí)現(xiàn)讓金融、法律、政務(wù)、醫(yī)藥的垂直領(lǐng)域?qū)崿F(xiàn)普通人對(duì)知識(shí)的觸手可得。

ChatLaw不是終點(diǎn)。以大模型驅(qū)動(dòng)的技術(shù)變革,必然會(huì)深刻改變各個(gè)行業(yè)的協(xié)作與溝通范式。大模型與產(chǎn)業(yè)深度如何融合將會(huì)是未來(lái)的關(guān)鍵。在新時(shí)代下,重要的是通過(guò)大模型能力重塑業(yè)務(wù)工作流,為企業(yè)、政府、乃至普通人創(chuàng)造價(jià)值。

未來(lái)兩年,團(tuán)隊(duì)要做中國(guó)版Cohere,專(zhuān)注大模型企業(yè)服務(wù)?;诜?、政務(wù)、金融3個(gè)領(lǐng)域,不斷完善行業(yè)級(jí)大模型。并基于企業(yè)知識(shí),接入企業(yè)業(yè)務(wù)能力,定制化、私有化為企業(yè)部署大模型應(yīng)用,向行業(yè)內(nèi)的先進(jìn)組織提供大模型時(shí)代下的全套解決方案。

研發(fā)團(tuán)隊(duì)

兔展智能在A(yíng)IGC內(nèi)容引擎和營(yíng)銷(xiāo)云這一領(lǐng)域經(jīng)過(guò)多年沉淀已成為國(guó)內(nèi)核心平臺(tái),并聯(lián)手北大深研院,建立了AIGC聯(lián)合實(shí)驗(yàn)室這一充滿(mǎn)科研活力的研發(fā)機(jī)構(gòu)。實(shí)驗(yàn)室聚焦大模型、CV、多模態(tài)等AIGC關(guān)鍵技術(shù),在多個(gè)領(lǐng)域具備突破性技術(shù)成果。實(shí)驗(yàn)室聚攏了一批新生代青年科研力量,如袁粒老師和張健老師的研究團(tuán)隊(duì)。團(tuán)隊(duì)多名骨干均為00后,成員伯華、家熙更是負(fù)責(zé)起了整個(gè)Chat-Knowledge產(chǎn)品的頂層架構(gòu)和模型訓(xùn)練。

結(jié)論

ChatLaw作為一款為普通人提供法律咨詢(xún)的AI產(chǎn)品,憑借其智能性和準(zhǔn)確性在市場(chǎng)中脫穎而出。通過(guò)知識(shí)注入和Plugin技術(shù)原理的支持,ChatLaw能夠?yàn)橛脩?hù)提供高質(zhì)量的法律指導(dǎo)、法律文書(shū)和法律建議。團(tuán)隊(duì)還計(jì)劃將其應(yīng)用于更多行業(yè),為企業(yè)提供數(shù)字化升級(jí)解決方案。ChatLaw的問(wèn)世為普通人維權(quán)提供了新的可能,使法律知識(shí)的獲取更加便捷,為維護(hù)自身權(quán)益提供了有力的工具。

相關(guān)內(nèi)容:

相關(guān)新聞