大模型不能再繼續(xù)“裸奔”了
8月15日起,《生成式人工智能服務(wù)管理暫行辦法》(以下簡稱《暫行辦法》)正式生效。
對于在過去半年多時間中草莽生長、狂飆突進(jìn)的大模型行業(yè)而言,《暫行辦法》的生效可以說是正當(dāng)其時。
據(jù)中國科學(xué)技術(shù)信息研究所發(fā)布的《中國人工智能大模型地圖研究報告》,截至2023上半年,國內(nèi)10億級參數(shù)規(guī)模以上大模型已發(fā)布了79個,數(shù)量排名全球第二,僅次于美國。
(相關(guān)資料圖)
在對大模型產(chǎn)業(yè)生態(tài)的探索過程中,數(shù)據(jù)是必要的生產(chǎn)數(shù)據(jù),也是亟待規(guī)范的重要環(huán)節(jié)。律師王晨告訴「市界」:“我國對個人隱私的保護(hù)早已在相關(guān)法規(guī)、規(guī)章中有所體現(xiàn),比如2012年通過的《關(guān)于加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定》,但是隨著AI技術(shù)發(fā)展,對個人信息的收集和使用方式也不斷推陳出新,需要監(jiān)管層面的不斷調(diào)整與補(bǔ)充。”
而剛剛生效的《暫行辦法》是國內(nèi)乃至全球,首個對于當(dāng)下爆火的生成式人工智能(AIGC)產(chǎn)業(yè)發(fā)布的規(guī)范性政策。
這樣的背景下,科大訊飛董事長劉慶峰認(rèn)為:“(隨著《暫行辦法》生效),8月15日將會迎來中國通用人工智能發(fā)展的關(guān)鍵節(jié)點,也將會是一個里程碑式的節(jié)點?!?/p>
“妙鴨相機(jī)”不能拿走用戶數(shù)據(jù)
就在前不久,9.9元生成數(shù)字分身和AI寫真的“妙鴨相機(jī)”火爆全網(wǎng),甚至出現(xiàn)了數(shù)千人排隊制作數(shù)字分身的情況。但是,其隱私條款中寫有用戶授予妙鴨相機(jī)的授權(quán)許可“不可撤銷”、對用戶內(nèi)容可以“任何形式任何范圍使用”等不當(dāng)內(nèi)容。
盡管妙鴨相機(jī)開發(fā)方此后回應(yīng)稱,原協(xié)議內(nèi)容有誤,并第一時間刪除了相關(guān)條款,這一事件仍引起了用戶的擔(dān)憂。
利用AIGC技術(shù)來生成人臉視頻甚至模擬人聲,用于新型詐騙的案例也曾見諸報端。據(jù)公安部數(shù)據(jù),截至8月10日,針對“AI換臉”導(dǎo)致的欺詐問題已偵破相關(guān)案件79起,抓獲犯罪嫌疑人515名。
AI算法工程師文牧告訴「市界」:“現(xiàn)在利用AI技術(shù)生成虛假的人臉照片或者視頻,成本極其低。理論來說,犯罪分子只需要一個訓(xùn)練好的AI模型和一張受害者的照片就能完成。”
一家AIGC企業(yè)的負(fù)責(zé)人徐亮認(rèn)為,上述對AI技術(shù)的不當(dāng)運(yùn)用事件反映出大模型產(chǎn)業(yè)的全產(chǎn)業(yè)鏈都亟需規(guī)范,“上游例如輸入數(shù)據(jù)的權(quán)屬,下游例如生成內(nèi)容的可信、合規(guī)等,不僅僅是在國內(nèi),在全球AI領(lǐng)域都是需要被重點關(guān)注的話題?!?
▲
8月15日生效的《暫行辦法》共有4章、24條內(nèi)容,對上述受到關(guān)注的問題作出了明確規(guī)定。
比如,《暫行辦法》規(guī)定在數(shù)據(jù)處理活動中,涉及個人信息的,AIGC服務(wù)提供者應(yīng)當(dāng)取得個人同意或者符合法律、行政法規(guī)規(guī)定的其他情形;同時明確了提供AIGC服務(wù)提供者的網(wǎng)絡(luò)信息內(nèi)容生產(chǎn)者責(zé)任、內(nèi)容管理相關(guān)義務(wù)等等。金杜律師事務(wù)所分析認(rèn)為,這一規(guī)定有助于避免相關(guān)主體怠于履行合規(guī)義務(wù)或相互推諉。
徐亮則認(rèn)為,《暫行辦法》中特別值得關(guān)注的還有對適用范圍的相關(guān)規(guī)定。具體規(guī)定包括:利用AIGC技術(shù)向境內(nèi)公眾提供生成文本、圖片、音頻、視頻等內(nèi)容的服務(wù),適用本辦法;行業(yè)組織、企業(yè)、教育和科研機(jī)構(gòu)、公共文化機(jī)構(gòu)、有關(guān)機(jī)構(gòu)等研發(fā)、應(yīng)用AIGC技術(shù),未向境內(nèi)公眾提供AIGC服務(wù)的,不適用本辦法的規(guī)定。
“在我的理解里,ToC級AIGC產(chǎn)品面向國內(nèi)市場將會面臨比較嚴(yán)格的監(jiān)管,但可以考慮出海。但是境內(nèi)訓(xùn)練的大模型產(chǎn)品在出海時,還需要考慮到數(shù)據(jù)出海的合規(guī)問題?!毙炝林v到,“整體來看,《暫行辦法》并不嚴(yán)苛,給了產(chǎn)業(yè)自由發(fā)展的空間?!?
值得指出的是,《暫行辦法》還規(guī)定提供具有輿論屬性或者社會動員能力的生成式人工智能服務(wù)的,應(yīng)當(dāng)按照有關(guān)規(guī)定開展安全評估,并履行備案等手續(xù)。
7月底以來,蘋果AppStore主動在中國區(qū)下架了大量生成式AI類應(yīng)用軟件。隨著《暫行辦法》生效,未來該類應(yīng)用軟件將在完成相關(guān)手續(xù)后,才能重新上架。
如何管好潘多拉的魔盒?
業(yè)界普遍認(rèn)為,在大模型行業(yè)的規(guī)范發(fā)展之路上,除了需要法律法規(guī)的不斷完善,還需要企業(yè)、行業(yè)搭建起人工智能合規(guī)體系。
一家虛擬數(shù)字人企業(yè)的負(fù)責(zé)人告訴「市界」:“新技術(shù)應(yīng)用往往是先于規(guī)范誕生的,我們不能被動等待,而是應(yīng)該在進(jìn)行技術(shù)和應(yīng)用探索創(chuàng)新的同時,積極地向有用、有益的方向進(jìn)行引導(dǎo),提供市場需要、行業(yè)需要、社會需要的服務(wù)。同時,我們也會進(jìn)行風(fēng)險評估,及時識別和評估技術(shù)發(fā)展可能帶來的負(fù)面效應(yīng),并制定相應(yīng)的應(yīng)對措施。在重視防范風(fēng)險的同時,也應(yīng)同步建立容錯、糾錯機(jī)制?!?
在《暫行辦法》生效之際,不少大模型企業(yè)也分享了各自搭建人工智能合規(guī)體系的思路與進(jìn)展。
8月15日,科大訊飛董事長劉慶峰在其自研大模型“訊飛星火認(rèn)知大模型2.0”的發(fā)布會上講到,科大訊飛在訓(xùn)練數(shù)據(jù)清洗、生成內(nèi)容糾偏方面進(jìn)行了設(shè)計。
其中,在數(shù)據(jù)清洗環(huán)節(jié),科大訊飛在收集來自全世界的訓(xùn)練語料后,會通過語種判別器、質(zhì)量判別器、隱私判別器、安全判別器進(jìn)行文本清洗,最終得到高質(zhì)量訓(xùn)練語料。面對大模型的幻覺問題,科大訊飛的思路則是結(jié)合通用知識庫、行業(yè)知識庫和大模型的能力,用通用大模型去學(xué)習(xí)安全、專業(yè)的行業(yè)知識庫,再將相關(guān)知識抽取出來,精準(zhǔn)地呈現(xiàn)給客戶。
百度表示,其在芯片層、框架層、模型層和應(yīng)用層這四層架構(gòu)中實現(xiàn)了供應(yīng)鏈的安全可控,其自研深度學(xué)習(xí)框架“飛槳”也具備完善的漏洞管理機(jī)制。
據(jù)《國內(nèi)LLM(大語言模型)產(chǎn)品測試》,百度大模型“文心一言”與訊飛大模型“訊飛星火”在宗教信仰、封建迷信,泛色情、時政、未成年人保護(hù)以及網(wǎng)絡(luò)安全法等相關(guān)領(lǐng)域的回答,客觀性與公正性均優(yōu)于GPT-3.5。
360集團(tuán)創(chuàng)始人周鴻祎則在接受媒體采訪時講到,360已推出企業(yè)級AI大模型解決方案,遵循“安全可靠、內(nèi)容向善、結(jié)果可信、能力可控”四原則打造企業(yè)級垂直大模型,目前已經(jīng)為20個行業(yè)提供解決方案。
按照6月6日印發(fā)的《國務(wù)院2023年度立法工作計劃》,中國《人工智能法》也已在立法進(jìn)程中,相關(guān)法律規(guī)范將日益完善。
(文中王晨、徐亮為化名)
本文來自微信公眾號“市界”(ID:ishijie2018),作者 | 董溫淑,編輯 | 孫春芳運(yùn)營 | 劉 珊,36氪經(jīng)授權(quán)發(fā)布。