谷歌破解了AI審核系統(tǒng) 破解者就是谷歌
(資料圖)
谷歌研究團(tuán)隊(duì)正在進(jìn)行一項(xiàng)實(shí)驗(yàn),他們利用OpenAI的GPT-4來破解其他AI模型的安全防護(hù)措施。目前,該團(tuán)隊(duì)已經(jīng)成功破解了AI-Guardian審核系統(tǒng),并公開了相關(guān)技術(shù)細(xì)節(jié)。 AI-Guardian是一種AI審核系統(tǒng),能夠檢測圖片中是否存在不當(dāng)內(nèi)容,以及圖片是否被其他AI修改過。如果檢測到圖片存在上述問題,系統(tǒng)會提示管理員進(jìn)行處理。谷歌Deep Mind的研究人員Nicholas Carlini在一篇論文中,探討了使用GPT-4設(shè)計(jì)攻擊方法、撰寫攻擊原理的方案,并將這些方案用于欺騙AI-Guardian的防御機(jī)制。 據(jù)了解,GPT-4會發(fā)出一系列錯誤的腳本和解釋來欺騙AI-Guardian。例如,GPT-4可以讓AI-Guardian認(rèn)為“某人拿著槍的照片”是“某人拿著無害蘋果的照片”,從而讓AI-Guardian直接放行相關(guān)圖片輸入源。谷歌研究團(tuán)隊(duì)表示,通過GPT-4的幫助,他們成功地“破解”了AI-Guardian的防御,使該模型的精確值從98%降低到僅8%。 目前,相關(guān)技術(shù)文檔已經(jīng)發(fā)布,有興趣的人可以前往了解。然而,AI-Guardian的開發(fā)者也指出,谷歌研究團(tuán)隊(duì)的這種攻擊方法將在未來的AI-Guardian版本中不再可用??紤]到其他模型也可能會進(jìn)行相應(yīng)的更新,因此谷歌的這套攻擊方案在未來可能只能作為參考。
相關(guān)內(nèi)容
TOP
- 基金/
- 數(shù)據(jù)
- 高通(QCOM.US)盤后跌逾7%!智能手機(jī)需求依舊疲軟 Q4營收指引遠(yuǎn)遜于市場預(yù)期
- 樓市迎密集政策利好 購房者還有哪些期待
- 制造業(yè)持續(xù)萎縮 美國經(jīng)濟(jì)復(fù)蘇乏力
- 你猜,全國有多少個人叫“建軍”?
- 留學(xué)疫苗接種證明怎么查詢,留學(xué)疫苗接種證明怎么打印
- 奧栢中國(08148)中文股份簡稱將更改為“悟喜生活”
- 和田白玉和羊脂玉有區(qū)別嗎
- 《逐夢》第四集:隨時準(zhǔn)備去打仗
- 新疆墨玉是山料還是籽料
- 【環(huán)球財(cái)經(jīng)】新加坡股市2日收跌1.45%
- 天氣題材接近尾聲,農(nóng)產(chǎn)品板塊有哪些投資機(jī)會?
- 關(guān)于書店的記憶
- 卡巴斯基為基于Linux的嵌入式設(shè)備推出專用解決方案
- “輕微事故”可線上報(bào)警 交警遠(yuǎn)程視頻快速處理
- 旅游、演出票務(wù)等須規(guī)范——中消協(xié)發(fā)布上半年消費(fèi)投訴情況
- 如何檢測主板是否有問題 檢測主板問題方法介紹 怎么檢測主板有問題
- CVS健康(CVS.US)Q2總營收超預(yù)期 凈利潤同比下降37%
- 房貸高于工資怎么辦車貸?快來看4種解決方案
- 邁克-戈?duì)柭簽閯P爾特人解說,是每一位波士頓孩童的夢想
- CAPTURE 3D利用蔡司eMotors ScanBox實(shí)現(xiàn)扁線電機(jī)組件的精確數(shù)字化和檢測自動化
公司
-
谷歌破解了AI審核系統(tǒng) 破解者就是谷歌
谷歌研究團(tuán)隊(duì)正在進(jìn)行一項(xiàng)實(shí)驗(yàn),他們利用OpenAI的GPT-4來破解其他AI模