ChatGPT也會“餓肚子”?
2023-02-15 17:03:02 來源:證券之星
(資料圖片)
前些天CHATGPT的崩潰,著實讓廣大用戶體驗了一把AI軟件的“算力危機”。而事實上,除了算力危機外,ChatGPT一類的人工智能聊天軟件,竟然也會有“餓肚子危機”,一旦陷入該危機,將出現(xiàn)有算力也給不出合適答案的情況。
ChatGPT盡管并非生命體,不需要進行生物學意義上的進食以獲得營養(yǎng),但是其需要大量的數(shù)據(jù)來訓練,特別是語料,即一定數(shù)量的文本資源集合。有了這些語料的訓練,類似于ChatGPT的人工智能軟件才能對用戶的信息做出正確的反應,并給出正確且語句通順的回復信息。
事實上,這些軟件吃得越飽,吃得越好,工作的效果一般也會越好。
大致明白了這類軟件要吃的是什么之后,在我們的A股市場,又有哪些公司,可以參與這項“做飯”的工作呢?
01
人民網(wǎng)(行情603000,診股)、浪潮信息(行情000977,診股)
食材提供者
“高端的食材,往往只需要最簡單的烹飪方式”——《舌尖上的中國》第一季。
對于ChatGPT來說,什么是高端的食材?來看下面這個例子。
假如向ChatGPT提問:2022年,中央網(wǎng)信辦舉報中心指導全國各級網(wǎng)信舉報工作部門、主要網(wǎng)站平臺受理網(wǎng)民舉報色情、賭博、侵權、謠言等違法和不良信息1.72億件,如何看待這一數(shù)據(jù)?
食材1:不良網(wǎng)絡給人們的生活帶來的危害是多方面的。虛假信息往往使人上當受騙,不僅造成經濟上的損失,而且還會給受害人帶來精神上的傷害。造謠傳[遙]會混淆是非,使人真假難辨,易引起思想混亂,影響社會和諧??傊涣季W(wǎng)絡其社會危害性不可小覷。因此凈化網(wǎng)絡空間除了相關部門加大督察整治和打擊的力度外,對于各網(wǎng)站及我們每個人來說也是責無旁[帶]的。
食材2:網(wǎng)絡違法和不良信息的出現(xiàn)與存在,是“冰凍三尺非一日之寒”,清除有害信息、根治頑瘴痼疾也很難一蹴而就。這就需要找準治理的重點,平臺需要加大優(yōu)質信息供給,多平臺、多渠道、多形態(tài)提供群眾需要的網(wǎng)絡內容及信息服務,做到用正能量驅散負能量。使網(wǎng)絡空間清朗起來,不是一時的事,而是一直的事,需要網(wǎng)上網(wǎng)下集眾智、匯合力,為文明辦網(wǎng)、文明用網(wǎng)、文明上網(wǎng)、文明興網(wǎng)保駕護航。
無論網(wǎng)上還是網(wǎng)下,無論大屏還是小屏,都沒有法外之地、輿論飛地。綜合運用法律、監(jiān)管、平臺、技術等手段,堅決遏制各類違法違規(guī)問題,不斷提升網(wǎng)絡空間治理效能,做到利刃出鞘、精準打擊、發(fā)力增效、久久為功,讓網(wǎng)絡不良信息無處遁形,讓清風正氣分外充盈。
是的,第一份食材出自一段普通的針對網(wǎng)絡有害信息的問答,里面還有兩個明顯的錯別字,而第二份食材,則是出自人民網(wǎng)針對網(wǎng)絡有害信息的時評。而這,正是中央級別大型媒體的優(yōu)勢:盡管這些文字顯然還不能作為聊天機器人(行情300024,診股)最終的答案,但如果語料更為優(yōu)質,后續(xù)加工出來的食糧需要的加工程序也會更少,輸出效果也會更佳。
不過,中央級的媒體,也并非只有人民網(wǎng)一家,為何人民網(wǎng)會成為語料提供者的排頭兵呢?
答案就在人民網(wǎng),對于數(shù)字經濟的布局。其中,特別是人民數(shù)據(jù)已經布局了新型數(shù)據(jù)中心和新型算力中心,進而人民網(wǎng)可以輕松地基于知識圖譜、自然語言處理和人工智能等技術,深度挖掘自由的核心數(shù)據(jù)資源(優(yōu)質語料等)。
圖片來源:人民網(wǎng)2022年半年報
自己擁有大量優(yōu)質語料,又有著數(shù)據(jù)提供的布局,那自然而然,論優(yōu)質語料,人民網(wǎng)是當仁不讓的食材提供商。
除了人民網(wǎng)之外,浪潮信息的源1.0,同樣是食材的寶庫,只不過相比于人民網(wǎng)來說,浪潮信息是以量取勝。
2021年9月28日,浪潮人工智能研究院在京發(fā)布全球最大規(guī)模人工智能巨量模型“源1.0”。“源”的單體模型參數(shù)量達2457億,超越美國OpenAI組織研發(fā)的GPT-3,成為全球最大規(guī)模的AI巨量模型。
這個模型的數(shù)據(jù)量大,并非是他適合作為原材料的理由,更重要的是,這款“源”是中文巨量模型,其蘊含的中文語料極為豐富,浪潮信息基于源1.0發(fā)布了4個技能大模型,對話模型源曉問、問答模型源曉搜、翻譯模型源曉譯、古文模型源曉文。這些模型,特別是有中文特色的對話、古文等模型,對于發(fā)展國內對標ChatGPT的智能聊天產品有著至關重要的作用。
去年,浪潮“源1.0”大模型登頂CUGE(一款清華北大領銜的中文機器語言能力評測基準)總榜榜首,并獲得語言理解(篇章級)、語言生成、對話交互、多語言、數(shù)學推理等5項評測最佳成績。足見這款模型在中文語料領域強大的優(yōu)勢。
02
拓爾思(行情300229,診股)、博彥科技(行情002649,診股)
我們來做飯、喂飯
和做飯類似,有了原材料,還需要一定的加工烹飪,才能成為真正的數(shù)據(jù)食糧,讓AI系統(tǒng)能夠學習、消化。
事實上,有專門的學科去做這塊的業(yè)務。自然語言處理(NLP,Natural Language Processing)是研究人與計算機交互的語言問題的一門學科。按照技術實現(xiàn)難度的不同,這類系統(tǒng)可以分成簡單匹配式、模糊匹配式和段落理解式三種類型
在A股市場,有不少公司擁有語料加工相關的業(yè)務,而拓爾思正是其中之一。
2022年12月,拓爾思在接受券商調研時曾表示,公司作為國內最早從事自然語言處理(NLP)研發(fā)的企業(yè)之一,在NLP、知識圖譜、OCR、圖像視頻結構化領域都具備自主可控的底層技術。在AIGC方面,公司圍繞傳媒、政府等垂直領域的語料庫積累已非常全面,在智能問答、自動寫作或智能寫稿、內容播報、創(chuàng)作智能輔助等方面亦有成熟應用場景。
更為重要的是,拓爾思已經有專門的平臺,去做語義處理這個事情了,公司旗下“數(shù)家”平臺,已經可以對語料數(shù)據(jù)進行結構化分類整合,而緊隨其后的“智語”平臺,則吸收了拓爾思在自然語言處理和信息檢索領域多年的技術積累,其已經可以進行分詞和詞性標注、語言分類和語言聚類等內容,可以說,拓爾思這些平臺已經成為語言的加工廠,經過這些平臺的加工后,機器就可以通過這些機器人適配的語言進行認知、學習了。
除了拓爾思,博彥科技在語言加工領域,也同樣有著自己的業(yè)務。2月10日,博彥科技在投資者互動平臺上稱,公司有智能聊天機器人方面的解決方案,有能力為機器提供語音訓練相關服務。
這句話也可以翻譯成:我可以,也很會給機器喂飯。
事實上,博彥科技在語料這條產業(yè)鏈中的地位,有點像醫(yī)藥中的CXO,客戶在研發(fā)過程中,可以將需要加工的語音、雜亂的語言文字等部分交給博彥科技,博彥科技憑借其經驗和專業(yè)能力,進行標注、歸類。如果客戶有需要,公司也可以協(xié)助公司完成相關的機器語義訓練。
作為這一領域的老牌企業(yè),此前,博彥科技已與微軟合作了長達二十多年,這也意味著在機器訓練領域,博彥科技已積累了長時間的經驗,隨著聊天機器人時代的到來,博彥科技的相關訂單或將迎來爆發(fā)。
當然,筆者所列舉的食材提供者、加工者相關公司并不完全,實際上,除了這些公司,漢王科技(行情002362,診股)、海天瑞聲(行情688787,診股)、科大訊飛(行情002230,診股)等公司在語料加工領域也有著多年的技術積淀,但這些公司或前期漲幅過大,或總市值過大、涉及領域實在過多,在這里就不做重點介紹了。其實在語料加工領域,這些公司的業(yè)務也多集中于數(shù)據(jù)標注、模式化、訓練等內容,本質上也是一個做飯的活。忽略二級市場因素的話,事實上未來這些公司在語料加工領域,也有望有所作為。
可以看到的是,單單文字領域的機器學習,就需要一系列的基礎數(shù)據(jù)積累、加工、訓練等工序,這部分的市場,隨著類ChatGPT軟件的不斷開發(fā),將在未來幾年呈持續(xù)爆發(fā)之勢。想象空間十分廣闊。機器吃飯,產業(yè)鏈喂飯并享受豐厚回報的時代,或許真的要到來了。
推薦內容
- ChatGPT也會“餓肚子”?
- 天天訊息:海天瑞聲:短期內暫未看到由AIGC帶來的
- 微速訊:水上復工 安全守護
- 規(guī)劃、政策都來了!上海外高橋地區(qū)將建世界級郵輪
- “中鹽組合港”攜手共榮粵港澳大灣區(qū)
- 今日報丨龍湖辦事處開展禁種鏟毒踏查宣傳工作
- 世界焦點!福州垃圾桶,今天也爆滿……
- 鳳縣:田間培訓忙 椒農信心足
- 暢銷國外最受東南亞歡迎!2022年武鳴沃柑產量占全
- 全球觀速訊丨省地方志辦聽取云浮市地方志辦工作匯
- 漳州監(jiān)獄:游藝翰墨促新生
- 世界今日訊!鄂州發(fā)生一起車禍女子倒地不起,交通
- 環(huán)球快資訊:公車撞傷男童后逃逸,鎮(zhèn)政府:司機系
- 天天資訊:全國第三!湖北5款工業(yè)軟件產品入圍國
- 極目銳評|1米65的女子電梯間跳5次才能刷臉成功,
- 天天滾動:江蘇泰興一老師課堂上用尺狠抽學生手,
- 環(huán)球熱頭條丨權威快報丨中國北方地區(qū)新石器考古實
- 每日消息!我國今年將發(fā)射3艘飛船 任務標識首次面
- 臺州頭門港區(qū)進港航道一期工程進度過半 臺州海事
- 當前關注:“警”跟復工復產 確保全力以“復”
- 【新視野】以實干促效提質 南京明州礦石卸船效率
- 提升污染防治能力 上海市船舶污染物免費接收公共
- 股票退到新三板還能回主板嗎?退市的股票還能上市
- 省自然資源廳舉辦政府采購工作業(yè)務講座
- 《滿江紅》周邊眾籌惹爭議,已下架
- 3名男子在南寧一小區(qū)盜竊電纜,當場被警方抓獲
- 微資訊!萊陽高速交警聯(lián)手地方交警護佑學生開學
- 精選!毒云漫天,動物死亡!專家建議:短期內不要
- 如何查詢三板市場的股票?三板市場的股票如何交易
- 環(huán)球熱點評!東湖高新區(qū)不動產登記中心:“八顆牙
- 男子患“怪病”靠冰水泡腳才能入睡 醫(yī)生植入神器
- 焦點!190斤女子卵巢功能低下 埋線減肥30斤實現(xiàn)
- 環(huán)球微頭條丨先天性白內障被誤認為近視,7歲男孩
- 【全球新視野】漢寧天然氣公司:燃氣便民服務進社
- 珠海夏灣市場小吃街營業(yè)時間(2023最新)
- 當前快訊:多類型 高品質!2023年春節(jié)檔電影引發(fā)
- 新思路新創(chuàng)舉 從莫高窟到三星堆 土遺址保護迎來
- 當前信息:數(shù)據(jù)共享 部門聯(lián)動 “治”“護”結合
- 當前通訊!團結奮斗 忠誠履職 | 讓群眾在家門
- 每日信息:全國高速公路貨車通行量環(huán)比增長9.39%