生成式人工智能備受矚目,因?yàn)榧夹g(shù)人員正在評(píng)估去年發(fā)布的機(jī)器學(xué)習(xí)模型,包括ChatGPT,Stable Diffusion,Dreamfusion以及即將成為GPT-4等。這些大型模型的發(fā)展軌跡和力量正在激發(fā)新一波創(chuàng)業(yè)公司的發(fā)展。Bessemer很早就確信大型模型有可能開創(chuàng)技術(shù)的新時(shí)代。今天,我們堅(jiān)信人工智能模型也將迎來搜索的新時(shí)代。
我們所說的搜索不僅僅指像谷歌這樣的公共互聯(lián)網(wǎng)搜索。我們認(rèn)為搜索是查詢信息并最終綜合并從中得出結(jié)論的能力。此定義涵蓋了從企業(yè)文檔搜索到會(huì)話式消費(fèi)者產(chǎn)品的所有內(nèi)容。
【資料圖】
搜索是一個(gè)跨越消費(fèi)者、企業(yè)和開發(fā)人員生態(tài)系統(tǒng)的萬億美元機(jī)會(huì),通過我們的人工智能搜索市場(chǎng)格局,我們探索了催化這些進(jìn)步的因素。
重新構(gòu)想搜索
機(jī)器學(xué)習(xí)和軟件基礎(chǔ)設(shè)施的進(jìn)步解鎖了新的數(shù)據(jù)類型,并為搜索代理提供了上下文智能。這要?dú)w功于:
1. 多模態(tài)數(shù)據(jù)和模型 。從歷史上看,搜索圖像和視頻等非結(jié)構(gòu)化數(shù)據(jù)一直很困難。正如OpenAI CLIP和LAION等文本圖像模型所證明的那樣,最近的突破提高了將非結(jié)構(gòu)化數(shù)據(jù)嵌入緊湊表示中的模型的保真度。這些表示(通常是矢量)可以跨圖像、視頻和其他豐富的數(shù)據(jù)類型實(shí)現(xiàn)更好的多模態(tài)模型。例如,Coactive.ai 為圖像數(shù)據(jù)提供類似 SQL 的查詢界面,并幫助團(tuán)隊(duì)快速訪問、組織和利用其視覺數(shù)據(jù)。
2.情境意識(shí)和基本推理。 過去的搜索系統(tǒng)提供詞匯或關(guān)鍵字搜索,但現(xiàn)代模型提供語義搜索或有意義搜索的能力?,F(xiàn)代搜索系統(tǒng)也可以是上下文感知的,將意圖和歷史考慮在內(nèi)?,F(xiàn)在,由于大型語言模型,這些系統(tǒng)可以執(zhí)行基本的推理任務(wù)。結(jié)果是一個(gè)更直觀和對(duì)話式的搜索,可以記住過去的搜索并跨來源合成。OpenAI的ChatGPT是最近的一個(gè)例子,它提供了明顯更好的搜索。ChatGPT 以有狀態(tài)的呼叫和響應(yīng)格式顯示信息,允許用戶迭代優(yōu)化和調(diào)整其搜索體驗(yàn)。如果消費(fèi)者問“我今天應(yīng)該穿什么?”該工具可能會(huì)回答一個(gè)探索性問題,例如“您希望如何被感知?”,然后再綜合答案。
3. 在現(xiàn)有工作的基礎(chǔ)上再接再厲。 許多大型語言模型通過與API集成并與用戶界面動(dòng)態(tài)交互(例如來自Perplexity,Adept,OpenAI的Codex和Google的Mind"s Eye的下一代搜索)插入到現(xiàn)有的軟件堆棧中。同樣,像 Seek.ai 和 Hearth.ai 這樣的公司圍繞數(shù)據(jù)庫和CRM包裝模型。隨著語言模型與現(xiàn)有產(chǎn)品的交互程度越來越高,搜索系統(tǒng)覆蓋了更多的領(lǐng)域,并且信息更靈通。
4. 大規(guī)?;A(chǔ)設(shè)施。 公司發(fā)現(xiàn)矢量嵌入的價(jià)值,在Zilliz(Milvus),Pinecone,Vespa和Weaviate等矢量數(shù)據(jù)庫以及Jina,Qdrant和FAISS等開源庫上構(gòu)建和擴(kuò)展其工作負(fù)載。同樣,研究人員正在研究模型大小和數(shù)據(jù)量等因素如何影響大型神經(jīng)網(wǎng)絡(luò)的模型性能。分布式深度學(xué)習(xí)領(lǐng)域已經(jīng)出現(xiàn),產(chǎn)生了優(yōu)化和并行技術(shù),以進(jìn)一步擴(kuò)展模型和數(shù)據(jù)量。
5. 搜索和推薦。 隨著搜索系統(tǒng)變得更加個(gè)性化,我們預(yù)測(cè)搜索和推薦之間的界限將變得模糊。例如,TikTok近年來發(fā)展迅速。該公司的個(gè)性化、不斷改進(jìn)的推薦體驗(yàn)成功地從 Youtube 等傳統(tǒng)視頻搜索產(chǎn)品中搶走了市場(chǎng)份額。我們預(yù)計(jì)推薦系統(tǒng)將在未來幾年激增,并從傳統(tǒng)搜索中占據(jù)份額。
人工智能正在重新構(gòu)想搜索。我們看到了消費(fèi)者和企業(yè)搜索以及基礎(chǔ)設(shè)施層的持久創(chuàng)新。
AI搜索市場(chǎng)地圖
搜索只是冰山一角
隨著人工智能使創(chuàng)建高質(zhì)量內(nèi)容變得更容易、更便宜,數(shù)字內(nèi)容的數(shù)量將呈爆炸式增長。我們預(yù)測(cè),在未來十年內(nèi),至少有50%的在線內(nèi)容將由人工智能生成或增強(qiáng)。隨著信息的爆炸式增長,我們歡迎更好的智能搜索代理來組織和合成它。
可能性是巨大的 — 用戶數(shù)據(jù)現(xiàn)在已成為一流的資產(chǎn),企業(yè)可以利用搜索體驗(yàn)更好地分析數(shù)據(jù)以進(jìn)行業(yè)務(wù)決策。在消費(fèi)者環(huán)境中,人們將受益于更準(zhǔn)確、個(gè)性化和精心策劃的結(jié)果,從而影響他們聯(lián)系、購物或?qū)W習(xí)的方式。為這些體驗(yàn)提供支持的是新興的開發(fā)人員生態(tài)系統(tǒng),用于大規(guī)模提供搜索查詢和建議。
本文發(fā)自Bessemer,原題為“Entering the era of Intelligent Search”,作者:BHAVIK NAGDA,感謝TALIA GOLDBERG,SAKIB DADI,KATE WALKER和ALEXANDRA SUKIN,經(jīng)朋湖網(wǎng)編譯整理,供業(yè)內(nèi)參考。