
數十年來,搜尋引擎產業的定義始終圍繞著基於連結的模型。Google、Bing 及其同類產品建立帝國的基礎,在於承諾為人類消費整理全球資訊,優先考慮搜尋引擎最佳化 (SEO)、廣告支援的點擊,以及大量索引的網頁爬取。然而,大型語言模型 (LLMs) 的迅速崛起,已從根本上改變了資訊檢索的需求。如今,不僅是人類需要尋找資訊,AI 代理本身也需要。
近期圍繞搜尋新創公司的資金熱潮,最顯著的例子就是 Exa 的最新發展,這標誌著科技產業的一個關鍵轉折點。投資者正積極支持那些並非在建立面向消費者的搜尋引擎,而是建立「AI 原生」搜尋基礎設施的公司。這些平台旨在作為 AI 代理的骨幹,提供結構化、確定性且相關的資料,使 LLMs 能夠在不產生幻覺的情況下進行複雜的推理。
這場運動代表著遠離主導網際網路的傳統關鍵字匹配演算法。相反地,焦點已轉向語意理解與 API 優先的存取能力,此時搜尋引擎的「使用者」是軟體,而非坐在瀏覽器前的人。
湧入 AI 代理搜尋領域的資金不僅僅是對一般 AI 炒作週期的反應,更是對未來 AI 經濟「基礎設施」的務實投資。隨著企業與開發者競相將 LLMs 整合到工作流程中,他們遇到了一個障礙:標準搜尋引擎是為人類視覺優化的,而非為機器理解而設計。
來自 Exa 等公司的近期融資消息,凸顯了風險投資家的一項體認:檢索增強生成 (Retrieval-Augmented Generation, RAG) 的成效,取決於其檢索層。如果 AI 代理試圖根據過時、充斥廣告或缺乏語意的搜尋結果進行推理,其輸出結果將不可避免地存在缺陷。因此,那些提供「乾淨」搜尋 API(回傳嵌入向量、結構化 JSON 資料或高度相關的上下文片段)的新創公司,正成為基礎設施堆疊中最具價值的資產。
這種轉變顯示,下一代搜尋巨頭將不再由其每月活躍使用者或展示廣告營收來定義。相反地,他們將由為代表企業與消費者行事的自主代理提供高品質資料的能力來定義。
為了理解為什麼這種轉變如此具有顛覆性,必須將傳統網際網路搜尋架構與新興的 AI 代理搜尋模型進行比較。下表突顯了在方法、優化與效用上的根本差異。
| 功能 | 傳統搜尋引擎 | AI 代理搜尋平台 |
|---|---|---|
| 主要使用者 | 透過網頁瀏覽器的人類使用者 | 透過 API 的自主 AI 代理/LLMs |
| 優化目標 | 點擊率與廣告營收 | 資料相關性與減少幻覺 |
| 查詢處理 | 關鍵字匹配 (專注於 SEO) | 語意搜尋與向量嵌入 |
| 輸出格式 | 用於顯示的 HTML 頁面/連結 | 用於攝取的結構化資料/JSON 上下文 |
| 檢索速度 | 為人類閱讀時間優化 | 為機器處理速度優化 |
| 上下文深度 | 表面層級 (片段) | 深層上下文 (深入資料檢索) |
這種顛覆的核心在於向基於嵌入 (embedding) 的搜尋轉變。傳統搜尋引擎嚴重依賴關鍵字索引。如果使用者搜尋「Q3 的最佳策略」,引擎會尋找包含這些特定單字的頁面。然而,與資料庫互動的 AI 代理需要理解查詢背後的意圖。
Exa 及其在該領域的競爭對手正利用神經搜尋技術。透過將查詢與潛在的搜尋結果轉換為向量嵌入,這些平台能夠執行語意搜尋。這使得 AI 代理即使在特定關鍵字不匹配的情況下,也能「檢索」概念上相關的資訊。
對於開發者與 AI 公司而言,這種技術差異至關重要。當建立一個需要研究主題、比較產品或執行複雜資料分析的應用程式時,代理無法承受解析 10 個充滿 SEO 優化廢話的搜尋結果。他們需要:
這種架構轉變有效地將搜尋引擎轉變為智慧 API。透過將網際網路視為動態資料庫而非靜態網頁的集合,這些新創公司解決了困擾當前 LLMs 的「資料時效性」問題。
儘管投資熱潮顯示了信心,但前方的道路並非沒有障礙。AI 代理搜尋新創公司面臨的主要挑戰是其商業模式的經濟永續性。爬取、索引並提供高品質的向量嵌入在計算上成本高昂。隨著資料量增長,在提供高相關性搜尋結果的同時保持低延遲,需要不斷進行基礎設施優化。
此外,這些公司必須處理網路抓取的法律與道德環境。隨著 AI 代理變得更加自主,它們可能會遇到主要內容發布商設置的付費牆、受限存取以及不斷演進的反抓取協定。成功將取決於像 Exa 這樣的平台,能否在「普及資訊存取」與內容創作者的權利之間取得平衡。
然而,這種趨勢似乎不可逆轉。隨著我們更深入進入 LLMs 時代,「搜尋」與「智慧」之間的界線將會消失。搜尋正成為人工智慧的記憶層。無論是規劃行程的代理,還是偵錯複雜軟體儲存庫的程式設計助手,底層的檢索機制必須與進行推理的模型一樣聰明。
這波資金浪潮的影響遠不止於這些新創公司本身。它對現有的搜尋巨頭發出了潛在的威脅,也帶來了巨大的機會。如果網頁搜尋流量的很大一部分從人類瀏覽器轉向程式化 API 呼叫,遺留搜尋引擎以廣告為驅動的商業模式將面臨生存危機。
我們正進入一個「搜尋產業」分裂為兩個不同類別的階段:
對於投資者而言,焦點已從「誰擁有瀏覽者的目光」轉向「誰擁有資料管道」。對 Exa 等新創公司興趣的激增證明,未來十年的贏家將是那些能夠以可靠、結構化且具備語意密度的資訊,最好地餵養 大型語言模型 那貪婪胃口的公司。隨著 AI 生態系統的成熟,這些搜尋新創公司的角色將從利基基礎設施提供者,轉變為大多數自動化智慧服務所建立的基礎層。