阿里巴巴新方法將AI搜索成本降低了幾乎90%
在紙中國技術公司的研究人員發表在ARxiv服務器上,描述了“ Zerosearch”,這是一個培訓快捷方式,可讓大型語言模型以一小部分成本提高其搜索技能。
阿里巴巴認為,該方法刪除了加固學習中最昂貴的步驟之一:通過付費的應用程序編程接口來劃分數万個查詢。
ZeroSearch將這種瓶頸使用。 已經擁有廣泛知識基礎的參考模型充當了獨立的搜索引擎,為每個查詢提供了有用和故意嘈雜的文檔。 然後,對那些自製嘈雜的文檔進行了培訓。
微調從措辭清晰的提示和乾淨的答案開始。 隨著時間的流逝,“課程推廣”會增加混亂,錯別字和矛盾,從而使學員模型經歷更接近開放互聯網的東西。
根據本文,數據噪聲加強了推理,並教導系統在凌亂的數據環境中生存。 研究人員解釋說:“我們的主要見解是,LLM在大規模預處理期間獲得了廣泛的世界知識,並且能夠在搜索查詢的情況下生成相關文件。”
團隊不必為每個查詢支付外部提供商。 對於資源有限的較小團隊來說,這種變化尤其重要。 例如,通過API向Google發送64,000個查詢的費用約為586.70美元。 通過140億參數進行相同的培訓你有一個模型花費大約70.80美元,節省88%。
阿里巴巴Zerosearch不需要其他硬件
團隊認為,Zerosearch不會添加額外的硬件需求。 它依賴於標準監督的調查,因此云計算需求保持在典型開發預算範圍內。
該論文已經引起了學術機器學習界的關注。 行業觀察家表示,節省可能會影響未來財政年度即將到來的預算週期。
行業競爭對手一直在競爭,以減少大型語言模型培訓的成本,因為它們推動了新的生成AI產品。
阿里巴巴新功能隨著中國公司與Google和OpENAI等美國公司競爭,它們都在AI代理商中投入了大量投資。 通過報告幾乎削減成本的削減,阿里巴巴表示AI搜索的成本可能很快就會發生變化。
您的加密新聞值得關注 - 鑰匙差線將您放在250多個頂級網站上