谷歌DeepMind的AlphaEvolve人工智能找到了解決未解數學難題的新方法
人工智能正在重塑科學研究,谷歌DEEPMind與著名數學家合作,利用人工智能工具來解決一些最棘手的數學難題,這是一個引人注目的例子。
本周宣布的這項合作重點介紹了一種名為 ALPHAEvolve 的新型人工智能係統,該系統不僅重新發現了已知的解決方案,而且還揭示了長期存在的問題的新見解。
“谷歌DeepMind一直與陶哲軒和哈維爾·戈麥斯-塞拉諾合作,利用我們的人工智能代理(AlphaEvolve、Alphaproof和Gemini Deep Think)來推進數學研究,”谷歌DeepMind負責科學和戰略計劃的計算機科學家普什米特·科利表示。 週四發推文“他們發現 AlphaEvolve 可以幫助解決一系列問題,並取得新的成果。”
科利引用了一篇最近的論文報告概述了這些突破,並指出了一項傑出的成就:“舉一個令人信服的例子,他們使用 AlphaEvolve 發現了有限域 Kakeya 猜想的新構造;Gemini Deep Think 隨後證明了它的正確性,而 AlphaProof 則用 Lean 形式化了該證明。”
他將其描述為“人工智能驅動的數學研究的實踐!”陶哲軒還詳細介紹了研究結果。 一篇博客文章.
卡凱亞猜想
有限域卡基亞猜想由數學家澤夫·德維爾於2008年首次證明,它探討的是一個看似簡單卻又十分棘手的問題,這個問題發生在被稱為有限域的抽象空間中——你可以把有限域想像成數字可以循環排列的網格,就像模運算一樣。 這個猜想要求找到一個最小的點集,使得該點集能夠包含一條在所有可能方向上都完整的“直線”,且不出現不必要的重疊。 這就像在棋盤上找到一種最有效的方法,以不浪費任何方格的方式向各個方向繪製箭頭一樣。
通俗地說,這關乎數學空間中的空間填充和效率,對編碼理論和信號處理等領域具有重要意義。 這項新工作並沒有推翻原有的證明,而是通過更優的構造方法對其進行了改進——本質上,就是用更巧妙的方式構建更小或在某些維度上更精確的集合。
該論文詳細介紹瞭如何對人工智能係統進行測試,測試題目涵蓋幾何學、組合數學和數論等領域的 67 個不同的數學問題。
“AlphaEvolve 是一個通用的進化編碼代理,它將 LLM 的生成能力與迭代進化框架中的自動評估相結合,提出、測試和改進算法解決方案,以應對具有挑戰性的科學和實際問題,”作者在摘要中寫道。
人工智能輔助數學的達爾文主義方法
AlphaEvolve 的核心在於模擬生物進化。 它首先利用大型語言模型生成基礎計算機程序,並根據問題的標準對其進行評估。 成功的程序會被“變異”或調整,從而產生變體,並在循環中再次進行測試。 這使得系統能夠快速探索大量的可能性,並常常發現人類由於時間限製而可能忽略的模式。
“進化過程由兩個主要部分組成:(1)生成器(LLM):該部分負責引入變異……(2)評估器(通常由用戶提供):這是‘適應度函數’,”該論文指出。
對於數學問題,評估者可能會根據一組建議的點滿足 Kakeya 規則的程度進行評分,從而偏愛緊湊高效的設計。
研究結果令人印象深刻。 摘要指出,該系統“在大多數情況下重新發現了已知的最佳解決方案,並在某些情況下發現了更優的解決方案”。 在某些情況下,它甚至將特定數值的發現推廣到普遍適用的公式。
這些調整以微小但有意義的幅度改進了之前的界限,就像在高維網格中減少額外的點一樣。
為數學家們注入活力
加州大學洛杉磯分校的菲爾茲獎得主、數學家陶哲軒和布朗大學的戈麥斯-塞拉諾運用人類專業知識來指導和驗證人工智能的輸出結果。 通過與DeepMind的其他工具——用於推理的Gemini Deep Think和用於Lean編程語言形式化證明的AlphaProof——的整合,這些原始發現最終轉化為嚴謹的數學推導。
此次合作凸顯了一種更廣泛的轉變:人工智能正在極大地增強數學家的能力。
“這些結果表明,大型語言模型引導的進化搜索能夠自主發現與人類直覺互補的數學構造,有時甚至能達到或超越已知的最佳結果,這凸顯了數學家和人工智能係統之間進行重大創新交互方式的潛力。”論文內容如下.
這可能意味著依賴數學的技術領域,例如密碼學或數據壓縮,將迎來更快的創新。 但這同時也引發了關於人工智能在純科學領域作用的疑問——機器究竟是能夠“發明創造”,還是僅僅進行優化?
這項最新研究表明,該領域才剛剛起步。