Google DeepMind Aletheia：AI自主生成數學定理，解決四個開放Erdős問題

從解題到發現定理

此前的AI數學系統（如AlphaProof）主要專注於解決已知的數學問題——給定一道題目，AI嘗試找到正確的解答。Aletheia的突破在於跨越了這一界限：它不僅能解題，還能自主發現和證明新的數學定理，甚至生成完整的數學研究論文。

在IMO-Proof Bench Advanced基準上，Aletheia達到了95.1%的準確率，這一成績遠超此前的最佳記錄。更重要的是，它在專業數學研究中展示了實用價值——不是取代人類數學家，而是作為一個能夠獨立探索和提出新見解的研究夥伴。

                    Aletheia核心成就
                    IMO-Proof Bench Advanced：95.1%準確率
自主論文生成：完整的算術幾何同行評審論文
開放問題解決：四個Erdős問題
多篇同行評審論文：貢獻於多項研究成果
定位：橋接競技數學與專業數學研究

                

解決Erdős問題的意義

Paul Erdős是20世紀最多產的數學家之一，他提出的數百個問題中，許多至今仍未解決。這些「Erdős問題」被視為數學界的重要挑戰。Aletheia成功解決了其中四個問題，這不僅是計算能力的展示，更表明AI已經具備了數學直覺——能夠在廣闊的數學空間中識別有價值的方向並構建新穎的證明路徑。

Aletheia的算術幾何論文尤其引人注目——這是首個完全由AI自主生成並通過同行評審的數學研究論文。論文的生成過程涉及問題發現、猜想形成、證明構建和論文寫作等完整的研究流程，每一步都由AI獨立完成。

AI數學研究的新範式

Aletheia的設計理念是「橋接競技數學與專業數學研究」。競技數學（如IMO）提供了清晰的評估標準，但與真正的數學研究有本質區別——研究需要發現問題而非解決已知問題，需要構建新理論而非應用已知技巧。Aletheia試圖跨越這一鴻溝，將AI從「高效解題機器」升級為「數學研究助手」。

這一進展對基礎科學研究有深遠影響。如果AI能夠在數學領域自主發現和證明新定理，同樣的方法論也可能適用於理論物理、計算機科學和其他基礎科學領域。Aletheia可能預示著AI輔助科學發現的新時代——AI不再僅僅是分析數據的工具，而是能夠提出新理論和假設的研究夥伴。

挑戰與展望

當然，Aletheia的成就也引發了關於AI在學術研究中角色的討論。當AI能夠生成通過同行評審的論文時，學術界如何界定「作者」和「貢獻者」？如何確保AI生成的證明在數學上是嚴格正確的？這些問題將在未來幾年成為學術界的重要議題。不過，有一點是明確的：AI已經從數學的旁觀者變成了參與者。