接近金牌水平,AI向人類奧數“下手”


從下棋到解析蛋白質結構,人工智能(AI)變得越來越無所不能。美國谷歌公司的DeepMind這次將目標瞄準數學領域,開發的一款AI幾何推理模型——AlphaGeometry能夠以接近國際數學奧林匹克(奧數)競賽金牌得主的水平,解決復雜的幾何問題。相關研究1月17日發表于《自然》。
奧數面向中學生每年7月舉辦,是全球最難的數學競賽之一。解決奧數幾何問題需要一定的數學創造力,而這正是AI一直在試圖攻克的。即使在其他領域展現出非凡推理能力的OpenAI的GPT-4,在奧數幾何問題上也只能得0分。
AI之所以對奧數幾何問題久攻不下,除了問題的難度外,缺乏訓練數據也是一個很重要的原因。奧數自1959年以來每年舉辦一次,且每次比賽只有6道題。然而,AI系統解決幾何問題需要數百萬甚至數十億個數據點,現有數據遠不能滿足訓練的需要。
為此,DeepMind的Thang Luong和同事創建了一種工具,可生成數以億計的機器可讀的幾何證明,從而繞過了現有數據不足的難點。
研究人員使用這些數據對AlphaGeometry進行訓練,并用30道奧數幾何題對它進行基準測試。結果,AlphaGeometry在標準時限內正確解出了25道題。相比之下,之前最先進的系統解決了其中10道題,而根據預測,人類奧數金牌得主平均解決25.9道題。
Luong介紹,AlphaGeometry由兩部分組成,一個是快速、直觀的語言模型系統——GPT-f,另一個是較慢、更具分析性的“符號引擎”系統。
面對一道奧數幾何題,AlphaGeometry首先利用GPT-f提出要嘗試的定理和論點,接著“符號引擎”就會通過邏輯推理,按照數學規則構建GPT-f提出的論點。兩個系統協同工作、不斷切換,直到問題解決。
Luong表示,雖然AlphaGeometry在解決奧數幾何題方面非常成功,但它的答案往往比人類的證明更長。不過,它可以發現一些人類遺漏的東西。比如,它對一道2004年奧數競賽題的解法,比官方給出的答案更好、更通用。
英國倫敦數學科學研究所的何楊輝指出,該系統在可用的數學運算方面存在固有的局限性,因為奧數問題應該用大學本科階段以下教授的定理來解決。因此,增加AlphaGeometry可以獲得的數學知識能夠改善系統,甚至有助于它取得新的數學發現。
目前,DeepMind拒絕透露是否計劃讓AlphaGeometry參加奧數現場比賽,以及是否再擴展該系統以解決其他非幾何奧數問題。
(徐銳)
相關論文信息:
https://doi.org/10.1038/s41586-023-06747-5
本文鏈接:http://m.albanygandhi.com/news-7-141.html接近金牌水平,AI向人類奧數“下手”
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
關于跨境稅費繳庫退庫業務管理有關事項的通知(銀發〔2024〕4號)
關于修訂支線航空補貼管理暫行辦法的通知(財建〔2023〕413號)
【申報】關于組織開展可再生能源供暖(制冷)項目典型案例申報工作的通知(京發改〔2024〕105號)
【申報】關于征集2024年豐臺區國際消費中心城市培育建設咨詢服務承辦機構的公告
【申報】關于開展2024年度懷柔區第一批人才引進集中申報需求征集工作的通知
國務院辦公廳印發《關于加快內外貿一體化發展的若干措施》的通知
石墨烯半導體研制成功 可能應用于量子計算機
2023年度《中國科普網工作年度報表》
北京培育建設國際消費中心城市2024年工作要點
北京培育建設國際消費中心城市2024年工作要點
求真務實:拼多多先用后付怎么套出來,最佳方法
今年正常正規2025印度拉羅替尼多少錢一盒價格公開:2200元起,(最全最新)印度拉羅替尼價格一覽表
如登春臺:石家莊深澤縣代還信用卡真實商戶積分,流程簡單高效
今日消息: 羊小咩享花卡如何取現出來? 最新四個秒提方法
小白必學:DY月付哪里取出來靠譜今日最強的攻略-
眉清目秀:南昌代還信用卡墊還,的6種刷法 (無視風控秒回款)
韋編三絕:如何使用拼多多先用后付(最新的三個方法)
印度阿培利司價格僅(3900元)起一盒一瓶!2025年印度阿培利司代購一盒真實報價
最新詳解:白條的錢怎么提現(教你如何找到合適的商家)-知者
節節開花:羊小咩購物額度怎么套出來(最新方法)