OpenAI最強(qiáng)推理模型o3發(fā)布:AGI能力暴漲 接近人類水平
- 來源:Steam
- 作者:3DM編輯
- 編輯:方形的圓
今日(12月21日),OpenAI“連續(xù)12日圣誕發(fā)布”終于迎來激動(dòng)人心的大結(jié)局,OpenAI推出重磅收官新品,其迄今最強(qiáng)前沿推理模型的升級(jí)版——o3。
OpenAI號(hào)稱o3在一些條件下接近通用人工智能(AGI),共有o3和精簡(jiǎn)版o3-mini兩個(gè)版本。
評(píng)估顯示,o3在軟件工程測(cè)試中準(zhǔn)確率比o1高近47%,競(jìng)賽數(shù)學(xué)測(cè)評(píng)的準(zhǔn)確率比o1高15%,人類博士專家級(jí)生化物測(cè)試中準(zhǔn)確率比o1高近13%。
AGI相關(guān)測(cè)試中,o3最佳成績(jī)87.5,超過人類水平門檻85,顯示邁向類人智能取得突破。
對(duì)比之下,GPT-3的評(píng)測(cè)結(jié)果為0%,GPT-4o為5%,而o3一舉將成績(jī)提升到87.5%。
OpenAI計(jì)劃明年初發(fā)布o(jì)3系列模型,CEO Altman暗示可能一段時(shí)間內(nèi)都不會(huì)面向大眾上線這類模型,稱希望正式發(fā)布前,先有一個(gè)聯(lián)邦政府的測(cè)試框架,指導(dǎo)監(jiān)控并減少這類模型的風(fēng)險(xiǎn)。
從本周五開始,OpenAI允許安全研究人員可以注冊(cè)訪問o3和o3-mini的預(yù)覽。
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論