【OpenAI再推新智能體Deep Research 在“人類的最后考試”中表現(xiàn)突出】八六軟件園報(bào)道,OpenAI發(fā)布了一款新的人工智能工具“Deep Research”,旨在為用戶執(zhí)行耗時(shí)的在線研究任務(wù),涵蓋從復(fù)雜科學(xué)問題到汽車推薦等眾多領(lǐng)域。這一新工具進(jìn)一步豐富了這家初創(chuàng)公司的人工智能代理陣容。Deep Research可能需要 5 到 30 分鐘來完成其工作——在你離開或處理其他任務(wù)時(shí)深入挖掘網(wǎng)絡(luò)。最終輸出以報(bào)告的形式出現(xiàn)在聊天中,很快用戶還將看到嵌入的圖像、數(shù)據(jù)可視化和其他分析輸出,以增強(qiáng)清晰度。這次的時(shí)間大大提升了它的能力。例如,在“人類的最后考試”中,Deep Research取得了令人印象深刻的 26.6% 的準(zhǔn)確率——遠(yuǎn)遠(yuǎn)超過了其最接近的競(jìng)爭(zhēng)對(duì)手 DeepSeek R1,后者的得分低于 10%。這一飛躍凸顯了系統(tǒng)的迭代優(yōu)化和結(jié)構(gòu)化綜合能力,證明了在人工智能快速發(fā)展的步伐中,有些任務(wù)確實(shí)需要時(shí)間。
本分分類:
7*24快訊
版權(quán)聲明:本文由八六軟件園用戶發(fā)布,不代表八六軟件園立場(chǎng),轉(zhuǎn)載聯(lián)系作者并注明出處:http://m.ilovecl.com/post/19516.html