DeepResearch Bench揭榜 千帆深度研究Agent居榜首

2026-02-05 02:00:02    來(lái)源:新經(jīng)網(wǎng)    作者:馮思韻
很多朋友不知道【DeepResearch Bench揭榜 千帆深度研究Agent居榜首】,今天小綠就為大家解答一下。

DeepResearch Bench揭榜 千帆深度研究Agent居榜首

【CNMO科技消息】2月4日,深度研究智能體DeepResearch Bench評測榜單正式揭曉,百度千帆深度研究Agent(Qianfan-DeepResearch Pro)憑借卓越的端到端研究能力和極高的報告產(chǎn)出質(zhì)量,登上榜首。

據CNMO了解,該榜單針對當前AI評測體系在通用任務(wù)上的局限性,專(zhuān)門(mén)填補了“端到端深度研究”領(lǐng)域的空白。與以往僅測試單一能力的基準測試不同,DeepResearch Bench設置了100個(gè)博士級別的復雜任務(wù),涵蓋22個(gè)學(xué)科,并引入RACE報告質(zhì)量評價(jià)框架與引文準確性評估,以此作為衡量AI生產(chǎn)力水平的標準。

在此次評測中,千帆深度研究Agent憑借其卓越的技術(shù)設計脫穎而出。該系統采用了Agentic架構,能夠通過(guò)“任務(wù)理解-規劃-執行”的機制,利用百度強大的搜索與RAG技術(shù),確保信息獲取的廣度與可信度。在任務(wù)執行過(guò)程中,該Agent采用“由粗到細”的研究路徑展開(kāi)方式及實(shí)時(shí)反思機制,能夠在每個(gè)研究節點(diǎn)動(dòng)態(tài)評估進(jìn)展、調整策略,有效避免幻覺(jué)與路徑偏離。

不僅如此,千帆深度研究Agent在報告生成階段采用了兩階段渲染機制:首先產(chǎn)出邏輯嚴密的pivot報告,隨后基于該報告生成Markdown、HTML、PPT等多形態(tài)文檔,實(shí)現“一次研究,多形態(tài)報告”的交付。

目前,深度研究Agent已正式上線(xiàn)百度千帆平臺。用戶(hù)只需輸入復雜的調研需求,系統即可在十幾分鐘內生成帶有精準引用的專(zhuān)業(yè)級研究報告,顯著(zhù)壓縮了傳統需數日完成的手動(dòng)研究時(shí)間,實(shí)現了學(xué)術(shù)綜述、金融投研與商業(yè)分析等領(lǐng)域的“分鐘級”深度洞察交付。

版權所有,未經(jīng)許可不得轉載


以上問(wèn)題已經(jīng)回答了。如果你想了解更多,請關(guān)新經(jīng)網(wǎng)網(wǎng)站 (http://wap.hkkqyy120.com/)
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。