剛剛,OpenAI放出Operator,能模擬人類上網(wǎng),智能體之戰(zhàn)打響
1月24日消息,今日凌晨,OpenAI 發(fā)布了首款智能體產(chǎn)品“Operator”。這一功能是一款能夠模擬人類操作網(wǎng)頁瀏覽器的AI助手,支持自動完成旅行住宿預(yù)訂、餐廳預(yù)約和在線購物等復(fù)雜任務(wù)。
本文引用地址:http://m.ptau.cn/article/202501/466616.htmOperator 目前以研究預(yù)覽(Research Preview)版本發(fā)布,能夠通過互聯(lián)網(wǎng)自動為用戶執(zhí)行多種任務(wù)。
OpenAI 表示,計劃很快將其集成到ChatGPT中。目前,該功能僅面向美國的 Pro 用戶開放。
Operator 的底層技術(shù)采用了一種全新的模型——Computer-Using-Agent(CUA)。
CUA 結(jié)合了 GPT-4o 的視覺能力和強(qiáng)化學(xué)習(xí)的高級推理能力,使其能夠與 GUI 界面交互。
Operator 可以識別網(wǎng)頁界面內(nèi)容,并通過鼠標(biāo)、鍵盤完成所有允許的操作,從而實現(xiàn)自動化操作,無需定制化的 API 集成。
當(dāng)遇到問題或出錯時,Operator 能利用自身的推理能力進(jìn)行自我糾錯。如果無法解決問題,它會將控制權(quán)交回用戶。
OpenAI 總裁 Greg Brockman 在 X 平臺發(fā)文稱:“Operator 是一種可以通過內(nèi)置瀏覽器為用戶執(zhí)行任務(wù)的智能體。2025年將成為智能體之年?!?/p>
評論