蓋世汽車訊 據(jù)外媒報(bào)道,OpenAI宣布推出新的旗艦生成式AI模型GPT-4o(“o”代表“omni”,即該模型處理文本、語音和視頻的能力)。根據(jù)演示視頻,它可以與用戶進(jìn)行近乎實(shí)時(shí)的語音對(duì)話,表現(xiàn)出類人的性格和行為。
(圖片來源:OpenAI)
GPT-4o提供“GPT-4級(jí)別”智能,但速度更快,并改進(jìn)了GPT-4跨多種模式和媒體的能力。OpenAI首席技術(shù)官M(fèi)ira Murati表示:“GPT-4o可以跨語音、文本和視覺進(jìn)行推理。這非常重要,因?yàn)槲覀冋谘芯咳祟惻c機(jī)器交互的未來?!?/p>
GPT-4o極大地改善了OpenAI的人工智能聊天機(jī)器人ChatGPT的體驗(yàn)。該平臺(tái)長(zhǎng)期以來一直提供語音模式,使用文本轉(zhuǎn)語音模型轉(zhuǎn)錄聊天機(jī)器人的響應(yīng),但GPT-4o對(duì)此進(jìn)行了增強(qiáng),讓用戶與更像助手一樣的ChatGPT進(jìn)行交互。
例如,用戶可以向GPT-4o支持的ChatGPT進(jìn)行提問,并在ChatGPT回答時(shí)打斷它。OpenAI 表示,該模型提供“實(shí)時(shí)”響應(yīng)能力,甚至可以識(shí)別用戶聲音中的細(xì)微差別,從而生成“一系列不同情感風(fēng)格(包括唱歌)”的聲音。
GPT-4o還升級(jí)了ChatGPT的視覺能力?,F(xiàn)在,向它展示一張照片或桌面屏幕,ChatGPT可以快速回答相關(guān)問題,主題范圍包括“這段軟件代碼中發(fā)生了什么?”到“這個(gè)人穿什么牌子的襯衫?”Murati表示,這些功能未來將得到進(jìn)一步發(fā)展。目前,GPT-4o可以查看不同語言的菜單圖片并進(jìn)行翻譯。舉例來說,未來該模型可以支持ChatGPT“觀看”現(xiàn)場(chǎng)體育比賽,并向用戶解釋規(guī)則。
Murati表示:“這些模型變得越來越復(fù)雜,但我們希望實(shí)際交互體驗(yàn)變得更自然、輕松,并且客戶無需關(guān)注用戶界面,而只關(guān)注與ChatGPT的協(xié)作。在過去幾年里,我們一直非常專注于提高這些模型的智能,這是我們第一次在易用性方面真正邁出一大步?!?/p>
為了使先進(jìn)的人工智能在全球范圍內(nèi)更易于獲得和使用,GPT-4o的語言功能在質(zhì)量和速度方面得到了提高?,F(xiàn)在,ChatGPT支持50多種語言(在新窗口中打開),包括注冊(cè)、登錄和用戶設(shè)置等。
OpenAI計(jì)劃在未來幾周內(nèi)首先向“一小群值得信賴的合作伙伴”提供GPT-4o新音頻功能支持。
來源:第一電動(dòng)網(wǎng)
作者:蓋世汽車
本文地址:http://www.vlxuusu.cn/news/shichang/231480
以上內(nèi)容轉(zhuǎn)載自蓋世汽車,目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.vlxuusu.cn)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。