5月14日消息,OpenAI宣布推出其最新旗艦生成式AI模型 GPT-4o,該模型將在未來幾周內(nèi)分階段集成至 OpenAI 的各個(gè)產(chǎn)品之中。最讓人驚喜的是,GPT-4o 將免費(fèi)提供給所有用戶使用。

OpenAI 首席技術(shù)官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 將提供與 GPT-4 同等水平的智能,但在文本、圖像以及語音處理方面均取得了進(jìn)一步提升。
“GPT-4o 可以綜合利用語音、文本和視覺信息進(jìn)行推理,”穆拉蒂在 OpenAI 公司總部舉行的主題演講中表示。GPT-4 是 OpenAI 此前的旗艦?zāi)P?可以處理由圖像和文本混合而成的信息,并能完成諸如從圖像中提取文字或描述圖像內(nèi)容等任務(wù),GPT-4o 則在此基礎(chǔ)上新增了語音處理能力。
GPT-4o 的運(yùn)行速度將大大提升,最大亮點(diǎn)在于其語音交互模式采用了新技術(shù)。OpenAI 一直致力于讓用戶通過語音與 ChatGPT 進(jìn)行交流,仿佛與真人對話一般。然而,之前的版本由于延遲問題,嚴(yán)重影響了對話的沉浸感。GPT-4o 則采用了全新的技術(shù),讓聊天機(jī)器人對話的響應(yīng)速度大幅提升。
IT之家注意到,發(fā)布會(huì)上 OpenAI 展示了使用 GPT-4o 進(jìn)行語音對話的演示。演示者提問結(jié)束后,GPT-4o 幾乎可以即時(shí)回應(yīng),并通過文本轉(zhuǎn)語音功能進(jìn)行朗讀,讓對話感覺更加自然逼真。
另一個(gè)演示展示了 GPT-4o 根據(jù)要求調(diào)整說話時(shí)語氣,GPT-4o 可以根據(jù)指令改變聲音,從夸張戲劇到冰冷機(jī)械,展現(xiàn)了出色的可塑性。最后,演示還展示了 GPT-4o 的唱歌功能。
以往,OpenAI 發(fā)布新版 ChatGPT 模型時(shí),通常會(huì)將其置于付費(fèi)墻之后。不過這次 GPT-4o 將免費(fèi)提供給所有用戶,付費(fèi)用戶則可以享受五倍的調(diào)用額度。
此外,OpenAI 還發(fā)布了桌面版的 ChatGPT 和新的用戶界面。“我們認(rèn)識到這些模型正變得越來越復(fù)雜,” 穆拉蒂說道,“但我們希望用戶與人工智能模型的交互體驗(yàn)?zāi)軌蚋幼匀、輕松,讓用戶可以將注意力完全集中在與模型的協(xié)作上,而無需在意界面本身!
【版權(quán)聲明】秉承互聯(lián)網(wǎng)開放、包容的精神,萬通商務(wù)網(wǎng)歡迎各方(自)媒體、機(jī)構(gòu)轉(zhuǎn)載、引用我們原創(chuàng)內(nèi)容,但要嚴(yán)格注明來源萬通商務(wù)網(wǎng);同時(shí),我們倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán),如發(fā)現(xiàn)本站文章存在版權(quán)問題,煩請將版權(quán)疑問、授權(quán)證明、版權(quán)證明、聯(lián)系方式等,發(fā)郵件至770276607@qq.com,我們將第一時(shí)間核實(shí)、處理。
部分資訊信息轉(zhuǎn)載網(wǎng)絡(luò)或會(huì)員自己投稿發(fā)布,如果有侵犯作者權(quán)力,請聯(lián)系我們刪除處理,聯(lián)系QQ:770276607
部分資訊信息轉(zhuǎn)載網(wǎng)絡(luò)或會(huì)員自己投稿發(fā)布,如果有侵犯作者權(quán)力,請聯(lián)系我們刪除處理,聯(lián)系QQ:770276607