OpenAI 突然推送推送高級(jí)語(yǔ)音模式「Her」,又搶了谷歌風(fēng)頭

9 月 25 日早,Google 發(fā)布兩款新模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。
在谷歌的系列模型中,Gemini Pro 屬于中號(hào)模型,付費(fèi)用戶可以使用。而 Gemini Flash 則由 Gemini Pro 蒸餾而來(lái),在今年 5 月的 Google I/O 上第一次亮相,目前用戶可以免費(fèi)在 Gemini 中使用,開(kāi)發(fā)者也有一定免費(fèi)的 api 使用配額。
模型升級(jí)的重點(diǎn)主要為 1.5 Pro 價(jià)格降低 >50%、1.5 Flash 的速率限制提高了 2 倍,1.5 Pro 的速率限制提高了約 3 倍、輸出速度提高 2 倍,延遲降低 3 倍;過(guò)濾器切換為選擇加入。
不過(guò),似乎 Google 今天的宣傳節(jié)點(diǎn)再一次被 OpenAI 提前知曉。OpenAI 同日宣布,OpenAI 的高級(jí)語(yǔ)音模式,將今日起開(kāi)始對(duì) Plus 和 Team 用戶推出。
5 月,Google 發(fā)布 Gemini 模型的大更新前,OpenAI 就曾提前搶開(kāi)發(fā)布會(huì),宣布很快會(huì)帶來(lái)高級(jí)語(yǔ)音模式,登上媒體頭條「?jìng)€(gè)人助理 Her 就要來(lái)了嗎?」
接下來(lái)半年,高級(jí)語(yǔ)音模式的發(fā)布一再推遲,直至今日 Google 更新模型,OpenAI 立刻表示,本周內(nèi)將推出語(yǔ)音模型。
除了之前已經(jīng)劇透過(guò)的語(yǔ)音模式與人類在對(duì)話中的反應(yīng)時(shí)間相近,會(huì)變換語(yǔ)調(diào)之外,還增加了個(gè)性化指令功能——可以直接指令模型說(shuō)話說(shuō)慢點(diǎn),或者用一個(gè)特定的口音,同時(shí)可以記住你的名字和提前提供的信息給出更個(gè)性化的回復(fù)。
X 上有用戶不禁感嘆,OpenAI 已經(jīng)養(yǎng)成了一個(gè)新愛(ài)好。等著 Google 發(fā)布一個(gè)更新,幾個(gè)小時(shí)后馬上發(fā)布一個(gè)更新。
01.Google Gemini Pro 價(jià)格下降一半
從 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 的名字也可以看出,此次 Google Gemini 的更新,不是一個(gè)大版本的更新,更多的是一次整體模型的升級(jí)。
降低價(jià)格是一個(gè)重要的更新重點(diǎn)。
Gemini 1.5 Pro 的輸入 token 價(jià)格降低 64%,輸出 token 價(jià)格降低 52%,增量緩存 token 價(jià)格降低 64%,適用于小于 128K token 的提示語(yǔ),自 2024 年 10 月 1 日起生效。再加上上下文緩存,這將繼續(xù)降低使用 Gemini 構(gòu)建應(yīng)用的成本。
此外,1.5 Flash 的速率限制從 1000 RPM 提高到 2000 RPM,1.5 Pro 的速率限制從 360 RPM 提高到 1000 RPM。在接下來(lái)的幾周內(nèi)生效。
Google 1.5 Flash 得到了 2 倍輸出速度和 3 倍更低延遲。
同時(shí),Google 表示,發(fā)布的 Gemini 模型,默認(rèn)不會(huì)應(yīng)用過(guò)濾器,開(kāi)發(fā)者可以根據(jù)其用例自行決定最佳的配置。Gemini 將繼續(xù)提供一系列安全過(guò)濾器,開(kāi)發(fā)者可以根據(jù)需要為 Google 的模型應(yīng)用這些過(guò)濾器。
Google 還表示,此次模型在數(shù)學(xué)、長(zhǎng)上下文窗口和視覺(jué)方面取得了一定的進(jìn)步。
在更具挑戰(zhàn)性的 MMLU-Pro 基準(zhǔn)測(cè)試中,看到大約 7% 的性能提升。而在數(shù)學(xué)和 HiddenMath(一個(gè)內(nèi)部保留的數(shù)學(xué)競(jìng)賽問(wèn)題集)基準(zhǔn)測(cè)試中,兩個(gè)模型都取得了約 20% 的顯著進(jìn)步。對(duì)于視覺(jué)和代碼使用場(chǎng)景,兩個(gè)模型在評(píng)估視覺(jué)理解和 Python 代碼生成的測(cè)試中表現(xiàn)也更好,提升范圍在約 2-7% 之間。
8 月份發(fā)布的 Gemini-1.5-Flash-8B 實(shí)驗(yàn)?zāi)P鸵驳玫搅诵碌母隆?span style="display:none">SAX知多少教育網(wǎng)-記錄每日最新科研教育資訊
Gemini 模型本身的亮點(diǎn)包括長(zhǎng)上下文和多模態(tài)功能。由于 Gemini Flash 對(duì)開(kāi)發(fā)者有部分免費(fèi)額度,新更新可能對(duì)于開(kāi)發(fā)某些應(yīng)用有著很好的效果。
X 上的 AshutoshSrivastava 就表示,他使用 Google Flash 構(gòu)建了一個(gè)應(yīng)用,能夠在 1 分鐘內(nèi)轉(zhuǎn)寫(xiě) 13 分鐘的長(zhǎng)音頻,且準(zhǔn)確度很高(且免費(fèi))。在另一個(gè)應(yīng)用中,他表示目標(biāo)探測(cè)功能的表現(xiàn)也很不錯(cuò)。
02.OpenAI 高級(jí)語(yǔ)音功能今日起推出
轉(zhuǎn)頭看 OpenAI 這邊。
凌晨?jī)牲c(diǎn),OpenAI 宣布高級(jí)語(yǔ)音模式今日起開(kāi)始向訂閱用戶推出,周內(nèi)會(huì)全量進(jìn)行推送。
根據(jù) OpenAI 的宣傳片,與標(biāo)準(zhǔn)語(yǔ)音模式進(jìn)行區(qū)分(黑色旋轉(zhuǎn)球),高級(jí)語(yǔ)音將以藍(lán)色旋轉(zhuǎn)球表示,并增加 5 個(gè)新語(yǔ)音。
此次發(fā)布的一個(gè)重要亮點(diǎn)是,OpenAI 表示,高級(jí)語(yǔ)音模式可以提供個(gè)性化定義。
在視頻中,OpenAI的研究員表示,用戶可以自定義指令,以讓模型以某種口音發(fā)音、記住事件以及用戶想要如何被稱呼等。
「你可以讓模型用特定的語(yǔ)速說(shuō)話,也許是非常清晰地發(fā)音,慢慢地說(shuō)話,用你的名字或你喜歡的稱呼來(lái)稱呼你。」研究員表示。
另一位研究員提供了一個(gè)例子,對(duì)模型輸入名字和所在城市,在向模型尋求周末的計(jì)劃時(shí),模型會(huì)根據(jù)所在城市,進(jìn)行更個(gè)性化的規(guī)劃。
高級(jí)語(yǔ)音對(duì)話目前僅適用于 ChatGPT Plus 和 Team 帳戶的用戶。免費(fèi)用戶仍然可以訪問(wèn)標(biāo)準(zhǔn)語(yǔ)音模式。
不過(guò),Plus 和 Team 用戶每天仍然有高級(jí)語(yǔ)音的使用限制,并且每日限制可能會(huì)發(fā)生變化。當(dāng)一天的高級(jí)語(yǔ)音還剩 15 分鐘時(shí),OpenAI 會(huì)向用戶發(fā)出通知。
同時(shí),使用高級(jí)語(yǔ)音模式無(wú)法使用 GPTs,即用戶設(shè)計(jì)的 OpenAI 的智能體。
高級(jí)語(yǔ)音模式因?yàn)閷?duì)語(yǔ)音反應(yīng)時(shí)間更敏感,在某些嘈雜的場(chǎng)景下,也更容易被打斷。
最后,OpenAI 還用高級(jí)語(yǔ)音模式搞了一個(gè)活,表示 ChatGPT 目前可以用五十多種語(yǔ)言表示「對(duì)不起,我遲到了,我不是故意讓你等這么久的。」
一個(gè)很有趣的點(diǎn)是,此次 Gemini 的發(fā)布,是由 Google 的 Logan Kilpatrick 主要負(fù)責(zé)對(duì)外溝通交流。
而 Logan Kilpatrick,正是 OpenAI 前開(kāi)發(fā)者關(guān)系負(fù)責(zé)人。2024 年跳槽 Google。
而轉(zhuǎn)頭,此次 Google 發(fā)布新模型,OpenAI 就卡點(diǎn)發(fā)布高級(jí)語(yǔ)音模式。
OpenAI 此次宣布的時(shí)間點(diǎn)或許還有另外一個(gè)意義——此前外媒報(bào)道稱,Meta 公司本周將在 Meta AI 中推出名人語(yǔ)調(diào)的音頻對(duì)話功能。
在硅谷,AI 的戰(zhàn)爭(zhēng)還在熱火朝天的繼續(xù)。
本文鏈接:http://m.albanygandhi.com/news-23-1894.htmlOpenAI 突然推送推送高級(jí)語(yǔ)音模式「Her」,又搶了谷歌風(fēng)頭
聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
關(guān)于在有條件的自由貿(mào)易試驗(yàn)區(qū)和自由貿(mào)易港試點(diǎn)有關(guān)進(jìn)口稅收政策措施的公告(2023年第75號(hào))
關(guān)于印發(fā)《服務(wù)健康事業(yè)和健康產(chǎn)業(yè)人才培養(yǎng)引導(dǎo)性專業(yè)指南》的通知(教高廳函〔2023〕26號(hào))
【解讀】《關(guān)于施行修改后的專利法及其實(shí)施細(xì)則相關(guān)審查業(yè)務(wù)處理的過(guò)渡辦法》解讀
【解讀】我國(guó)正加快探索數(shù)據(jù)知識(shí)產(chǎn)權(quán)保護(hù)規(guī)則
中共北京市委 北京市人民政府關(guān)于北京市全面優(yōu)化營(yíng)商環(huán)境打造“北京服務(wù)”的意見(jiàn)
關(guān)于印發(fā)《加強(qiáng)審計(jì)報(bào)告查驗(yàn)工作實(shí)施方案》的通知(京財(cái)會(huì)〔2024〕30號(hào))
【征集】關(guān)于公開(kāi)征集2024年度朝陽(yáng)區(qū)互聯(lián)網(wǎng)3.0示范應(yīng)用場(chǎng)景和示范解決方案的通知
《關(guān)于推動(dòng)未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展的實(shí)施意見(jiàn)》
《北京市綠色制造單位培育管理暫行辦法》
【公示】第一批北京工業(yè)遺產(chǎn)擬認(rèn)定名單公示
如登春臺(tái):石家莊靈壽縣代還信用卡墊還,多年經(jīng)營(yíng),高效便捷服務(wù)
正品代購(gòu)印度替莫唑胺哪里買(mǎi):2025印度替莫唑胺代購(gòu)步驟有哪些?官方報(bào)價(jià)印度替莫唑胺多少錢(qián)一盒(100mg5粒)印度替莫唑胺價(jià)格約200~300元一盒一瓶現(xiàn)在公布
最新分享:京東白條加油額度可以套出來(lái)嗎(二十四小時(shí)在線解答)-知者
大吉大利:佛山順德區(qū)上門(mén)代還信用卡,可長(zhǎng)期幫還,實(shí)體店多種方式
最新技巧分享-DYDou分期怎么找商家取出現(xiàn)金
喜從天降:上海代還信用卡墊還,秒到賬(當(dāng)面秒結(jié)算)
專心致志:蘋(píng)果id貸逾期,蘋(píng)果手機(jī)id貸款口子2024
重大:誰(shuí)有京東店鋪可以套白條(這篇文章包你白條提現(xiàn)到賬)-知者
男子為解饞,在山里鋪設(shè)電網(wǎng)欲捕獵,涉嫌非法狩獵被抓
小白必懂:羊小咩怎么提出現(xiàn)金完美的操作: