6 月 28 日消息,科技媒體 9to5Mac 昨日(6 月 27 日)發(fā)布博文,報(bào)道稱 macOS 應(yīng)用 MacWhisper 在近期版本更新中,通過接入英偉達(dá)的 Parakeet 模型,轉(zhuǎn)錄速度飆升。
曾于 2023 年 2 月報(bào)道,開發(fā)者 Jordi Bruin 推出 MacWhisper 應(yīng)用,主要基于 OpenAI 的 Whisper 轉(zhuǎn)錄模型,可以在本地完成音頻文件轉(zhuǎn)錄為文本的工作。
不過隨著 OpenAI 將重點(diǎn)轉(zhuǎn)向更具商業(yè)價(jià)值的 gpt-4o-transcribe 模型,Whisper 開始顯得有些過時(shí),更快、更新的轉(zhuǎn)錄模型一次次超越 Whisper。
英偉達(dá)于上月宣布 Parakeet 模型,擁有 A100、H100、T4 或 V100 GPU 的硬件上,僅需 1 秒鐘就能轉(zhuǎn)錄 60 分鐘的音頻。
Parakeet 可以通過開源工具獲得,但問題在于,并非每個(gè)人都熟悉命令行界面或自定義模型部署,而用戶現(xiàn)在通過新版 MacWhisper,可以更輕松地使用該功能。
應(yīng)用開發(fā)者 Jordi Bruin 表示:“得益于我們與 Argmax 團(tuán)隊(duì)的協(xié)作,MacWhisper 現(xiàn)在支持 Parakeet 模型。為了展示這一變化的重大意義,請查看下面的 GIF,我們用不到 8 秒的時(shí)間轉(zhuǎn)錄并整理了一個(gè) 30 分鐘的播客!”

該媒體隨后用新版 MacWhisper 應(yīng)用實(shí)測,一個(gè) 3 小時(shí)的 9to5Mac Happy Hour 播客節(jié)目,轉(zhuǎn)錄僅用了 1 分 22 秒。
