匯幫音頻大師 v4.0.1.0 官方安裝版24.7MB / 12-04
星優(yōu)音頻助手(格式轉(zhuǎn)換/壓縮/分割/變速)V2.1.0 官方安裝版774KB / 06-13
音頻修復(fù)iZotope RX 11 Audio Editor Advanced v11.2.0 免安裝綠1.9GB / 11-18
aiXdsp Intuition Compressor(音頻壓縮器) v3.0.3 免費(fèi)安裝版 附24MB / 03-05
削波效果器插件Yum Audio Crispy Clip Light v1.1.2 官方免費(fèi)安22.5MB / 02-29
Anemond Factoid(音頻剪輯插件) v2.0.1 免費(fèi)安裝版 附圖文教程26.3MB / 02-26
TBProAudio ABLM(音頻增益控制插件) v2.2.4 免費(fèi)安裝版 附圖文安5.30MB / 02-22
伴奏與人聲一鍵分離工具Ultimate Vocal Remover GUI(UVR5) v5.6.8.1GB / 03-13
Steinberg WaveLab Elements(音頻編輯/母帶處理軟件) v12.0.10 368MB / 02-11
JMG Sound BITPUNK(模擬復(fù)古數(shù)字音頻失真效果的插件) v1.2 安裝16MB / 02-04
-
EZ Meta Tag Editor(音頻標(biāo)簽編輯軟件) v12.3.4.1 特別安裝版 64 音頻處理 / 43.68MB
-
EZ Meta Tag Editor 音頻標(biāo)簽編輯器 v12.3.4.1 綠色免費(fèi)版 音頻處理 / 59.1MB
-
大餅AI變聲 v2.5.8 官方安裝版 音頻處理 / 125MB
-
背景音樂(lè)合成助手 v5.2.0.0 官方安裝版 音頻處理 / 11.8MB
-
喜馬拉雅電腦版 v4.0.9_99C 官方安裝版 音頻處理 / 65.2MB
-
ACE Studio(AI歌聲合成)v2.0.3 官方安裝版 音頻處理 / 1.11GB
-
終極音頻降噪去雜音修復(fù)增強(qiáng)插件BorisFX CrumplePop Complete Pr 音頻處理 / 1.1GB
-
音樂(lè)制作軟件Cubase Elements v7.5 漢化安裝特別版(兼容win10) 音頻處理 / 312MB
-
Native Instruments Kontakt 8 v8.8.0 最新中文綠色免費(fèi)版 音頻處理 / 1.2GB
-
Native Instruments Kontakt 8 v8.8.0 完整安裝免費(fèi)版(附文件+教 音頻處理 / 1.2GB
詳情介紹
FasterWhisperGUI是一款帶有 PySide6 的 fast_whisper 的 GUI 軟件,你可以將音頻或視頻文件轉(zhuǎn)錄為srt/txt/smi/vtt/lrc文件,將在線OpenAI-whisper模型轉(zhuǎn)換為ct2格式,并且提供VAD模型和whisper模型的所有參數(shù),目前支持whisperX,Democs 模型,whisper large-v3模型。
聽(tīng)到Whisper,這個(gè)大家可能有點(diǎn)熟悉,這是OpenAI做的一個(gè)神經(jīng)網(wǎng)絡(luò)模型,可以在本地實(shí)時(shí)語(yǔ)音轉(zhuǎn)文字,用來(lái)翻譯和做字幕等,之前給大家介紹過(guò)一款叫做Constme-Whisper的軟件,可以快速進(jìn)行離線語(yǔ)音文字識(shí)別,還有GPU加速等等。
而faster-whisper-GUI增添了更多的特性,可以快速把音視頻文件轉(zhuǎn)成srt/txt/smi/vtt/lrc,支持Demucs、FastWhiper和whisperX、VAD-model這些技術(shù),簡(jiǎn)單來(lái)說(shuō),支持的可調(diào)整的選項(xiàng)要比之前推薦的工具更多一點(diǎn)。
由于這類工具離線處理的特點(diǎn),所以體積都比較大,faster-whisper-GUI的本體有1.6個(gè)G,安裝完之后的占用又是6個(gè)多G,而且還不包括后續(xù)添加模型的大小,建議大家體驗(yàn)的時(shí)候,裝在空間富裕的盤里。


如果是分離音頻和背景音樂(lè)的話,直接把文件丟進(jìn)來(lái)就行,試了一下效果還不錯(cuò),也可以單獨(dú)設(shè)置輸出的內(nèi)容。


其他的就需要加載一下額外模型了,把模型加載的時(shí)候需要注意,有個(gè)處理設(shè)備的選項(xiàng),CPU還是CUDA,如果你用的不是英偉達(dá)的顯卡,選擇自動(dòng)就好了,不然會(huì)提示加載失敗。

模型也有多重選擇,如果上面帶有V3標(biāo)志,記得把這個(gè)開(kāi)關(guān)打開(kāi)。

模型也有多重選擇,如果上面帶有V3標(biāo)志,記得把這個(gè)開(kāi)關(guān)打開(kāi)。


來(lái)試試語(yǔ)音轉(zhuǎn)文字,如果你覺(jué)得自己的設(shè)備處理等待時(shí)間有點(diǎn)長(zhǎng),在軟件執(zhí)行的時(shí)候可以掛在后臺(tái)和切換到其他界面,在它的詳情頁(yè)面能看到輸出的具體信息,它的正確率還是比較高的,中英文混合與首字母大小寫(xiě)這些細(xì)節(jié)都有。

這類機(jī)器識(shí)別和人一樣,識(shí)別率還不能做到100%正確,識(shí)別完之后,會(huì)有一些錯(cuò)誤需要手動(dòng)調(diào)整,在faster-whisper-GUI里,它會(huì)自己跳轉(zhuǎn)到字幕制作的界面,可以快速瀏覽調(diào)整,在這里分割不同說(shuō)話人的文本等等

在設(shè)置里面,還有許多細(xì)節(jié)可以調(diào)整,調(diào)整音頻的默認(rèn)語(yǔ)言和翻譯,以及各種防止幻聽(tīng)的參數(shù)。

這個(gè)功能在一些視頻編輯軟件還是需要收費(fèi)的,或者需要云端處理,識(shí)別的準(zhǔn)確率也就那樣。
更新日志
0.8.0 改動(dòng)
修復(fù)沒(méi)有贊助渠道的 bug #126
升級(jí) faster-whisper 到 1.02 版本
添加 distil-large-v3 模型在線模式支持 #130
最新的 Distil-Whisper 模型 distil-large-v3 本質(zhì)上是為與 OpenAI 順序算法配合使用而設(shè)計(jì)的。
支持初始化更多 whisper 模型參數(shù)
音頻分段設(shè)置
max_new_tokens: 每個(gè)區(qū)塊生成的新令牌的最大數(shù)量。如果未設(shè)置,最大值將通過(guò)默認(rèn)的 max_size 設(shè)置。
chunk_length: 音頻段的長(zhǎng)度。如果不是 None,它將覆蓋 FeatureExtractor 的默認(rèn)chunk_size。
clip_timestamps: 逗號(hào)分隔的要處理的剪輯的時(shí)間戳列表(以秒為單位)開(kāi)始,結(jié)束,開(kāi)始,結(jié)束......。最后一個(gè)結(jié)束時(shí)間戳默認(rèn)為文件的結(jié)束。如果使用 clip_timestamps,將忽略 VAD 設(shè)置。
幻聽(tīng)參數(shù)
hallucination_silence_threshold: 當(dāng) word_timestamps 為 True 時(shí),當(dāng)檢測(cè)到可能的幻覺(jué)時(shí),跳過(guò)長(zhǎng)于此閾值(以秒為單位)的靜默期。
其他設(shè)置
hotwords: 為模型提供的熱詞/提示短語(yǔ)。如果 prefix 不是 None,則無(wú)效。 你可以輸入提示詞,類似于:“the video is about comfyUI”。
常規(guī)
language_detection_threshold: 如果語(yǔ)言標(biāo)記的最大概率高于此值,則會(huì)檢測(cè)為該語(yǔ)言。
language_detection_segments: 語(yǔ)言檢測(cè)需要考慮的分段數(shù)量。
其他新特性:https://github.com/SYSTRAN/faster-whisper/releases/tag/v1.0.2
修復(fù) 復(fù)制字幕 功能的 bug
更新一些 UI 文字
停用 轉(zhuǎn)寫(xiě)參數(shù) 頁(yè)面的 保存參數(shù)、讀取參數(shù) 功能
起止時(shí)間、說(shuō)話人 列居中顯示
升級(jí) pytorch 到 2.3.0 , CUDA12
提示
軟件需要完全卸載舊版之后安裝新版(cache文件夾可不做清理)
需要安裝 ffmpeg
使用 V3 模型時(shí),如果頻繁出現(xiàn)顯存溢出,請(qǐng)嘗試更新顯卡驅(qū)動(dòng)程序到最新或者回退到上一個(gè)穩(wěn)定版本,當(dāng)前版本(2024.5.29)測(cè)試結(jié)果穩(wěn)定。
下載地址
人氣軟件

PreSonus Studio One 6 Professional V6.6.2 中文永久免費(fèi)版(附
最強(qiáng)伴奏與人聲一鍵分離工具Ultimate Vocal Remover GUI(UVR5) v
PreSonus Studio One Pro 7 v7.2.1 中文完整免費(fèi)版(附安裝教程)
Studio One6機(jī)架效果包插件 V6.0.2 中文免費(fèi)版(附使用教程)
IBM ViaVoice Pro語(yǔ)音識(shí)別輸入系統(tǒng) v9.1 簡(jiǎn)體中文版
大餅AI變聲 v2.5.8 官方安裝版
Adobe Audition 2024(Au2024) v24.6.0.069 中文安裝免費(fèi)版 64位
阿里開(kāi)源語(yǔ)音模型CosyVoice 0721 整合包 免費(fèi)版
終極伴奏人聲提取工具 Ultimate Vocal Remover(UVR) v5.5.1 中文
Native Instruments Kontakt 8 v8.8.0 完整安裝免費(fèi)版(附文件+教
相關(guān)文章
-
EZ Meta Tag Editor 音頻標(biāo)簽編輯器 v12.3.4.1 綠色免費(fèi)版EZ Meta Tag Editor是一款專業(yè)實(shí)用的音樂(lè)文件編輯軟件,有的時(shí)候用戶需要對(duì)音樂(lè)添加各種標(biāo)簽,或者編輯音樂(lè)的各個(gè)參數(shù)進(jìn)行管理,直接通過(guò)該軟件就可以直接進(jìn)行設(shè)置,歡迎需...
-
廣告配音王(配音軟件) V1.0 免費(fèi)安裝版廣告配音王是一款真正為廣告行業(yè)量身打造的專業(yè)軟件,它不僅簡(jiǎn)化了文字轉(zhuǎn)語(yǔ)音的過(guò)程,還大大提高了音頻文件的質(zhì)量...
-
冬瓜配音 v1.3.0 官方安裝版冬瓜配音提供多樣的語(yǔ)音庫(kù),涵蓋各種音色、語(yǔ)調(diào),滿足用戶多樣化的配音需求,歡迎下載使用...
-
優(yōu)聲音頻轉(zhuǎn)換大師 V1.0.1.1 官方安裝版優(yōu)聲音頻轉(zhuǎn)換大師支持音頻格式轉(zhuǎn)換、音頻合并、音頻變速、音頻剪切、音頻變調(diào)、音頻添加封面、音頻音量調(diào)整等功能...
-
全方位錄音 V2.1.0.2 官方安裝版全方位錄音提供了麥克風(fēng)錄音、電腦系統(tǒng)錄音、電腦內(nèi)錄、音樂(lè)平臺(tái)錄制等,支持的格式MP3,WMA,AC3,FLAC,WAV,M4A,OGG等,歡迎下載...
-
團(tuán)子AI(伴奏提取分離)v1.0.10 linux最新版團(tuán)子AI專業(yè)的人工智能工具,該軟件擁有專業(yè) NVIDIAV100 計(jì)算卡,提供批量處理工具,無(wú)人托管,一鍵上傳,批量處理...
下載聲明
☉ 解壓密碼:www.dhdzp.com 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個(gè)軟件總是不能下載的請(qǐng)?jiān)谠u(píng)論中留言,我們會(huì)盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請(qǐng)過(guò)一段時(shí)間重試!或者多試試幾個(gè)下載地址
☉ 如果遇到什么問(wèn)題,請(qǐng)?jiān)u論留言,我們定會(huì)解決問(wèn)題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請(qǐng)購(gòu)買正版。
☉ 本站提供的FasterWhisperGUI(音頻處理工具) v0.8.0 安裝免費(fèi)版資源來(lái)源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。



