和ChatGPT師出同門(OpenAI公司)的自動語音識別(ASR)工具-Whisper又有了新的增強:除了用C/C++改寫執行緩慢的Python外,也有高手幫它加上了翅膀-也能使用GPU執行了!
還在使用剪映上傳影片以取得字幕的朋友們,Whisper是離線執行,能充份保障影片隱私,現在又有了GPU的並行處理能力,不換Whiper更待何時?
可惜WihsperDesktop目前只有Windows版本,macOS與Linux的朋友們要再等一等。
1. 安裝與執行
- 由GitHub下載Zip檔後解壓縮即可
- 下載Model檔案,建議下載ggml-medium.bin檔案(1.5G),可在安裝資料夾建立 models 子目錄,將.bin檔存入
- 執行WhisperDesktop.exe,指定Model檔案,再逐一輸入資料後,按【Transcribe】即可產生需要的輸出格式
2. 命令行
- 須下載cli.zip
- 命令行main.exe只接受音訊檔,因此先用 ffmpeg.exe 將影片檔轉轉換成.wav。
- 音訊檔必須是16MHz
ffmpeg.exe -i "%~1" -ar 16000 -acodec pcm_s16le "%~1.wav"
- 指定語音語言為中文(不指定則為auto自動偵測,可能會輸出成英文),輸出格式為.srt,使用medium模型
main.exe -l zh -osrt -m models\ggml-medium.bin "%~1.wav"
- 顯示在螢幕上的中文會是問號,但輸出檔案正常
3. 相關鏈接
- ffmpeg下載:https://ffmpeg.org/download.html
- ggml檔案下載: https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main
- WhisperDesktop Const-me/Whisper: High-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model
- Whisper.cpp ggerganov/whisper.cpp: Port of OpenAI's Whisper model in C/C++
- Buzz GitHub
4. 教學影片
##
您可能也會有興趣的類似文章
- 能離線使用的語音識別工具:Buzz,使用OpenAI Whisper神經網路,正確率高 (0則留言, 2022/12/04)
- [AHK#36] 自製AutoSub圖形介面工具:AutoSub-AHK;Windows適用 (7則留言, 2020/05/15)
- 歡迎參觀與訂閱YouTube新頻道:《簡睿軟體頻道》! (0則留言, 2018/02/26)
- [Ubuntu] 使用youtube-dl下載YouTube.com的影片 (0則留言, 2014/02/01)
- B站生存手記 (0則留言, 2021/09/23)
- AI 降噪! Krisp 測試:能有效遮蔽鍵盤打字聲嗎? (0則留言, 2021/04/16)
- 字幕編輯軟體Subtitle Edit的使用技巧 (0則留言, 2020/05/15)
- YouTube影片實務02:Filmora 11製作Subscription推廣動畫的幾個方法 (0則留言, 2022/07/31)
- YouTube影片實務01:Filmora 11使用關鍵幀局部放大螢幕 (0則留言, 2022/07/24)
- AdSense帳號區分成兩組 (0則留言, 2022/07/20)
- Windows專屬的3個YouTuber錄製影片的利器:滑鼠游標螢光高亮顯示和畫筆、聚光燈等引人注目的功能 (0則留言, 2022/04/24)
- 免費影片後製軟體《剪映》語音辨識上字幕和簡轉繁技巧~JianYing (0則留言, 2021/07/24)
- ArcTime變更Default樣式技巧與取消字幕淡入淡出動畫特效 (0則留言, 2020/06/11)
- ArcTime 快速複製樣式的方法 (0則留言, 2020/05/30)
- 用人工智慧幫你的影片加字幕:超方便的網易見外工作台 (0則留言, 2019/05/01)