使用 google 的 Gemini CLI 來製作字幕

技術心得文摘要

本文介紹如何使用 Google Gemini CLI 生成具有時間軸的 繁體中文 SRT 字幕檔,主要流程如下:
1. 前置條件與注意事項
– 確保影片下載具備合法版權。
– Gemini CLI 使用 Google Gemini 模型,需注意 API 使用費用。
– 建議影片/音訊檔放在獨立資料夾中操作,避免混亂。
– 支援 MacOS,文中範例以 Mac 為主。
2. Gemini CLI 介紹與安裝
– 可透過 npm 或 Homebrew 安裝,需 Node.js 20+(npm 方式)或已安裝 Homebrew(Mac 方式)。
– 安裝完成後可輸入 gemini 驗證版本。
– 可登入 Google 帳號使用免費額度,或設定 GEMINI_API_KEY 以提高使用限制。
3. 影片轉音訊(MP3)
– 方法一:使用外部工具提取音訊。
– 方法二:直接用 Gemini CLI 下指令 請幫我把影片轉成mp3 音訊檔案 @檔案路徑,內部會調用 ffmpeg。
4. 產生字幕檔(SRT 格式)
– 使用指令:「這是一個在 oooo 的聲音檔案,請幫我產生 srt 字幕檔,請使用繁體中文,且使用台灣詞彙用字。中英文請使用空格隔開。聲音檔案路徑 @檔案路徑」
– 系統會使用 whisper 進行語音轉文字,並生成 SRT 檔案。
– 可依需要加上專業領域描述,讓字幕內容更精準。
5. 結果
– 完成後字幕檔會存放於相同資料夾,可直接用於 YouTube CC 或其他平台。

繼續閱讀