SUB字幕轉SRT字幕教學

轉中文字幕

 用SubRip將SUB字幕抽取成BMP圖檔,再交由SubtoSrt辨識成SRT檔

先執行SubRip,在其下方的Action:選Save Pictures As BMP

其餘按照教學過程

轉英文字幕

單獨用SubRip即可將轉英文字幕 

若要將英文SUB字幕轉為SRT字幕,先執行SubRip

在右上角Characters matrix file 切換至AAA.sum這個字庫檔
在其下方的Action:選Subpictures to TEXT via OCR,其餘按照教學過程中文SUB字幕轉SRT字幕教學

作者:貓‧如此瘋狂  (已徵得原作者同意轉載)

發表於Mobile01   [教學]將SUB字幕轉為SRT字幕檔

------------------------------------------------------------------------------------------------------------------------------

首先要感謝NG論壇裡的garmee兄...在他們的免費資源版提供了免註冊免費的圖片上傳的網站
在這裡引用他貼出來其中的一個http://www.imgspot.com/真的很好用喔
所以...讓我們來瘋狂的貼圖吧

我們都知道SUB是圖形字幕,本身檔案就很大,少說都會有15MB左右
相較之下做成SRT是比較受歡迎的格式...一來他是純文字文件,大小不會超過100KB
另外他可以透過記事本直接來編輯...播放的時候還可以選擇字型,有較高的自由度
網路上提供的轉換方法有好幾種,目前我學會的是以下的這一種...
請一起來看看吧...

首先介紹的使用軟體...
軟體1. SubRip 1.17.1(將SUB檔分成一連串的BMP檔和字幕的時間序列的工具)
軟體2. SubToSrt 3.11(利用上面分出來的BMP字幕配合時間序列來作辨識,完成我們所要的SRT純文字字幕)

以上兩個軟體的教學 在下曾經在某個網站上看過,但是在下已經忘記了
因此在這裡將自己的使用心得 貼出來和大家分享...


1.安裝SubRip 1.17.1後將他打開...選擇 FILE
OPEN VOBS
2.選擇 OPEN DIR...


3.在這裡以【The Perfect Score.超完美得分】為例來作說明...開啟上面的SUB檔

4.在左上方的 LANGUAGE STREAM 部份 出現了可以選擇的語言選單...我們先選擇 00-CHINESE
但是...喂喂...有兩個 CHINESE 選項是怎樣阿...
相信眼尖的您也看到了...沒錯!一個是中文繁體...另一個當然就是中文簡體了
在這裡告訴各位...不見得 00-CHINESE 就是繁體的喔...這個真的用的時候要先TRY一下...
另外...右邊 ACTION 那一欄的 SAVE SUBPICTURES AS BMP 記得要核選喔...

5.按下 START...他會問你要把分出來的BMP檔放在哪裡...
因為分出來的BMP檔會很多...而且檔案也不小...大約會有十幾MB

所以我會建議另外開一個資料夾(例如:字幕)來存放...


6.按下儲存....就會看到以下這個畫面 將右邊 PRESET 欄的 I-AUTHOR 核選
看到字沒有呢...如果沒有呢就調整一下左邊欄COLOR #1~4的色彩

他們分別代表「底色」、「字體」、「外框」、「描邊」的顏色...
因此我們都用白色和黑色來辨別

先把四個都選白色,在用黑色的一個一個試(這個部份也是得自己TRY一下) 將字體的部份顯示出來...
補充一點...如果底下的那張圖怎樣都看不到字的話

請按下 SKIP THIS PICTURE 換到下一張繼續...這個常常會遇到喔...切記!7.按下OK就會開始把圖片轉出來了...上面顯示的進度到100%時就表示完成了8.好了之後在下面的小視窗中選 OUTPUT FORMAT → SET OUTPUT FORMAT9.在左邊的選單點 TEXTS FORMATS 選擇 SUBRIP(*.SRT)...
按下 CONVERT TO THIS FORMAT


10.按下後程式會自作主張的出現以下警告...按 OK 別理他就好

11.按下 FILE → SAVE AS 另存新檔...這個部份就大功告成了


接下來要進入PART2了...

12.再來打開SubToSrt 3.11點選 文件 → 打開SRT或SSA文件 把剛剛儲存的SRT文件叫出來...
補充說明一下SubToSrt 3.11屬於綠色軟體...免安裝...可以直接執行
如果您看到的界面不是繁體中文的話 可以點選 設置 → LANGUAGE 裡面改
界面提供:繁體中文、簡體中文、英文


13.出現以下畫面


14.開始進行辨識之前還有一些準備工作要做...這會讓你提高很多工作效率喔
(1)首先看到 設置 → 程序設置 裡面有四個分頁標籤,分別為各位解說一下...
「保存設置」:用來加入作者的訊息...這個會放在開頭的地方
「輸入法設置」:這個得感謝作者貼心的設計,在辨識的過程遇到程式不認得的字的時候程式會主動切換到你設定的輸入法 方便你輸入...
「檢查替換設置」:有關標點符號規則的設定...看看就會懂的
「詞組替換設置」:顧名思義,可以透過他來轉換兩岸三地不同地方的慣用語


(2)再來是字幕圖片的部份...請看 圖片處理 → 自動剪裁
這道手續的用意 就是將字幕圖片剪裁成適當大小 這樣可以提高辨識的效率
比較一下...這一張是裁切前...
裁切好了就會變成這樣子

(3)最後看到左下角的部份,有沒有看到 空格檢測設置、空格寬度設置和行高檢測設置...

這三根 SLIDE BAR 的調整(中文叫作滑棒嗎..?)對於辨識結果有相當大的影響喔...
跟據在下的經驗...
當辨識中文的時候,我會建議大家把空格檢測和空格寬度的滑棒調到底(也就是都忽略)如下圖


經過測試,辨識英文的時候,我會建議大家把空格檢測調至第四格

這樣子辨識出來的單字和單字之間可以保持最佳的距離,其餘項目保持不變,如下圖15.好了...現在可以開始辨識了...
請點選 識別 → 開始識別 就會開始識別的動作了
看到沒有...畫面開始跑了

如果遇到程式不認識的字,就會跳出這個視窗來問你


記得之前我有提到過的「輸入法設置」那邊,如果你有選擇輸入法的話現在就會自動切換過去了...

如果輸入錯了...就在按下「前一個」重新再輸入正確的字
程式會自動的再重新把那一行辨識一次...
*補充說明一下他使用的快速鍵:
Alt+E 是將辨識的範圍(游標的框框)擴展(延伸?)一倍...通常一個框框代表一個半形的範圍
Alt+D 取消擴展
Alt+S 跳過
Alt+P 終止識別


16.結束之後程式會依照您先前設定的「檢查替換設置」和「詞組替換設置」來幫你做校正...

當然,你可以自己設定要替換的內容17.最後當然是將他儲存為SRT或SSA格式的字幕檔囉...

另外在介紹「字庫」的用法...
點選 字庫 → 修改 就會出現以下的畫面...


沒錯...我們輸入過的字...都跑到裡面去了
字庫的內容越多...辨識的效率也就越高 而且還可以透過分享來增加本身的字庫喔

(可以利用 字庫 → 導出 將字庫匯出成*.STS檔 和別人分享 同樣的利用 字庫 → 合併

就可以將別人提供給你的字庫合併到程式裡的WORD.STS檔裡面了)
所以剛開始建立字庫是很痛苦的...一般轉了四五部影片之後,速度就會開始變快了
如果你發現以前輸入的字是錯誤的...想要刪掉 也很簡單...

找到要刪字以後就在「刪」的那一欄點兩下滑鼠...在選「保存所做的修改」就行了
其實他的操作真的很簡單...界面都很直覺 而且也是中文的 所以其餘不是重點的部份再下就不再贅述了...
以上就介紹到這裡
祝 使用愉快...


以上內容轉貼至 作者:貓‧如此瘋狂  (已徵得原作者同意轉載)

                        發表於Mobile01   [教學]將SUB字幕轉為SRT字幕檔

------------------------------------------------------------------------------------------------------------------------------

以下是我自己補充的註解,這些細節容易出錯:

一、上述的步驟6,一定要將SubRip出現的字幕顏色調整為「白底黑字」
      

二、建議將SubToSrt左下方的空格設定調整如下圖:因為原設定會使字幕的空格無法偵測出來


若遇到辨識的字體只出現一半時,選「擴展」


、每次跳出要求輸入的畫面,都要先手動切換中文輸入法,可否自動切換到中文輸入呢?

        在「設置」「輸入法設置」 中可作設定,你預設的輸入法就可自動打開


五、 用SubToSrt將中文SUB字幕轉為SRT字幕後,有很多錯字怎麼辦?

請看 [教學] 瞬間訂正「中文字幕SRT檔的錯字」

(2)英文SUB字幕轉SRT字幕教學(使用SubRip)

                  中文SUB字幕轉SRT字幕,可用SubRip搭配SubToSrt

                  那英文SUB字幕要如何轉成SRT字幕呢?

                  轉英文字幕,使用SubRip即可 (SubRip本身就有OCR功能,辨識英文非常好用)


1.選File Open VOB(s)

2. 選Open Dir,選擇你的SUB檔來源


3.在Langurage stream切換至English
   在Characters matrix file
開啟AAA.sum
 (AAA.sum是我提供的SubRip英文字庫檔,在下載區我有提供,可大幅度提高辨識的 速度及成功率!)
   在Action:選SubPictures to Text via OCR

   按Start開始自動辨識
(第二欄Save Subpictures As BMP,那是中文SUB轉英文SUB才會用到,是將SUB字幕抽出成BMP圖檔)


4.當SubRip遇到認不出來的字時,就會跳出如下面的視窗,要求你輸入(記得分大小寫喔!)
   輸入後的字會自動存入字庫檔中,下次再出現的話就可以自動辨識成功
  
我在下載區提供的SubRip英文字庫檔AAA.sum

   是累積了一百多部片的英文字幕,對辨識的速度及正確性很有幫助


5.當辨識完成時(100%),設定輸出的格式
   選Output Format
 → Set Output Format  → SubRip(*.srt)


6.拼字訂正:

   Corrections  → Post OCR Spelling Correction

  (此步驟一定要做!不然會出現大寫的I 跟小寫的L混雜的情形)

   很多教學根本少了這重要步驟,所以網路上流傳的英文SRT字幕檔很多都有這問題

  透過SubRip的拼字訂正功能,可自動修正大寫I 跟小寫L 辨識不清造成的錯字


7.存檔:File
Save As

8.存入字庫檔:
當存檔完成關閉SubRip時,會跳出一個訊息,問你要不要將這次的新增的辨識資料存入字庫檔
我的習慣是先打開已存檔的SRT字幕看看有無問題,且在輸入時沒有打錯字,這才存入字庫檔中
否則的話會把錯誤的字存入,會影響往後的辨識正確率


9.如何修改字庫檔裡的錯字
在SubRip的選項中,選擇Characters Matrix → Edit/View Characters Matrix File
可以編輯現有字庫檔裡的錯字


一、SubRip英文字庫檔跟SubToSrt中文字庫檔一樣,都是一步一腳印慢慢累積而成的

當你的字庫檔越龐大,往後的辨識就會越輕鬆

如果你的SubRip是1.3版之前(1.17.1或1.2),字庫檔會存在C:\Program Files\SubRip\ChMatrix,副檔名是sum

               如果你的SubRip是1.3版之後(1.17.1或1.2),字庫檔會存在SubRip的資料夾ChMatrix底下,副檔名是sum


二、 為什麼經過SubRip辨識過後,大寫的 I 跟小寫的L會混在一起?

因為大寫的 I 與小寫的L非常類似,SubRip會辨識不出來

請看教學: [教學] 瞬間訂正「英文字幕SRT檔的錯字」