首頁 > 軟體

記一次語音轉文字程式的開發-當一次野生字幕君

2020-09-23 22:32:06

下一秒我就是野生字幕君

最近劇荒,偶然翻出了曾經下載的電視劇回味一番,經典就是經典,不論是劇情還是臺詞,都那麼有魅力,咦?等等,臺詞,臺詞……作為一個IT從業者,我忽然靈光一現——現在語音識別技術這麼發達,能否有什麼辦法能幫我儲存下一些精彩橋段的臺詞呢?或許我也可以是個野生字幕君:p ,似乎也可以在此基礎上順手再翻譯一下個別難懂的臺詞!

略加思索,我大概有了個想法——做個視訊中提取音訊的程式,而後去請求一個開放的語音識別API來幫我把語音轉為文字。鑑於之前呼叫有道智雲的愉快經驗,我決定再次拿來為我所用,很快做出了這個demo(請忽略這醜醜的介面佈局,能用就行……)。

呼叫API介面的準備工作

首先,是需要在有道智雲的個人頁面上創建例項、創建應用、繫結應用和例項,獲取呼叫介面用到的應用的id和金鑰。具體個人註冊的過程和應用創建過程詳見文章分享一次批量檔案翻譯的開發過程

效果可以,斷句的一點小瑕疵可以忽略。沒想到這短語音識別API博古通今,古文語音識別也這麼溜,厲害厲害!

總結

一番嘗試帶我打開了新世界的大門,從今天開始我可以是一個不打字卻能搬運字幕的野生字幕君了,後面再有時間可以試試識別完翻譯成其他語言的操作,嗯,是技術的力量!

項目地址:https://github.com/LemonQH/SRFromVideo


IT145.com E-mail:sddin#qq.com