pythonで音声からの文字起こしと翻訳をしてみよう!

学習

今回はpythonを使って音声からの文字起こしと翻訳をしてみようと思います。ついでに、作成した字幕データを使って日本語で動画を聞けるようにしてみたいと思います。

★pythonコード
・前半:https://k-dm.work/ja/finance/nlp/mp32srt/
・後半:https://k-dm.work/ja/finance/nlp/srt2jp/

※本動画で使用したコードを用いたあらゆる結果について一切の責任は負えません。また、作成された文字起こしデータと翻訳データは正しさが保証されたものではありません。
—————————–
★参考文献・使用したモデル
・openai/whisper: https://github.com/openai/whisper
・staka/fugumt-en-ja: https://huggingface.co/staka/fugumt-en-ja
・ニューラル機械翻訳モデルFuguMT: https://staka.jp/wordpress/?p=413
—————————–
★お借りしたもの
・音声:VOICEVOX (https://voicevox.hiroshiba.jp/)
・立ち絵:ずんだもん立ち絵素材・坂本アヒルさま(https://seiga.nicovideo.jp/seiga/im10788496)
・動画内で実験のために使用した音声 → Flex LNG Q3 2022 Key Takeaways (https://www.youtube.com/watch?v=tsU0jebpux0)
—————————–
★タイトル
00:00 タイトル
00:15 音声認識・翻訳・音声合成の実行例
00:52 この動画でやりたいこと
01:48 pythonでの処理手順
02:14 OpenAI whisper
02:52 ①IRの音声データを取得する
03:17 ②pythonで音声認識・翻訳
04:54 ③日本語字幕データ作成
06:12 ④VOICEVOXでの音声データ作成
06:32 ⑤字幕・音声データから動画を作成
—————————–
★SNS
twitter:https://twitter.com/intent/follow?screen_name=_K_DM
ブログ: https://kdm.hatenablog.jp/
コード置き場: https://k-dm.work/ja/
—————————–
★BGM
Flower Field (by FLASH☆BEAT様) https://dova-s.jp/bgm/play13492.html
—————————–
★免責事項
本動画で使用したコードを用いたあらゆる結果について一切の責任は負えません。また、作成された文字起こしデータと翻訳データは正しさが保証されたものではありません。

この配信の内容は情報提供と教育のみを目的としたものであり、実際の株の売買を薦めるものではございません。株の売買を行う場合は、事前に必ずご自身で調査をした上で、自己責任でお願い致します。また、翻訳の正しさは保証されておらず、また本コードも動作や出力に関しては
一切の責任を負えません。
—————————–
★このチャンネルについて
週に一回ペースで機械学習・データサイエンスに関する情報を発信します!よろしければチャンネル登録お願いします。大変励みになります。

#機械学習 #データ分析 #Python

コメント

タイトルとURLをコピーしました