4倍速で文字起こし!Faster Whisperの使い方を解説してみた【Python初心者でも使えるコード付き】

学習

#AI #python #プログラミング #whisper #動画編集 #文字起こし #openai
今回はgradioは使いませんでした!

00:00 オープニング
00:54 どれくらい高速化されるのか?
01:43 どうやって高速化しているのか?
02:14 AIがどのように文章を扱うかの説明
02:29 トークンはベクトルが振られることの説明
02:50 AIのモデルのパラメータの意味を解説
03:13 パラメータの量子化の意味を解説
03:58 whisper-large-v2の性能比較
04:44 実装の紹介
06:44 動画ファイルのアップロード方法について
07:21 ファイル名の取得方法
07:51 faster whisperの使い方の解説
09:32 文字起こしのファイル参照の仕方
10:09 文字起こしの精度を確認
10:42 OpenAIのWhisper-large-v2の使い方の解説
11:46 OpenAIのWhisperとfaster-whisperの比較
12:33 英語翻訳版の出力方法について
13:34 エンディング

■動画で紹介したコード
https://colab.research.google.com/github/nyanta012/demo/blob/main/faster_whisper.ipynb
※無断転載禁止

■faster-whisperのgithub
https://github.com/guillaumekln/faster-whisper

■CTranslate2のgithub
https://github.com/OpenNMT/CTranslate2/

■以前のwhisperを使った動画
【AIで字幕作成】Whisperで字幕の文字起こしをするWebアプリを作ってみた【コード付き】

【AIで字幕作成】Whisperで字幕の文字起こしをするWebアプリを作ってみた【コード付き】

【音声認識AI】OpenAIのWhisperで文字起こししてみた【コード付き】

【音声認識AI】OpenAIのWhisperで文字起こししてみた【コード付き】

■Twitter

——————————————————————————————————
■楽曲提供:フリーBGM DOVA-SYNDROME : http://dova-s.jp/
     効果音ラボ : https://soundeffect-lab.info/
——————————————————————————————————

コメント

タイトルとURLをコピーしました