動画のスライドを文字起こしする 2025年01月10日

■経緯

コロナ過の影響もあり、
ほとんどがウェビナーになったのですが、
困ることにスライド資料を配布してくれない方がいます、

単純に、死ねと思いましたが、
AI全盛期の今、
動画のテキストを抽出する方法はないかな?
とググりましたが、結論は「ない」でした。

そこで考えたのは、
動画のキャプチャーを自動で撮り、
静止画をOCRするという方法です。

■動画の分割

動画をフレーム単位で分割するには、
ffmpegを使います。

・ffmpegのインストール
こちらにお世話になりました

WindowsにFFmpegをインストールする方法 - Qiita
はじめにFFmpegは強力な動画・音声処理ツールですが、Windowsへのインストールに戸惑う方も多いでしょう。この記事では、FFmpegを手動でインストールする方法と、簡単にインストールする方法…

・ffmpegのフレームカットはこちらを参考に。

ffmpegで連番画像から動画生成 / 動画から連番画像を生成 ~コマ落ちを防ぐには~ - Qiita
#■ 動画や音声を扱うための非常に強力なツール ffmpegffmpegは動画や音声を扱うための非常に強力なツールです。LinuxやMac、Windowsでも使えます。扱えるフォーマットも多数あ…

■実行後

実行したところ、
194550個のjpgファイルができました、
多すぎだろ…

そこで、
重複したファイルを削除するアプリを使いましt、

Fast Duplicate File Finderというアプリです。
https://www.gigafree.net/utility/compare/FastDuplicateFileFinder.html

しかし重複しているファイルはやっと10477まで減るのみ。

この時点で詰みました。

■キャブチャーを手動でとる

しょうがないので、
必要な箇所のキャプチャーを手動でとることにしました、
かなりめんどくさいですが、
しょうがありません。

■OCRする

OCRはGoogleドキュメントが優秀です、
キャブチャーした画像をGoogle ドライブにアップし、
右クリックで「アプリで開く」を選択し、
Google ドキュメントに送ると、
自動でOCRしてくれます、
精度はかなり高いです。

■終わりに

とりあえず、
動画のテキスト化はできましたが、
かなりめんどくさい方法です、

早く動画からテキストを抜き出すAIが登場してほしいです。

以上。

コメント

タイトルとURLをコピーしました