Whisper の
インストール
バージョン 2.9 の新機能として、OpenAI が公開している Whisper という音声認識のアプリケーションを利用する機能を実験的につけました。CasualTranscriber 本体には含まれないので、別途インストールする必要があります。
Whisper は、Python と ffmpeg に依存するので、これらもインストールする必要があります。Python は、macOS に標準でインストールされていますが、Whisper を利用するためには、3.9 もしくは 3.10 が必要で、macOS のバージョンによっては、これらとは違うバージョンの Python がインストールされているため、別途インストールする必要があります。
CasualTranscriber では、パッケージマネージャーである Homebrew を利用して、Whisper および必要なアプリケーションなどをインストールするインストーラーを用意しました。ただ、Homebrew はインストール時に管理者権限が必要なので、公式サイトからインストーラーパッケージをダウンロードしてインストールしてもらう必要があります。
CasualTranscriber で Whisper をインストールすると、必要なファイルをダウンロードして、ローカルで書き起こしの処理を行うように Whisper の処理を変更します。具体的には、インストール時にこのページにある処理を実行します。
インストールプロセス
CasualTranscriber で Whisper とその実行に必要なパッケージをインストールするには、メニューの書き起こしから Whisper インストーラを選びます。このプロセスでは、Command Line Tools, Homebrew, Python 3.9, ffmpeg, Whisper をインストールします。
Whisper インストーラパネルが開きます。ここに表示される説明は、適宜変更する予定なので、現在のバージョンのものとは多少異なっているかもしれません。
Command Line Tools がインストールされていない場合、CT Tools インストールというボタンが見えるはずなので、クリックしてインストールしてください。インストールが開始されると、次のようなメッセージが出るので、インストールをクリックして、Command Line Tools のインストールを続行してください。
Command Line Tools がインストールされると、Homebrew がインストールされていなければ Homebrew ダウンロードのボタンが見えているはずなので、Homebrew ダウンロードをクリックしてください。デフォルトのブラウザで Homebrew のダウンロードページが開きます。
Homebrew ダウンロードをクリックして開いたページから、Assets のところにある Homebrew-x.x.xpkg と書かれているリンクをクリックして、Homebrew のインストーラパッケージをダウンロードしてください。 2024/11/17 現在、4.4.5 が最新バージョンのようです。
Homebrew がインストールされると、左下のボタンが消えます。
Whisper インストールをクリックすると、Whisper の言語モデルのリストが表示されるので、インストールしたいモデルにチェックを入れて、開始をクリックします。通常 Whisper を利用すると、指定したモデルを初回使用時にモデルファイルがダウンロードされますが、CasualTranscriber では、事前にダウンロードしたモデルのみを利用する方法をとっているので、あらかじめモデルを選んでダウンロードします。すでにインストールされているモデルはチェックが入れられないようになっています。モデルは、リストの下の方に行くほど、ファイルのサイズが大きくなり、音声認識に時間がかかりますが、精度は高くなります。
通信速度にもよりますが、Whisper を含めたアプリケーションのインストールには数分程度、モデルは大きなものを複数選ぶと、10分以上かかる可能性があるので、気長に待ってください。
Whisper のインストールが終了すると、次のメッセージが表示されます。これで、Whisper を使った書き起こしができるようになります。Whisper の利用ページに説明があるので参照してください。