新しい機能といくつかのバグフィックスを含む、新しいバージョンのベータ版を公開しました。バージョンは 3.0 です。
新機能
Apple Silicon Mac 向けに WhisperKit を使った自動文字起こし機能を追加しました。WhisperKit は、OpenAI の Whisper を Mac 向けにしたもので、Whisper は Mac では CPU だけで処理していましたが、Neural Engine を利用するため、文字起こしの速度が上がっています。また、英語に限れば、1/10 程の時間で、精度の低下もあまりないモデルも提供されています。WhisperKit 自体は CasualTranscriber に含めているので、モデルをダウンロードするための Command Line Tools のインストール以外は、外部アプリをインストールする必要がありません。
メディアファイルを m4a ファイルに変換する機能をつけました。これは、mp3 ファイルだと、タイムスタンプを使った際に再生位置がズレる問題があるため、m4a に変換して扱えるようにするものです。ffmpeg がインストールされていれば、それを利用することもできます。ffmpeg のインストーラもついています。
ポッドキャストのファイルをダウンロードする機能をつけました。これは、CasualConc と連携して音声付きコーパスを作るための補助機能で、RSS のアドレス、もしくは Apple Podcast のポッドキャストのアドレスを入力することで、そのポッドキャストの効果isれているファイルをダウンロードする機能です。
インターフェイスの変更
文書ファイルの見た目を変更して、再生・停止ボタンとタイムスライダー、再生時間など以外はデフォルトでは隠すようにしてあります。
バグフィックス
文字カウントをオンにしている場合に、文字入力中にクラッシュすることがある問題に対処しました。
メディアファイルから音声を抽出してファイルとして保存する処理で保存後にクラッシュする問題に対処しました。
ファイルデータベース・単語データベースが機能しなくなっていたものを修正しました。