bizSPA!フレッシュ

録音した音声を自動でテキスト化。2万円「最新レコーダー」の侮れない実力

お買い物

英語音声はかなり正確に認識!

 なお、プレゼンのような事前に話す内容が決まったものではなく、自由な会話の場合、精度的に少々厳しそうだ。Zoomの通信状態が悪くなり、電話での会話に切り替えたいという話をしているを認識させようとしたが、反応はイマイチだった。

 実際には、「すみません。お声、聞こえていますでしょうか?」「電波状態が悪いみたいです」「では、電話でのお話に切り替えさせていただいてもよろしいでしょうか」という会話をしているが、部分的にしか認識されていない。

AutoMemo_11

自由度の高い会話は認識精度が低下

 AutoMemoは、設定から認識言語を切り替えることで、72の言語で利用できる。YouTubeのWHO公式チャンネルで公開されている動画を使い、英語音声の認識精度をチェックしてみた。

 動画内の字幕と読み比べてみると、人物名などで一部誤認識が出ているものの、かなり高い精度で認識されている。テキストファイルをGoogle翻訳などを使って翻訳すれば、英語プレゼンの内容を短時間で把握するのに役立ちそうだ

AutoMemo_12

日本語に比べると認識精度は段違い

他のアプリと比較した場合の精度は?

AutoMemo_13

左がAutoMemo、右がSpeechyのテキスト化結果

 AutoMemoはレコーダーとアプリを組み合わせて使うものだが、アプリ単体で音声をテキスト化できるものも存在する。iPhone向け音声テキスト化アプリの「Speechy」で、先ほどの日本語のプレゼン音声をテキスト化し、結果を比較してみた。

 Speechyのほうが認識されずに飛んでいる箇所がやや多いかなという印象はあるが、全体的な精度にそれほど大きな違いはなさそうだ。またSpeechyの無料版は1回に録音できる時間が1分と短いため、実際に使う場合には1220円有料版の購入が必要になるだろう。

 買い切りであることを考えるとAutoMemoよりコスト面ではお得感がある。ただし、AutoMemoのように、テキストのタップで音声データを移動できる機能は備えていないため、音声を聞き直すときの作業効率はこちらのほうが下がりそうだ。

おすすめ記事