録音した音声を自動でテキスト化。2万円「最新レコーダー」の侮れない実力
「コロナ禍」を「このなか」と誤認識
アプリは毎月1時間まで無料でテキスト化が可能。それ以上利用したい場合は、10時間分980円で利用枠を購入するか、毎月30時間まで利用できる月額980円の定額プランに加入する必要がある。
2月3日現在、申し込みから6か月間は定額プランが無料になる「発売記念キャンペーン」が行われている。
では早速、認識精度を確認してみよう。1月29日にYouTubeでライブ配信された、楽天モバイルの新プラン発表会の音声を認識させてみた。iMacのスピーカーで音声を流し、その真下にAutoMemoを置いて録音している。
このプレゼンの最初の部分では「みなさんこんにちは。本当にこの、なかなか大変なコロナ禍の中〜」と話しているが、冒頭の挨拶が認識されておらず、新語である「コロナ禍」は「このなか」と誤認識されている。
そのほかにも、正しく認識されていない単語や、実際には話されている言葉が認識されずに飛んでいる箇所などがあるので、テキストデータを見ながら録音を聞き直し、修正していく作業は必須になるだろう。文字起こしを完全に自動化するような機能をイメージしていると期待外れに感じるかもしれないが、ベースとなるテキストがあるだけで文字起こしの時間は大幅に短縮できる。
電話や打ち合わせは認識しにくい?
テキスト化されたデータは、「共有」ボタンからDropboxなどのクラウドストレージやメールに送ることが可能。テキストファイル内に記載されたリンクからは、元の音声ファイルをダウンロードすることもできる。
テキストの手直しは、PCでテキストファイルを開き、スマホのAutoMemoアプリで音声を聞きながら行うと作業しやすい。
その際に便利なのが、文字をタップした箇所から音声を再生できる機能だ。気になるところをピンポイントで聞き直したり、不要なところを飛ばしたりしたい場合に重宝する。