テープ起こし・文字起こし、スマホアプリでの音声認識率を上げるのに心がけること

こんにちは。カナ文字工房の関香奈枝です。今回は「テープ起こし・文字起こし、スマホアプリでの音声認識率を上げるのに心がけること」というテーマで話を進めていきます。
スマホアプリでの音声認識技術は、かなり向上してきました。インタビューなどの文字起こしに使う方もいらっしゃると思います。少しでも音声を正確に文字化するためには、どんなことに心がけたら良いのかを以下にまとめましたので、ご覧ください。
結論:スマホが認識しやすくできるように人間が配慮する
スマホが音声認識を正確にできるようにするには、以下を心がければ良いと思います。
・マイクに口元を近づけて録音
・スマホを人数分用意できる
・単語登録をする
・文章全体を話す
・滑舌よく話す
・静かな場所
音声認識アプリを使って静かな場所で一般人の私が話した場合、正答率はおよそ85%でした。NHKアナウンサーなどの発話の訓練を受けた人の認識率でも正答率は90%台であり、全てを正確に文字化できるわけではないのです。
機械は融通が利かないので、機械が認識しやすくするように人間のほうが動く必要があります。しかし予算やマンパワー、かけられる時間には限りがありますので、全ての条件をそろえられないかもしれません。そんな場合は、どうしたら良いのでしょうか。
上記の条件をそろえられない場合は?
上記の条件がそろえられない場合は、スマホアプリより人力テープ起こしのほうが正確にできます。私が作業していて人力でテープ起こししたほうが良い場合は、以下のとおりだと思います。
・そもそも機械操作が苦手な人が議事録作成担当者になっている
・講演会などで放映される動画の音声も文字化する
・マイクを口元に近づけての録音ができない
・スマホを発話する全員分、用意できない
・滑舌の悪い人が参加している
・会場が広くて音が反響する
・窓を開けて会議する
・周囲で環境音がする
ーーーーーーーーーーーーーーーーーーーーーー
最後までお読みいただき、ありがとうございました。この記事が、あなたの何かに役立てば幸いです。