AI活用の音声認識でコールセンターの通話をテキスト化するメリット3点をご紹介

AIを用いたコールセンターの音声テキスト化(文字起こし)
AIを用いた音声テキスト化(文字起こし)とは、人工知能が音声を認識して音声内容を全自動でテキスト化することです。会議や打ち合わせの録音データを聞いて文字起こしするといった従来のテキスト化作業とは異なり、AIが音声と言語を認識し、自動でテキストを打ち込んでくれます。
例えば動画の音声を自動でテキスト化して字幕を流したり、会議の議事録のベースとなるやりとりの内容のテキストを会議終了後に出力したりするといった活用事例がございます。
また、コールセンターでのオペレーターと顧客の通話内容をテキスト化する活用事例もございます。情報共有が重要なコールセンターにおいて、テキスト化のメリットはかなり大きいと言えます。
最近では、ChatGPTを開発したOpenAI社の文字起こしAPI「Whisper」の精度の高さと低いコストに注目が当たっています。これまでもAIを活用した音声テキスト化のAPIはございましたが、大規模言語モデルで開発されたWhisperの精度の高さは他社製品と比較して飛躍的に向上したと言えます。コールセンターシステムの中には、このような高精度の音声テキスト化機能を搭載したものもございます。
本記事では、ホットなトピックであるコールセンターのAI音声テキスト化機能のメリットについて3つほどご紹介いたします。
ナレッジマネジメントの強化
AIによる音声のテキスト化は、コールセンターのナレッジマネジメントを強化します。具体的には、オペレーターの教育・指導、それから高い顧客応対品質の維持に、音声テキスト化は貢献します。
まず、音声のテキスト化はオペレーターの教育・指導を効率化します。オペレーターに通話内容の改善点についてフィードバックをするとき、発話でのフィードバックだとメモを取り損ねたり、誤解した内容を書いてしまったり、時間経過とともに忘れられたりする懸念があります。音声だからこそ伝わりやすい内容もございますが、知識の定着が重要な教育や指導においては、テキスト化は欠かせません。高精度で自動テキスト化機能は、オペレーターにとって知識を吸収しやすく、次にアクションの改善点を文字からいつでも振り返ることができます。指導する側にとっても、テキスト化された通話内容は教材として使いやすく利用できるでしょう。
加えて、顧客応対品質の維持にも音声テキスト化は貢献します。というのも、発話内容とは異なり、テキスト情報は時間経過しても内容が残り続け、メモとして有効活用できるからです。例えば、担当とは別の営業スタッフが顧客対応する際にも、担当と顧客の通話内容がテキスト化されていれば、正確かつスピーディーに過去のやりとりの内容を把握できます。履歴がテキスト化されて共有されれば、担当者のスキルに依存せず、コールセンター全体で顧客や商材知識がシェアされるため、誰が対応しても水準の高いコールセンター運営が可能になるでしょう。
このように、AIによる音声テキスト化はコールセンターの知識を管理するうえで非常に有効だと言えるのです。
スムーズな情報共有を推進
AIの音声テキスト化はスムーズな情報共有にも貢献します。
まず一般的に、テキストの確認は音声の確認よりも短時間で行うことができます。過去の通話内容をチェックして、顧客に対する対応方針を決める時、通話ログを一つ一つ聞きなおしていると、時間もかかりますし重要なポイントを見定めにくくなります。
しかし、通話音声が自動でテキスト化されれば、過去の応対履歴を確認する際にも、テキストをスクロールして簡単に内容を把握することが可能になるでしょう。通話履歴の内容からマネージャーに架電の結果を報告する際に、報告書が必要になる場合や議事録の作成が求められても、音声のテキスト化によって録音内容を改めて聞きなおす手間が省けます。最近では、ChatGPT等の生成AIに文章を解析させることで、テキスト化された通話内容を要約するといったサービスもございます。
音声のテキスト化は情報共有を迅速かつ正確にするのに大いに役立つ機能だと言えるでしょう。
通話トラブル防止対策の推進
コールセンターや電話対応で頭を悩ませる課題は、「言った・言わない」のやりとりです。録音データやテキスト情報が残されていない場合、最終的には記憶を根拠にした主張同士がぶつかるため、らちがあかないことが頻繁に起こりえます。そのようなトラブルを回避させてくれるのが、AIの音声テキスト化機能です。
例えば、顧客からクレームを受けた際も、自動的に通話内容がテキスト化されれば、コールセンター内で情報をエスカレーションしやすくなります。チーム内でテキスト情報が円滑に共有されれば、クレーム内容をサービスの向上に役立つ意見として受け止めるか、それともクレーム顧客の言い分に妥当性がないか、等の判断が可能です。
さらに、オペレーター側の応対品質に問題がなかったかも音声テキスト化によって簡単に把握できます。もしテキスト化されるベースの録音音声が、話者同士を区別していた場合、オペレーターの音声のみ区別してテキスト化することが可能です。テキスト内容から顧客に対してNGワードを述べていたり、コンプライアンス違反の文言が見つかったりすれば、通話録音テキストの確認業務によって、大きな問題に発展する前にクレームや不正の火種を消すこともできるかもしれません。
そして、問題のあった通話内容のテキスト化内容を、センターの共有ナレッジとして管理すれば、通話トラブルをオペレーター側で未然に防ぐ対応フローも作成できるでしょう。文字化されたナレッジを蓄積することで、将来的なトラブルの回避ができる可能性が高まります。
このように、通話音声のAIテキスト化は、コールセンターを悩ませる通話トラブルのリスクを低減し、防止対策にも寄与すると言えます。
まとめ
本記事では、コールセンターのAI音声テキスト化機能の概要と、メリット3つについてご紹介しました。AIによる音声認識とテキスト化は、大規模言語モデルの出現により、Whisperを始めとして大きく精度が向上しました。特に、コールセンターでの活用例はブレイクスルーであり、導入メリットとしてナレッジマネジメントの強化、スムーズな情報共有、そして通話トラブルの防止対策の推進の3つのメリットをご紹介しました。
株式会社アセンドのOmni Contactは、高精度AIによる音声認識・テキスト化機能を搭載した、クラウドPBXの多機能コールシステムです。ChatGPTと連携した、通話内容の要約や評価もできる最先端の技術も取り入れています。もしコールセンターのAIソリューションについて、ご興味がございましたらお気軽にお問い合わせください。