一般社団法人 自治体DX推進協議会

自治体PR・業務効率化を支援。高精度の音声認識エンジンが生んだ2つのソリューション

自治体の業務は「人」との接点が多く、接する人の数も膨大である。自治体職員は日々煩雑な他業務と並行しながら、一人ひとりの問い合わせや相談に応じている。それらの業務が、心身ともに多大な労力を要していることは否定できない。

キャラクターAIとの自然な対話が可能な【AI Avatar AOI】と、電話応対を支援する【AmiVoice Communication Suite(以下、Communication Suite)】が、自治体における対人業務のDXに挑戦する。

 


 

株式会社アドバンスト・メディア CTI事業部長 今宮 元輝様

株式会社アドバンスト・メディア
CTI事業部長 今宮 元輝 プロフィール
  • 2012年 アドバンスト・メディア入社。
  • 2012年~2016年 コンタクトセンター向け音声認識システムの営業として約8000席へAmiVoice を導入
  • 2017年〜2018年 プロダクト事業推進グループ長としてオンプレミスのシステム提案~導入プロジェクトを統括
  • 2019年~現在 CTI事業部長として導入プロジェクト、製品開発等事業部運営を統括


 


 

株式会社アドバンスト・メディア CTI事業部 営業グループ 田浦 怜奈様

株式会社アドバンスト・メディア
CTI事業部 営業グループ 田浦 怜奈 プロフィール
  • 大学在学中コールセンター業務に携わり、令和3年に株式会社アドバンスト・メディアへ入社。
  • おもに電話応対業務向け音声認識システムのコンサルティング販売業務を担当する。


 


 

 

正確性と柔軟性の両立を目指すAI音声対話アバター

まずは【AI Avatar AOI】の概要と開発のきっかけを教えてください。

今宮

【AI Avatar AOI】は、PC・スマートフォン、デジタルサイネージ、VR・メタバースなど、あらゆるデバイス上で利用できるAI音声対話アバターです。無人でお客様対応ができるため、問い合わせ対応の省力化・効率化、人手不足の解消、リモートワーク環境における顧客接点の強化等にお役立ていただけると想定して、2022年8月に発表いたしました。

 

当社の主力製品の一つは【AmiVoice Communication Suite】というコールセンターのオペレーターや管理者向けに業務を支援するためのシステムですが、昨今、世の中で話題になっている「AIによって無くなる仕事」といった調査で「コールセンターの案内係」が上位にランクインするケースが見られるようになってきました。

将来的な市場の動向を正確に予測することは困難ですが、従来のビジネスでターゲットにしていた市場が縮小した場合を考え、常に新たな製品の企画、開発を意識しておりました。

 

“企業と顧客の接点”という部分で考えると、まだ今の段階では「コールセンターのオペレーター通話」自体は減少していません。しかしコロナ禍以降、対面チャネルが激減する一方でSNSやチャットbot等の活用が拡がり、顧客接点の手段が著しく多様化しました。この現象は、技術の発達とともに今後も加速していくでしょう。

 

ただ、手段が如何に多様化したとしても、それぞれのチャネルごとに得手不得手というものがあります。対面であれば音声・映像・テキストを全て使うことができますが、無人化はできません。チャットbotは無人で運用できる一方で、音声や映像の使用は難しいことが多いですよね。つまり、対面では当たり前であったものの一部を切り離しながら、ユーザー側が自身のニーズに合ったチャネルを選択しているという現状があります。

 

その中で、様々なデバイスでAI音声対話アバターが利用できれば、音声・映像・テキストを全て使えて、かつ無人化も実現できるのではないか─。そのような考えに至ったことが、【AI Avatar AOI】開発の経緯です。

 

 

─実際の導入事例について

今宮

企業様のメタバースのイベントでお客様案内係として活用いただく等のケースのほか、自治体様における活用事例としては、茨城県公認Vtuber「茨ひより」のAI化が挙げられます。「ニコニコ超会議2023」やシンガポールで行われた東南アジア最大のポップカルチャーイベント「Anime Festival Asia Singapore 2023」にて、茨城県の魅力の発信に活躍したキャラクターです。

 

茨ひより自体は既存のキャラクターだったので、音声合成エンジン(テキストを声にする技術)の作成にあたっては音声の提供にご協力をいただきました。また、茨城県の魅力を発信するからには誤った内容の発言を出来る限り減らさないといけないため茨城県の特産物や観光名所等を数多く学習させました。

 

面白い取組としては、茨城県の委託のもと、茨ひよりの企画制作を行っているトリバルコン社と協議してどんな質問をしても全て茨城県の話で終結するようなチューニングをしてみました。たとえば就職活動について相談すると、最初は「大変ですよね、自分のやりたいことを見定めて…」など一般的な回答をしていくのですが、最終的には「茨城県には良い会社がたくさんあるので、ぜひ茨城県に就職を検討してくださいね!」という感じで終わります。正確性を大切にしつつ、遊び心や楽しさを加えて提供している点も特徴ですね。

 

その他、茨城県庁の受付横にサイネージを設置し、AI茨ひよりが来庁者へ案内する取組を試験的に行いました。県庁のフロアマップ等を学習させ、受付業務をAI茨ひよりが代行したのです。

 

ちょうど地元の小学生が県庁見学に訪れる時期で、「AI茨ひよりへの質問」が見学のプログラムに組み込まれていました。代表児童数名からの質問に一通り答えることができ、良いものを見せられたなと嬉しく思っています。教育という観点でも面白い施策だったのではないでしょうか。世間からの反響も大きく、テレビ局が取材に来たり、新聞等あらゆるメディアで記事化されたりもしました。

 

ニコニコ超会議2023に登場した茨ひより

 

 

─【AI Avatar AOI】を開発する際に重視したことや苦労したポイントは

今宮

AI対話のアバターやキャラクターは、以前から存在はしていました。しかし従来型のAIは機械学習のような形で教え込んだ内容を答えるだけなので、柔軟性に乏しくユーザー体験として面白味に欠けるという弱点があります。実際に、当社が過去にリリースした【AOIブラウザ】というサービスも、あまり世に拡がりませんでした。

 

ターニングポイントとなったのは、2022年後半のChatGPTをはじめとした生成AIの登場です。どんな質問をしても自然な文章で返ってくるという技術が一気に拡がったことで、AI対話型アバターを進化させる大きなチャンスだと感じ、いち早く【AI Avatar AOI】もChatGPTに連携させました。

 

対話力が上がったのは喜ばしいことですが、一方で課題となったのは「ハルシネーションをどう減らすか」ということです。嘘や誤った情報を発信してしまうと実運用に支障が出ます。そこで、事前に教えた情報から参照して正しく回答するようにチューニングする、絶対的な正答がある質問については敢えてChatGPTを噛ませず従来方式のAIに繋ぎかえる等のハイブリッド型で対策することも可能にしました。そうすることで正確性をある程度、確保しながら柔軟性を加え、AI対話アバターへのChatGPT実装を実現させたのです。

 

また、ChatGPTの文章をアバターがそのまま喋ると無機質な印象になってしまうので、回答の仕方に遊び心やキャラクター性を加えて、ユーザーとアバターが楽しく対話できるように工夫しました。

 

─音声認識の精度が非常に高いと伺いました

今宮

もともと当社は音声認識を専門としてきた会社で、【AmiVoice】という国内シェア№1(※1)の音声認識エンジンを提供しています。その技術があるからこそ、AI対応の中で最も重要な“耳”に当たる部分を、高い精度で最適化してコントロールすることが可能なのです。
 
固有名詞や地域独特の言葉などを正確に認識・表出できるのは、当社の非常に大きな強みだと自負しています。長年培ってきた音声認識のバックボーンと新技術のAIを掛け合わせ、キャラクター性も大切にしながら出来上がったのが【AI Avatar AOI】です。
 
「AIとの対話」という観点だけでいえば、SiriやGoogleが既に実装されていて、いつでも誰でも使える状態ではあります。しかし、「スマートフォンに向かって話しかける」という行為が非常に無機質であるからか、実際の能力を十分に発揮できていません。擬人化したAIアバターと楽しく会話ができるようになれば、「AIに話しかける」ことへのハードルが格段に下がり、使っていただきやすくなるのではないかと感じています。

 

─【AI Avatar AOI】が目指す今後の展望についてお聞かせください

今宮

現時点でもPCやスマートフォンで使える「マルチデバイス対応」が特徴なのですが、実はさらなる進化系を目指しています。それは、どのデバイスでAOIにアクセスしても、同じAOIと対話ができること。デバイスを切り替えても過去の会話が継承され、ユーザーのパーソナライズができるような形を目指しています。
 
たとえば観光地の駅のサイネージに映るご当地キャラクターにおすすめの店や観光スポットを尋ねる所までは、今までのAIでもできていました。一方、前述の意味でのマルチデバイスが実現すれば、同じアバターをQRコード経由等でスマートフォンに読み込み、手元に置くことが可能になるのです。スマートフォンに移した後も最初の会話が継承されているので、アバターがそのまま目的地までの道案内や道中のガイドをしてくれます。
 
対自治体様でいうと、観光地の町おこし等の分野において、非常に柔軟な使い方ができるのではないでしょうか。コアになる技術はある程度出来上がっているので、そう遠くない将来に実証実験・実装へと向かっていく予定です。
 

音声認識結果や自動応答の内容は、管理画面から確認・編集が可能

 

 

 

電話応対業務の支援に特化した
音声認識ソリューション

─後半は【AmiVoice® Communication Suite(以下、Communication Suite)】についてお伺いします。まずは概要と開発の背景をお聞かせください

田浦

音声認識の技術を用いて通話内容をリアルタイムにテキスト化し、電話応対業務を支援するシステムで、もともとは企業のコールセンター向けに開発が始まりました。というのも、コールセンターの電話応対には様々な課題があったのです。
 
課題の内容として例を挙げてみましょう。まず、終話してから通話内容を記録する作業に膨大な時間がかかること。次に、通話中にわからないことが出てきたら保留にして調べる必要があること。そもそも記録を作るためにはメモを取りながら通話しなければならず、会話に集中しづらくなること。複雑な案件において、相手との会話を中断できないために管理者のフォローが得られず、結果として問題が大きくなってしまうケースもあるでしょう。
 
一方で、【Communication Suite】で通話内容をテキスト化しておくと、ゼロから記録を作成するよりも作業時間が大幅に短縮されます。通話中にメモを取る必要がなくなり、お客様との対話に集中できるでしょう。さらにはリアルタイムのテキスト化なので、関連する資料が自動的に表示され、保留時間の短縮・スムーズな案内にも繋がります。管理者側には全ての席の通話内容が共有されており、オペレーターが保留や“手挙げ”でSOSを出さなくても、素早くフォローに入れます。
 
コールセンターの通話は、企業様にとって非常に重要な「お客様との接点」です。通話内容には膨大な量の「お客様の声」が隠されていたり、金融関係のコールセンターではコンプライアンスチェックのために記録が重要であったりもします。そのため、通話内容のテキスト化に対するニーズは昔からあり、当社でも2003年頃から声を単体でテキスト化する製品を提供していました。その後、お客様のご要望をもとにしながらコールセンター向けにパッケージ化した製品が【Communication Suite】です。

 

管理者は全オペレーターの通話をリアルタイムでモニタリング


 

事前に登録したキーワードを音声認識して関連資料を表示

 

 

─自治体様を含め、かなり現場への導入が進んでいると伺いました

田浦

最初は民間企業様を中心に拡がりまして、現在すでに500社を超える企業様にご利用いただいております。そして一昨年くらいから一気に、自治体様からのお声がけや、実際に導入されるケースが増えてきたのです。10年ほど前にも警察の相談窓口のような所で少数の導入はあったのですが、現在では水道局、政令指定都市の住民向け相談窓口、児童相談所など、部局も多様化しています。
 
その中で、前述の「コールセンターの課題」というものは、自治体様やの電話窓口や相談窓口にも同じように当てはまることが見えてきました。自治体様に【Communication Suite】をご活用いただけば、職員の方の負担軽減はもちろんのこと、住民の方に対するより良い応対や情報提供にも貢献できると考え、自治体様向けに本格的な展開を始めた次第です。
 
自治体区分でいうと、現状では市以上が主になっています。5席から数千席まで対応可能なのですが、窓口の種類と導入席数は千差万別ですね。警察の相談窓口で6席、水道局で80席など、児童相談所は県で10席というパターンもあれば、80席で導入いただいている政令指定都市もございます。

 

 

─類似製品との差別化ポイントについて教えてください

田浦

主に三つの特徴がございます。まず、世の中には様々な電話機や電話基盤環境があり、特に自治体様の場合は昔からずっと同じ固定電話機を使い続けている所も多いです。しかし、他サービスでは既存の電話機に音声認識をそのまま繋げることができず、電話機の交換を要するケースが少なくないと聞いています。
 
一方で弊社の製品は、基本的には今ある電話機からそのまま音を取って音声認識をすることができるので、電話機を丸ごと交換するコストをかけずに音声認識を使い始めることが可能です。ここは他社様との違いとして、ユーザーの皆様から評価していただけているポイントですね。
 
二つ目は、やはり音声認識の精度の部分です。自治体様ですと、高齢者や滑舌が明瞭ではない方からの問い合わせや、屋外から電話をかけて来られる方など、様々なパターンが考えられるでしょう。これらは音声認識にあたって良好な環境とは言えないのですが、当社は過去の実績から精度の高い音声認識エンジンを提供しておりますので、100%とは言えずとも正確性の高いテキスト変換が可能になっています。
 
そして三つ目としては、使いやすい画面GUI(Graphical User Interface)が挙げられます。たとえば単語の登録や資料の表示等も簡単な画面操作で可能な設計になっており、一般職員の方々にも無理なく使いこなしていただくことが可能です。専任のIT職員さんを置くことが難しい自治体様においても活用しやすいのではないでしょうか。導入後に使われなくなるパターンを避けるためにも、使いやすさにこだわりたかったのです。

 

 

─デジタルスキルの問題は自治体DXにおいて大変重要だと私共も認識しています。開発・展開にあたって重視した点はありますか

田浦

コールセンター向けのパッケージソフトとして製品化したことです。通話を単純にテキスト化する製品は他にもあったのですが、コールセンター特化型の製品として展開したのは、おそらく当社が初であったと記憶しています。
 
そもそも音声認識は手段であり目的ではありません。VOC(Voice Of Customer:お客様の声)を知りたい、コンプライアンスチェックをしたい等の手段であり、テキスト化するだけでは正直あまり意味のない行為に過ぎないので、コールセンターの課題解決に繋がり真に役立つ製品としての開発を目指したのです。
 
とはいえ私共は自社でコールセンターを持っているわけではありませんし、コールセンターに関するプロフェッショナルではないので、ユーザーの皆さんの意見をUI(User Interface)に反映できるよう意識してきました。製品を良いものにするためには、何物にも代え難い「現場のプロからのご意見・要望」をヒアリングしながら、どんどん取り入れて今の製品が出来上がっています。

 

 

─導入された自治体様からのフィードバックや要望・改善点について

田浦

いくつかの自治体様で実証実験を進めている中では、「機能を使いこなせるのか分からない」という声が散見されます。【Communication Suite】は豊富な機能が特徴でもありますが、一つのソリューションをお渡しするだけで全て使いこなしていただけるケースは極めて少ないです。
 
そこで、直接もしくは代理店を介して密にコミュニケーションを取っているほか、ユーザー様向けオンラインコミュニティもご用意いたしました。アカウントは無料で作ることができ、ある程度はユーザー様同士で疑問や不安の解決が可能ですし、もちろん直接のコミュニケーションでも皆様の困りごとを解消できるよう手厚くサポートさせていただきます。

 

 

 

自治体業務の負荷を軽減し課題解決へ導く

─最後に、お二方から自治体の方々へのメッセージをお願いします

今宮

【AI Avatar AOI】は、住民の方々・観光客の方々・その他の皆様と自治体様との新しい接点になると考えています。これからの時代は人口減少や高齢化が加速し、各自治体様が「どのように自らの自治体をアピールしていくか」という課題と向き合っていくことになるでしょう。【AI Avatar AOI】の技術は、それらの分野に間違いなく活用いただけると確信しているので、ぜひご検討いただければと思います。

 


 

田浦

【Communication Suite】に関しては、「相談業務」という観点からお話をさせていただきます。自治体様の相談業務は昔からずっと業務負担が高い状態にあると考えています。電話応対はもちろん、児童相談所であれば、48時間以内に直接面会して安全確認をしなければならないというルールがあったりもしますよね。そこで働く皆様は、様々な業務を掛け持ちしながら住民からの電話相談に応じ、記録の作成等も担っていらっしゃいます。

 

当社の【Communication Suite】は、記録作成までを含めた電話応対業務を協力にサポートできる製品であると自負しています。ぜひ自治体DX推進における検討材料の一つとしてご検討いただき、負荷の高い相談業務の効率化・省力化にお役立ていただけましたら幸いです。

 

以前は民間企業様が中心でしたが、既に自治体業務への導入も始まっています。具体的にどのようなことができるのかを直接ご案内できたらと思いますので、ぜひお気軽にお問い合わせください。

 

 
 
 

AI音声対話アバター AI Avotar AOI

コンタクトセンター向け音声認識ソリューション AmiVoice® Communication Suite

 


 

株式会社アドバンスト・メディア 企業概要

音声認識ベンチャーとして1997年12月に設立。翌1998年、Interactive Systems, Inc.社(米国)と日本語音声認識システムAmiVoiceの共同開発を開始。以後、AmiVoiceをベースとして、医療や英語学習等に特化した様々なアプリケーションをリリース。
2009年、コールセンター向け音声統合ソリューション「AmiVoice CommunicationSuite」をリリース。2015年頃より人工知能技術の活用に着手し、2022年8月にAI音声対話アバター「AI Avatar AOI」を開発。

カテゴリ一覧

アーカイブ

その他の自治体DXガイド

鍵管理のDXで自治体の課題を解決<br>災害時の避難所の鍵問題にも対応する革新的システム「Traka」

鍵管理のDXで自治体の課題を解決
災害時の避難所の鍵問題にも対応する革新的システム「Traka」

プレミアム商品券・地域通貨のデジタル化で自治体の負担軽減と消費者利便性向上を実現

プレミアム商品券・地域通貨のデジタル化で自治体の負担軽減と消費者利便性向上を実現

「さるぼぼコインで地域に根付く経済循環」<br>飛騨市、電子地域通貨で関係人口を拡大

「さるぼぼコインで地域に根付く経済循環」
飛騨市、電子地域通貨で関係人口を拡大

「良い人が得をする世界」を実現する<br>ふるさと納税NFT・WEB3事業とは?

「良い人が得をする世界」を実現する
ふるさと納税NFT・WEB3事業とは?

自治体DXガイドの一覧はこちら

無料相談・お問い合わせ

地方自治体と事業者の架け橋となり、デジタルトランスフォーメーションを通じて地方創生を加速するパートナーシップの場を提供します。お気軽にお問合せください。

無料相談・お問い合わせ

TOP

一般社団法人 自治体DX推進協議会