第34回 人工知能学会全国大会 参加報告

こんにちは
AIチームの友松, 杉山です。
6/09(火)-6/12(金)でオンライン行われた2020年度 人工知能学会全国大会に参加させていただきました。今回は、AI Shiftメンバーが聴講した発表の中からいくつか抜粋して紹介できればと思います。

また、AI Shiftからインタラクティブセッションで「チャットボット運用効率化のための新規問い合わせ候補抽出システム」というタイトルで発表しており、そちらに関してはこちらのブログを御覧ください

友松

[1I4-GS-2-01] ポインタ生成機構を用いたキャラクター応答生成の検証

QAシステムにおいてキャラクタ性をもたせた応答を生成するために、少量のキャラクタの発話データから個性を学習する研究。MPQGと呼ばれるポインタ生成機構を改良し、K種類のキャラクタ応答を得られるようにしている。ユーザ発話に対してコールセンターの受付、ツンデレな女の子、頼れるお兄ちゃんのキャラクターを対象とした応答を生成する。評価はこれから行われる。

[2D1-GS-9-02] 外国語語彙学習のための教師なし深層異常検知に基づく語の用例の多義性・主要性の提示

モチベーションとしては英語学習者のために優先的に勉強すべき単語を出したい、その際に多義語に関しては特殊な使用例を省きたいという研究。アプローチとして語義曖昧性解消をつかわずに、主要な使用例と特殊な使用例を区別できれば良いという観点から異常検知の枠組みを利用している。混合正規分布モデルの一種のDAGMMを用いて異常度を計算し精度の検証と可視化を実施した。

[2D1-GS-9-03] 高信頼度な文法誤り解説生成のための生成制御手法

英語学習者のユーザの入力に対し、文法的に誤っている箇所を解説する文(例: ○○は他動詞なので、目的語に前置詞はいりません)を生成する際に解説自体に誤りが含まれることがクリティカルなので信頼度を求めようとする研究。文法誤り解説生成で2種類のアプローチを取っており、検索ベースの手法とRetrieve & Editに対して4種類の信頼度を提案している。信頼度の傾向は事例や条件により変動しており、さらなる調査がFuture Worksとなっている。

[2D1-GS-9-04] 英語エッセイテキストに対する段落タイトル付与コーパス

段落からタイトルを生成する問題。必ずしも文章からの抽出ではないケースもある。センター試験の6問Bが段落タイトル付与問題となっており、以前の研究で90%以上の関東率を達成している。通常このようなデータセットが存在しないので作成し、研究利用可能な形で提供を行ったという研究。3つの異なるドメインのデータセットに対し大卒以上の英語ネイティブが1文あたり5名割り当てられてコーパスの作成を行った。また、いくつかのモデルを用いて評価を行っている。よくあるニュース記事からヘッドラインを生成する際は最初の文がかなり有効であるのに対して、今回のケースの場合は文章全体を対象としている。

[3O5-GS-13-03] カウンセラーの対話スキル分析に向けたマルチモーダルデータコーパスの収集

プロのカウンセラーの暗黙知とされている対話スキルを顕在化させたいのがモチベーション。美容カウンセリングの音声データと言語データに対してクライアントが納得した箇所をアノテーションしマルチモーダルデータコーパスを作成。言語特徴で統計的有意差が現れた特徴に関して分析を行っている。またユニモーダルでは言語特徴よりも韻律的特徴の有効であることを示している。
以前ブログでも取り上げさせていただいた東京都立大学小町研との取り組みである、AI Shiftにおける共同研究の取り組み内で紹介させていただいた経験の浅いオペレータの発話をベテランオペレータの発話にスタイル変換するタスクにモチベーションが近いものがあり拝見させていただきました。

杉山

[1E4-GS-9-05] コールセンターの業務改善に向けた応答マニュアルの分析と検索手法の検討

コールセンターでの、問い合わせに対する回答ドキュメントの検索は難しく、弊社でも過去に取り組んでいました。
本研究は、事前にドキュメント群をクラスタ化しておき、オペレーターが問い合わせ内容に関連しそうなクラスタを選択することで、そのクラスタ内で検索するという二問二答形式を用いて検索結果の絞り込みを試みるものでした。word2vecとIDFでドキュメントをベクトル化してk-meansでクラスタリングした結果をword cloudで可視化、オペレーターはそれを見て関連しそうなクラスタを選択するという手法でした。教師なしであるクラスタリングの結果をword cloudで可視化したものから尤もらしいものを応対中という環境下でスピーディーに選ぶというのは、私の経験上厳しそうだなとも思いましたが、二問二答形式で検索結果を絞り込むという枠組みは有効であると感じました。今後、リッチなベクトル化手法や可視化方法の選定次第では、広く利用できる可能性を感じました。

[3J5-OS-9b-01] 意思決定を通じた緩やかな対話誘導を行う対話システムの実現

筆者が、人の意思決定を緩やかに誘導する対話システムを実世界で動作させ検証を行った結果についての報告であった。選択式対話システムで人の選好や購買行動に影響を与えることができると述べられており、チャットボットでのアップセルを考えている我々には興味深い内容であった。
個人的に、「対話とは、正確に相手の音声を認識し、破綻のない返答をすることではなく、意思決定を通じた相手との文脈やストーリーの共有を実現することではないか」という提言が胸に刺さった。弊社は音声対話システムについての共同研究を行っているのですが、理想の対話についてや音声である意義について考える中で、別の切り口で考えるための気づきを得ることができました。

[3Rin4-09] 文字列・音の類似度を考慮した深層学習に基づくテキストの正規化

こちらの発表は、文字列と音(読み)の類似度を用いてスラングを含む文章を正規化するものでした。文字列と音をそれぞれDeep LevenshteinとDeep Metaphoneを用いて学習することで、実際に正規化のスコアが向上することが報告されていました。
また、この読みを用いた文の正規化は、今弊社が取り組んでいる誤り訂正にも適用することができる考えだと思い、大変参考になりました。

[4Rin1-71] マルチモーダル感情表現を用いて説得を行う音声対話ロボット

こちらは、昨年の対話システムシンポジウムの記事で紹介させていただいた研究の続きで、当時は感情音声データとその伝達度合いの調査まででしたが、それを用いて説得までの実験を行った結果の報告でした。平静の場合に比べて、適切に感情を付与した音声を用いて説得を行うと、かなりの効果があることが報告されており、今取り組んでいる音声による自動応答を行う際にも感情を積極的に用いた方がいいのではないかと思うほどでした。最適な対話戦略や感情状態の遷移戦略を自動で行うのは難しいとは思うものの、いずれは音声自動応答には必須の技術であると感じました。

終わりに

AI Shiftとしては、3月に行われた言語処理学会ぶりのオンラインでの学会参加となりました。2回目のオンライン学会ということもあり多少慣れてはきたものの、やはりオンライン特有の難しさもあると感じます。オンラインのメリットを最大限活かしつつ、質問が出にくいなど難しい面が改善されていけば今までよりも良い形式になると思うので、今後も改善を続けていきたいと思います。
来年の全国大会は仙台で行われると発表がありましたが、COVID-19が落ち着き、来年は現地で開催できることを祈っております。