知識科学基礎

	【問題点】対話システムの問題点は何ですか?具体例を書いて、問題を指摘してください。
	【解決策】今までの3回の講義の内容を踏まえて、解決策を書いてください。
  • 【問題点】話者の気持ちを理解した話し方をできない。
    • 【解決策】音声だけでなく、表情などの視覚や、誤解があった場合の処理機能をつけるべき。
  • 【問題点】ニーズに答えきれない
    • 【解決策】応答やキーワードを分類ごとに分けて、対応できるようにする
  • 【問題点】その状況状況で適切な解釈をした返答であるかどうか。
    • 【解決策】システムをもっと細かくしていく
  • 【問題点】音声認識の弱さ
    • 【解決策】大規模なデータの蓄積と統計的モデル化手法を発達させ認識精度を上げる。
  • 【問題点】不自然な対話。例えば「こんにちは」→「わあ、スゴい」などといったもの。対話システムのキャラクターが定まっていない。(男性?女性?大人?子ども?)
    • 【解決策】まず、エキサイト翻訳のようにある単語にある単語をがっちり対応させる。それで対話実験を繰り返し、コンピューターに学習システムを搭載し、しっかり対応した言語で不自然なものがあれば、yesかnoで良かったか悪かったかを評価→こういう場合はこういう風に返すのだと覚えさせる。
  • 【問題点】こんにちは と入力すると、こんにちは と返答するが、こんにちわ と入力すると認識されない。→間違ってた語が認識されない。
    • 【解決策】キーワードとしてこんにちは、こんにちわ、こんちは等考えうる「こんにちは」に代わる言葉を登録し、状態遷移を使って、これらが入力された場合に「こんにちは」と正しく返答されるようにする。
  • 【問題点】該当するキーワードの登録が少ないために、返答に曖昧な表現が多くなってしまっている。そのままだとは対話にはならない。例:「今日は晴れますか?」→「へぇー」そこで、より対話らしい返答ができるようにシステムにもっと多くのキーワードを登録すればよいとおもう。
    • 【解決策】対話システムとして、自然な会話が成り立つようにするためには、なげかけた言葉に対して適切な返答がかえってこなければならない。相づちをうつ場面ではないのに相づちをうたないなど。そのためにシステムが言葉を受けるときに返答を選び出すためのヒントを得なければならず、そのキーワードは多い方がよいとおもう。
  • 【問題点】文に対して適切な応答がなされない点
    • 【解決策】人間らしい会話を望むなら、追加された対話規則などを人の手によって管理する
  • 【問題点】聞きたいことを言っても無視されたり、期待した返答が返ってこない場合が多い
    • 【解決策】返答できる答えの数を増やす
  • 【問題点】応答がランダムだと、会話が成立しないことがある。たとえば、「こんにちは」と入力して「それな」と返されるなど。
    • 【解決策】まず一回めの講義では、キーワードで応答を絞るということを学んだ。さらに前回は正規表現で置きかえることを学んだ。たとえば「こんにちは(名前)です」といれたら「(名前)さんこんにちは」と返される、など。
  • 【問題点】"実際に対話システムを使う場面になった場合喋る内容がない"
    • 【解決策】キーワードを増やし、それに対応できるように状態をもっと把握できるようにする
  • 【問題点】対話に対する応答が適切ではない場合、例えばSiriにおいては受け答えを求めているのにも関わらず、検索を開始してしまうという点
    • 【解決策】1回目の講義で学んだ置換を出来る限り長い会話でも行えるようにインプットしておく
  • 【問題点】めいちゃんのをみて思いましたが、システムに入ってることを表現して、わかりますか?と問いかけてわからないと答えても無視されているというところがなんだかもう少し何かできるのではないかと思いました。
    • 【解決策】おわかりですか?などの問いかけならイエスとノーの二つの応答を考えればよいと思うので、正規表現で対応できそうだと思います。
  • 【問題点】話しかけた人が言ってほしいような答えを言えない時がある。
    • 【解決策】表情を読み取れるようにする。
  • 【問題点】二つ以上の意味をもった言葉をどっちの意味で会話に使うかの判断。具体例として、「どれくらい」ということばをだす。あなたはどれくらいのお金を持っていますか?とあなたは宿題をどれくらいしましたか?などがある。
    • 【解決策】どちらも判断せずに、どれくらいなどの数や量をあらわすキーワードが出たらわかりませんなどの曖昧表現を使う
  • 【問題点】言葉が堅苦しいので親しみがなく、相手に好印象をあたえない点。例えばMMDAシステムは喋る言葉が単調である。
    • 【解決策】パソコンで言葉をつなぎあわせるのではなく、生身の人間が話したことを録音する。
  • 【問題点】返答パターンが限られているため、「こんにちは」「〜〜はどこですか」のようにパターン化されている質問は違和感なく会話が成り立つが、不自然な会話になってしまっていたり会話が成り立たない場合がある。
    • 【解決策】あるキーワードに対して返答するパターンをいくつか用意して、そのパターンに応じて状態遷移のパターンを増やして、ある程度システムの方で対話の流れを作ってしまうと、人間主導での会話にならないためある程度不自然のない対話になるのではないか。
  • 【問題点】どう似た意味を持つ文章を探すかと言う点や、同じ文章でも場合によって意味が全く異なってしまう点や、文章一つだけ取り出しても何を意味しているのかわからない点。
    • 【解決策】データを、徐々に集めることしかないと思います。
  • 【問題点】"iPhoneのSiriを使用しているとき、自分の声が低いからか、Siriが正しく聞き取らないことがある。声のトーン、ボリューム、速さに質が左右される。"
    • 【解決策】声のトーン、ボリュームや速さによって完全に聞き取れなかったとしても、聞き取れた部分からキーワードを抽出して対話を成り立たせるシステムの構築。曖昧な応答、置換、キーワードによる対話システムの発展。
  • 【問題点】単語に反応しているだけなので会話の内容にそぐわないものも返答となること。例えば ごはん→おいしい だと Q「ごはん食べる?」 A「おいしいよね。」
    • 【解決策】キーワードにタグをつけるなどしてパターンを複雑化する。可能であれば主語と述語(できれば目的語も)をまとめてタグ付けしてパターン化すると受け答えに近づくのではないか。
  • 【問題点】「こんにちは」という問いには「こんにちは」と返すことができるが、予測できていない問いかけをされると答えることができなかったり、また、違う問いと認識して、的外れな回答をしてしまうことがある。
    • 【解決策】問いかけに答えるだけの音声的な認識に加え、相手の表情やしぐさを読み取ることができたり、時代に合わせた解答を増やしていくことが大切であるように思う。
  • 【問題点】"同音異義語を単体で発声すると、聞き取りの場合、誤解する場合がある。例えば:くも(雲・蜘蛛)"
    • 【解決策】どの同音異義語も回答が同じでもおかしくないように、相手に質問をして、キーワードをもっと引き出す。そして、予想される言葉でなるべく分類する。組み込まれていないのは、曖昧表現で答えるようにする。例えば:くも(雲・蜘蛛)は好きですか?-【問題点】くもは嫌い。-【問題点】(嫌いということは蜘蛛だろう)蜘蛛は怖いです。くも(雲・蜘蛛)は好きですか?-【問題点】どうだろうね。-【問題点】ふーん。
  • 【問題点】対話システムの問題点は、予想外の返答等が返ってきたときに、言葉を返すことが出来ない、もしくは意味不明な返答が返ってくる、という点である。例えば、今回の知識科学基礎の例で出てきたような、「図書館はどこですか?」と話して、返答が帰ってきたあとに、理解できなかった旨の発言を返すと、返答出来ないような状況である。
    • 【解決策】この問題を解決する根本的な方法としては、誤解や齟齬等にも対応出来るようにする方法があるが、これは非常に難しい。そもそも正規表現で置換可能なパターンは限られており、状態遷移 の方法を用いても遷移出来るパターンにも限界がある。従って私は、誤解や齟齬等のエラー処理を複数用意し、それに適宜感情を付加する、という解決策を提案する。具体的には、「ごめんね…あなたの言ったことが理解出来ませんでした…もっと頑張るね!!」といった返答を複数追加する。これは一種のエラー処理に近いようなもので、このような種類の返答を出来るだけ増やす。つまり、対応出来なかったときも人間のように返答するのである。(1000程度のエラー処理用の返答を追加すれば、違和感を感じづらいように感じられるが、これは一個人としての感覚である)
  • 【問題点】音声を拾い認識する範囲がまだ甘いという部分だと思います。滑舌の悪い人ではしっかり聞き取ってもらえないことがあること。
    • 【解決策】曖昧な応答のところでもっと種類を増やすことによってより多くの言葉を聞き取り対応できるようにしていく。キーワードなどをもっと増やす。
  • 【問題点】こちらの感情を相手に伝えることが出来ない(同じ言葉でも違う感情で使っている場合がある)
    • 【解決策】言葉と言葉と間を読み取ったり、表情や仕草を読み取る機能と連立させる。それも音声と同じくらい瞬時に。
  • 【問題点】会話の受け答えが出来ていない場合がある。
    • 【解決策】状態遷移を使って、返答しやすい会話に誘導する。
  • 【問題点】会話が上手く噛み合わない。方言や独特の言い回しに対応できない。
    • 【解決策】正規表現を利用することで、対応できるワードを増やす。状態変遷を利用して、曖昧な表現を避け、システムが応答できる特定の言葉を引き出せるようにする。
  • 【問題点】もし私が同音異義語を言ったら、区別して、対話できるのか?私「起源をしりたい」 対話システムは期限、機嫌、紀元、起源のどれか判断できない。
    • 【解決策】対話システムに、曖昧な表現を使わせる。私「起源をしりたい」対話システム「わかりません」
  • 【問題点】日本語は表現が多種多様なのでどんなに表現を覚えても返答パターンには限界がある。
    • 【解決策】英語は疑問詞や動詞の表現が限られているので、翻訳ソフトを連動させて問いかけなどを英語訳して返答パターンを作る。例)How many〜→数字で答える。
  • 【問題点】もし私が同音異義語を言ったら、区別して、対話できるのか?私「起源をしりたい」対話システムは期限、機嫌、紀元、起源のどれか判断できない。
    • 【解決策】対話システムに、曖昧な表現を使わせる。私「起源をしりたい」対話システム「わかりません」
  • 【問題点】人間同士の対話では相手の反応をある程度予測しながら対話をすることが多いが、今までに授業内で扱ってきた対話システムでは相手への反応が上手にできたとしても、その反応への更なる相手の反応は上手くいかない場合が多い。
    • 【解決策】相手への反応は曖昧な応答や置換、キーワード、正規表現を用いつつ、状態遷移の考え方でストーリーとその分岐を細かく作る。システム側が相手への受け答えをしながらその反応への相手の反応を色々想定できるようなイメージ。
  • 【問題点】ひとつひとつの対話が成立していても、全体を通して見たときに繋がりがない。「ソルティライチ飲みたい」→「おいしい」 「飲んだの?」→「お前がそう思うならな」 「笑」→「そういうこともあるんですね」
    • 【解決策】キャラクターに合わせて返答の口調を統一する。曖昧な応答でさりげなく話題を切り替えるなどして自然に会話が繋がるようにする。正規表現ではシステム側が話題をより具体的に発展させて、べつの登録語彙を人間が入力するように誘発する。よくある文字入力の間違いなどをデータとして集めて、修正してキーワードに幅広く反応できるようにする。
  • 【問題点】問題点・・・言葉遣いに統一性がない。具体例・・・「うっせえ」などと言い出す。
    • 【解決策】曖昧表現の追加、置換規則の追加、キーワードと応答の追加をする際に言葉遣いを統一する。敬体にするならすべて敬体に、常体にするならすべて常体にする。知識科学基礎の講義で使用する対話システムは学生を含む様々な人が好きなように曖昧表現の追加、置換規則の追加、キーワードと応答の追加を行っているために、その対話システムのキャラクター性の統一、維持ができない。一つの対話システムをつくるなら一冊の辞書をつくるかのように曖昧表現、キーワードと応答を吟味する専門のチームが必要だと思う。
  • 【問題点】あいさつをしても「そういうことね」など、あいさつと全く関係のない答えが返って来ることがあるため、会話が成立しない。また、会話の途中でもう一度あいさつをするなどの現実では考え難い会話を行おうとしても、何の問題もなく何らかの答えが返って来る。
    • 【解決策】対話システム側が出す応答文をあらかじめ「出あいさつ」「出返答」「出同意」「出その他」「出疑問」など、使用が予想される状況ごとに分ける。例えば「こんにちは」や「おはよう」は「出あいさつ」に登録しておき、「$1は好きだよ」は「出返答」に登録しておく。「出その他」には、どんな文にも使用可能な曖昧な文を登録しておく。「出疑問」は特殊で、「急にどうしたの?」や「どうかした?」といった、曖昧な疑問文を登録しておく。入力者が入力するキーワードも同じく分ける。キーワードの場合は「入あいさつ」「入質問」「入同意」に分ける。例えば「(.+?)についてどう思う?」の場合は「入質問」に登録しておき、「(.+?)思わない?」の場合は「入同意」に登録しておく。最初は状態を「通常」にしておき、入力された文によって状態を「あいさつ」「質問」「同意」「その他」「疑問」に遷移する。例えば「(.+?)についてどう思う?」などの「入質問」に当てはまる文が入力されれば「質問」に遷移し、「出質問」に登録されている応答分のみをランダムに返す。「質問」がされたあとに再度あいさつ文が入力されることは現実の会話において考え難いため、「質問」の状態のときに「入あいさつ」に当てはまる文が入力されたときは「疑問」に遷移し、「出疑問」に登録されている曖昧な疑問文を返すことにより、入力者に会話の流れの乱れを指摘し、話題を戻そうとする。入力されたキーワードが「入あいさつ」「入質問」「入同意」のそれぞれに登録されている文のいずれにも当てはまらなかった場合は「その他」に遷移し、「出その他」に登録されている曖昧な文のみをランダムに返す。入力文の(.+?)の数と、応答分の$nの数が必ずしも一致するとは限らないため、その点で課題は残るが、以前と比べて入力文と応答文の著しい不一致が少なくなることが期待できる。また、状態の種類や遷移の条件の追加、応答文とキーワードのカテゴリの追加を行うことで、より会話の整合性を上げることができると考えられる。
  • 【問題点】TDLやUSJなど、略語に対応することが難しい。
    • 【解決策】アルファベット3文字の正規表現を作る。
  • 【問題点】的外れな応答をするときがたまにある。
    • 【解決策】その原因として、実際に何を話しかけるのか、などを細かく想定していないことだと考えられる。1つの話しかけられた内容に対して、もっと多くの応答を用意しておく必要がある。
  • 【問題点】対話システムの問題点は「自然な会話の流れ」が作られにくいという点にあると私は考える。iPhoneに搭載されているSiriと実際に会話をしてみようとすると、ある程度会話が成り立つが、どこか不自然に感じる場合が多い。その原因は対話システムに「それまでの文脈を読み取る力」が欠けていることにあると思われる。
    • 【解決策】解決策として、会話精度の向上、高度な状態遷移の実現が挙げられる。会話精度を向上させ、受け答えをより自然なものとし、状態遷移によって会話の流れを作り上げることで「自然な会話の流れ」の作成が可能となる。
  • 【問題点】日本語は重要な主語や述語を省略することが多いため、会話が噛み合わないことが多々ある。
    • 【解決策】曖昧で足りない状態の日本語を文脈から自動で補う。
  • 【問題点】自分の意見など、はい/いいえで答えられなかったり、単純に前のキーワードを当てはめて答えられない質問をされたときの対応ができない。例)最近観た映画と感想教えてー。
    • 【解決策】今までの講義を踏まえると、「映画」や「感想」などの言葉をキーワードにして、楽しかったー とか あっという間に感じたなどの定型文を返す。あるいはネット環境があり、返信にある程度時間がかかってもいいのなら、ネット検索し、出てきた文をコピーして返す。いくつかの文に共通した部分をピックアップする。などの解決策が考えられる。
  • 【問題点】文脈によって意味が違うことがある時にうまく対応ができない。例→うまい(おいしいと上手い)
    • 【解決策】うまいの例をあげると、うまいという言葉だけで意味を判断できないため、前後の言葉で意味を判断する。前後に食べ物に関するワードがあれば、おいしいという意味で判断でき、それ以外は上手いという意味で判断できると思う。そのために、前後のキーワードを収録しそれに応答するようなシステムを作る。食べ物に関することを一括りにできる方法は思いつかなかった。ただ、一括りにできれば「○○はうまい」という文に対し「うまい」を「おいしい」に変換できると思う。
  • 【問題点】音声対話システムは、文法や語順が正しいものに反応する。しかし、日常の会話言葉は、言い間違い、言い直し、また、同じ言葉でも声のトーンやテンポによってもちがう。必ずしも文法どおりでない。従来の音声対話システムではこのような話し言葉は扱えない。だから人間と同じように円滑には会話ができない。たとえば、人間は面と向かって、好きです、といえば私があなたを好きだと伝わるが、音声システムでは、私はあなたのことが好きです、といわなければ、だれがなにを好きなのかはわからない。
    • 【解決策】これは、置換機能に、頼りすぎていることが問題である。たとえば、あなたは〜なのか?と聞かれれば音声システムはおそらく、置換機能で私は〜です。と答えるが、それだけではもし人間が、あなたはバカなのか?といったとすれば、それはバカなのかそうでないかを質問してるのではなく、あなたはバカである、と伝えているのに等しい。これを改善するためには、上の例でも、ひとつ前の例でもそうだが、前の文章だけでなくそれまでの文章のキーワードもすべて含めて、一つ一つの言葉でのキーワードでなく、一つの文章でのキーグループで登録をするようにするとよい。
  • 【問題点】例えばシステムの話す言葉が「そうだね」「そうですね」のように話し方にばらつきがある点。
    • 【解決策】例えば言葉を「です、ます口調」とそれ以外に分類し、初めはランダムに言葉を使うとして、その言葉の分類された口調のみを使うように設定する。
  • 【問題点】どうやって似た意味の文章を探すかということ。例えば、別れの挨拶には、「さよなら」「さようなら」「バイバイ」「じゃあね」「またね」「また明日」など、何通りも存在する。これら全てを、どのようにして同じグループと見なして適切な返答をするのかが問題として考えられると思う。
    • 【解決策】状態遷移を使って、考えられる別れの挨拶のパターンを記憶させておき、それらのうちどれがなされても、こちらが「さようなら」など適切な返答ができるようにしておく。
  • 【問題点】認識の誤解や齟齬などのエラーが起こること。
    • 【解決策】状態遷移をなるべく多くプログラミングする。
  • 【問題点】話しかける言葉が見つからない、話しかけてもちゃんと会話が成り立たない。
    • 【解決策】名工大のメイちゃんを授業で見て、こんなにすごい機能があるのに誰も使わなくなってしまうということがとても残念でした。やはり、何を話しかけていいのかがわからないのが、ひとが離れていってしまう原因だと考えます。そして、私が考えた解決策は、「話すテーマを提案する」ということです。挨拶が終わると、人工知能側から、どんなお話がしたいですか?とテーマの選択を促します。その返事に入ってきたキーワードから、会話を広げていくようにすると、話しかける言葉を絞りやすいし、人工知能側も返事の登録がしやすいはずです。テーマごとに返事をグルーピングし、このテーマの時はこのグループの中から選ぶということができれば、対話のレベルもあがると思います。
  • 【問題点】対話システムはAという言葉に返す言葉の選択肢の数が限られているため、その選択肢から外れた答えを期待している人間が対話システムを使用してもあまり意味が無い。
    • 【解決策】言われた言葉に対して答えを用意するだけではなくその言葉が発言者にとってどのような意味を持つかを登録させてそれに関連づけて対話を進める。
  • 【問題点】対話のバリエーションが少ないこ。siriはあなたの出身はどこですか?と聞いても答えてくれるし、バーカといっても答えてくれる。さりげない会話もできるようになるとかなりスゴイと思う
    • 【解決策】状態遷移で色んなキーワードに反応するように経路を作るといいと思う

木村ゼミ生限定

編集画面
ゼミ生
2017-2018年度生(11期)
石黒栞奈一宮拓海
亀井海舟佐藤栞
佐藤有希桧森拓真
藤本朱夏ホワイトジニー
増田優作谷内健太
2016-2017年度生(10期)
伊藤みき岡島健悟
小西雪葉祐川泰輝
鈴木佑菜大門拓史
田頭わかば戸嶋咲穂
中村智貴西野哲生
横山祐果川岸祐果
2015-2016年度生(09期)
浅賀七海小林真菜
西村伊央堀江知未
針生惟希村上浩太
2014-2015年度生(08期)
大石誠大野晋太朗
加藤裕樹佐々木左近
高橋理沙武田莉穂
寺島舞子畑賀大
山田修世
2013-2014年度生(07期)
加藤史織工藤智子
佐々木葉子志鎌周
高橋玄龍眈丈
中尾千咲中川玲菜
中藪大貴
2012-2013年度生(06期)
遠藤星地大野紗季
鎌田めぐみ木下和大
齋木涼介佐々木遥
佐藤優子沼澤文香
古屋真理吉田智弘
2010-2011年度生(05期)
葦原史敏伊藤大起
伊藤みどり永坂文乃
藤田航哉前多大輔
松本陵佑宮津有沙
山田亜季
2009-2010年度生(04期)
岸本隆志窪地由恵
志賀千鶴津田有子
三浦工弥
2008-2009年度生(03期)
粟津康佑井上さゆり
北崎佑樹工藤和寛
古俣優花佐川彰宏
佐藤禎洋鈴木亜衣
竹原希美藤井優作
堀公一堀内小織
米澤宏史
2007-2008年度生(02期)
佐藤健太上村佳弘
奥田啓貴小野誠
白井かずみ高井庸介
森谷亮介六渡有梨恵
若本哲平
2006-2007年度生(01期)
菅井梓渡部謙太郎
相坂真大村佳慎
奥桃子笠井猛
小林和幸齊藤いつこ
齊藤雄紀佐々木麻未
佐藤日加吏谷本貴之
徳江佑介長嶺脩平
西本みゆき林絵里子
澤田大輝