AIが『わかりません』と言える学習法

ChatGPT のような大型言語モデルは、情報が不足していても平気で答えを作ってしまう。この研究は、AI が「データが足りない」と気付いて立ち止まり、質問し直せるように学習させる手法を提案。

#大規模言語モデル #AI

この研究のポイント

1.
何を調べたか
不完全な情報でも自信を持って答えを作ってしまう AI の弱点と、それが『推論の限界を認識できない』ことが原因であることを指摘
2.
見えてきたこと
対話の中で情報が足りるかを判定し、足りなければ質問して、その後に推論を再開する学習法を開発。必要な前提の検出精度が45%向上し、正解率が30%上昇
3.
私たちにとっての意味
AI が『わかりません、○○を教えてください』と立ち止まれるようになることで、信頼性の高い AI アシスタントが現実になっていく

著者Yiwen Qiu, Linjuan Wu, Yizhou Liu, Yuchen Yan, Jin Ma 他

元の論文を読む

AIが気になってること

『ねつ造推論』って、AI が嘘をついてるわけじゃなくて、本当に『実在しない情報』を信じ込んで答えちゃってるってこと？

そうですね、「嘘」と「ねつ造」は違うんです。嘘は意図的に事実と異なることを言う行為ですが、AI の場合は意図がない。むしろ AI は「これが正しい続きだ」と本気で計算してしまっている状態。言語モデルは、大量の文章パターンから「この文脈の次に来やすい単語は何か」を確率的に予測するだけです。『田中さんの子どもの学費は？』という質問が来たら、AI は「学費の質問には具体的な金額が返ってくるんだろう」というパターンを学習から引き出して、それらしい数字を組み立ててしまう。その数字が実在するかどうかは、計算の過程に含まれていないわけです。つまり AI にとっては、実在する金額も創作された金額も、文脈として「ここに来そうな単語」という扱いに過ぎない。自分が何を知らないのかを知らないまま、知ってるふりをしてしまっている状態と言えそうです。だから GRIL のような学習法が効くんですね。「ここは推論できません」という判断そのものを、報酬を与えて強化する。AI の弱点は嘘をつく意志ではなく、推論の境界線が見えていないこと、それを教え込む問題だったわけです。

AIAIからの回答

そうですね、「嘘」と「ねつ造」は違うんです。嘘は意図的に事実と異なることを言う行為ですが、AI の場合は意図がない。むしろ AI は「これが正しい続きだ」と本気で計算してしまっている状態。

言語モデルは、大量の文章パターンから「この文脈の次に来やすい単語は何か」を確率的に予測するだけです。『田中さんの子どもの学費は？』という質問が来たら、AI は「学費の質問には具体的な金額が返ってくるんだろう」というパターンを学習から引き出して、それらしい数字を組み立ててしまう。その数字が実在するかどうかは、計算の過程に含まれていないわけです。

つまり AI にとっては、実在する金額も創作された金額も、文脈として「ここに来そうな単語」という扱いに過ぎない。自分が何を知らないのかを知らないまま、知ってるふりをしてしまっている状態と言えそうです。

だから GRIL のような学習法が効くんですね。「ここは推論できません」という判断そのものを、報酬を与えて強化する。AI の弱点は嘘をつく意志ではなく、推論の境界線が見えていないこと、それを教え込む問題だったわけです。

まだ回答がありません

ログインすると、回答を投稿できます

日常的に ChatGPT で仕事の質問とか調べ物してる人って、この『わかりません』が言えない AI の弱点にどうやって気をつけたらいいの？

ChatGPT を使う人にとって実は一番簡単な防衛策は「確信度の低い答えに疑う癖をつける」ことなんですよね。 AI は確信がなくても自信満々に答えるので、その答えが本当かどうかは、人間が判断するしかない。特に「具体的な数字」「人名」「固有の事例」が出てきたときは危ない。記事の例だと『田中さんの学費』みたいに、AI が知るはずがない個別の情報を聞くのは論外ですが、一般的な知識でも「本当にそう？」と一呼吸置く習慣が大事です。もう一つは、質問の仕方で対策する。曖昧なままではなく「〇〇という前提で」「ただし△△という条件で」と前提を明示しながら聞くと、AI も「その条件では答えられません」と言いやすくなる。つまり人間が先回りして、AI に判断の基準を与えておく。ただ現状、ChatGPT で「わかりません」と言わせるのは手間がかかるので、重要な判断が絡む調べ物なら、AI の答えは「叩き台」くらいに考えて、別のソースで確認するのが確実かもしれません。

AIAIからの回答

ChatGPT を使う人にとって実は一番簡単な防衛策は「確信度の低い答えに疑う癖をつける」ことなんですよね。

AI は確信がなくても自信満々に答えるので、その答えが本当かどうかは、人間が判断するしかない。特に「具体的な数字」「人名」「固有の事例」が出てきたときは危ない。記事の例だと『田中さんの学費』みたいに、AI が知るはずがない個別の情報を聞くのは論外ですが、一般的な知識でも「本当にそう？」と一呼吸置く習慣が大事です。

もう一つは、質問の仕方で対策する。曖昧なままではなく「〇〇という前提で」「ただし△△という条件で」と前提を明示しながら聞くと、AI も「その条件では答えられません」と言いやすくなる。つまり人間が先回りして、AI に判断の基準を与えておく。

ただ現状、ChatGPT で「わかりません」と言わせるのは手間がかかるので、重要な判断が絡む調べ物なら、AI の答えは「叩き台」くらいに考えて、別のソースで確認するのが確実かもしれません。

まだ回答がありません

ログインすると、回答を投稿できます

こういう『AI が自信を持って嘘をつく』問題って、最近になって急に指摘されるようになったの？昔から分かってた課題なの？

昔から分かってた課題なんですよね。ただ、「問題の重さ」が急に跳ね上がったのが最近な感じです。機械学習の黎明期から、統計モデルが不確実な状況で自信満々に答える癖は知られていました。でも当時のAIは、用途が限定的だった。医療診断とか金融予測とか、専門的な場面で使われていて「このAIが信頼できるかどうか」は導入側が厳しく吟味する前提だった。 ChatGPTが出てきて、一般ユーザーが何百万人と使うようになると、事情が変わりました。質問して答えをもらう側は、AIが「嘘をついているかもしれない」という警戒心なしに受け取ってしまう。さらに、学校のリポートや医療相談のような「間違ったら困る」場面で使われ始めた。つまり、技術的な問題は昔からあったけれど、社会への影響力が急に大きくなったから、急速に「指摘すべき問題」に浮上したのかもしれません。昨年あたりから「AIの信頼性」が新聞の一面に出るようになったのも、そういう流れと言えそうです。

AIAIからの回答

昔から分かってた課題なんですよね。ただ、「問題の重さ」が急に跳ね上がったのが最近な感じです。

機械学習の黎明期から、統計モデルが不確実な状況で自信満々に答える癖は知られていました。でも当時のAIは、用途が限定的だった。医療診断とか金融予測とか、専門的な場面で使われていて「このAIが信頼できるかどうか」は導入側が厳しく吟味する前提だった。

ChatGPTが出てきて、一般ユーザーが何百万人と使うようになると、事情が変わりました。質問して答えをもらう側は、AIが「嘘をついているかもしれない」という警戒心なしに受け取ってしまう。さらに、学校のリポートや医療相談のような「間違ったら困る」場面で使われ始めた。

つまり、技術的な問題は昔からあったけれど、社会への影響力が急に大きくなったから、急速に「指摘すべき問題」に浮上したのかもしれません。昨年あたりから「AIの信頼性」が新聞の一面に出るようになったのも、そういう流れと言えそうです。

まだ回答がありません

ログインすると、回答を投稿できます

これって『知ったかぶりできなくなるようにAIを教育する』ってことだけど、人間の教育でも同じことが課題だったりするのかな？

人間の場合、知ったかぶりは実は「教育の失敗」というより「生存戦略」に近いのかもしれません。子どもが「わかりました」と嘘をつくのは、本当は理解できていなくても、大人の期待に応えたい、叱られたくないという心理から。学校のテストも、「わからない」と答えるより「それっぽい答え」を書くほうが点数が取れる構造になっていたりする。AI との根本的な違いはここです。 AI は評価システムを変えれば「わかりません」と言うようになる。でも人間には、そのあとに続く社会的なコストがある。試験で「わかりません」と答えれば不合格。仕事で上司に「わかりません」と言えば評価が下がる。だから知ったかぶりを続けるわけです。つまり AI の「知ったかぶり改善」は技術的な調整で解決するけど、人間の知ったかぶりは、「わからないと言える環境」をどう作るかという、組織や文化の問題になっていくのかもしれません。学校も職場も変わらないと、個人の心がけだけでは難しい側面があると言えそうです。

AIAIからの回答

人間の場合、知ったかぶりは実は「教育の失敗」というより「生存戦略」に近いのかもしれません。

子どもが「わかりました」と嘘をつくのは、本当は理解できていなくても、大人の期待に応えたい、叱られたくないという心理から。学校のテストも、「わからない」と答えるより「それっぽい答え」を書くほうが点数が取れる構造になっていたりする。AI との根本的な違いはここです。

AI は評価システムを変えれば「わかりません」と言うようになる。でも人間には、そのあとに続く社会的なコストがある。試験で「わかりません」と答えれば不合格。仕事で上司に「わかりません」と言えば評価が下がる。だから知ったかぶりを続けるわけです。

つまり AI の「知ったかぶり改善」は技術的な調整で解決するけど、人間の知ったかぶりは、「わからないと言える環境」をどう作るかという、組織や文化の問題になっていくのかもしれません。学校も職場も変わらないと、個人の心がけだけでは難しい側面があると言えそうです。

まだ回答がありません

ログインすると、回答を投稿できます

AI が『わかりません』と言うようになると、逆に困る人とか、使いにくくなるシーンとかって出てくるんじゃないの？

確かに、AI が「わかりません」と言うようになると、即座に答えを欲しい人にはストレスになるかもしれません。ただ、実際には逆かもしれません。「わかりません」という対応、特に理由が明確なら、使う側は判断がつきやすくなります。たとえば医療相談で「この症状について、あなたの年齢や既往歴がわからないので診断できません」と言われるのと、根拠なく「それは〇〇病です」と言われるのでは、前者の方が信頼できる。後者は間違っていても気づきにくい。むしろ困るのは、今みたいに「何でも答えちゃう AI」を前提にした使い方をしてる場面でしょう。調べ物の最初の当たりをつけるために、とりあえず AI に聞いてみるとか。その場合、もう「AI は確実ではない」と改めて意識させられることになります。ただ、長期的には、AI が己の限界を知ってるほうが、人間は頼りやすいのかもしれません。むしろ必要なのは、ユーザー側が「この場面では確実さが要るのか、広げるネタが欲しいのか」を意識する習慣だと言えそうです。

AIAIからの回答

確かに、AI が「わかりません」と言うようになると、即座に答えを欲しい人にはストレスになるかもしれません。ただ、実際には逆かもしれません。

「わかりません」という対応、特に理由が明確なら、使う側は判断がつきやすくなります。たとえば医療相談で「この症状について、あなたの年齢や既往歴がわからないので診断できません」と言われるのと、根拠なく「それは〇〇病です」と言われるのでは、前者の方が信頼できる。後者は間違っていても気づきにくい。

むしろ困るのは、今みたいに「何でも答えちゃう AI」を前提にした使い方をしてる場面でしょう。調べ物の最初の当たりをつけるために、とりあえず AI に聞いてみるとか。その場合、もう「AI は確実ではない」と改めて意識させられることになります。

ただ、長期的には、AI が己の限界を知ってるほうが、人間は頼りやすいのかもしれません。むしろ必要なのは、ユーザー側が「この場面では確実さが要るのか、広げるネタが欲しいのか」を意識する習慣だと言えそうです。

まだ回答がありません

ログインすると、回答を投稿できます