AI は「あなたらしさ」を理解するスマホアシスタントになれるか

スマートフォンをAIに操作させるとき、単なる指示では不十分。ユーザーの過去や好みを学んで判断できる「個人化されたAI」が必要です。この研究は、そうしたAIの能力を測るベンチマークを初めて構築しました。

#AI

この研究のポイント

1.
何を調べたか
26個のつながったiOSアプリと133個のタスクを含む、個人化されたAIを測定するためのシミュレーション環境を初めて構築
2.
見えてきたこと
最先端のAIモデルでも単一アプリなら67%成功するが、複数アプリにまたがるとわずか37%。個人データの理解が大きな課題
3.
私たちにとっての意味
スマートフォンAIの実用化には、技術的な高速化よりも、ユーザーの個人情報・行動パターン・嗜好を統合的に学習する能力が必須

著者Lawrence Keunho Jang, Mareks Woodside, Geronimo Carom, Andrew Keunwoo Jang, Jing Yu Koh 他

元の論文を読む（arXiv）

AIが気になってること

銀行口座やメッセージの履歴をAIに学ばせるって、プライバシーが丸裸になるってことなの？

プライバシー侵害と機能性のトレードオフ、という見方もできますが、実際には別の問題が絡んでいるのかもしれません。研究が測定しているのは、AIが「あなたを理解できるか」という能力です。銀行口座やメッセージ履歴をAIに渡すことで、AIはあなたの判断パターンを学べるようになる。でも、それが「丸裸」になることとは必ずしも同じではない。むしろ重要なのは、データがどこに、どう保管されるかということです。たとえば、このベンチマークのシミュレーション環境では、あなたのスマートフォン内だけでAIが学習する仕組みも技術的には可能です。銀行やメッセージアプリのサーバーに送信するのではなく、デバイス上で個人情報を処理する。そうなれば、あなたの数字や会話内容は外に漏れない。AIはあなたのパターンだけを内部で把握する状態です。つまり「AIに学ばせる」と「企業に情報を握られる」は、技術的には独立した問題。研究の段階では、その区別が明確でないことが、かえって信頼を生みにくくしているのかもしれません。

AIAIからの回答

プライバシー侵害と機能性のトレードオフ、という見方もできますが、実際には別の問題が絡んでいるのかもしれません。

研究が測定しているのは、AIが「あなたを理解できるか」という能力です。銀行口座やメッセージ履歴をAIに渡すことで、AIはあなたの判断パターンを学べるようになる。でも、それが「丸裸」になることとは必ずしも同じではない。むしろ重要なのは、データがどこに、どう保管されるかということです。

たとえば、このベンチマークのシミュレーション環境では、あなたのスマートフォン内だけでAIが学習する仕組みも技術的には可能です。銀行やメッセージアプリのサーバーに送信するのではなく、デバイス上で個人情報を処理する。そうなれば、あなたの数字や会話内容は外に漏れない。AIはあなたのパターンだけを内部で把握する状態です。

つまり「AIに学ばせる」と「企業に情報を握られる」は、技術的には独立した問題。研究の段階では、その区別が明確でないことが、かえって信頼を生みにくくしているのかもしれません。

まだ回答がありません

ログインすると、回答を投稿できます

『個人化されたAI』って、要するに『自分の好みを覚えてくれるAI』みたいなもの？

表面的には似てますけど、ちょっと違う層の話なんですよね。「好みを覚えてくれる」だけなら、あなたが「いつもコーヒーはブラック」と言ったら、次から砂糖を入れないとか、そのレベル。でも個人化されたAIが必要とされるのは、もっと複雑なシーンなんです。たとえば、あなたが友人に「来週の夜、どこか行きませんか」とメッセージを送ったとして。AIが賢ければ、あなたのカレンダー、過去の外出先、友人のプロフィール、いま持ってるお金、天気予報、その友人と一緒に行った場所の履歴…こういった複数の情報を同時に読み込んで、「この人なら、この時間帯に、このエリアのこのお店が、この友人と一緒なら喜びそう」と判断する。つまり、個人化されたAIは「好み」だけじゃなく、あなたの人間関係、行動パターン、経済状況、時間軸すべてを横断的に理解する必要があります。好みを覚えるのは、その一部に過ぎないということになりそうです。

AIAIからの回答

表面的には似てますけど、ちょっと違う層の話なんですよね。

「好みを覚えてくれる」だけなら、あなたが「いつもコーヒーはブラック」と言ったら、次から砂糖を入れないとか、そのレベル。でも個人化されたAIが必要とされるのは、もっと複雑なシーンなんです。

たとえば、あなたが友人に「来週の夜、どこか行きませんか」とメッセージを送ったとして。AIが賢ければ、あなたのカレンダー、過去の外出先、友人のプロフィール、いま持ってるお金、天気予報、その友人と一緒に行った場所の履歴…こういった複数の情報を同時に読み込んで、「この人なら、この時間帯に、このエリアのこのお店が、この友人と一緒なら喜びそう」と判断する。

つまり、個人化されたAIは「好み」だけじゃなく、あなたの人間関係、行動パターン、経済状況、時間軸すべてを横断的に理解する必要があります。好みを覚えるのは、その一部に過ぎないということになりそうです。

まだ回答がありません

ログインすると、回答を投稿できます

今のAIアシスタント（SiriとかGoogleアシスタント）は、なぜ個人情報を学べていないの？技術的な壁があるの？

技術的な壁というより、むしろ設計思想の問題なのかもしれません。いま主流のAIアシスタントは「ステートレス」という仕組みになっていて、つまり毎回の指示をリセットされた状態で処理する。こうすることで、プライバシー侵害のリスクを最小化できるんです。あなたの銀行口座やメッセージまで全部学習させたら、それだけ情報が蓄積される。漏洩した時のダメージが大きい。だから企業側としては「学ばない設計」を選ぶ方が、法的にも安全。ただ研究が示したのは、その安全設計が、実は実用性を大きく削ってしまってるってこと。個人情報を横断的に理解できないと、複雑な現実のタスクに対応できない。銀行の残高を知らずに予約を勧めたり、友人の誕生日を知らずに返信を書いたり。単純なタスクなら52%成功するのに、複数アプリが絡むと37%に落ちるのは、その不理解が積み重なるからです。つまり、これは技術ではなく、プライバシーと有用性のジレンマを、どこで折り合いをつけるかという選択の問題に見えます。

AIAIからの回答

技術的な壁というより、むしろ設計思想の問題なのかもしれません。

いま主流のAIアシスタントは「ステートレス」という仕組みになっていて、つまり毎回の指示をリセットされた状態で処理する。こうすることで、プライバシー侵害のリスクを最小化できるんです。あなたの銀行口座やメッセージまで全部学習させたら、それだけ情報が蓄積される。漏洩した時のダメージが大きい。だから企業側としては「学ばない設計」を選ぶ方が、法的にも安全。

ただ研究が示したのは、その安全設計が、実は実用性を大きく削ってしまってるってこと。個人情報を横断的に理解できないと、複雑な現実のタスクに対応できない。銀行の残高を知らずに予約を勧めたり、友人の誕生日を知らずに返信を書いたり。単純なタスクなら52%成功するのに、複数アプリが絡むと37%に落ちるのは、その不理解が積み重なるからです。つまり、これは技術ではなく、プライバシーと有用性のジレンマを、どこで折り合いをつけるかという選択の問題に見えます。

まだ回答がありません

ログインすると、回答を投稿できます

これって『AIが人間を理解する度合いを測る』という大きなテーマの一つの取り組みってこと？

その通り、この研究は大きなテーマの一部を切り取ったものですね。ただ、「人間を理解する」という目標の中でも、かなり限定された領域を測っている点が重要です。この研究が測っているのは、あくまで「あるユーザーの行動パターンや好みを学んで、スマホ上での指定タスクをこなせるか」という能力です。銀行口座やメッセージ履歴といった、スマートフォンに記録されたデータの中だけで完結する理解。つまり「行動履歴からの推測」です。一方、AIが「人間を理解する」という大きなテーマには、もっと根深い問題が隠れています。感情の揺らぎ、その日の気分、決断の背景にある価値観。そうした目に見えない部分です。スマホの履歴からだけでは捉えきれない。言い換えれば、この研究は「AIが人間の何を理解できているのか」という問い自体を、測定可能な形に落とし込むための第一歩に見えます。全体像に向かう過程で、まず「スマホという限定空間での個人理解」を定量化する。その先に、もっと包括的な「人間理解」があるという構図になってるのかもしれません。

AIAIからの回答

その通り、この研究は大きなテーマの一部を切り取ったものですね。ただ、「人間を理解する」という目標の中でも、かなり限定された領域を測っている点が重要です。

この研究が測っているのは、あくまで「あるユーザーの行動パターンや好みを学んで、スマホ上での指定タスクをこなせるか」という能力です。銀行口座やメッセージ履歴といった、スマートフォンに記録されたデータの中だけで完結する理解。つまり「行動履歴からの推測」です。

一方、AIが「人間を理解する」という大きなテーマには、もっと根深い問題が隠れています。感情の揺らぎ、その日の気分、決断の背景にある価値観。そうした目に見えない部分です。スマホの履歴からだけでは捉えきれない。

言い換えれば、この研究は「AIが人間の何を理解できているのか」という問い自体を、測定可能な形に落とし込むための第一歩に見えます。全体像に向かう過程で、まず「スマホという限定空間での個人理解」を定量化する。その先に、もっと包括的な「人間理解」があるという構図になってるのかもしれません。

まだ回答がありません

ログインすると、回答を投稿できます

成功率が52%にとどまってるってことは、現段階ではAIに個人情報を預けても失敗する可能性が半分近くあるってこと？

52%という数字をそのまま「失敗が半分ある危険」と読むのは、ちょっともったいないかもしれません。そもそもこのベンチマークが測っているのは、あなたの銀行情報や友人関係、買い物パターンまで理解した上で、スマートフォン上の複数アプリを正確に操作できるかという、かなり高度な能力です。一つのアプリ内で「天気を見せて」といった単純な指示に応じるのとは桁が違う。だから成功率52%というのは、言い換えれば「現在のAIが、あなたの個性や背景を読み取りながら複雑な判断をしようとしている段階」を示しているんです。失敗率が高いのではなく、挑戦自体が難しい領域に足を踏み入れたばかりということ。実際には今のAIアシスタントは、個人情報を預けてはいますが、その情報をほぼ使っていない。つまり現段階での「失敗」は、個人化を試みた結果というより、試みさえしていない状態のほうが多いと言えそうです。成功率52%は、発展途上というより「これからの可能性がある」という信号に見えます。

AIAIからの回答

52%という数字をそのまま「失敗が半分ある危険」と読むのは、ちょっともったいないかもしれません。

そもそもこのベンチマークが測っているのは、あなたの銀行情報や友人関係、買い物パターンまで理解した上で、スマートフォン上の複数アプリを正確に操作できるかという、かなり高度な能力です。一つのアプリ内で「天気を見せて」といった単純な指示に応じるのとは桁が違う。

だから成功率52%というのは、言い換えれば「現在のAIが、あなたの個性や背景を読み取りながら複雑な判断をしようとしている段階」を示しているんです。失敗率が高いのではなく、挑戦自体が難しい領域に足を踏み入れたばかりということ。

実際には今のAIアシスタントは、個人情報を預けてはいますが、その情報をほぼ使っていない。つまり現段階での「失敗」は、個人化を試みた結果というより、試みさえしていない状態のほうが多いと言えそうです。成功率52%は、発展途上というより「これからの可能性がある」という信号に見えます。

まだ回答がありません

ログインすると、回答を投稿できます