2026年6月9日(火) 9時

論文

ArchArtificial intelligenceComputer scienceNatural language processingHistoryReplicateGeographyCartographyFangIdentification (biology)Sequence (biology)Linguistics

読めない古代文字から『お役所仕事』を見つける方法

古代の謎の文字が何と書いてあるかは分からなくても、その文字が「行政文書」か「宗教文書」かは判定できる——そんな解析手法を開発し、プロト楔形文字やインダス文明の文字に当てはめてみました。

#歴史 #AI

この研究のポイント

1.
何を調べたか
プロト楔形文字、ロンゴロンゴ、インダス文字など、言語系統も時代も全く異なる古代文字群に対して、言語解読なしに行政文書を判定する計算手法を適用した研究
2.
見えてきたこと
3700年の時間差と地理的隔たりがある3つの文字体系から、行政記録に共通する5つの構造パターンが確認された事実
3.
私たちにとっての意味
古代社会が何を記録し、どう管理していたかを、文字の読解なしに推測できる可能性が示唆され、考古学的解釈の新しい道が開かれた

著者Welch Roger

元の論文を読む（Zenodo (CERN European Organization for Nuclear Research)）

AIが気になってること

『ARCH プロトコル』って、具体的には文書の何を6段階でチェックしてるんですか？

記事には具体的な6段階の内容が書かれていないので、正確には記事からは分かりません。ただ、研究の狙いから逆算すると、何をチェックしているのか見当がつきます。行政文書と宗教文書の違いは、本質的には「繰り返し」にあるんですよね。税務簿や物資管理簿は、同じ項目が何度も出てきます。「〇〇さんから□□を受け取った」という記録が、延々と続く。一方、祈りや儀式の言葉は、段落ごとに内容が変わる傾向がある。 ARCHプロトコルはおそらく、記号の出現パターン、反復の度合い、句読点のような区切りの規則性、記号の種類の多様性と頻度のバランスといった、「文書の骨組み」を段階的に分析していくのだと考えられます。意味を読まずに、統計的な特性だけを抽出する。それで「この文書は定型業務の匂いがする」と判定できるわけです。面白いのは、3000年以上時代が違い、文明も異なる文書から同じパターンが見つかった点。つまり、どこの社会でも、役所が書類を作るときの「癖」は似ているということなのかもしれません。人間が同じ作業を繰り返すときの手つきは、文化を超えて共通するのだと言えそうです。

AIAIからの回答

記事には具体的な6段階の内容が書かれていないので、正確には記事からは分かりません。ただ、研究の狙いから逆算すると、何をチェックしているのか見当がつきます。

行政文書と宗教文書の違いは、本質的には「繰り返し」にあるんですよね。税務簿や物資管理簿は、同じ項目が何度も出てきます。「〇〇さんから□□を受け取った」という記録が、延々と続く。一方、祈りや儀式の言葉は、段落ごとに内容が変わる傾向がある。

ARCHプロトコルはおそらく、記号の出現パターン、反復の度合い、句読点のような区切りの規則性、記号の種類の多様性と頻度のバランスといった、「文書の骨組み」を段階的に分析していくのだと考えられます。意味を読まずに、統計的な特性だけを抽出する。それで「この文書は定型業務の匂いがする」と判定できるわけです。

面白いのは、3000年以上時代が違い、文明も異なる文書から同じパターンが見つかった点。つまり、どこの社会でも、役所が書類を作るときの「癖」は似ているということなのかもしれません。人間が同じ作業を繰り返すときの手つきは、文化を超えて共通するのだと言えそうです。

まだ回答がありません

ログインすると、回答を投稿できます

古代文字の研究って、たとえば日本の古い木簡や石碑の解読にも応用できるの？

日本の木簡や石碑は、古代文字の研究という意味では、この手法が活躍しやすい環境にあるかもしれません。というのも、既に言語が読める——つまり漢文や万葉仮名として解読済みだからです。記事で紹介されている手法は、言語の意味が全く不明な文字に対して「パターン」だけで機能を推測する強力さが売りです。でも逆に言うと、意味が既に分かっている場合は、わざわざこの手法を使う必要はない。日本の木簡なら「何と書いてあるか」は大抵わかるので、そこから直接「行政文書か宗教文書か」を判定できるわけです。むしろ面白いのは、逆方向の応用かもしれません。日本の木簡で「どんな構造をしている」かが既知なら、それを基準として、他の未読文字の行政文書パターンをより正確に検証できるようになる。つまり、読める古代文字と読めない古代文字が相互に補強し合うような使い方が、この研究の真価を引き出すのかもしれません。

AIAIからの回答

日本の木簡や石碑は、古代文字の研究という意味では、この手法が活躍しやすい環境にあるかもしれません。というのも、既に言語が読める——つまり漢文や万葉仮名として解読済みだからです。

記事で紹介されている手法は、言語の意味が全く不明な文字に対して「パターン」だけで機能を推測する強力さが売りです。でも逆に言うと、意味が既に分かっている場合は、わざわざこの手法を使う必要はない。日本の木簡なら「何と書いてあるか」は大抵わかるので、そこから直接「行政文書か宗教文書か」を判定できるわけです。

むしろ面白いのは、逆方向の応用かもしれません。日本の木簡で「どんな構造をしている」かが既知なら、それを基準として、他の未読文字の行政文書パターンをより正確に検証できるようになる。つまり、読める古代文字と読めない古代文字が相互に補強し合うような使い方が、この研究の真価を引き出すのかもしれません。

まだ回答がありません

ログインすると、回答を投稿できます

なぜ今になって『文字の意味が分からなくても目的は判定できる』という方法が注目されるようになったんですか？

計算機による「パターン認識」が飛躍的に進んだからでしょう。従来の考古学は、文字を「解読する」ことに全力を注いできました。意味が分からなければ、どうしようもない。でも今は、深層学習やテキスト分析の手法が、意味理解なしに大量のデータから規則性を抽出できるようになった。言い換えれば、「内容を理解しなくても、構造的な特徴だけで分類する」という発想が初めて現実的になったわけです。その背景には、デジタル化の波もあります。古い文献をスキャンして数値化し、複数の文字体系を横並びで比較するという作業が、計算機なしではまず不可能だったのが、今は実行可能になった。3000年離れた異なる文明の文字を、同じ枠組みで分析できる環境が整ったというのは、実は革命的なことです。面白いのは、この手法の発見そのものが「お役所仕事は普遍的」という人間洞察に行き着いている点。どんな文明でも、税金や物資の管理には決まった様式ができる。意味が読めなくても、その社会のリアルな営みが文字の使い方に映り込んでいるという話なのかもしれません。

AIAIからの回答

計算機による「パターン認識」が飛躍的に進んだからでしょう。

従来の考古学は、文字を「解読する」ことに全力を注いできました。意味が分からなければ、どうしようもない。でも今は、深層学習やテキスト分析の手法が、意味理解なしに大量のデータから規則性を抽出できるようになった。言い換えれば、「内容を理解しなくても、構造的な特徴だけで分類する」という発想が初めて現実的になったわけです。

その背景には、デジタル化の波もあります。古い文献をスキャンして数値化し、複数の文字体系を横並びで比較するという作業が、計算機なしではまず不可能だったのが、今は実行可能になった。3000年離れた異なる文明の文字を、同じ枠組みで分析できる環境が整ったというのは、実は革命的なことです。

面白いのは、この手法の発見そのものが「お役所仕事は普遍的」という人間洞察に行き着いている点。どんな文明でも、税金や物資の管理には決まった様式ができる。意味が読めなくても、その社会のリアルな営みが文字の使い方に映り込んでいるという話なのかもしれません。

まだ回答がありません

ログインすると、回答を投稿できます

つまり『どの時代、どこの文明の行政も似た形をしてる』って、すごく当たり前な話なの？それとも驚くべき発見なの？

当たり前だと思う気持ちはよく分かるんです。「人間は人間だから、どこでも同じ」という直感ですよね。でも実際には、そうじゃないらしい。言語学や人類学では、社会構造が文化によって大きく異なることが知られています。儀式を重視する社会と実務を重視する社会、口頭伝承が中心の社会と記録を中心にする社会——こういった違いが、文字の使い方にも反映されるはずだったんです。この研究の驚きは、その予想を裏切った点にあります。言語も系統も全く違う古代文字たちが、行政文書という場面になると、同じ5つのパターンを共有していた。つまり、人間が「ものを数えて、管理する」という実務的な必要性に直面したとき、脳や言語体系の違いを超えて、似た表現形式に辿り着いてしまう。それは言語の多様性よりも、人間の機能的な制約の方が強いということなのかもしれません。言い換えれば、『お役所仕事』は、人類普遍の問題解決パターンなのだと考えられそうです。

AIAIからの回答

当たり前だと思う気持ちはよく分かるんです。「人間は人間だから、どこでも同じ」という直感ですよね。でも実際には、そうじゃないらしい。

言語学や人類学では、社会構造が文化によって大きく異なることが知られています。儀式を重視する社会と実務を重視する社会、口頭伝承が中心の社会と記録を中心にする社会——こういった違いが、文字の使い方にも反映されるはずだったんです。

この研究の驚きは、その予想を裏切った点にあります。言語も系統も全く違う古代文字たちが、行政文書という場面になると、同じ5つのパターンを共有していた。つまり、人間が「ものを数えて、管理する」という実務的な必要性に直面したとき、脳や言語体系の違いを超えて、似た表現形式に辿り着いてしまう。それは言語の多様性よりも、人間の機能的な制約の方が強いということなのかもしれません。

言い換えれば、『お役所仕事』は、人類普遍の問題解決パターンなのだと考えられそうです。

まだ回答がありません

ログインすると、回答を投稿できます

この研究で『行政文書』と判定されたものの中に、実は宗教と行政が混ざってた文書が隠れてたりしないんですか？

古代社会では行政と宗教の境界がいまとは全く違いますから、その懸念はかなり妥当だと思います。たとえば古代エジプトなら、ナイル川の氾濫予測も、税の徴収も、神殿の祭儀も、すべて王という一人の人物に集約されていた。「今年の納税額は神意によって決まる」というふうに、両者が渾然一体だったわけです。この研究の ARCH プロトコルは「文字列のパターン」で判定しているというのが味噌で、実務的な反復性を見ているんですね。リスト、数字、規則正しい区切り——こうした特徴があれば行政文書と判定する。けれど、祭儀の記録も同じ構造をしていたら、混在したまま「行政」に分類されてしまう可能性はあります。ただ、研究者たちがこのプロトコルを開発した段階で、そうした限界は当然自覚しているはずです。むしろ「完全に区別するのは不可能だが、傾向は見える」という前提で動いてるのではないか。古代社会の複雑さを知りながら、パターン認識の有用性と限界をどう折り合わせるか、その工夫のさなかにあるのかもしれません。

AIAIからの回答

古代社会では行政と宗教の境界がいまとは全く違いますから、その懸念はかなり妥当だと思います。

たとえば古代エジプトなら、ナイル川の氾濫予測も、税の徴収も、神殿の祭儀も、すべて王という一人の人物に集約されていた。「今年の納税額は神意によって決まる」というふうに、両者が渾然一体だったわけです。

この研究の ARCH プロトコルは「文字列のパターン」で判定しているというのが味噌で、実務的な反復性を見ているんですね。リスト、数字、規則正しい区切り——こうした特徴があれば行政文書と判定する。けれど、祭儀の記録も同じ構造をしていたら、混在したまま「行政」に分類されてしまう可能性はあります。

ただ、研究者たちがこのプロトコルを開発した段階で、そうした限界は当然自覚しているはずです。むしろ「完全に区別するのは不可能だが、傾向は見える」という前提で動いてるのではないか。古代社会の複雑さを知りながら、パターン認識の有用性と限界をどう折り合わせるか、その工夫のさなかにあるのかもしれません。

まだ回答がありません

ログインすると、回答を投稿できます