メインメニューをとばして、このページの本文エリアへ

Listening

<坂村健の目>パナマ文書 調査報道の将来

[PR]

 パナマ文書については、いろいろな方面で話題になっているが、我々の情報科学の分野的にもなかなか興味深い事件である。

 ただ今回の興味のポイントは、ハッキングとかではない。ポイントはデータのサイズ。「文書」と言うが、実は1150万ファイル、2・6テラバイトという巨大データの塊がその正体だ。

 経済犯罪で検察や調査報道の記者が行うのが押収文書の分析。文書を読み込んでその中に出てくる登記上の名前や住所が実質同じなのかとか、取引相手の血縁関係といった相関図を作り金の流れを追い、本当は誰の金なのかを解き明かす。

 しかし、2・6テラバイトは小さめの図書館にも匹敵する文書量。その分析はもはや人間のおよぶところではない。当然コンピューターの出番となる。

 いわゆるビッグデータ処理だ。パナマ文書が公開されたというのに、やり玉に挙げるべき人の名前がすぐに出てこないのは何かの陰謀か?という声もあった。しかし、陰謀も何も、手書き文書のスキャンまで交じっていたというから、純粋に全文対象検索できるところまで持っていくだけでも大変だったろう。

 ただ、やはり感慨深いのは、そのビッグデータ処理のパワーがあっというまに−−いわば「民主化」しているということだ。全文検索エンジンだけでなく、ドキュメント分析、メタデータ抽出、インデックス化、相関関係分析のオープンソースのツールキットがネットで簡単に入手できる。さらに、賃貸しのクラウド計算資源を使えば、個人の出せるお金程度でそれらを実行できる。

 とはいえ、大量の外国語の文書、世界の税制度の知識に加えて、ビッグデータ処理に関する知識が必要となると、日本独自の報道がないのも当たり前。とても分析できるとは思えない。現在は知識さえあれば個人でもものすごいパワーが使える時代だが、同時に要求される知識のハードルはかなり高い。

 リークを最初に受けた南ドイツ新聞も国際調査報道ジャーナリスト連合を巻き込んだ。大量データ解析の技術に明るく、IT企業とも協力体制をとれる新しい時代のジャーナリストのグループがいるからだ。

 ただ調査過程の報告を見ると、どんなにハイテクを使っても裏社会の関係といった従来的な知恵や勘による解釈も大事で、それにより調査を絞りこまないと総当たりはいくらハイテクでも無理らしい。

 ちなみに、最近の「将来職業が無くなる論」から言えば、これは新しい職業の芽生えともいえる。今から10年後はプログラミング技術を駆使し調査報道する職種が生まれているかもしれない。人工知能も少なくとも近未来では自らの意図を持たない。問題意識を持って調査報道する職業人が、社会に必要であることは変わらない−−ただし、求められる資質は大きく変わっているだろう。(東大教授)=次回は6月16日

コメント

投稿について

読者の皆さんと議論を深める記事です。たくさんの自由で率直なご意見をお待ちしています。

※ 投稿は利用規約に同意したものとみなします。

利用規約

おすすめ記事
広告
毎日新聞のアカウント
ピックアップ
話題の記事

アクセスランキング

毎時01分更新

  1. 「嵐フェス2020」収録中の花火で神宮球場の試合中断 ジャニーズおわび

  2. 大阪・梅田HEP FIVEで高校生転落し死亡 路上の19歳巻き添え意識不明

  3. 特集ワイド れいわ・山本氏、強気姿勢から現実路線に? インディーズ魂のままで 結党1年余、リーダーの顔に

  4. 「優しく温厚。成人式で会えると…」 大阪・巻き添え死 女子学生の友人が涙

  5. #排除する政治~学術会議問題を考える 行革や効率性で「文句を言う人」飛ばす怖さ 菅政権の新自由主義 重田明大教授

編集部のオススメ記事

のマークについて

今週のおすすめ
毎日新聞社は、東京2020大会のオフィシャルパートナーです