BLOG

「データの世紀」の落とし穴

日本経済新聞で「データの世紀」という特集が4月6日から始まった。初回は堂々1面でトイレットペーパーの買い占め問題をツイッター分析から「善意の投稿 人類翻弄」ときた。コロナ問題が始まる前からAI、ビッグデータはホットな話題であり、ホットの2乗のタイムリーな企画だ。

と、思った。しかし、読んでみるとあれ?トイレットペーパーの買い占めが起こったのは(そもそもこの「買い占め」という言葉使いもどうかと思うが)テレビニュースでカラの棚を何度も取り上げたからではないのか?トイレットペーパーを買っていた層とツイッターの利用者層がどの程度重なるのか?さらに言えば、ツイッターは原因ではなくて、結果ではないのか?「デマのツイッターではなく、それを打ち消そうとしたツイッターが実は問題だった」という、思い込みを裏切るinterestingな記事に見える(これは毎年清水ゼミ第1回目のテーマ)が、実際は初めから「ツイッターが犯人だ」と決め打ちの冤罪事件のように見える。

数日前に、中国でスタバをしのぐ勢いで成長しているといわれていたラッキンコーヒーの粉飾が見つかって株価が急落したという報道があった。それは「監視カメラによる981店舗の来店客数の1万時間記録」「2万5千枚のレシート」「WeChatの会話記録」の分析からの告発に端を発する。これでは認めないわけにはいくまい。

「ガーベッジイン、ガーベッジアウト」という言葉がある。「データの世紀」だからこそ、全体像をもち、データに振り回されないことが重要であると、最終回のメッセージを先取りしたのかもしれない。ちなみに、これは(遠隔)清水ゼミ第2回目のテーマです。