

約8割のエンジニアが陥る? AI専門家が語る「疑似相関」の罠を回避し、因果関係を見極める方法
【PR】 ITニュース
昨年9月、米OpenAIが発表した新たな推論モデル「o1」は象徴的な出来事だったが、ここ最近のAIの推論能力の向上がめざましい。2025年もこの流れは加速し、AIはビジネスのあり方を変えていくだろう。
そんな中、機械学習やデータ解析などのAI分野を専門とするエンジニアの「約8割が見落としがちなことがある」と語るのが、製造業のデジタル化やAIソリューションの提供に注力する横河デジタルで、AIプロジェクトをリードする岩城秀和さんだ。
岩城さんは第二次AIブームが終わる90年代後半から現在まで数多くのAI関連の研究および事業に携わってきた、AIの専門家だ。岩城さんは、ビジネスでのAI活用が増える中、「データ分析において、“疑似相関の罠”にハマってしまっている人を多く見かける。ここを間違えるとビジネスが停滞する恐れがある」とも指摘する。
「疑似相関」という名の落とし穴。一体どういう罠なのだろうか。岩城さんが例に挙げたのは「アイスが売れると水難事故が増える」という説だった。

横河デジタル株式会社
DX/ITコンサルティング事業本部
AIコンサルティング部
シニアAIコンサルタント
岩城秀和さん
東京工業大学(現東京科学大学)大学院 知能システム科学専攻修了。オリンパス株式会社に入社後、米国パデュー大学の客員研究員として、監視カメラ社会におけるQOL向上を目指した共同研究に従事する。また、小腸用カプセル内視鏡の映像要約技術の開発や、大腸内視鏡検査におけるポリープ発見支援AIの開発に取り組み、同社初のAI内視鏡システムの上市に貢献した。さらに、腹腔鏡手術における手術プロセス認識AIを米国MITと共同研究し、その成果はICRA2020に採択された。2022年にはソニーセミコンダクタソリューションズ株式会社に転職し、エッジAIプラットフォーム「AITRIOS」のAI品質向上に貢献する。専門分野はAI、医用画像処理、空間認識。2024年7月より現職
「アイスが売れると水難事故が増える」の落とし穴
ーー早速ですが、「アイスが売れると水難事故が増える」説とは、何なのでしょうか?
この言葉だけ聞くと、ついつい「そうなの?」「どういうこと?」と真相を知りたくなるかもしれませんが、これはデータを見る際に“陥りがちなミス”を分かりやすく伝えるために引き合いに出される例えです。

アイスの売上と水難事故の数に因果関係はありません。もし因果関係があるなら、アイスの販売を止めれば、 水難事故は減るはずです。しかし、実際はそんなことにはなりませんよね。
ただし、二つの事実に相関関係はある。当然ですが、アイスが売れるくらい暑い日には海や川で遊ぶ人が増えますから、それに伴って水難事故の数も増えるわけです。
このように、実際は因果関係がないにもかかわらず、見落としがちな要因(今回の場合は「気温」)によって、あたかも因果関係があるように見えてしまう現象を「疑似相関」といいます。「アイスが売れると水難事故が増える」説とは、この疑似相関のことを言っているのです。
前職も含め、100を超えるAI活用プロジェクトを見てきた私の感覚だと、8割近くのAIエンジニアはこの疑似相関に惑わされているように感じています。
ーー因果関係と相関の違いを見極めるのはそれほど難しいものなんですね。
そうですね。アイスの例だと、事故が発生するまでの背景は容易に想像がつくので疑似相関を見極めやすいのですが、実際の現場だとそううまくはいきません。
例えば、「ある特定の人が出社するタイミングでいつもデータがおかしくなる」「この人がPCを触ると故障する」といった現象があるとします。エンジニアが「クラッシャー」と呼ぶような人たちです(笑)

たまたま機械が壊れるタイミングに居合わせる人というのは結構いるのですが、それも偶発的なことで、相関はあっても因果関係はありません。
実際にあった話ですが、よくよく調べると、その人が出社してくる時間帯に毎日ダンプトラックがオフィス前を通過することが判明し、その振動がデータに影響している可能性が高いとなりました。
ダンプカーが通る事実を知らない限り、到底たどり着けない結論ですよね。つまり、入力するデータの中に因果関係につながる要素がなければ、正しい結論にたどり着けないわけです。
ーー誤った見方をしてしまうと、どんな問題が起きるのでしょうか。
手元にあるデータから見える答えばかりを追いかけてしまうと、疑似相関であることを見抜けないばかりか「アイスの販売を禁止にすれば水難事故は減らせるはずだ」と解釈してしまい、誤った解決策を講じたり、本当の問題が見えづらくなったりしてしまいます。
さらに不幸なのは、因果関係がないのに(疑似相関なのに)、偶然うまくいってしまうケースです。つまり、アイスの販売を禁止した年に、たまたま水難事故の数が例年より減る、なんてこともある。そうなると事態はより深刻になります。関係者の誰もが「(アイスの販売禁止で)うまくいった」と認識してしまい、根本的な対策を打つことができなくなってしまうからです。
そもそも因果関係というのは複雑で、ある一つの要因がある現象を100%左右するということは滅多にありません。たいていは複数の要因が関係しています。
近年はAIが勝手に因果関係を見つけ出してくれるようになってきましたが、その要因のデータが分析するデータの中に入っていなければ、AIでも発見しようがありません。何がパラメータとなり得るのかは、結局人間が見当をつけなければならないのです。
因果関係を見極める三つのポイント

ーーでは、AIエンジニアはどうしたら正しい因果関係に気付けるようになりますか?
因果関係に気付く確率を高めるポイントは大きく三つあると思います。一つは「現場に行く」ことです。問題が発生している現場に赴き、どういう環境なのかをしっかりと把握する。アイスの例であれば、現場に行けば暑さや視界の悪さ、騒音レベルなど、いろいろな要素が目につくはずです。
すると、記録(入力)するデータ項目にアイスが売れた数や水難事故の数だけでなく、天気や気温、湿度……と入力すべき項目の精度があがります。逆に、気温のデータを取っていなければ一生解決には至りません。
AIエンジニアは部屋で作業する時間が長いので、ついデータの世界に閉じこもってしまいがちですが、現場に赴き、パラメータになりそうな要素を人間としての感覚で感じ取ってくることはとても大切です。
ーーAIをうまく使うためには、人間しか持っていない五感を使うことが大事だなんて面白いですね。
人間はAIに、人間と同じことをさせたいんですよね。であれば、人間がその問題を解決するために必要なデータは、AIにも余すことなく渡してあげる必要があるんです。そうでないとAIとの間に情報格差が出てしまい、とんちんかんな出力になってしまいます。
ーー因果関係を見極める上で大切なこと、二つ目はいかがでしょうか。
二つ目は「仮説を持つ」ことです。当たり前のように聞こえますが、若い人ほど仮説もほどほどに「とりあえずやってみよう」マインドになりやすい。おそらく、今は便利なツールがゴロゴロ転がっているので、一から作りこむ必要がなく、すぐ試せてしまう環境のせいでしょう。
しかも、疑似相関みたいなものは早い段階で見つけられるので「このデータを使えばうまくいきそうだぞ」と早合点しがちに。それが悪いわけではないのですが、分析を進めるほど「自分のやっていることは正しい」と信じたくなるのが人間の性です(笑)。プロジェクトも中盤に差し掛かると「最初の前提」を確かめたり、見返すことはほぼありませんから注意が必要です。
ーー一度やり始めると、なかなか止められない……肝に銘じておかないといけないですね。
そうです。こうした事態に陥らないために、「仮説を振り返る」が三つ目のポイントとなります。
ーー具体的には?
本来AIエンジニアは、実験を通して「仮説が違う」と分かったら、何か一つ教訓を得なければなりません。しかし仮説を振り返らないと、実験をしたところで何も得られないんです。私はそういう残念な実験を山ほど見てきました。
しかし仮説を振り返ることで、思ったような結果にならなくても「仮説を立てる段階で問題があったはずだ」と前提に立ち戻ることができます。
仮説を作って確かめる。仮説が外れたらなぜだろうと考える。これを繰り返すことで、問題の原因にたどり着ける可能性が高まります。
仮説を作る「前提」に弱いところはないか?
ーーAIエンジニアが疑似相関の問題に陥らないように、岩城さんはどんなアドバイスをしていますか?
自分がエンジニアによく聞くのは「この仮説は何を前提としているのか?」ということです。仮説とは前提を積み上げた結果生まれるものなので、その前提のうちどれか一つに怪しいものがあると、仮説も誤ったものになりやすいからです。
例えば、ある商品を企画したときに「Z世代はこんな商品が好きだ」という仮説を立てたとします。その前提として「Z世代はこんな味が好き」ということが分かるデータを使ったとしましょう。これは一見問題なさそうですが、そのまま使うには注意が必要です。例えば地域によって嗜好に偏りがある可能性がある場合は、地域差を考慮したデータを使わなければなりません。

私に言わせてみれば、うまくいっていないプロジェクトほど、仮説の解像度が足りていません。仮説を立てるときは、使ったデータをどこから持ってきたのか。それこそ、5W1Hみたいなレベルの情報を一つ一つ念入りに確認する必要があります。
ーーどうすれば最初から解像度の高い仮説を作れるようになりますか?
疑似相関に惑わされず、良い仮説が立てられるようになるには一定の経験が必要です。なので、最初からうまくやろうなんて考えない方がいいかもしれません(笑)
私自身は前職も含めて約26年、あらゆるAIプロジェクトに携わってきました。前職で所属していた部門ではAIプロジェクトが多数発足していて、あちこちのチームからヘルプを要請されては赴き、仮説の見直しやアドバイスをしてきました。業界は違えど、こうした「分析作業の基本」は汎用性が高く、経験するほどに見極める力が上がっていることを実感します。
キャリアも仕事も仮説思考で。シニアでもいい転職はできる
ーー岩城さんは横河デジタルで今どのようなプロジェクトに携わっていますか?
製造や物流、生産管理などの、サプライチェーン上のさまざまな領域をAIでDXし、最適化や効率化を目指すプロジェクトに携わっています。
GAFAMなどが行っているAIの技術開発は、いずれデータ不足に陥り頭打ちになる可能性がありますが、データを使って産業の課題解決をする領域は未だブルーオーシャンです。
そんな中、当社は親会社が横河電機ということもあり、会社自体がサプライチェーンの全領域にアクセスできる。他では得られない生のデータを豊富に得ながらAIを使った課題解決に取り組めるんです。
仮説をいかにしっかり作れるか。プロジェクトの成否や質はここにかかっていることが多いので、やりがいがありますよ。

ーー50代でありながら納得のいく転職ができた理由は何だと思いますか?
分かりやすい実績があったからじゃないかなと思います。例えば、このプロジェクトのどこを担っていたとか、この論文を書いたとか。私の場合は海外大学の客員研究員もしていたので客観的にみても実績や成果が分かりやすかったのだと思います。
ーー有名大学の客員研究員……誰もができるものではないですね(汗)
大それたものじゃなくてもいいと思います。特に若いうちは、なかなかそのような成果は生み出せないですから。成果の大きさではなく、他者に説明できるか・できないかの違いだと感じます。
例えば、課題に対してどんなアプローチで解決したのか。自分で思考し、取り組んだことを説明できることが重要です。そのためには、分析と同じく、仮説を持っておくことをおすすめします。
私自身、最初から自分のやりたい仕事ができたわけではありませんでした。もともと医療機器の開発を志していたのですが、配属先がドンピシャの部門じゃなかったりして最初の10年はそのチャンスがなかったんです。
それでも「この仕事をやればこんなスキルが身につくのではないか」という仮説を立てながら経験を重ねる中で、やりたい仕事ができるスキルを身に付けていきました。
転職で武器となるような分かりやすい実績は、一朝一夕に生まれるものではありません。業務においてもキャリアにおいても、仮説を立て、それを検証しながら一歩一歩着実に前へ進んでいく姿勢が、最も大切なのではないでしょうか。
文/一本麻衣 撮影/赤松洋太 編集/玉城智子(編集部)
RELATED関連記事
RANKING人気記事ランキング

NEW!
早期退職の嵐、予兆はどこに出る?「ネットで“自分”を公開」がパニック回避に

NEW!
AI全盛期にオンプレミス回帰が加速? クラウドファースト見直しで問われるインフラエンジニアの役割

生成AI時代におけるデータサイエンティストの価値とは? 今後求められる三つのスキル

「ただ作る」だけでは足りない。ビジネス価値の最大化に挑む“攻めのシステム開発”の実態

大AI時代、FF14・吉田直樹がエンジニアの“手”に託す希望とは?【聞き手/今井翔太】
JOB BOARD編集部オススメ求人特集
タグ