先日、『統計でウソをつく法』を読み返しました。

いや、必読書と言っていい本です。

『統計でウソをつく法』は、世間にあふれている「おかしな統計」を見抜くヒント集。

テレビでも新聞でもウェブでも雑誌でも、あらゆるメディアで統計、平均、グラフを目にします。

けれど、その中身は玉石混交。

ほとんど悪意を感じるような統計もあるし、悪意がなくても結果的にウソになってしまっている統計もある。

それを読み解いて、数字に踊らされずに、自分の頭で考えて判断できるようになるための本。

早速、ご紹介しましょう!

『統計でウソをつく法』章立て

  • 第1章 かたよりはサンプルにつき物
  • 第2章 ”平均”でだます法
  • 第3章 小さい数字はないも同然
  • 第4章 大山鳴動 ネズミ一匹
  • 第5章 びっくりグラフ
  • 第6章 絵グラフの紅葉
  • 第7章 こじつけた数字
  • 第8章 因果はめぐる
  • 第9章 統計操縦法
  • 第10章 統計のウソを見破る5つのカギ

統計でウソをつく4つの方法

本の中から、特によく見かける「騙しのテクニック」を4つピックアップしてまとめてみましょう。

  1. サンプルの偏りで騙す
  2. 平均で騙す
  3. グラフで騙す
  4. 因果と相関をごっちゃにして騙す

サンプルの偏りで騙す

統計をするとき、理想は「全部」を調べることです。

日本国民の声がどうなのかを調べようと思ったら、日本国民全員に聴くのが一番単純な方法。

けれど、実際にはそんなことできません。手間がかかりすぎる。

そこで、統計では「サンプリング(標本調査)」を使います。

全部の中から、一部を拾い出すわけです。

が、ここで問題が起きます。

拾いだした一部(サンプル)が、上手く全体の縮図になっていればいいんですが、そうでないことも多い。

例えば、完全歩合制の営業職を募集している会社が、こんなことを言います。

「我が社の営業マンは全部で150人いますが、平均年収は1,000万円を超えています。あなたも努力次第ではそうなれますよ」なんて。

これなんか典型的な「偏ったサンプルを元に出した数字」です。

完全歩合制の営業ということは、営業で成績を残せなかった人はすでに退社していて計算に含まれていないはず。

平均年収1,000万以上の人が150人誕生するのに、いったい何人が入社して、何人が去り、150人残ったんでしょう?

入社する人にとっては、その会社に入った人が平均的にどうなったかを知ることで、自分の行く末を考えたいはず。

けれど、歩合制の営業で成功した凄腕の人ばかり、そんな偏ったサンプルで統計を取ったら、出てきた数字はまったく信用できないものになります。

統計は30人よりも50人、100人と数を増やしたら正確になっていくと思われがちですが、それ以前に「その100人って誰なの?」「偏った100人じゃないの?」ってことがとっても大事です。

平均で騙す

また、平均もよく「騙しのテクニック」として使われることがあります。

平均には、「全体のバラつき、傾向が見えなくなる」という欠点があるからです。

例えば、極端ですが以下のようなケース。

ST株式会社の年収(架空の会社です)

年収 人数
8,000万円 1人
1,600万円 1人
800万円 1人
500万円 5人
350万円 7人
220万円 13人

これ、平均の年収は650万円です。

ただ、「我が社の平均年収は650万円です」って言われて思い浮かべるイメージとは、かけ離れていますよね。

一部のべらぼうに高い報酬をもらっている人が平均を釣り上げているだけで、人数として一番多いのは220万円。

こんなふうに、算術平均では「全体の分布がどうなっているか」が分かりません。

全体の傾向として給与が高いのか、一部の人が平均を釣り上げているだけなのかが見えてこない。

なので、平均を見るときには、あわせて「最頻値」と「中央値」という考え方も知っておくと、数字に踊らされにくくなります。

最頻値とは

最頻値というのは、文字通り、一番頻繁に登場する数字。

先ほどの給与の例で言えば、13人がもらっている220万円が最頻値です。

この最頻値は、多数の人が実感として感じている数字に近くなります。

中央値とは

また、サンプルのちょうど真ん中の順位にある数字が「中央値」です。

上の例でいくと、全28人を給与の高い順に並べます。

データが奇数ならちょうど真ん中の数字が、そのまま中央値。

偶数なら(今回は28人)、真ん中に近い2つの数字(今回なら14番目、15番目)の数字を足して2で割った値(330万円)になります。

中央値は、ちょうど真ん中の数字を選ぶので、データ全体の実態を掴みやすいです。

平均って言葉が出た時には、

  • 「裏にどれくらい数字のバラつきがあるんだろう」
  • 「中央値や最頻値はいくつなんだろう」

こんなふうに一瞬考えるようにすると、その平均を鵜呑みにせずに考えることができます。

グラフで騙す

また、目に見えて分かりやすいので多用されるグラフ。

これも簡単に人を騙すことができます。

以下のグラフは、同じ数字を元にしています。

違うのはグラフのスケールだけ。

上のグラフは、27~36。下のグラフは0~50。

全然印象が違いますよね。 000364_statistics-1

スケールを細かくすればするほど、大したことない変化が「ものすごい変化」に見える。

逆にスケールを大きく刻めば、それなりの変化も「些細な変化」に見せることができてしまう。

グラフは分かりやすいですが、簡単に印象操作できてしまうツールでもあります。

因果と相関をごっちゃにして騙す

また、因果と相関で騙す方法もあります。

因果っていうのは、「Aが原因で、Bが起きた」っていう原因と結果のこと。

相関っていうのは、「Aが上がると、Bも上がる傾向がある。Aが下がると、Bも下がる傾向がある」という関係性のこと。

この相関と因果をごっちゃにしないことが、めちゃくちゃ大事。

例えば、O社のダイエット食品を食べる人は、肥満が多いことが分かった。

O社のダイエット食品には、ダイエット効果はないばかりか、太る原因なのでは。

こんな話があったとしましょう。

「ダイエット食品が原因で、肥満が起こる」という発想です。

でも、実際は全然違いますよね。

「もともと太っている人が、痩せたくてダイエット食品を食べている」わけです。

体重の多い人ほど、ダイエット食品を食べる率が多くなるっていう相関関係はあるでしょう。

けれど、それは原因と結果ではありません。

この「関係ないものを、いかにも原因と結果風に語る」のは、そこら中に溢れているので、 ちょっと目を凝らせばいくらでも見つかります。

何かの健康食品を食べ続けると、病気のリスクが下がった、なんていう話もよくありますよね。

本当に健康食品がカラダにいいのか(因果なのか)、それとも健康食品にお金を払い続けるくらい健康への意識が高い人は、もともと病気にかかりにくい生活習慣を持っているから病気リスクが低いのか(相関なのか)、もっと厳密な調査をしなければ、本当は分からないです。

まとめ

統計や数字は、いくらでも「作る」ことができるものです。

特に作り手に「こういったことが言えたらいいなぁ」という気持ちがある場合、いくらでも見せ方を変えることができてしまいます。

ありとあらゆるものの効果が、統計や数字で語られる時代。

『統計でウソをつく法』は、統計を見たときに、鵜呑みにせず、自分の頭で考えられるように手助けしてくれる一冊。

おすすめです!

スポンサードリンク

【ご案内】

新規のコーチング受付について

2017年3月:残1件

2017年4月:残2件

2017年5月:残2件

コーチングについて、詳細はこちらから。

お問い合わせはこちらのフォームからどうぞ!