●代表値 社長として判断を下すときは、多くのデータを参考にすることになる。そのデータの見方にもフレームワークを当てはめることで、一元的な判断にならず、データが示しているものを多方面から捉えることができるようになる。 代表値とは、調査したグループの中の特徴を表す数値のことをいい、平均値、中央値、最大値と最小値などがある。 同じデータでも、どの数字を見るかによって分析結果は異なる。そのため、それぞれの値を理解し、多面的に理解をすることが大切だ。様々な値から対象を見ることでグループの特徴が立体的に理解できるようになる。 平均値は、データの値の合計をデータの総数で割った値。すべてのデータを考慮した値になるため、グループ全体の特徴を理解することが可能だ。 ただ、データの中に大きく乖離した「外れ値」と呼ばれるデータがあると、その影響を受けやすいという弱点がある。この「外れ値」のうち、原因がわかっているもののことを「異常値」という。 中央値は、データを小さい順に並べたときに中央にくる数値のことを指す。中央値があると、外れ値を含んでいる場合でも集団の特性を把握しやすい。最大値は、データの中の最大の値。そして最小値とはデータの中の最小の値のことだ。 どこを切り取って見るかで、データから受ける印象は大きく異なる。平均値だけを見て「高すぎる」と思っても、中央値を見れば「適切だ」という判断ができるかもしれない。また、外れ値や異常値を把握することで、ビジネスの穴(あるいはチャンス)を見つけることもできるかもしれない。 今の時代、どんなビジネスでもデータ分析が重要になっているが、ただ数字を見ればいいのではない。あらゆる値を見て、多面的に捉えることが大切だ。また、何か数値を示されたら、それはデータのうちのどの値なのかを理解することで、真実を知ることに近づく。 ●標準偏差 標準偏差とは、データのばらつきを示す指標だ。この値が大きければ、そのデータのばらつきが大きいということを示すのだが、ここでは難しい統計学の話はしない。それよりも、正規分布の図をイメージすることで、フレームワークとして活用したい。 正規分布では、平均値に最も多くのデータがあり、そこから離れるに従ってデータ数が減っていく。例えば「小学 4年生男子の身長」というデータをグラフにしたとき、平均値あたりの最も人数の多いところで山を描き、そこから左右に裾野が広がっていくような図形になる。 このような正規分布を描くとき、平均値を挟んだ標準偏差の範囲内に、全体の 68%のデータが含まれる。
100人の小4男子の平均身長が 137センチなら、そのうち 68人は、マイナス 34%である 90・ 4センチから、プラス 34%の 183・ 5センチの間にいる、ということだ。もし小4で身長 190センチの少年がいたとしたら、それは標準偏差から外れていることになる。 これをビジネスにどう応用するのかというと、自分がやりたいことが標準偏差の中に収まるかどうかを確認するのだ。 例えば、保険の営業をするときに何人に声をかけると売上が立つのか、原宿駅前でお昼の時間帯にチラシを撒いたら何人が受け取るかなどは、試行回数を増やすことで平均値がわかる。すると、その前後 34%の範囲内の成果を出せる確率が 68%ある、とわかるのだ。 多くの人は、平均値しか意識しない。たしかに正規分布では「平均値 =中央値 =最もデータ数の多い値」だが、それで全体の大半をカバーできるわけではない。前後 34%まで含めることで、全体の約 7割を見ることができるようになる。 ただし、これは正規分布を描くようなデータにおける真実であって、例えば日本の年齢別人口のようなデータには当てはまらないので注意してほしい。また、ここで言いたいのは「思考の枠組み」として標準偏差であるから、正確なデータ分析をしろという話ではない。よくわからないという人は、無理に使う必要もない。 どのフレームワークにも言えることだが、あくまで物事を多面的に捉えるためのヒントに過ぎない。標準偏差を用いたからと言って、絶対に正確な判断を下せるわけではない。 ただ、普段はしない見方をすることで、自分では気づけなかった落とし穴に気づくこともある。そのような前提で、自分に適しているフレームワークを見つけてほしい。
コメント