ITツールの発達により、様々なデータを低コストで集められる時代になりました。
ただし問題は、それをどう分析し、仕事やビジネスに活かすかです。
最近、統計学の本がブームになったのも、その方法を知りたい人が多いからでしょう。
もちろん、統計学を学ぶことはムダではありません。
しかし、それであなたの仕事に何か変化はあったでしょうか。
理論については納得できても、日々の仕事にどう活用すればいいかわからない人もいたのではありませんか?そこで本章では、私が実際に仕事でよく使う「七つのデータ分析手法」を紹介しましょう。
①プロセス分析、②散布図と単回帰分析、③重回帰分析、④パレート図分析、⑤T勘定、⑥差異分析、⑦LTV分析手法そのものを解説するだけでなく、様々な事例を想定し、どんな場面でどのように使うのかを具体的に説明するので、「数値化によって問題解決をする」というのがどういうことか、きっとイメージをつかんでもらえると思います。
それとあわせて、知っておくと便利なデータ分析のツールも紹介します。
いずれも難しい統計学の知識や高度なエクセルのスキルは一切不要です。
ぜひあなたも、今日から実際に仕事で使ってみてください。
①プロセス分析──シンプル&簡単な手法なのに効果は抜群!最初に紹介するのは、「プロセス分析」です。
ソフトバンク時代はもちろん、私が現在手がけるトライズの事業でも、毎日のように使っています。
ビジネスパーソンなら誰でも、仕事で思うようなアウトプットが出ずに悩むことがあるでしょう。
そんな時、「仕事の始点から終点までのどこに問題があるのか」を明らかにし、具体的な改善策を考え出すための手法として、効果抜群なのがプロセス分析です。
プロセスに分けて、プロセスごとに計測して記録し、解決策の仮説を立てて実行し、また数字で検証する──。
このサイクルを高速で回していくというものです。
基本中の基本となる手法なので、やり方そのものは至って簡単です。
エクセルを使ったほうがラクではありますが、ノートに手書きで記録するだけでも構いません。
当然、統計学の知識はまったく不要です。
シンプルかつとても簡単な手法なのに、その効果はてきめんです。
本章で紹介する〝七つ道具〟の中でも、特に効果が目に見えてはっきりと出るものであり、どんな職種や業種であっても使える応用範囲の広さが特長です。
にもかかわらず、実際に使っている人はさほど多くないようです。
でも、それは非常にもったいない!事例をもとに、詳しく解説していきましょう。
事例不動産仲介会社の若手営業マンA君は、入社して二年。
「トップセールスになるぞ」という意気込みで始めた仕事ですが、「一ヶ月に一件、売買契約を取る」というノルマをなかなか達成できず悩んでいます。
上司や先輩からは「何ごとも経験だから、あまり難しく考えずに手足を動かせ」と言われ、深夜まで残業して頑張っていますが、「毎月一件」という数字を達成し続けるにはほど遠い状態が続いています。
歩合給の仕事で、個人事業主の集まりのような会社なので、上司や先輩が契約の取り方をていねいに指導してくれる機会もありません。
経験の少ないA君が、自力で毎月のノルマを達成できるようになるには、果たしてどうすればいいのでしょうか。
【プロセス分析による解決法】手順1プロセスに分けて、歩留まりを計測するA君がまずやるべきことは、第1章のポイント③で紹介したように、「契約までの業務フローをプロセスごとに分ける」です。
この場合も、「始点=初めてお客様と接するところ」です。
相手がWEBやチラシの広告に載っている物件についてメールや問い合わせフォーム経由で連絡をくれたり、知り合いの紹介で店舗を訪れたり、完成物件の見学会に参加したところなどが始点となります。
そして「終点=契約を結ぶこと」です。
始点と終点を定めたら、その間をいくつかのプロセスに分けます。
A君の仕事なら、ざっくりと以下の五つのプロセスに分けられます。
①初回接触・問い合わせ②物件案内・内見③購入申し込み④ローン審査⑤契約次に、プロセスごとに数字を計測します。
この場合なら、この一ヶ月で「①初回接触・問い合わせ」をしたお客様は何人か、そのうち「②物件案内・内見」に進んだのは何人か、さらにそのうち「③購入申し込み」に進んだのは何人か……といったように、五つのプロセスごとに歩留まりを計測します。
念のために説明しておくと、「歩留まり」とはもともと製造業の品質管理で使われる用語で、「ある品目の生産量に対して、それに含まれる良品の割合」を意味します。
よって、歩留まりが高いほど不良品が少なく、低いほど不良品が多くなります。
この歩留まりをホワイトカラーの仕事に当てはめると、「ある一定量の業務のうち、うまくいった割合」となります。
つまり、歩留まりが高いほど仕事がうまくいっていて、歩留まりが低いほど仕事がうまくいっていないというわけです。
A君が実際に一ヶ月間にわたり数字を記録したところ、結果は次の通りになりました。
①初回接触・問い合わせ五〇件②物件案内・内見二五件③購入申し込み一件④ローン審査一件⑤契約〇件これをグラフにすると、次のようになります。
手順2歩留まりから「問題のありか」を突き止めるこの月は友人からの紹介で、戸建購入にかなり前向きなお客様がいたので、何とかこの一件は契約を獲得したいと考えていました。
しかしプロセスの終盤にきたところで、金融機関のローン審査が通らず、結局この月も契約はゼロで終わりました。
ただしプロセスごとの数字とグラフを見れば、契約が取れない本当の理由は、ローン審査の段階にあるのではないことは明らかです。
五つのプロセスで、歩留まりが大幅に下がるのは「①→②」です。
「五〇件→二五件」ですから、歩留まりはたったの五〇%です。
確かに「②→③」の歩留まりも下がっていますが、ここは「戸建販売の仲介」という業務内容を考えれば、それほど極端な数字ではありません。
マイホームという人生最大の買い物をするのですから、賃貸物件の仲介とは異なり、物件を内見したからといってあっさりと購入申し込みに進む人のほうが少ないのは当然です。
おそらくA君も、プロセス分析をする以前から、「②→③」の歩留まりが低いことは感覚的にわかっていたはずです。
一方、「①→②」の歩留まり低下は、かなり問題があります。
①で接触したのは、広告を見たり、友人や知人から紹介されたりして、向こうからやって来たお客様ばかりです。
こちらから無理に勧誘したわけではなく、もともと住宅を購入したいというニーズがある人たちであるにもかかわらず、②につながったのが半数だけというのは、やはり少なすぎます。
つまりA君の仕事において、ここが「問題のありか」であり、真っ先に着手すべき問題だということです。
もちろん「②→③」の低さも課題ですが、改善すべき優先順位としては「①→②」が上になります。
手順3解決策の仮説を立て、中間目標を設定する私なら、すぐに「①→②」の歩留まりを上げるための解決策を考え、アクションに移ります。
そのためにやるべきことは、単純です。
それは、最初の接触から次のアポを取るまでに、日数を空けないことです。
物件について問い合わせをするのは、「家を買いたい」という気持ちが一番盛り上がっている時です。
しかし、時間が経てば経つほど冷静になり、家を買うこ
とそのものを再検討し始める人も出てきます。
また、住宅購入を考えた時、一つの物件しか見ない人はほとんどいません。
いくつも物件を見て比較検討するのが普通なので、他の不動産仲介会社にも同時に問い合わせをしている可能性が高いはずです。
したがって、のんびりしていると、すぐ競合にお客様を取られてしまいます。
タイミングを逃してしまうと、A君がいくら必死になって電話をかけても、二度とそのお客様とは連絡がつかないという結果に終わります。
そこでA君は、次の二つの目標を設定しました。
メールで問い合わせをもらったお客様でも、来店して連絡先を聞いたお客様でも、必ずその日のうちにメールや電話でコンタクトを取る。
初回の接触から一週間以内に次のアポを取り、物件案内をする。
そして、は一〇〇%、は五〇%を数値目標とし、その達成度合いも記録することにしました。
これが「中間目標」であり、A君の仕事における「KPI」(KeyPerformanceIndicator/重要業績評価指標)になります。
もともとKPIは経営管理に使われる指標ですが、「目標達成に向かってプロセスが適切に実行されているか」を計測する役割があるので、ぜひ個人の仕事においても設定すべきです。
もちろんA君も、一度接触したお客様にはなるべく早く連絡することを心がけていましたが、忙しさにかまけて後回しになってしまうお客様も少なくありませんでした。
この「なるべく早く」という曖昧な基準を数値化したことで、「自分がやるべきこと」が明確になったのです。
手順4仮説を実行し、結果を数字で検証するこの行動目標を自分に課して、一ヶ月仕事を続けたところ、「①→②」の歩留まりは「五〇%→七〇%」へと二〇%も改善しました。
その結果、始点で接触するのは以前と同じ五〇件でも、次の物件案内につながったのは三五件となり、実数も一〇件増やすことができました。
さらにA君は、「①初回接触・問い合わせ」をチャネルごとに分けて計測することにしました。
「WEBからの問い合わせ」「メールでの問い合わせ」「電話での問い合わせ」「店舗訪問」「見学会参加」などに分けて人数を計測したことで、「歩留まりの高い『見学会参加』のお客様を優先して対応しよう」といった順位づけも明確になりました。
こうして「①→②」の歩留まりが改善したら、次は「②→③」の改善に着手します。
この歩留まりが低いのはある程度仕方がないと前述しましたが、それはあくまで他のプロセスと比較しての話です。
「二五件→一件」というのは、たとえ乗り越えるべきハードルが高いプロセスだとしても、改善の余地は大いにあります。
そこでA君が思い出したのは、ある先輩営業マンの言葉でした。
「お客様と商談する時、提携先のハウスメーカーの設計士やデザイナーを早めの段階で連れていくようにしているんだ」不動産仲介会社の営業マンは、完成済の建売住宅だけでなく、土地や中古住宅も扱っています。
しかし、土地を購入して注文住宅を一から建てる場合や、中古物件を大幅リフォームする場合は、素人ではなかなか完成イメージがつきづらいもの。
顧客はよほどいい物件でなければ「またにしておこうか」となりがちです。
一方、プロの設計士やデザイナーがざっくりとでもいいからプランを作ってくれて、「この土地ならば、こんな感じの間取りの三階建てのおうちが建ちますよ」などと言ってくれれば、自分たちがその住宅に住んだ時のイメージがずっと具体的になり、購入意欲もぐっと高まります。
ハウスメーカーのほうもそれでお客さんになってくれればビジネスになるわけですから、「プランを作るなら手数料を払ってくれ」などとは言わないはずです。
だから先輩営業マンは、設計士やデザイナーに同席してもらい、一緒に打ち合わせをすることで、「こちらの土地なら、ざっくりとですが、こんなプランニングが可能ですよ」といった提案を早めにしてもらうことにしたのでしょう。
そこでA君も同じ戦略を実践することにしました。
つまり、「②→③」の間に「デザイナー・設計士によるプランニング」というプロセスが一つ増えたことになります。
そして、プランニングの提案ができたお客様の数を「一週間に一人、一ヶ月に四人」と目標設定し、数を計測して記録するようにしました。
最初は辞退するお客様も多かったのですが、「この物件を購入することになっても、必ずこのハウスメーカーに頼まなければいけないわけではないのでご安心ください。
あくまでプランニングは、無料のサービスですから」という一言を添えるようにしたところ、週に一人の目標を達成できるようになりました。
それに伴い、「②→③」の歩留まりも上がり、購入申し込みに進む割合も順調に上がっていったのです。
「購入申し込み→ローン審査」までは、ほぼ自動的に進むので、歩留まりは一〇〇%です。
しかし、なかにはローン審査で落ちてしまう人もいます。
せっかくここまで来たのに、最後になって契約に至らないのは、あまりにもったいない話です。
そこでA君は、「②物件案内・内見」のあとに「資金計画の相談」という新たなプロセスを加えました。
早い段階で相手の資金状況を聞き出せば、ローン審査に通るかどうかの見込みが立ちますし、そもそもお客さんの資産状況に見合っていない価格の物件を紹介することもなくなります。
そうすれば、最後の「④→⑤」の歩留まりも、確実に一〇〇%へと近づくはずです。
「中間目標」を設定すれば、モチベーションも向上するこうして、「プロセスに分けて、プロセスごとに計測して記録し、解決策の仮説を立てて実行し、また数字で検証する」というサイクルを回し続ければ、A君は必ず「毎月一件の契約」というノルマを達成できるようになります。
プロセス分析を使うと、なぜこれほど確実に結果を出せるかと言えば、「中間目標」を設定できるからです。
日々の行動目標を具体的な数字に落とし込めば、「今日の自分はやるべきことをやれたのか、それともやれなかったのか」がはっきりします。
「なるべく早くお客様に連絡をとる」だと、実際に連絡したのが初の接触から三日後や一週間後でも、自分が「できるだけ早くやったんだからいいや」と納得してしまえばそれまでです。
しかし「当日のうちに連絡した割合を一〇〇%にする」と数値で決めれば、今日の自分が目標をクリアできたかどうかは一目瞭然です。
だからこそ「残りのメールは後回しでいいや」ではなく、「今日お会いした全員に連絡するまで頑張るぞ」というモチベーションが生まれます。
また、クリアすべき中間目標を設定することで仕事がゲーム化され、毎日のように達成感を味わうことができるので、常に前向きな気持ちで仕事に取り組むことができます。
もし中間目標を設定せず、最終的な目標しかなかったらどうでしょうか。
A君の場合なら、「毎月一件の契約を取る」というのが最終目標ですが、それが達成できるかどうか見えてくるのは、月末が近づいた頃です。
それまでは、自分が目標達成にどれだけ近づいているのかもわからないため、「もっと頑張らなければ」という危機感や緊張感を持ちにくくなります。
だから
「今日はお客様に電話できなかったけど、明日やればいいだろう」と仕事を先送りしがちになるのです。
そんなことを繰り返すうちに月末が近づき、ようやく「今月もノルマ達成は厳しいぞ……」と気づいても、もはや取り返しはつきません。
一方で、頭の片隅には常に「今月はノルマを達成できるだろうか」と漠然とした不安が渦巻いています。
モヤモヤした不安はあるのに、目の前の仕事を頑張る意欲は湧かない。
これが中間目標を設定しない人の日常ということです。
よって、毎月のノルマや四半期ごとの目標といった「最終目標」を達成できずに悩んでいる人は、日々の行動に落とし込んだ中間目標を設定することが不可欠です。
その際は、自分で管理できる行動に対して、数字で目標を決めることが重要です。
「購入申込数を増やすために、営業トークを上達させる」といったものは、中間目標にはなりません。
何をもって上達したと判断するか明確な基準がありませんし、そもそも上達具合を自分でコントロールすることは不可能です。
それに対し、「問い合わせがあったお客様には、その日のうちに連絡を取る」「家族構成や自己資金といった重要な顧客情報を収集するための質問を、一回の面談につき最低でも三つはする」といった行動なら、自分で管理できます。
例えば前者について「一〇〇%」を中間目標にしたなら、その日会った全員に電話をかけたり、メールをすればいいだけですから、今日入ったばかりの新入社員でも自分の意思で実行できます。
「自分で管理できる行動」に対して数値目標を設定する最初に中間目標を設定する時は、あくまで仮のもので構いません。
A君は「お客様の五〇%に対し一週間以内に次のアポを取る」という目標を設定しましたが、それをやっても歩留まりが改善せず、「毎月一件」の最終目標も達成できない、ということもありえます。
その時は、「お客様の八〇%に対し一週間以内に次のアポを取る」といったように、中間目標そのものを修正すればいいだけです。
同様に、設計士やデザイナーを連れて商談したお客様の数を「一ヶ月に四人」としても最終目標を達成できないのであれば、ひと月の目標を六人や八人に増やしてみればいいでしょう。
こうして中間目標を調整しながら、歩留まりの変化や最終目標の達成度を検証し、また仮説を立てて改善策を実行するというサイクルを繰り返せば、きっと問題は解決します。
たとえすぐに最終目標を達成できなくても、「自分はこの仕事に向いていないのではないか」と迷いや悩みを抱えながら仕事をしたり、ひたすら根性と長時間労働で乗り切ろうとするより、ずっと建設的で意味のある努力ができるはずです。
今回は営業の事例を取り上げましたが、これはすべての仕事で応用できます。
データ入力する件数や資料を作成する枚数、関係者とコミュニケーションする時間や回数など、どんな仕事のプロセスも数値化できるからです。
ぜひあなたの仕事でも、プロセス分析を取り入れてみましょう。
②散布図と単回帰分析──二つの要素の関係性を数字でつかめるビジネスに関わる人であれば、「この二つの要素の因果関係がはっきりすればいいのに」と、もどかしく感じた経験があるはずです。
「『この広告を出したら、これだけ売上が上がる』という関係を数字で示せれば、もっと広告費を増やすよう上司を説得できるのに……」「店舗前の通行量と売上に関係性があるのはわかっているが、あくまで経験値に過ぎない。
『通行量が何人増えると、売上がいくら上がるか』がわかれば、店舗の賃料にいくらまで出していいかがこまかくわかるのだが……」このように、因果関係さえ明らかにできれば、より精度の高い計画を作ったり、上の人間に提案を通したりできる場面は多々あります。
そんな時に役立つのが、「回帰分析」です。
これは複数の変数間の関係を一次方程式(y=ax+b)で表す分析手法です。
というと難しく聞こえますが、要は「複数の物事がどのように影響を与え合っているかを予測する方法」だと考えてください。
この回帰分析こそ、孫社長が最も重視した分析手法だと言っていいでしょう。
特にADSL事業に参入してからは、ソフトバンクの幹部全員に対して、「多変量解析を徹底してやれ」という有無を言わさぬ指示が下されました。
この章で紹介する単回帰分析や重回帰分析は、多変量解析の一種と考えてください。
多変量解析にも色々な手法がありますが、一般的なビジネスパーソンであれば、とりあえずこの二つを使えるようになれば十分だと思います。
回帰分析そのものは、統計的手法としては非常にシンプルです。
わかりやすい例として取り上げられるのが、「アイスクリームの販売個数と気温」の因果関係です。
気温が上がれば、人は冷たいアイスクリームをより食べたくなり、アイスクリームの売上は上がります。
これは当たり前の話です。
では、気温が一度上昇したら、アイスクリームの販売個数はどれだけ伸びるのでしょうか。
これを回帰分析の「y=ax+b」に当てはめると、「アイスクリームの売上=y」「気温=x」となります。
数式で表せれば、答えが出せます。
そして、答えがそのまま「予測値」になります。
アイスクリームの場合、「y=ax+b」に気温を入れれば、売上の予測値を計算できるということです。
なお、予測したい変数を「目的変数」、目的変数に影響を与える変数を「説明変数」と呼びます。
アイスクリームの事例なら、「アイスクリームの売上=y」が目的変数、「気温=x」は説明変数です。
説明変数は、一つだけとは限りません。
アイスクリームの売上なら、気温だけでなく、値段、一個あたりの量、フレーバー、店の前の通行量など、様々な説明変数が想定できます。
説明変数が一つのものを「単回帰分析」、二つ以上あるものを「重回帰分析」と呼びます。
なお、「散布図」とは、二つのデータの関係性を点でプロットしたものです。
これを作れば、例えばアイスクリームの「売上」と「気温」の間にどのような相関関係があるかがひと目でわかります。
今から説明する通りにエクセルで操作すればすぐに作成できるので心配ありません。
事例ある保険会社で、来店型販売ショップの出店計画を任されているBさんは、事業計画書の作成に苦慮していました。
自身も長く営業の現場を経験してきたので、店舗前の人通りが多いほど、契約数が多くなることは経験則としてわかっています。
実際にいくつかの店舗の通行量を調べてみると、たしかに一日の通行量が多いお店ほど契約獲得数は多くなっていました。
しかし、これは当たり前の話です。
それを事業計画に落とし込むためには、「一日の通行量が三〇〇人の場所に出店すれば、一ヶ月で四〇件前後の契約獲得が見込めます」「一日の通行量が一〇〇人増えるごとに、月に一〇件前後の契約獲得件数の増加が見込めます」といったような、もっと具体的で、かつ説得力のある数字が必要です。
どうすれば、会社の上層部が納得するような計画書を作ることができるのでしょうか。
【単回帰分析による解決法】手順1エクセルを使って単回帰分析の直線を引くBさんが抱える問題は、単回帰分析ですぐ解決できます。
使うツールは、皆さんもおなじみのエクセルだけです(注:本書では「エクセル2019」の場合の操作方法を説明しています。
エクセルのバージョンによっては操作方法が異なることがあります)。
まず画像❶のように、元になるデータをエクセルに入力します。
この場合、「目的変数=一ヶ月の契約獲得件数」、「説明変数=一日の平均通行量」です。
データ部分を範囲指定した上で、「挿入」→「グラフ」の中にある「散布図(x,y)またはバブルチャートの挿入」→「散布図」とクリックすると(画像❷)、一日の通行量と一ヶ月の契約獲得件数をプロットした散布図があっという間にできあがります(画像❸)。
さらに、散布図のどこかの点の上にカーソルを合わせて右クリックすると、ショートカットメニューが出てくるので、その中の「近似曲線の追加」をクリックします(画像❹)。
すると、「一日の通行量」と「一ヶ月の契約獲得件数」の関係を示す単回帰分析の点線が引かれます(画像❺)。
この点線が「近似曲線」です。
これをパッと見て、右肩上がりの線になっていたら、目的変数と説明変数が正の相関関係にあるということです。
つまり、「店舗前の道の一日の通行量が増えれば増えるほど、一ヶ月の契約件数が増える」という因果関係が証明されたわけです。
一方、右肩下がりの線になっていたら、負の相関関係にあるということです。
その場合は「店舗前の道の一日の通行量が増えれば増えるほど、一ヶ月の契約件数が減る」という因果関係が証明されます(現実には負の相関関係になることはまずありませんが)。
この場合は右肩上がりなので、「二つの要因は、正の相関関係にある」と判明しました。
手順2「近似曲線」が適切か確認する実際にやってみるとわかる通り、エクセルでの作業は至って簡単です。
ただし、この後で必ずやるべき重要なことがあります。
それは、近似曲線がどれだけ現実に即しているかをチェックすることです。
エクセルで操作しただけだと、目的変数と説明変数にほとんど関係がない場合でも、とりあえず線は引かれてしまいます。
よって、回帰分析によって引かれた線が、どれくらい現実を的確に表しているかを確認しなくてはいけません。
とはいえ、この作業もエクセルで簡単にできます。
先ほど引いた近似曲線をダブルクリックしてください。
すると、「近似曲線の書式設定」が右側に出てくるので、「近似曲線のオプション」の中の一番下にある「グラフに数式を表示する」と「グラフにR‐2乗値を表示する」にチェックを入れます(画像❻)。
すると、画像❼のように、グラフの上に「y=0.1159x+5.8633」という数式と「=0.8788」が表示されます。
後者は「R‐2乗値」と呼ばれるもので、単回帰式の「y=0.1159x+5.8633」がどのぐらい当てはまっているかを示す値であり、これを「決定係数」と呼びます。
と聞くと、これも難しく感じますが、要するに「決定係数が一に近いほど、実際の分布に当てはまっている」と考えればいいだけです。
目安としては、〇・五以上であれば精度は高く、それなりに現実に即していると考えていいでしょう。
なお、この保険販売店のケースでは、決定係数が約〇・八八なので、「一ヶ月の契約獲得件数」と「一日の通行量」の因果関係をかなり的確に表した数式であると結論できます。
手順3予測値を出し、次にとるべきアクションを決める二つの要素の因果関係がわかれば、次にとるべきアクションも見えてきます。
「一ヶ月の契約獲得件数」と「一日の通行量」の関係を表す数式がわかったのですから、あとは実際の通行量がわかれば、一ヶ月あたりの契約獲得件数について予測値が出せます。
通行量については、不動産業者がデータを持っていることが多いので、適切な手順を踏めば、それを入手するのはそれほど難しくありません。
もし一日の通行量が三〇〇人だったら、一ヶ月の契約獲得件数の予測値は「0.1159×300+5.8633=約四一人」となります。
あとは、その物件の賃料やその地域のアルバイトの平均時給などを勘案すれば、その場所に出店すべきかどうかを判断できるでしょう。
もちろん現実には、通行量以外にも様々な要素が絡んでくると思います。
それでも「通行量が多い場所ほど契約件数が多くとれる」といった単純な経験則で出店場所を決めるよりは正確な予測ができます。
上層部から「なぜこの場所に出店するのか」の説明を求められた際も、説得力のあるプレゼンができるはずです。
なお、このケースでは一に近い決定係数が出ましたが、実際には〇・五以下になることも少なくありません。
しかし、そこで「予測が外れた」と落ち込む必要はまったくありません。
「この二つの要素は関連性が低い」という事実が明らかになったのですから、別の要素を説明変数として仮定し、そのデータを取って再分析してみればいいだけです。
こうして繰り返していけば、決定係数の高い要因がきっと見つかるはずです。
回帰分析をすれば、優先順位が明らかになる次の項目では、説明変数が二つ以上になる「重回帰分析」の手法を紹介しますが、その前にシンプルな単回帰分析を実践してみれば、コツがつかみやすいでしょう。
法人営業であれば、「電話をかける数」「訪問件数」「客先での滞在時間」といった、様々な変数を当てはめて分析してみることをお勧めします。
「話を聞いてくれた担当者の役職」といった質的なものも、数値化できます。
例えば「平社員は『1』、主任・係長レベルは『2』、課長レベルは『3』」といった設定をすれば、これも回帰分析で売上との因果関係を明らかにできます。
こうしてあらゆる要素を回帰分析してみれば、「決定係数が高いものほど、売上への影響度が高い」とわかるので、おのずと優先順位も明確になります。
電話をかける件数を増やすべきなのか、訪問件数を増やすべきなのか、客先での滞在時間を延ばすべきなのか、話をする担当者の役職を上げるべきなのか。
こうした様々な選択肢がある中で、「何から着手すべきか」がはっきりするのです。
それがわかれば、その説明変数を上げることに注力できます。
次にとるべきアクションが明らかになる。
これこそ、「数値化仕事術」の目的です。
先ほどの手順に沿って実際にやってみてもらえばわかる通り、単回帰分析は手法としては至って簡単です。
だからこそ、日々の仕事に使わなければもったいないのです。
あなたの仕事でも使ってみれば、思いもよらない要素の因果関係が見えてきて、問題解決につながる可能性は大いにあるはずです。
③重回帰分析──「精度の高い予測値」を計算でき、次の一手を素早く打てる前項目で「単回帰分析」を紹介しましたが、実際のビジネスでは、売上にせよ利益にせよ、関わってくるのは一つの要素だけとは限りません。
多くの場合、複数の要素が関わりあって、最終的な売上や利益が決まるものです。
そんな時、各要素の相関関係を明らかにするのに役立つのが「重回帰分析」です。
実際にソフトバンクでも、徹底した重回帰分析が行われていました。
「駅からの距離によって売上はどれくらい違うか」「晴れの日、曇りの日、雨の日では、どれくらい売れ行きに差が出るか」「平日と休日ではどれくらい違うか」「アルバイトの人数を一人増やすと売れ行きがどのくらい伸びるか」「アルバイトの熟練度(経験月数)と売れ行きにはどれくらい関連があるか」このように、あらゆる要素が顧客獲得にどのように影響しているかを数値化し、分析していたのです。
単回帰分析と同様、重回帰分析の利点は、数式をもとに予測値を計算できることです。
よって、「次に何をすべきか」という計画も立てやすくなります。
「Yahoo!BB」の顧客獲得キャンペーンを展開していた時も、重回帰分析を駆使しました。
目標の顧客数を獲得するには、パラソルをどこに何ヶ所出さなくてはいけないか。
あるいは、モデムを配るアルバイトはどれだけ雇わなくてはいけないか。
こうした数字を計算し、「次は何をすべきか」を考えたことで、より効果の高い場所や日時にパラソルを出店したり、アルバイトを多く投入するといった対応ができました。
重回帰分析による予測値と実測値の間に大きなギャップがあれば、「まだ気づいていない要素が売上に影響しているのでは?」と、いち早く問題に気づけるというメリットもあります。
「Yahoo!BB」が一気に五〇〇万人もの顧客を獲得できたのは、重回帰分析のおかげと言っても過言ではないほどです。
ここでは重回帰分析をよりわかりやすく解説するために、ビジネスではなく皆さんの生活に密着したある事例を取り上げることにします。
事例会社員のCさんは、結婚して子どもが生まれたのを機に、東京の郊外の某市に中古マンションを購入しようと考えています。
そこで先日、物件探しを始めたところ、ある不動産会社に案内された物件を奥さんがいきなり気に入り、「けっこういいじゃない。
これで決めちゃいましょうよ」と言い出しました。
ただCさんは、その物件の価格が相場に比べて割高なのか割安なのかが気になっています。
そこで、インターネットの不動産紹介サイトで、その物件のある駅の他のマンションの価格をいろいろ調べてみたのですが、マンション価格には広さや築年数、駅からの距離など、様々な要因が関係しています。
あれこれ見ても、その物件が割高なのか割安なのかはよくわかりませんでした。
その物件の価格が相場に比べてどうなのかを知る方法はないのでしょうか。
【重回帰分析による解決法】手順0アドインを有効にして「データ分析」を表示させる重回帰分析を使えば、「あるエリアの中古マンション価格が、どんな要因によって決まっているか」を分析できます。
ただし、事前の準備としてアドインの有効化が必要な場合もあります。
「ファイル」→「オプション」→「アドイン」の順にクリックしてください(次の画像❶)。
下のほうにある「設定」をクリックするとポップアップが出てくるので、その中の「分析ツール」にチェックを入れ、「OK」をクリックします(画像❷)。
「データ」のタブを選ぶと、右端にそれまでなかった「データ分析」が表示されるようになります(画像❸)。
これで事前準備は完了です。
手順1エクセルにデータを入力するまず単回帰分析と同じように、データをエクセルに入力します(次の画像❹)。
これは「Yahoo!不動産」から取得した、某市にある実際の物件データ(二〇一七年時点のもの)です。
マンションの実名は出せないので、物件名は仮にA、B、C、D……Kとします。
この場合、目的変数は「価格(万円)」です。
そして説明変数は、「部屋の階数」「専有面積()」「築年数」「最寄り駅からバスでかかる時間(分)」「最寄り駅から徒歩でかかる時間(分)」です。
データ入力をする際の注意点は、「目的変数・説明変数は横に並べ、各データ数値は縦に入力していく」ということです。
さらに、一番上の行には、「物件名」「価格」「階数」「専有面積」「築年数」「バス」「駅徒歩」というラベルを入れます。
ここまで入力したら、先ほどの「データ分析」ツールをクリックします(次の画像❺)。
すると画像❻のポップが出てくるので、その中から「回帰分析」を選択し、「OK」をクリックしてください。
手順2各項目の相関関係を算出する画像❼の画面が出てきたら、分析する範囲を指定します。
「入力Y範囲」は、目的変数を指定する項目です。
この場合は「価格」なので、ラベルも含めたすべての物件の価格を範囲指定します(「入力Y範囲」の右横の白窓の上で左クリックの後、データのあるシートに戻り、マウスを使って範囲指定することができます)。
「入力X範囲」は、説明変数を指定する項目です。
こちらは、「階数」から「駅徒歩」のすべてのラベルとデータを範囲指定します(「入力Y範囲」とやり方は同じ)。
続いて「ラベル」に必ずチェックを入れ、「新規ワークシート」も選択してください。
そして「OK」をクリックすると、次の画像❽が出てきます。
いきなり難しい用語とわけのわからない数字がたくさん出てくるので、びっくりするかもしれませんが、心配しないでください。
着目すべきは、一番下の表のうち「係数」の列です。
数字だけ見ていると複雑に思えるかもしれませんが、これは「左側の説明変数が、それぞれ価格にどれだけ影響するか」を示しています。
この場合なら、次のように読み取ることができます。
「階数が一階上がるごとに、約三万円上がる」「専有面積が一平方メートル増えるごとに、約八万円上がる」「築年数が一年増えるごとに、約三六万円下がる」「バスに乗っている時間が一分増えるごとに、約九五万円下がる」「駅からの徒歩時間が一分増えるごとに、約二四万円下がる」よって、この分析結果から「マンションの価格が決まるのに、階数や専有面積は影響が小さく、築年数や最寄り駅からの時間は影響が大きい」とわかりました。
画像❽の結果を数式にすると、次のようになります(少数点第三位以下は切り捨て)。
「価格=2436.71(切片)万円+(3.09×階数)万円+(8.07×専有面積)万円+(−35.84×築年数)万円+(−94.64×バス分数)万円+(−24.15×駅徒歩分数)万円」なお、この表にある「切片」というのは、一次関数のグラフがy軸と交わる点であり、「y=ax+b」のbの数字のことですが、そこまで深く意味を理解しなくても構いません。
手順3算出された数値の「当てはまり具合」を検証するここで分析をやめてもいいのですが、余力があれば単回帰分析と同様に、これらの数値がどれだけ現実に当てはまっているかをチェックしてみましょう。
それにはまず、次図の画像❾の「P−値」のところを見てください。
これは「危険度」を示す値で、この数字が大きいほど、式を不安定にする要素が含まれることを意味します。
そこで、「P−値」が高い説明変数を削除して元データを作り直し(画像❿)、再び同じ手順で重回帰分析を行います。
その上で、残った説明変数で計算した式が「どれだけ現実に当てはまっているか」を検証してみましょう。
単回帰分析では「R‐2乗値」で検証しましたが、重回帰分析では「Ru値」というものを計算して検証します。
ただ、「R‐2乗値」と違い、エクセルが自動的に計算してくれません。
Ru値の計算式は次の通りです。
式そのものは少し複雑ですが、エクセルにそのまま入力すれば計算してくれますから、一度入力してしまえば、さほど大変ではありません。
Ru=1−(1−)×(n+k+1)/(n−k−1)「」「n」「k」の数値の意味と場所は以下の通りです(次の画像⓫参照)。
・「」:重回帰分析の重相関数の二乗→一番上の回帰統計のところにある「重相関R」の数値の二乗・「n」:データの数→同じく回帰統計のところにある「観測数」の数値・「k」:説明変数の個数→中段の分散分析表のところにある「回帰・自由度」の数値これらの数字をエクセル上で入力すれば、Ru値を簡単に算出できます。
例えば、「築年数」「バス分数」「駅徒歩分数」の三つに絞った時のRu値は「〇・七八八三」です(画像⓫)。
これ以外にもいろいろな説明変数の組み合わせで計算してみた結果、最もRu値が高かったのは、最初に計算した「築年数」「バス分数」「駅徒歩分数」の組み合わせでした。
このRu値も、「大きければ大きいほど、現実に即した正確な数値である」と言うことができます。
よってこの某市の中古マンション価格では、「築年数」「バス分数」「駅徒歩分数」の三つの組み合わせの式が、最も良く現実に当てはまっているということです。
手順4重回帰分析の式で、その物件の価格が適正かどうかをチェックするこうして「ベストな説明変数の組み合わせの式」がわかったら、いよいよお目当ての物件の価格が「相場に対して適正なのかどうか」を検証します。
例えばCさんが、「物件Cが良さそうだ」と考えていたとします。
その場合、画像⓫の「係数」のところの数値をもとに、次の計算式で物件Cの販売価格が適切かを検証します(少数点第一位を四捨五入)。
「価格=3351(切片)万円+(−40×築年数)万円+(−130×バス分数)万円+(−35×駅徒歩分数)万円」これに物件Cの実際の築年数、バス分数、駅徒歩分数を入れて計算すると、約一七七〇万円となります。
これが重回帰分析で導き出された、物件Cの適正価格ということです。
しかし実際は一九五〇万円で売り出されているので、「物件Cは相場より割高である」と判断できます。
また、「築二十九年の物件Cに一九五〇万円出すなら、あと二四〇万円上乗せして、築八年の物件Dを購入したほうが実はお得ではないか」といった比較もできるでしょう。
このように、いくつもの要因が複雑に絡み合っているように思える数字も、重回帰分析を使えば、より確度の高い選択と決断ができます。
これをビジネスに活用するなら、ショッピングセンターに出店する際の目的変数を「売上」とし、説明変数を「商圏人口」「道路交通量」「近隣住民の所得」などとして、出店計画の精度を確認することができます。
あるいは、商品に備わる複数の機能を説明変数とし、目的変数である商品価格の設定に役立てることも可能です。
「Yahoo!BB」の販促キャンペーンでも、重回帰分析を使ったからこそ、パラソルの立地やアルバイトの熟練度などの変数から、精度の高い売上予測をすることができました。
単回帰分析に比べるとやや手間がかかりますが、それでも決して難しくはありませんので、ぜひ重回帰分析をあなたの仕事で活用してみてください。
④パレート図分析──「優先的に解決すべき問題」が一目瞭然仕事やビジネスで思うような成果が出なければ、現場に何らかの問題があることは明白です。
そして経営レベルから現場の社員までが、それぞれに「問題を解決しなければマズい」という危機感を抱いているはずです。
ところが、問題があることは肌感覚で認識していても、現場で起こっているいくつもの問題を正確に把握し、組織内で話し合って「どの問題から優先して解決すべきか」を結論づけるのは容易ではありません。
ある人は「商品の価格設定を下げるべきだ」と主張し、ある人は「いや、商品のパッケージをリニューアルしたほうがいい」と主張し、ある人は「販売手法を見直すべきだ」と主張する。
それぞれが自分の立場でものを言うので、議論は平行線をたどるばかりです。
そして最後は上司が口を開き、「私の経験から言うと、こういう時は商品に手をつけず、営業の人員を増やすべきだな」などと言い出して、結局は鶴のひと声で物事が決まってしまうことがどの会社でもあるのではないでしょうか。
第1章でも指摘した通り、声が大きい人や立場が上の人の意見ばかりが通ってしまうことにうんざりしているビジネスパーソンは多いはずです。
その意見が適切ならまだしも、的外れなものだったら問題はいつまで経っても改善しません。
それどころか、解決してもたいした効果が得られない問題にムダな時間と労力を費やすことになってしまいます。
こんな場面で、「優先的に着手すべき問題」を明確に示してくれるのが「パレート図」です。
パレート図は、「複数の項目についてデータの値が大きい順に並べた棒グラフ」と、「累積比率を表す折れ線グラフ」で構成される二軸の図です。
百聞は一見にしかずなので、次の画像❶を見てください。
これがパレート図の見本です。
この図を作成すれば、現場で起こっている複数の問題を原因別に分類し、どれが大きな割合を占めているかがすぐわかります。
事例Dさんが勤める会社で新サービスを始めたところ、ユーザーからクレームが殺到しました。
数が多いだけでなく、その内容も様々で、何から改善すればクレームを減らせるのかわかりません。
コールセンター業務を担当するDさんたち社員も、大量のクレーム対応に忙殺される毎日が続き、精神的に参ってしまいました。
会社の上層部に「何とかしてほしい」と改善を訴えたものの、「クレーム対応は現場の仕事だから、君たちがもっと対応スキルを磨けばいい」と言われただけで、上は一向に動いてくれません。
しかし寄せられるクレームの内容は、商品の品質に関するものや、申し込みの手続き方法がわかりにくいといったものがかなり多いことを、Dさんたちは実感値として認識していました。
商品や手続きに関することが原因なら、コールセンターの対応スキルを向上させるだけでは、何の解決にもなりません。
どうすれば、上の人間を説得して、クレームを減らすための適切な改善策をとってもらえるでしょうか。
【パレート図分析による解決法】手順1クレームの種類を分けるこうしたケースで上の人間を動かすには、パレート図を見せながら、「このクレームの占める割合がこれだけ高いので、この原因を解決してください」と具体的な数字で示すのが最も効果的です。
パレート図を作成するために、まずはクレームの種類を分類します。
第1章で紹介したように、ソフトバンク時代の私が実際にやった方法が実践しやすいでしょう。
クレームの記録をすべてプリントアウトし、七つを目安に分類します。
七つを基準にするのは、それ以上数が多くなると数字の管理が難しくなるからです(「マジックナンバー7」参照)。
優先順位をつけるのが目的なので、分け方の基準はざっくりとしたもので構いません。
最初はたくさん紙の山ができても、「これとこれは、どちらも『商品の品質』に関することだな」「これとこれは、『支払い方法』で一つにできるだろう」といったようにまとめていけば、最終的に七種類前後に整理することが可能です。
ここでは、分けた七種類のクレームを仮にA〜Gとし、簡易版のパレート図の作成方法を解説しましょう。
手順2エクセルで簡易版のパレート図を作成するエクセルを開き、A〜Gのクレームの発生数を入力します(次の画像❷)。
ここでは発生数の多い順に並んでいますが、数の多い順に並び替える必要はありません。
入力が終わったら、「クレーム種類」と「発生数」の部分を範囲選択します(画像❸)。
次に、「挿入」→「グラフ」の中にある「統計グラフの挿入」→「ヒストグラム」の中の「パレート図」をクリックしてください(画像❹)。
すると、画像❺が現れます。
棒グラフが発生数、折れ線グラフが累積比率を示しています。
これだけで、簡易版のパレート図が完成します。
本来のパレート図は画像❶なので、折れ線グラフは0から始まっていなければなりません。
このように、画像❺の簡易版のパレート図は本来のパレート図からすると加工が足りない点もあります。
でも、「優先的に手をつけるべきクレームを明確に示す」という目的からすれば、簡易版で十分です。
もし本来のパレート図の作成方法を知りたい場合は、「パレート図作り方」と検索するとわかりやすく説明したサイトがいくつもあるので、それらを参照してください。
あるいは、拙著『世界のトップを10秒で納得させる資料の法則』(東洋経済新報社)でも、パレート図の作成方法を詳しく解説しているので、そちらを読んでいただいても構いません。
手順3パレート図を分析し、優先順位をつけるでは、完成したパレート図から、「どのクレームから優先して手をつけるべきか」を分析しましょう。
第1章で紹介した「二:八の法則」を思い出してください。
これは一部の要素(二〇%)が全体のかなりの割合(八〇%)を占めるという法則です。
この場合なら、どのクレームが全体の八〇%を占めているのかを確認すれば、それを取り除くことでクレーム数を大幅に減らすことができます。
画像❺をもう一度見てください。
クレームCのすぐ右のあたりで、折れ線グラフが八〇%を超えています。
つまり、クレームAとBとCの三つを解決すれば、全体のクレームのほぼ八割をなくすことができるということです。
よって、他のクレームはとりあえず後回しにして、まずはABCという三つのクレームの解決に集中すべきだと判断できます。
たとえトップが「クレームDから手をつけろ」と命令しても、このパレート図を見せれば、「この現状分析から見て、まずはABCから着手すべきです」と説得できるでしょう。
これだけ明快に数字を示されたら、どんなに立場が上の人でも、さすがに反論しにくいはずです。
「トライズ」の事業戦略にもパレート図を活用このように、パレート図はクレームや不具合、事故などを分析する時に使われることが多い手法ですが、他にも工夫次第で使える場面はたくさんあります。
例えば私は、英語コーチング・スクール「TORAIZ(トライズ)」の事業を始めるにあたって、その事業戦略を練っていた時にもパレート図を使いました。
受講者を獲得するために、サービスや施設、料金プランなど、どの要素を優先して注力すべきかを明確にしたかったからです。
元になるデータは、教育情報サイト「リセマム」で公開されている「英会話スクール(教室)を選んだ理由」というアンケート調査の結果(画像❻)を利用しました。
パレート図の分析をより明確にするには本来なら一択回答が望ましいのですが、この調査は複数回答です。
そこで一〇〇%換算してウェイトづけをし、わかりやすいよう補正しました。
アンケート調査の元データの数値と、一〇〇%換算の数値をエクセルに入力し、累積比率を出します(画像❼)。
第1章で紹介した「二:八の法則」を思い出してください。
これは一部の要素(二〇%)が全体のかなりの割合(八〇%)を占めるという法則です。
この場合なら、どのクレームが全体の八〇%を占めているのかを確認すれば、それを取り除くことでクレーム数を大幅に減らすことができます。
画像❺をもう一度見てください。
クレームCのすぐ右のあたりで、折れ線グラフが八〇%を超えています。
つまり、クレームAとBとCの三つを解決すれば、全体のクレームのほぼ八割をなくすことができるということです。
よって、他のクレームはとりあえず後回しにして、まずはABCという三つのクレームの解決に集中すべきだと判断できます。
たとえトップが「クレームDから手をつけろ」と命令しても、このパレート図を見せれば、「この現状分析から見て、まずはABCから着手すべきです」と説得できるでしょう。
これだけ明快に数字を示されたら、どんなに立場が上の人でも、さすがに反論しにくいはずです。
「トライズ」の事業戦略にもパレート図を活用このように、パレート図はクレームや不具合、事故などを分析する時に使われることが多い手法ですが、他にも工夫次第で使える場面はたくさんあります。
例えば私は、英語コーチング・スクール「TORAIZ(トライズ)」の事業を始めるにあたって、その事業戦略を練っていた時にもパレート図を使いました。
受講者を獲得するために、サービスや施設、料金プランなど、どの要素を優先して注力すべきかを明確にしたかったからです。
元になるデータは、教育情報サイト「リセマム」で公開されている「英会話スクール(教室)を選んだ理由」というアンケート調査の結果(画像❻)を利用しました。
パレート図の分析をより明確にするには本来なら一択回答が望ましいのですが、この調査は複数回答です。
そこで一〇〇%換算してウェイトづけをし、わかりやすいよう補正しました。
アンケート調査の元データの数値と、一〇〇%換算の数値をエクセルに入力し、累積比率を出します(画像❼)。
これをパレート図にすると、次の画像❽になりました。
八〇%に含まれるのは、「立地がよい」「講師がよい」「窓口対応がよい」「予約のとりやすさ」「教材が充実している」「希望のレッスンプランがある」といった項目です。
一方、「授業料がよい」「ブランド力がある」といった項目は、意外にも八〇%には含まれませんでした。
よって私は、価格が高くても、「立地がよく、講師がよく、窓口対応がよく、予約がとりやすく、教材が充実していて、希望のレッスンプランがある」というサービスを実現することを最優先に、事業戦略を策定したのです。
トライズの教室があるのは、東京丸の内、新宿、渋谷、池袋、銀座、大阪・梅田など、どれも最高の立地ばかりです(注:コロナ禍を機に完全オンラインコースもスタート)。
レッスンプランは受講生の目標(ゴール)に合わせて個別に作り、教材も世界中から最適なものを探して提供しています。
また、一人ひとりの受講生にパーソナルトレーナーがつき、その人のゴールに最適なネイティブの講師を担任にするシステムをとっています。
担任制にして時間も指定できるようにしたため、「予約がとれない」という窓口対応への不満もゼロです。
こうして、パレート図分析によって優先的に注力すべきことを見極めたおかげで、トライズは急速に事業を拡大することができました。
パレート図を活用しなかったら、これほどの快進撃はなかったでしょう。
もしあなたがたくさんの問題を抱えて、「何から手をつけるべきか」と迷う場面があったら、パレート図を作ってみることをお勧めします。
きっとすぐに答えが出るはずです。
⑤T勘定──複雑な業務フローでもボトルネックがつかめる一生懸命手を動かしているはずなのに、仕事がどんどん溜まってしまう。
あなたもそんな悩みを抱えていないでしょうか。
仕事が溜まるということは、どこかにボトルネックがあるはずです。
しかし、処理する件数が膨大だったり、業務フローが複数のプロセスに枝分かれしていたりすると、ボトルネックがどこにあるのかつかみにくくなります。
原因がわからないまま、仕事は一向に片づかず、目の前に積み上がっていくばかり。
そんな毎日が続いて、どんどん疲弊していくビジネスパーソンが少なくありません。
旧社会保険庁の年金記録問題作業委員会に呼ばれた時も、現場はまさにそんな状況でした。
「消えた年金問題」を解決するため、すべての年金加入者と受給者に「ねんきん特別便」を郵送し、自分の記録を確認して返送してもらうことになったのですが、全国から返送される膨大な書類を現場が処理できず、大混乱に陥っていたのです。
私が初めて現場に入った日、大きな倉庫のような場所に、未処理の書類が大量に山積みにされている光景を見て啞然としたほどです。
この状況を引き起こしているボトルネックはどこにあるのか。
それを解明するために、私が使ったのが「T勘定」です。
これはもともと簿記で使われている手法で、〝T〟の字で表を作り、勘定科目ごとに取引を集計していくやり方です。
簿記と聞くと複雑そうに感じるかもしれませんが、そんなことはまったくありません。
これは要するに、「入ってきた数」と「出ていった数」をパッと見てわかるように整理し、「現在手元に残っている数量」を管理する方法です。
簿記の場合は、「お金や資産の数量」を管理しますが、これを仕事に活用する場合は「作業の数量」「書類の数量」「在庫の数量」などを管理できるということです。
仕組みもいたって簡単で、足し算と引き算ができれば、誰でも使いこなせます。
では、具体的な使い方を説明しましょう。
事例Eさんはある証券会社で、今年一月に加入対象が大幅に拡張された「個人型確定拠出年金」の申込書を処理する作業チームのリーダーを務めています。
ところが社内の体制整備が遅れたため、処理作業はなかなか進まず、顧客から送られてくる申込書だけがどんどん山積みになっています。
確認項目が多いため、そもそもデータ入力に時間がかかるのに加え、申込書の枚数や記入欄が多いために抜け・もれが多く、顧客に再確認用の書類を発送しなくてはいけないケースも少なくありません。
そのたびに作業工程は増え、対応に時間がかかり、書類の処理は遅れていきます。
顧客から「なぜ口座開設にこれほど時間がかかるのか」とクレームが入る件数も増える一方です。
Eさんも何とかしなくてはと思うものの、どこにボトルネックがあるのかわからず、途方に暮れています。
どうすればこの状況を引き起こしている原因を突き止め、ボトルネックを取り除くことができるでしょうか。
【T勘定による解決法】手順1今日の「入り」と「出」の数を記録するまずはT勘定の仕組みを理解するため、業務全体の「入ってきた数」と「出ていった数」を記録してみましょう。
A4用紙を用意して、大きくTと書きます(後掲の図参照)。
次に、T字の左側上に、「昨日までに処理できず残った申込書の数」を書きます。
これはつまり、「その日の朝の業務開始時点で、Eさんたちの手元に残っている在庫数」になります。
T字の左側下には、「今朝新たに届いた申込書の数」も記入します。
この左側の二つの数字を合わせたものが、その日の「入ってきた数」になります。
昨日までに処理できず残った申込書の数が一五〇件、今朝新たに届いた申込書の数が四五〇件なら、その日の「入ってきた数」は六〇〇件です。
一方、その日の業務が終了したら、T字の右側に今日一日で「記入もれなしで正常処理できた申込書の数」「記入もれで、修正フローに回した申込書の数」をそれぞれ記入します。
そしてその二つを合わせた数が四五〇件ならば、差し引き(六〇〇件−四五〇件)で一五〇件が残っているということ。
これはつまり、「その日の夕方の業務終了時点で、処理できずに残った申込書の在庫数」で、これもT字の右側下に記入します。
こうして整理したことで、今日の「入ってきた数」と「出ていった数」がひと目でわかるようになりました。
なおTの右側と左側の合計は、常に等しくなるのがルールです。
左右の合計が違った場合は、いずれかの数字が間違っているので、再度計測してください。
手順2プロセスごとに毎日の在庫数を記録するT勘定の使い方がわかったら、業務のプロセスごとに毎日の「入ってきた数」と「出ていった数」を記録します。
この事例では次の図のように、業務プロセスは分岐しながらつながっています。
記入もれがない書類はコンピュータ入力に回し、記入もれがあったものは再確認書類を発送します。
このプロセスごとにT勘定で左右の数を記録し、右側にある「在庫数=未処理の件数」を毎日チェックすれば、どのプロセスで在庫が積み上がっているかがひと目でわかります。
そのプロセスこそ、業務全体を遅らせているボトルネックだということです。
手順3ボトルネックを突き止め、改善策を実行する前掲の図を見ると、他のプロセスに比べて、明らかに「再確認書類の発送フロー」のところで在庫数が多いのがわかります。
これで、ボトルネックを突き止めることができました。
それがわかれば、おのずと改善策も見えてきます。
ここで処理が滞っているということは、このプロセスを担当する人数が足りないか、スタッフの熟練度が不足しているといった理由が考えられます。
よって早急に人手を増やすか、人員の配置を見直して、作業スピードの速いスタッフを投入するといった手を打つ必要があります。
また、届いた申込書のうち三通に一通は記入もれがあり、再確認書類の発送フローに回っていることもわかります。
これではあまりに数が多いので、記入もれを減らす改善策も必要でしょう。
そこでEさんは、申込書を送る時に、特に記入もれが多い箇所をまとめた注意書きをつけるよう、申込書の作成・送付を担当するチームに提案しました。
こうしてボトルネックを改善すれば、チーム全体の処理速度も確実に上がっていくはずです。
T勘定で「ねんきん特別便」の業務効率が四倍アップこのように、T勘定でプロセスごとに毎日の数字の出入りを把握すれば、どこにボトルネックがあるかが一目瞭然となります。
もし全体の「入り(=送られてくる申込書の数)」と「出(=処理が完了した申込書の数)」だけを管理していたら、どんなアクションをとれば状況が好転するのか、まったく見当がつかなかったでしょう。
本章の最初で紹介した「プロセス分析」と手法は似ていますが、このケースのように業務のプロセスが複数に枝分かれしていく場合や、管理する数が大きい場合は、よりT勘定が向いているかもしれません。
私が関わった「ねんきん特別便」の場合、未処理となっていた件数は、当初五〇〇万件を超えていました。
そこで私は業務を四つのプロセスに分け、T勘定を用いて各プロセスの進捗状況を管理しました。
あまりに数が膨大だったので、正確に数字を計測するため、業務プロセスをリアルタイムで把握できるバーコード管理を導入しましたが、もともとはA4一枚の紙に書いたT勘定が出発点です。
こうして突き止めたボトルネックを解消した結果、全体の処理能力は一気に上がり、約一年間で業務効率を四倍に高めることができました。
数百万件という気が遠くなるような処理件数も、T勘定を活用すれば管理できてしまいます。
「目の前の仕事が溜まってどうしようもない」という人こそ、「紙一枚に手書きでOK」のT勘定をうまく使いこなしてください。
(注:「T勘定」と次の「差異分析」の記述内容は、簿記の知識に筆者なりのアレンジを加えたものです。
厳密な定義・使い方等をお知りになりたい方は、専門書やWEB上の解説サイトをご覧いただければ幸いです)
⑥差異分析──計画と実績にギャップが生じた要因を探る差異分析とは、「計画」と「実績」を比較し、差異が生じた原因を分析する手法です。
ビジネスプランを実行したものの、計画よりも予算や原価がかかってしまった。
そんなことは、珍しくはありません。
大事なのは、その原因をきちんと突き止めることです。
PDCAを高速で回すためには、「DO(実行)」の後で迅速に「CHECK(検証)」を行い、それをもとにより良い改善策を見つけて、また実行に移さなくてはいけません。
しかし、全体の結果だけを見ていては、なぜ差異が生じたのかはわかりません。
計画値と実績値にギャップがあった場合、たいていは複数の要因が影響しているものです。
なかでも大きく二つの要因が考えられる場合、ここで紹介する差異分析を使えば、そのうちどちらの要素がより大きく影響しているかを明らかにできます。
事例Fさんが所属するマーケティングチームでは、自社がリリースした新サービスの認知度を上げるため、インターネットで広告キャンペーンを展開しました。
ところが実際にやってみると、当初の予算よりも金額がオーバーしてしまいました。
Fさんの手元に来た請求書を見ると、一〇〇万円の予算のはずが約一二二万円かかっています。
内容をよく見ると、クリック単価だけでなく、クリック数も計画の数字を超過していました。
リスティング広告の場合、クリック単価を指値で入札するので、実際に課金される金額はそれを下回るはずですが、担当者が上限に余裕を持たせて調整しながら運用していたようなのです。
何から改善すればいいのでしょうか。
【差異分析による解決法】手順1「計画」と「実績」の差異を二軸で整理するFさんの会社が支払う広告料金は、「クリック単価×クリック数」で決まります。
計画段階で想定していた「予算」は、次の通りでした。
・クリック単価→一〇〇円・クリック数→一万回これなら「一〇〇円×一万回=一〇〇万円」に収まります。
しかし、実際の数字は、こうなりました。
・クリック単価→一二〇円・クリック数→一万二〇〇回よって、「実績」は「一二〇円×一万二〇〇回=一二二万四〇〇〇円」です。
つまり、「計画」と「実績」の差異は「二二万四〇〇〇円」となります。
この結果を、「クリック単価」と「クリック数」の二軸で整理してみましょう。
すると、次の図のようになります。
手順2「価格差異」と「数量差異」を比較するこの図を見ると、差異といっても、「価格差異」と「数量差異」の二つがあるとわかります。
前者はクリック単価が上がったことによる差異、後者はクリック数が増えたことによる差異です。
では、それぞれの差異を計算してみましょう。
クリック単価の計画と実績の差異は「二〇円」です。
クリック数の計画と実績の差異は「二〇〇回」です。
よって、二つの差異はこのようになります。
・価格差異→「二〇円×一万二〇〇回=二〇万四〇〇〇円」・数量差異→「一二〇円×二〇〇回=二万四〇〇〇円」(注:右上の「価格差異」と「数量差異」が重なっている部分[=混合差異]は、原価の差異分析では通常、「価格差異」のほうに含まれる。
これは価格は自社でコントロール不能である一方、数量は社内で改善できるからである。
ただここでは、インターネット広告の事例であり、価格も改善対象であるため価格差異と数量差異の両方に含まれるとして計算。
したがって、「価格差異+数量差異」は「実績−計画=二二万四〇〇〇円」と一致しない)こうしてみると、価格差異のほうが数量差異よりも圧倒的に大きいことがわかります。
つまり、クリック数が二〇〇回増えたことより、クリック単価が二〇円上がったことによる影響のほうが大きいということです。
よって、予算がオーバーした原因は、主に「クリック単価が高すぎるため」と判断できます。
クリック単価が想定をオーバーしたのは、広告が表示された回数に対して、クリックされた割合が低いからです。
ということは、Fさんたちがやるべきなのは、クリック率を高めることです。
そこでFさんは、より多くのユーザーにクリックを促すため、広告バナーのデザインやレイアウトを見直すよう、チームリーダーに提案することにしました。
また、優先順位は後ですが、数量差異についても、一回の予算上限を徹底して管理することとしました。
このようにして「計画」と「実績」のギャップを分析すれば、何から優先して次の手を打つべきかが明らかになります。
PDCAの「C」の精度とスピードを上げ、迅速に「ACTION(改善)」へ移るためにも、ぜひ差異分析を活用してください。
⑦LTV分析──「LTVが最大化するコストのかけ方」がわかる第1章で、これからの時代は「ライフタイムバリュー(LTV)」を重視すべきだと話しました。
今後は、これを意識してビジネスをするかどうかで、勝敗が決まります。
LTVを意識することが、なぜ強みになるのか。
それは、意識していない競合他社より、顧客獲得コストを多くかけられるからです。
広告費や契約時の特典、販売代理店へのバックマージンといった顧客獲得コストをどれだけかけられるかは、LTVから逆算できます。
例えば、毎月の料金が同じ三〇〇〇円の二つのサービスがあったとします。
サービスAは、ユーザーが平均で二年間サービスを継続してくれるので、顧客一人あたりのLTVは七万二〇〇〇円です。
しかしサービスBは、平均で一ヶ月しか継続されないので、LTVは三〇〇〇円です。
LTVが二四倍も違うのですから、毎月の売上が同じだからといって、AとBに同じ顧客獲得コストをかけるのは明らかに間違いです。
これは言われてみれば当たり前のことですが、「一回売り切り」のビジネスしか経験がない会社ほど、「LTVを最大化する」という発想が弱いようです。
そのために、本来ならもっと顧客獲得コストをかけていいビジネスでも、そのラインを見誤り、本来だったら獲得できるはずのLTVを逃しているケースが目立ちます。
そう言われても、「LTVを最大化するコストのかけ方など、どうやって割り出せばいいんだ?」と思う人もいるでしょう。
でも、心配はいりません。
LTVの計算方法は、さほど難しくないのです。
次の事例をもとに、詳しく説明しましょう。
事例Gさんが勤めるIT企業では、これまでにアプリを数十本リリースしてきました。
そのいずれについても、広告宣伝費や販促キャンペーン費などの顧客獲得コストは、「アプリ単体の売上の一五%」を投入するようにと決められています。
これまでは何も考えず、上が決めたことに従ってきたGさんですが、「すぐに市場から消えるアプリより、ユーザーの人気が長く継続するアプリに、もっと宣伝費やキャンペーン費をかけてもいいのでは」と考えるようになりました。
かといって、「どのアプリにいくらまで顧客獲得コストをかけていいのか」という正確な数字まではわからないため、上司に提案したくても根拠を示すことができません。
どうすれば、投入コストの上限を知ることができるのでしょうか。
【LTV分析による解決法】手順1広告媒体や販促手法ごとに顧客獲得単価を出すそれでは、Gさんの会社が扱う三つのアプリについて、それぞれ顧客獲得コストをいくらまでかけていいかを検証してみましょう。
まずは、キャンペーンごとの顧客獲得コストのデータを整理します。
過去に広告を出稿した媒体別や販促の手法別にキャンペーンA〜Hという形でまとめると、次の表❶になりました。
顧客獲得コストの最小単価が一〇〇円、最大単価は一六〇〇円です。
獲得単価一〇〇円の方法でずっと顧客獲得を続ければいいではないか、と思った人もいるかもしれません。
しかし、どんな媒体も販促手法も、やればやるほど顧客獲得コストは上がっていくのが一般的です。
最初は一人のお客さんを一〇〇円で獲得できても、そのうち二〇〇円、三〇〇円……というようにもっとコストをかけなければ、新規の顧客はつかめなくなります(「限界効用逓減の法則」を参照)。
また、どんなに有効な手法でも、獲得できる顧客数には上限があります。
ですから、様々な顧客獲得方法を採用する必要があるのです。
しかし、そうはいっても投入できるコストには限度があります。
顧客獲得コストがLTVを超えてしまったら損をしてしまいます(実際には顧客維持コストもかかりますが、この事例では説明をわかりやすくするためにゼロと仮定しています)。
そこで、より顧客獲得単価が安い手法(=獲得効率が良い手法)から始めて、キャンペーンAからHのどこまで実行すればLTVが最大になるかを計算することにします。
手順2アプリごとに「獲得費控除前LTV」を計算する次の表❷を見てください。
検証する三つのアプリについて、「一ヶ月ごとの売上(料金)」と「平均残存期間(顧客でいてくれる期間)」を並べ、さらに両者をかけた「獲得費控除前LTV」を示したものです。
「獲得費控除前LTV」とは、広告費や販促費などのコストを差し引く前のLTVということです。
例えば「アプリ(1)」なら、月額の料金は四二〇円で、平均残存期間は三ヶ月、獲得費控除前LTVは「四二〇円×三ヶ月=一二六〇円」となります。
なお、今回は最大で一年以内のLTVなので割引率は考えないものとします。
手順3「累積LTV」が最大化するラインを割り出す続いて、それぞれのアプリがいくらまで獲得コストを追加していいかを割り出します。
結論から言ってしまうと、例えばアプリ(1)では、「キャンペーンFまで行うことが望ましい」となります。
次の表❸を見てください。
アプリ(1)について、各キャンペーンを実施した場合の顧客獲得数が表の通りだったとして(注:本項目の最後の段落を参照)、キャンペーンごとの「獲得費控除前LTV」と「(獲得費を引いた後の)LTV」、キャンペーンを追加するごとの「累積LTV」を表にしました。
もしキャンペーンEでやめた場合、累積LTVは一〇八万一七〇〇円です。
キャンペーンFまでやれば、累積LTVは一〇八万七七〇〇円です。
ところが、キャンペーンGまでいくと、LTVがマイナスになり、累積LTVも一〇八万五七〇〇円と減少に転じてしまいます。
つまり、ここまではやらないほうがいいということです。
よって、累積LTVを最大化するギリギリのラインは、「キャンペーンFまで行うこと」と判断できます。
こうして計算すれば、「売上の一五%を一律で広告費に回す」といった大ざっぱなコスト管理ではなく、個々の商品やサービスについて、LTVを最大化できる顧客獲得コスト投入の上限ラインを精緻に知ることができるのです。
なお、ここでは説明を簡潔にするため、各キャンペーンを実施した場合の顧客獲得数がある程度わかっているという前提で話を進めましたが、現実のビジネスではそれが事前にはまったくわからないケースも多々あります。
こうした場合、孫社長なら、「各キャンペーンを小規模でいいのでとりあえず全部いっせいにやってみて、その結果を数値化して分析。
それによって、獲得数の予想精度を高める」という方法をとるはずです。
こうした「PLANの前にまずDO(実行)」という考え方・やり方については、「「間違った数値化」パターン❻」をご覧ください。
超おすすめツール❶「必要な回答者数(サンプルサイズ)」がわかる!──「SurveyMonkey標本サイズカルキュレータ」アンケート調査やユーザーリサーチを実施する時、いったい何人分の回答を集めればいいのか、悩んだことはないでしょうか。
せっかくコストをかけて調査したのに、上司から「数が少なすぎて、そんなデータじゃゴーサインを出せない」と言われてしまった……こんな経験がある人は少なくないはずです。
たしかに、回答者数が少なすぎればデータの信頼性が疑われます。
かといって、予算には限りがあるので、むやみに回答者数を増やすわけにもいきません。
調査会社に依頼すると、「信頼できる結果を出すには、これくらいの回答者数が必要です」と提案されます。
しかし、本当にそれが適切な数字なのか、なかなか判断がつきません。
「リサーチ費用をつり上げるために、数を多めに出しているんじゃないか?」と思っても、確証がないので反論もできません。
実は、こうした悩みを解決してくれるツールがあります。
それが「SurveyMonkey標本サイズカルキュレータ」(https://jp.surveymonkey.com/mp/samplesizecalculator/)です。
まず「SurveyMonkey」とは、世界最大規模のオンラインアンケート・サービスのこと。
WEB上で手軽に、本格的なアンケート&フォームを作成できます。
その「SurveyMonkey」のサイトに、とてもシンプルな計算ツール「標本サイズカルキュレータ」があります(次の画像参照)。
これで「母集団のサイズ」「信頼水準(%)」「許容誤差(%)」をそれぞれ入力すると、「必要な回答者数=サンプルサイズ(SampleSize)」を一瞬で計算してくれます。
専門用語が出てきてびっくりされたかもしれません。
それぞれの意味を説明しましょう。
「母集団のサイズ」とは、その調査をすることで理解したい集団の規模です。
例えば、従業員の満足度調査なら、その会社の全社員数がこれに当たります。
「許容誤差」とは、調査結果として上下に容認可能な誤差で、「五%」が最もよく使われる数値です。
例えば調査結果が六〇%だった場合、許容誤差が五%なら、「五五%から六五%の間」で誤差を認めるということです。
「信頼水準」とは、その標本(サンプル)の集団がどのくらい母集団を反映しているかを表した率で、「信頼水準九五%」とすることが多いです。
この場合、同じアンケートを同じ条件で一〇〇回実施した場合、そのうちの九五回は許容誤差の範囲内に収まる、という意味です。
(注:「SurveyMonkey標本サイズカルキュレータ」では指定するようになっていませんが、サンプルサイズの計算では通常、「回答比率」というものも指定します。
これは特定の回答を選択する比率のことなのですが、「それは実際に調査をしてみないとわからない」という場合が多いでしょう。
回答比率は「五〇%」の時に最も保守的な結果になる、つまり最も多くのサンプルサイズが必要になります。
したがって、どれくらいの比率にすればいいかわからなければ、「五〇%」として計算すれば問題ありません)
では実際に、「SurveyMonkey標本サイズカルキュレータ」を使って計算してみましょう。
社員一万人の会社で、何らかのアンケートをするとします。
そこで、「母集団のサイズ=一〇〇〇〇」「信頼水準=九五(%)」「許容誤差=五(%)」とそれぞれ入力します。
すると、「標本サイズ」の下に「三七〇(人)」と計算されました(前の画像参照)。
これは、「三七〇人の社員を無作為に抽出してアンケート調査をすれば、同じアンケートを同じ条件で一〇〇回実施した場合でも、そのうちの九五回は誤差五%の範囲内に収まる」という意味です。
これなら、ほぼ「全社員にアンケートをしたのと同じ」と言っていいでしょう。
面白いのは、この母集団のサイズを一万、一〇万、一〇〇万と増やしていっても、サンプル(標本)サイズはほとんど変わらないということです。
例えば「信頼水準=九五(%)」「許容誤差=五(%)」の場合、母集団が一〇万なら「三八三」、さらに大きくなると一〇〇万だろうが一億だろうが一兆だろうが、サンプルサイズは「三八五」となります(実際に数字を入力してみてください)。
こうして「サンプルサイズ=必要な回答者数」がわかったら、アンケートの「回収率」を考慮して、最終的にアンケートを配布する数を割り出します。
例えば、先ほどの会社で、社員にアンケートを配布すると、これまで返答率が約五割だったとすれば、「三七〇÷〇・五=七四〇人」の社員を無作為に抽出してアンケートを配布すれば、信頼水準九五%、許容誤差五%の結果を得られる、ということになります。
こうしたことがわかっていれば、調査会社から「信頼できる結果を出すには、一〇〇〇サンプルは必要です」と言われても、「いや四〇〇サンプルあれば十分です」というように交渉できます。
あるいは上司に「サンプルが少なすぎる」と言われても、「四〇〇サンプルあれば、九五%の確率で誤差は五%以内に収まります」と説明できます。
もちろん、「確実に全員に当てはまる回答が欲しい」というなら、信頼水準を九九%にして計算することもできます(当然、信頼水準九五%の時よりはサンプルサイズは大きくなります)。
いずれにせよ、何のあてもなく調査会社や上司に振り回されるより、「低コストで、精度の高い調査結果」を得ることができるようになるはずです。
超おすすめツール❷「ABテスト」を簡単に行える!──「Googleオプティマイズ」「ちょっと違うんだよなあ」あなたの会社にも、これが口グセの上司がいるのではないでしょうか。
ネット広告のデザイン案を見せたら、「何かちょっと違うから、他の案も出して」と言われる。
仕方なく代案を出すと、またもや「何かちょっと違う」と別の案を求められる。
こうしていくつも案を出させておいて、挙げ句の果てに「う〜ん、どれもちょっと違う気がする」と決断を放り投げてしまう上司は少なくありません。
自分では「A案とB案なら、A案がいい」と思っているものの、あくまで主観なので上司をうまく説得できません。
「いっそのこと、お客さんにどちらがいいか聞けたらいいのに……」そう思った人にぜひおすすめしたいのが、ABテストを簡単に実施できるツールです。
代表的なものに、「Googleオプティマイズ」があります。
ABテストとは、主にWEBマーケティングで使われる手法で、比較したいサイトや広告、テキストなどを二種類用意して、どちらがより高い成果を出せるか検証するものです。
例えば、バナー広告のデザインを二種類用意し、ある特定の期間に両方をランダムに表示して、アクセス数や実際の購入に至った数を計測します。
そこから二つのバナー広告のコンバージョン率(CVR)を比較できるわけです。
これを使えば、「AとBのどちらがいいか」を数字ではっきりと示すことができます。
個人の趣味や好き嫌いで、「これはいい」「これは違う」と不毛な議論をする必要もなくなります。
しかも、ある特定の期間に、同時に二つを比較できるのがABテストのメリットです。
もしA案を四月に、B案を七月にというように時期をずらしてテストしてしまったら、数字は出ても客観的な比較ができません。
「春は新しいものを試してみようと考える人が多いから、数値が高かったんだ」「七月はちょうど他社も似たようなキャンペーンをぶつけてきたから、数値が低かったんだ」などと言い出す
人も必ず出てきて、またもや議論は平行線をたどることになります。
昔は広告にしろ販促キャンペーンにしろ、二つを同時にテストしようとすれば手間もお金もかかりました。
しかし今は、WEBサイトであれば、ABテストツールを使えば、簡単かつ低コストで同時期に複数をテストすることができます。
無意味な〝ちょっと違う議論〟をしている暇があったら、さっさと数字で比較して結論を出してしまったほうが早いということです。
実は「トライズ」でも、ABテストツールでフェイスブック広告を比較したことがあります。
二種類の広告を同じタイミングでテストしたところ、パターンAのCVRは〇・八二%、パターンBのCVRは〇・七七%になりました。
よって、パターンAの広告のほうが、〇・〇五%高い成果が出せるということです。
「〇・〇五%なんて、わずかな差じゃないか」と思うかもしれません。
しかし、パターンAのCVRはパターンBの一・〇六倍なので、両者の間には約六%の差があることになります。
仮に顧客一人あたりのライフタイムバリューが一〇〇万円だったとすると、「一〇〇万円×六%=六万円」の差が生じるのです。
これを「わずかな差」として見逃すことはできないでしょう。
ビジネスの拡大を目指すからこそ、小さな数字の差もきちんと検証し、自分たちが目指すゴールにどれだけの影響を与えるかを正確に理解する必要があります。
そのためにも、ABテストツールを活用して、「正しい数字の比較」を行うようにしてください。
超おすすめツール❸「テキストマイニング」が無料で!──「UserLocalテキストマイニングツール」アンケート調査を実施したものの、回答数が膨大でどのように解析すればいいか見当がつかない。
ブログやSNSで自社商品に関するユーザーの声や評判を集めたものの、どのように活用していいかわからない……。
そんな場面で役立つのが、「テキストマイニング」と呼ばれる手法です。
これは文章を単語や文節で区切り、それぞれが出現する頻度や相関関係、時系列などを解析して、役立つ情報を取り出すための分析方法です。
テキストマイニングの理論は複雑なので、ひと昔前までは専門の業者に高いお金を払って分析してもらうしかありませんでした。
私もソフトバンク時代に、コールセンターのアンケート調査結果をある業者に分析してもらったことがありますが、数百万円もかかりました。
ところが今は、あるツールを使えば、テキストマイニングによる分析がなんと無料でできてしまいます(ただし一〇万字まで)。
それが、第1章でも紹介した「UserLocalテキストマイニングツール」です。
やり方もいたって簡単。
サイト(https://textmining1.userlocal.jp)へ行き、分析をしたいテキストを貼りつけて「テキストマイニングする」をクリックするだけです(次図参照)。
例として、「ソフトバンクワールド2019」での孫社長の基調講演の前半部分を、このツールで分析したものをお見せしましょう(次図参照)。
WEB上に公開されている講演の書き起こしテキストを実際に貼りつけて、分析してみました。
まず、「共起ネットワーク」は、単語同士の関係性を視覚的に表したものです。
出現数が多い単語ほど円が大きく、また、「共起関係」(特定の文章においてある単語が出現した時、別の単語が頻繁に同時に出現する関係にあること)が強いほど太い線で結ばれるようになっています。
次に、「ワードクラウド」は、スコアが高い単語を選び出し、その値に応じた大きさで図示したもの(スコアは、単純な出現頻度だけでなく、その単語がどれだけ特徴的かを加味したもの。
そのため、「こと」「もの」といった「出現頻度は高いが、ありふれた一般語」はスコアが低めになる)。
さらに、「青=名詞、赤=動詞、緑=形容詞」というように、品詞ごとに色分けもされています。
これらを見ると、この講演で孫社長が一番伝えたかったことが、「AI」は「推論」するものであり、具体的には「自動運転」「天気予報」「在庫(予測)」などに「使う」時代が「やってくる」──といったものであったことがわかります。
こうして図を眺めるだけで、孫社長が頭の中でどんなことを考えているかを感覚的につかむことができるのです。
先述したように、実際に私はソフトバンク時代、コールセンターのクレーム分析にこうしたテキストマイニングを使っていました。
「『WiFi』という単語の出現が多く、しかも『切れる』という単語との共起関係が強い」といった分析ができるので、具体的な改善策を実施することができました。
わざわざアンケートをしなくても、ネットやSNSの書き込みを集めて分析すれば、自社の商品やサービスがどのような単語と結びついているかを簡単に分析できてしまいます。
「UserLocalテキストマイニングツール」は、使う人のアイデア次第でさまざまなテキスト情報を分析できます。
文字情報を扱う機会が多い人は、ぜひ一度活用してみてください。
コメント