Translate

2010年2月28日

クロス集計表の有意差検定

アンケート結果などの集計表をみたときに、これって差があると言えるのかなという疑問を持ったことはありませんか?有意な差があるかの検定は、Excelで簡単にできますので、試してください。

先日、アンケートのクロス集計の結果を有意検定して欲しいと依頼があったので、カイ2乗 (χ2) 検定と調整残差から残差判定の結果を添付しました。そのときの期待値などの説明を手書きで書いてPDFにしたものを送付したのですが、折角書いたのでブログにも記しておきます。

Excelでカイ二乗検定を調べると、CHITESTという関数があります。(と、いうかExcelでカイ二乗検定ができることを知りませんでした...。)

ヘルプには下記の集計表が記載されています。

A B C
1 男性(結果) 女性(結果) 説明
2 58 35 賛成
3 11 25 中立
4 10 23 反対
5 男性(予想) 女性(予想) 説明
6 45.35 47.65 賛成
7 17.56 18.44 中立
8 16.09 16.91 反対

=CHITEST(A2:B4,A6:B8)

χ2 統計量が 16.16957、自由度が 2 になる上のデータのカイ 2 乗分布の確率を求めます (0.000308)。

と、説明されています。

表計算ソフトの“おまけ機能”としては十二分ですが、説明はあまりにも貧弱です。

クロス集計表のカイ2乗 (χ2) 検定は、実測値(Excelの説明でいう結果)と期待値(Excelの説明でいう予想)から求めます。


期待値とは

期待値とは、下記の考え方に基づきます。

実測値:
A B C D E
1 説明 男性 女性 列計 行比率
2 賛成 58 35 93 57%
3 中立 11 25 36 22%
4 反対 10 23 33 20%
5 行計 79 83 162 100%
6 列比率 49% 51% 100%
  1. 全体の男女比率は49:51なので、賛成、中立、反対それぞれも男女比率は49:51になるハズ
  2. 全体の賛成、中立、反対の比率は、57:22:20なので、男性も女性も57:22:20の比率になるハズ

これは下記の数式から求まります。

\[ 期待値 = \frac{列計 \times 行計}{n} \]

男性・賛成のセル(B2)の期待値は、93×79÷162=45.35185です。Excelでは、

=$D2*B$5/$D$5

で求まります。

期待値:
A B C
7 説明 男性 女性
8 賛成 45.35 47.65
9 中立 17.56 18.44
10 反対 16.09 16.91
※小数点2桁で表示

カイ2乗(χ2)値

実測値と期待値にどれだけ差があるかを計るために、実測値と期待値の差を2乗した総和を求めます。

\[ x^2 値 = \sum \frac{(実測値 - 期待値)^2}{期待値} \]

Excelでは、χ2値を算出する関数はないので(多分)、わかりやすく段階的に求めてみます。先ずは、各セルの実測値と期待値の差を2乗して期待値で割った値を求めます。男性・賛成は、実測値がA2、期待値がB8となので、=(B2-B8)^2/B8 で求まります。同様に各セルの値を求めたものが下記の表になります。

(実測値-期待値)2/期待値:
A B C
11 説明 男性 女性
12 賛成 3.53 3.36
13 中立 2.45 2.33
14 反対 2.31 2.20
※小数点2桁で表示

そして、それぞれのセルを合算します。=sum(B12:C14)

χ2値=16.16492

Excelのヘルプには、χ2 統計量が 16.16957とありますが、若干異なります?


自由度

今回の例でいえば、男女であればどちらかが決まれば、残りが決まってしまうような場合は、自由度は1となります。また賛成、中立、反対のように3種類あれば2つが決まれば全部が決まるので自由度は2となります。クロス表では行と列があるのでこれを掛け合わせます

自由度=(列数-1)×(行数-1)

今回は2列3行の表なので、自由度=(2-1)×(3-1)で、自由度は2となります。行と列の計がわかっているので2つのセルが決まれば残りも確定できるという意味です。


カイ2乗検定

Excelでカイ2乗検定は、=CHITEST(実測値の範囲:期待値の範囲)と指定します。上記の例では、=CHITEST(B2:C4,B8:C10)となり、p値=0.00030891です。

帰無仮説や有意水準の詳しい説明は省きますが、p値が0.05よりも小さければ、このクロス表の実測値と期待値との差がない確率は、5%以下と判定します。また0.01よりも小さければ差がない確率は1%以下となります。

つまり、男女の賛成、反対、中立というクロス表では、差があると判定されます。


残差判定

χ2検定で差があると判定されたクロス集計表ですが、この検定結果だけでは、どのセルに差があるのかは判りません。そこで残差判定を行います。

残差とは、実測値-期待値になります。A16のセルであれば、=B2-B8となります。

残差:
A B C
15 説明 男性 女性
16 賛成 12.65 -12.65
17 中立 -6.56 6.56
18 反対 -6.09 6.09
※小数点2桁で表示

残差を見ると、賛成は男女の差が大きく、男性がプラス方向、女性がマイナス方向であることが判ります。また中立と反対は、賛成よりも差が大きくはないけど、男性が小さく、女性が大きいことが判ります。しかし、残差は基準値がないので、差が大きい小さいの判断が一概には言えません。


調整残差(調整済み残差)

調整残差(調整済み残差)は、各セルに有意差があるかを判定するために、正規分布しているものと仮定して、ブレがどの程度あるかを求めます。

\[ 調整残差 = \frac{実測値 - 期待値}{\sqrt{期待値 \left( 1 - \frac{列計}{n} \right) \left( 1 - \frac{行計}{n} \right)}} \]

男性・賛成の調整残差は、

=(B2-B8)/SQRT(B8*(1-$D2/$D$5)*(1-B$5/$D$5))

で求まります。

調整残差:
A B C
1 説明 男性 女性
2 賛成 4.02 -4.02
3 中立 -2.48 2.48
4 反対 -2.38 2.38
※小数点2桁で表示

調整残差の値が、1.96より大きい、若しくは-1.96より小さい場合は、有意差がない確率は5%となります。つまり上記のクロス集計表の各セルはすべて差があると判定されます。1.96という数字は、標準正規分布表を見るとz値は0.975です。これは1.96の右側が面積の2.5%であることを意味し、1.96より大きい確率は2.5%です。また-1.96の左側の面積も同様に2.5%です。つまり両方合わせると5%となります。

標準正規分布

また調整残差が2.58よりも大きければ(-2.56よりも小さければ)有意水準は1%なり、差がないと間違う確率は1%となります。

上記の結果から、全セルとも95%の確率で差があるといえるけど、99%を求められると男女の賛成の差だけとなります。


調整残差については、すべてわかるアンケートデータの分析を参考文献としています。

すべてわかるアンケートデータの分析
著者: 管 民郎
出版社:  現代数学社
発売日: 1998/11
価格: ¥3,675



今日の一曲

チュラナマ/Churamana - てぃんさぐぬ花

てぃんさぐぬ花とは「てぃ(手)をさぐる(飾る)花」という意味で、マニュキアとして使われていたほうせんかのことす。

ほうせんかは爪先に染めなさい
親の教えは肝に染めなさい

といった教訓歌なのです。

沖縄民謡の代表的な曲で、多くの音楽家が奏でいるので一度は聴いたことがあるのではないでしょうか。今回は、Churamanaという女性二人組の「てぃんさぐぬ花」ですが、沖縄民謡とハワイアンを上手く調和させています。

アルバム名の「ふたつの楽園」も沖縄とハワイを指していると思います。

2010年2月22日

顧客ロックイン戦略-CRMの戦略フレーム(その2)

顧客ロックイン戦略-CRMの戦略フレーム」で、7つのロックイン戦略の中で「インティマシー・ロックイン」、「メンバーシップ・ロックイン」について紹介しましたが、今回は、「コンビニエンス・ロックイン」、「ブランド・ロックイン」、「ラーニング・ロックイン」についてです。全3回に分けて7つの顧客ロックイン戦略について説明をしています。

第1回 顧客ロックイン戦略-CRMの戦略フレーム

  • インティマシー・ロックイン
  • メンバーシップ・ロックイン

第2回 顧客ロックイン戦略-CRMの戦略フレーム(その2) 

  • コンビニエンス・ロックイン
  • ブランド・ロックイン
  • ラーニング・ロックイン

第3回 顧客ロックイン戦略-CRMの戦略フレーム(その3)

  • コミュニティ・ロックイン
  • シリーズ・ロックイン

参考にした文献は下記になります。

2001年のHBRに掲載された「顧客ロックイン戦略」。著者は、NRIの中川理氏、日戸浩之氏、宮本浩之氏で、7つのロックイン戦略についてわかりやすく記載されています。

ハーバードビジネスレビューは、単価の高い雑誌ですが、たまに読みたくなる記事が掲載されます。過去記事は、バックナンバーを購入してもよいですが、ハーバード・ビジネス・ライブラリーやブックネストから単体の記事として購入することもできます。(2020.1.6 削除)

今回、ブックネストを使ってyukiセレクションに顧客ロックイン戦略を紹介しておりますので、興味がある方は、購入して全文を読んでみてください。(2020.1.6 削除)

バックナンバー(電子版)を購入するか、ハーバードビジネスレビューを定期購読してDHBRオンライン会員になると、こちらから読めます。(2020.1.6 追記)

また顧客ロックイン戦略については、ダイヤモンド社発刊の戦略実践ノートの第一章にも掲載されているので、こちらも参考にしてみてください。

戦略実践ノート
著者: 野村総合研究所 コンサルティング・セクター
出版社:  ダイヤモンド社
発売日: 2004/10/7
価格: ¥1,890


顧客ロックイン戦略

顧客ロックイン戦略の中で、ロックイン戦略とは、顧客との長期的関係を構築するためのさまざまな戦略を、顧客サイドの視点からロジックを組み立て、体系づけたものであり、CRMの概念に体系的な戦略を適用するものであるとあります。

下記は、顧客ロックイン戦略について自分の理解でまとめたものです。


コンビニエンス・ロックイン

コンビニエンス・ロックインとは、商品やサービスの利用しやすさ(アクセスしやすさ)により顧客をロックインする戦略で、「ワンストップ型」と「補充型」があります。


ワンストップ型

ここに来れば、必要なものはすべてあります。といった、比較商品や、同時購入する商品を1箇所で提供し、顧客の利便性を高める方式です。そう考えると百貨店もワンストップ型ですね。複数の店舗を集めて利便性を高めるショッピングモール、POSで管理して売れ筋商品しか店頭に並べないコンビニエンスストアもこの部類です。これをネットで展開しているのが、楽天市場やYahoo!ショッピングになります。

またひとつのリアル店舗ですべての商品を取り揃えることは現実的には不可能ですが、店舗を保有しないことでロングテールに応えたAmazonもこのワンストップ型ですね。

ワンストップ型の場合は、また商品の“探しやすさ”、“比較しやすさ”といったユーザビリティも必要となります。これもネットでは、かなりの範囲で実現されてきました。また後述する「コミュティ・ロックイン」とも関連しますが、“比較しやすさ”を実現する方式として商品レビューなどがあります。


補充型

必要なときに必要な分だけを提供するといった融通性で顧客をロックインする方式です。書の中でも代表例として挙げられているのが、「富山の薬売り」です。office glicoも菓子の新たな需要を創出するという以外にも、ビジネスモデルとして「富山の薬売り」の補充型を真似ています。

またサザエさんに出てくる酒屋のサブちゃんのような御用聞きは、この補充型のロックイン戦略の典型例です。

ワンストップ型にしても補充型にしても需要喚起が必要であるとありますが、そういう意味では酒屋のサブちゃんは「醤油そろそろ切れていませんか?」と磯野家に商品を提案しています。ワンストップ型の同時購入でも、以前ブログにも記載したデータマイニング界の都市伝説となっている「ビールとオムツ」に見られるようなリコメンデーションが必要となります。Amazonが導入している協調フィルタリング形式のレコメンデーションはまさにこれに該当します。


ブランド・ロックイン

商品やサービス、企業そのもののブランド力によって顧客をロックインします。○○なら××といった具合に、顧客はロックインされると具体的な商品名や企業名を連想できるようになります。

ブランド・ロックインは、顧客との直接の接点を持ちにくいメーカーにとってのロックイン戦略の選択肢のひとつであるとありますが、現状では、ネットでのコミュニケーションが発展し、ユーザー登録時にメールアドレスを取得したり、マイページを展開することによって、各メーカーも直接顧客とコミュニケーションを試みています。

ソニー友の会、Club Panasonicなどは、ユーザー登録という形式を取っていますが、アフターフォローによる顧客満足度の向上だけではなく、新商品の紹介、消耗品のダイレクト販売、顧客ニーズの把握といった新たなメーカーの顧客との関わり方を示唆しています。

またブランド力は、一旦、綻びをみせると一気に失墜するリスクがあります。エコカーならプリウスを築き上げたトヨタ自動車も、最近のリコール問題から、どのように信頼回復できるかが鍵となっています。


ラーニング・ロックイン

慣れているから使い続けたい、知っている人に聴きたい、といった学習という要素に関連するロックイン戦略で、下記に分類されています。


ラーニング・プラス

顧客自身が学習し、慣れ親しんだ結果、知識やノウハウといったサンクコストによってロックインする方法です。また利用者数が増えれば、そのルールがデファクトスタンダードとなり、更に強い効力を発揮するとあります。

マイクロソフトのWindowsなどがその典型です。Windowsに慣れしたしんできたユーザーは、性能面や価格で優れているからといってLinuxに移行するようなことはありませんでした。またマイクロソフトはOSだけではなくワープロソフトやスプレッドシートでも、その地位を確立するためにプリインストールに固執していたのでしょう。


ベンチマーク・ラーニング

熟知している人を真似る、参考にするといった心理を利用してロックイン戦略に結びつけるのが、ベンチマークラーニングです。CMで有名人を起用するのもこの心理作用を利用しているのだと思います。

店長ブログなどもこの部類に属すると思います。ネットでは、集合知という形でも進化し、はてな、教えて!goo、OKWaveなどが該当します。また商品レビューもベンチマークラーニングです。但し、Amazonや価格.comに記載されている商品レビューが実際の利用者かどうかはわかりません。そういった意味では、前述したClub Panasonicなどユーザー登録している方のレビューというのは、実際の購入者であることがわかるので、今後の商品レビューのあり方を考える上での参考となるのではないでしょうか。


ラーニング・プロポジション

自分のことをよくわかってくれている。と思わせる提案を行って顧客をロックインします。このため企業は、顧客に関する十分な知識や情報が必要となるとあります。デパートの渉外担当などが該当するのではないでしょうか。顧客のデータを必要とするため嘗ては限られた上位顧客にしか適応できませんでしたが、技術の進歩により、大量のデータを蓄積し、高速に処理ができるようになり、データベースマーケティング、ワントゥワンマーケティングを実践する企業が増えてきています。

最近では、ネットでの行動履歴に基づく広告やレコメンデーションもできるようになってきています。もともと顧客を理解し、顧客にあった提案をするというのがCRMの原点でもあり、更に進化を遂げていく領域ではないかと思います。


ラーニング・アウトソース

専門家にすべてを委ねることで起こるロックインとあります。顧客側の観点でみるとサーチコストをゼロに近づけることができます。名前の通り、例でも企業のアウトソーシングがあげられていますが、BtoCの観点で考えると、図書館司書やソムリエ的な発想で、人手はなくオートマチックに旅行や本、趣味事などに関しての商品やサービスの組み立てをするといった点では、まだまだ改善の余地はあると思います。

釣りもしたことがない人が、エギングを始めるといっても、道具として何が必要であるか、どのように釣ればよいのか、どこで釣ればよいのかと、わからないことだらけです。この解決策として、集合知に頼る方法もありますが、専門的知識を必要とするものであれば、専門家にすべてを委ねるというのは楽な解決方法ではあります。

ということで、

コミュニティ・ロックイン、シリーズ・ロックインについては、また次に記載します。


今日の一曲

Brain Enoのアンビエントシーリズの第1作が、この Music for Airpots です。テープループの代表作でもあり、テープによるループの位相がとても気持ちよく、ゆっくりと身体に染み込んできます。レコードのジャケットにはプラス・マイナスを逆に接続したスピーカを追加して聴くようにと記載されていました。

随分前になりますが、ベルギーからスイスに向かうのでスイス航空に搭乗した際にBGMとして1/1が流れていました。流石と思ったのですが、そのスイス航空も今はありません。

そんな Music for Airpots を “Bang on a Can All-Stars” が機械的に造られた位相を生演奏によって再現しています。実はこのCDは、ベンチマーク・ラーニングでロックインされた結果として購入した1枚です。

Bang on a Can All-stars - Music for Airports

Amazon Music でも Music for Airports: Live (Bang On A Can All-Stars) を聴くことができます。

アクセス上位(過去7日間)