Translate

ラベル データマイニング の投稿を表示しています。 すべての投稿を表示
ラベル データマイニング の投稿を表示しています。 すべての投稿を表示
Post Date:2020年3月8日 

データの大切さを「都道府県別新型コロナウイルス感染者数マップ」から考える

Coronavirus COVID-19  2019-nCoV

各種イベントの中止、TDLやUSJの休園、プロ野球や大相撲の無観客試合、学校の臨時休校、企業のテレワーク推進など、身近にもあっという間に新型コロナウィルスの影響が広まっています。

マスクだけでなく、SNSでの拡散からトイレットペーパー、ティッシュペーパーなども小売店の棚からなくなりました。経済産業省が マスクや消毒液やトイレットペーパーの状況 ~不足を解消するために官民連携して対応中です~ (METI/経済産業省) で現状について伝えていますが、実際に近所のスーパーなどで伽藍とした棚をみると不安を煽られます。

台湾では、デジタル担当政務委員(大臣)の唐鳳(オードリー・タン)氏(38)がマスクの在庫情報を政府がリアルタイムで提供して、アプリで店舗の在庫状況を確認できるというのが、日本でもニュースになっていましたが、流通のデータがそんなに細かく取得できるというのに驚きです。やっぱりこれからはデータの時代です

日本でも、流通データまでは取得できなかったとしても、昨今、オリンピックチケットの抽選販売を行ったばかりなので、国が一括購入をしてECで販売するのことぐらいはできないものかと思ってしまいます。


感染者数を可視化

米ジョンズ・ホプキンス大学の集計データによると、3月7日時点で世界の感染者数が10万人を超えたとニュースサイトに記載されていたので、データソースを探してみたところ、

ジョンズホプキンス大学システム科学工学センター(CSSE)が、Coronavirus COVID-19 (2019-nCoV)、モバイル版は、Dashboard Coronavirus COVID-19 (Mobile) というサイトで世界の新型コロナウイルス感染者数を地図とグラフで可視化して提供していました。

もちろん、日本の感染者数も確認することができます。

Coronavirus COVID-19  2019-nCoV (Japan)

3月7日時点のデータでは、

  • 感染者数:420名
  • 死者数:6名
  • 退院者:46名
  • 現患者数:368名

とあります。

しかし、残念ながら日本という一括りで都道府県別には分けられていません

ちなみに日本にマーキングされているもうひとつは、集計上は Others となっているダイアモンドプリンセスに関するデータについてです。

Coronavirus COVID-19  2019-nCoV (diamond princess cruise ship)

都道府県別新型コロナウイルス感染症患者数マップ

日本では、同じような形でデータを可視化しているところはないかと探してみると、「都道府県別新型コロナウイルス感染者数マップ」(2020/11 更新終了)が、ジャッグジャパン株式会社より公開されていました。こちらのデータは都道府県別にマッピングされています

都道府県別新型コロナウイルス感染者数マップ(3月7日時点)

COVID19_Japan - For publication に記載されている説明を読むと、

本マップは、米国ジョンズ・ホプキンズ大学のシステム科学工学センター (CSSE) が公開している「 Wuhan Coronavirus (2019-nCoV) Global Cases (by Johns Hopkins CSSE)」に着想を得て、日本国内にフォーカスして公開しております。本マップはジョンズ・ホプキンズ大学とは一切関係ありません。

とあり、Operations Dashboard for ArcGIS を使っていて、グラフをクリックすることで、表示するコンテンツを絞り込むことができます。

例えば、「直近一週間の感染者増加数(男女別)」棒グラフで3月7日を選ぶと他のグラフ、地図が連動して変化し、15名の感染者数都道府県別の内訳数と場所が地図上で表示されます。

都道府県別新型コロナウイルス感染者数マップ Coronavirus COVID-19 Japan Case  2019-nCoV (Mar7)

データソースについては、

原則、自治体発出の文章を基準についており、1日1回公開の厚生労働省発出の文章によって二重チェックと採番の反映を行う。自治体発出の文章が間に合わない場合のみ、記者会見のストリーミング動画を一次ソースにする場合がある。

と、記載されていますが、データ更新もむちゃくちゃ早いです。


データの即時性

都道府県別新型コロナウイルス感染者数マップの最終更新日は、閲覧時点で2020/3/7 23:41となっていますが、その時点のデータでは、

都道府県別新型コロナウイルス感染者数マップ Coronavirus COVID-19 Japan Case  2019-nCoV
  • 感染者数:461名
  • 死者数:6名
  • 退院者:69名

と、ジョンズホプキンス大学システム科学工学センター(CSSE)のデータと41名の差があります。このブログを書き始めた時点のデータが443名だったので数時間の間にデータが更新されていました。


CSVデータもダウンロード可

データはCSV形式でダウンロードすることもできます。CSVデータは、Creative Commons「BY-NC 国際4.0」として提供されています。

都道府県別新型コロナウイルス感染者数マップ(CSVデータ)

フォーマットについては、「新型コロナウイルス感染者数マップ」について – J.A.G JAPAN に説明があります。


CSVデータを使ってみた

CSVデータを実際に使ってみました。

都道府県別新型コロナウイルス感染者数マップ(日次集計)

ただ、このグラフには、現時点の患者数がなかったので、実患者数累計=累計-(退院数累計+死亡合計)で求めグラフを作成してみました。

日本の新型コロナウイルス感染者数 累積

新型コロナウイルス感染者数が地図やグラフで可視化されているサイト

上記で紹介した、ジョンズホプキンス大学システム科学工学センター(CSSE)の Coronavirus COVID-19 (2019-nCoV)、ジャックジャパンの 都道府県別新型コロナウイルス感染者数マップ 以外にも下記のサイトで同じような地図とグラフでデータの可視化がされています。(参考:COVID-19 Maps & visuals | CIDRAP

新型コロナウイルスをマップ化しているサイト一覧

しかし、日本の新型コロナウイルス感染者に関しては、都道府県別で確認できる、ジャックジャパンが提供する都道府県別新型コロナウイルス感染者数マップが最も優れています。

ジャックジャパン株式会社の関係者みなさまの努力に敬意を表したいと思います。「新型コロナウイルス感染者数マップ」へのご寄付について – J.A.G JAPAN というページもありますので、賛同される方は是非。(サイトの更新は2020年11月で終了しています。)

Post Date:2017年12月19日 

イノベーター理論を統計的に考えてみる

LINE Clova Wave の 機能限定バージョンの先行発売時に思わずポチッとしてしまい、Google Home の発売で、またもやポチッてしまった自分を反省しつつ、キャズム理論について考えてみました。

キャズム理論とは、ジェフリー・A・ムーア(Geoffrey A. Moore)の著書『Crossing the chasm』(1991年)に提唱されたハイテク市場におけるマーケティング理論で、エベレット・M・ロジャーズ(Everett M. Rogers)の提唱するイノベーター理論(1962年)の「アーリーアダプター」と「アーリーマジョリティ」の間に大きなキャズムがあるというものです。

日本では、2002年に 『Crossing the chasm, 2nd Edition』が『キャズム』として翻訳されたので、2014年の『Crossing the chasm, 3rd Edition』が 『キャズム2』として翻訳されています。ちょっとわかりづらい、、、。


イノベーター理論とは?

キャズム理論のベースとなっているはイノベーター理論です。イノベーター理論とは、商品やサービスが市場に浸透する過程を時系列で5つに分類し、それぞれの段階に合わせたマーケティング戦略が必要であるというものです。

イノベーター理論を正規分布で表記
  1. イノベーター(革新者)
    新しいものがでると直ぐに飛びつく、新しもの好きな人たちです。これは、市場全体の2.5%と少ないタイプの人々です。LINE Wave の先行体験版を購入してしまう人ですね。
  2. アーリーアダプター(初期採用者)
    イノベーターほどではないものの、常に最新の情報をチェックして、新商品の導入には前向きな人たちです。オピニオンリーダーと呼ばれ、マーケティングではこの層を重要視しています。つまり、LINE Wave の発売も知っていて、Amazon Echo の先行発売, Apple Home Pod などの発売動向をみて購入を決めるような人たちです。
  3. アーリーマジョリティ(前期追随者)
    比較的慎重ではあるけど、アーリーアダプターの動向をみながら購入を決めるような人です。周りで何人かがAIスピーカーを持ち始めて、「いいよ」と言われてから買う人たちです。
  4. レイトマジョリティ(後期追随者)
    自らは新商品を選ばないけど、周りがみんな持ち始めると購入を検討する人たちです。AIスピーカーも周りのみんなが使ってるから購入しようと考えます。
  5. ラガード(遅滞者)
    最も保守的な層で、自分が必要ないと判断したものは購入しません。AIスピーカーは自分には必要ないから購入しないという人たちです。

イノベーター理論と正規分布

前述したイノベーター理論の分布は、正規分布に基づいています。正規分布では、データが平均からどのくらい離れているかを表すバラツキの指標である標準偏差を用いると、

  • 1σ :μ + σ と μ - σ の間に68%のデータがある
  • 2σ :μ + 2σ と μ - 2σ の間に95%のデータがある
  • 3σ :μ + 3σ と μ - 3σ の間に99.7%のデータがある
※ σ(シグマ):標準偏差
※ μ(ミュー):平均

と、表すことができます。

下図は、正規分布のデータのバラツキを更にわかりやすくするために「良い・悪い」を用いて分類したものです。

平均から標準偏差1つ分の範囲(±1σ)を「普通」として、1σ以上(上位15%-2.5%)を「良い」、2σ以上(上位2.5%)を「すごく良い」、逆に、-1σ以下(下位15%-2.5%)を「悪い」、-2σ以下(下位2.5%)を「すごく悪い」と考えます。

良い・悪いを正規分布で表記

イノベーター理論を偏差値で考える

イノベーター理論は、商品・サービスの購入時期によって分別しているので正規分布の+-(左右)を逆転します。更に新商品(サービス)への敏感度を偏差値として表してみると、敏感度が「すごく良い」、上位2.5%の人たちがイノベーターですが、偏差値でいえば70以上(偏差値70は正確には上位2.3%)です。また偏差値60-70は、敏感度が「良い」アーリーアダプターです。

68%の普通は二分して、偏差値50-60の敏感度が「少し良い」グループをアーリーマジョリティ偏差値40-50の敏感度が平均より「少し悪い」グループがレイトマジョリティとなります。そして偏差値40以下の敏感度が「悪い」と「すごく悪い」をまとめたのがラガードです。

これを図解したものが下記となります。

イノベーター理論を偏差値で考える

偏差値70以上の人がイノベーター(革新者)と言われると納得できます。やはり日本人は、偏差値で考えるとイメージとして捉えやすくなります。

分類 偏差値 評価
イノベーター 70以上 すごく良い
アーリーアダプター
60-70
良い
アーリーマジョリティ
50-60
まあ良い
レイトマジョリティ
40-50
少し悪い
アーリーアダプター
40以下
悪い

偏差値60前後にキャズム(溝)がある

更にキャズム理論は、 「アーリーアダプター」と「アーリーマジョリティ」の間に大きなキャズムがあるというものですが、偏差値60以上とそれ以下ではキャズム(溝)があると言われると妙に納得できてしまいます。

偏差値での分類を踏まえて『キャズム理論』を読むと頭にすんなりと入るのではないでしょうか。

Post Date:2011年5月31日 

Twitterの平均フォロワー数は何人?

先日、某社から届いたセミナー案内のメールに
facebookのお友達数の平均は130人
Twitterの平均フォロワー数は183人
という記載があったのですが、感覚値よりも多く感じたのと、データ元の記述がないため、日本ローカルの数字なのかグローバルでの数字なのかも判らなかったのでデータもとを調べてみました。

フェイスブックの平均友達数

Facebookの平均友達数130人というのは、Facebookの統計ページに掲載されている数字だと思います。この数字は5億人以上のアクティブユーザーとあるので、平均友達数も当然全世界での数字になります。Facebook公式の数字ではありますが、いつの時点のデータかはわかりません。

People on Facebook
More than 500 million active users
50% of our active users log on to Facebook in any given day
Average user has 130 friends
People spend over 700 billion minutes per month on Facebook


ツィッターの平均フォロワー数

Twitterの平均フォロワー数については、アスキー総合研究所から提供されている「Twitter利用実態調査2010」の中に平均フォローワー数183人と記載されていました。レポートは有償販売されていますが、サンプルを閲覧することはできます。

Tiwtter利用実態調査2010のプレスリリースの調査概要が見てみます。
Twitter利用実態調査2010のプレスリリースより

「MCS(メディア&コンテンツ・サーベイ)」と「Twitterご利用状況についてのアンケート」という、2つのネットでのアンケート調査がもとになっているレポートのようですが、直接関係のありそうな「Twitterご利用状況についてのアンケート」のサンプル数は、299件で、調査時期は2009年の12月です。

サンプルを見るとTwitterに関する調査は、10,580サンプルに対しても行われていることが伺われますが、利用者数(n値)の最大数は393件です。つまりフォロワー数についての設問についての回答は、最大でも393名の平均値なのです。アンケート回答者のサンプルがどのように作られているかはわからないので、サンプルが母集団を表しているかは分かりませんが、少なくともTwitterのフォロワー数のように差が大きなものを平均値で語るには問題があるのではないかと思います。
n=393

例えば、サンプル数が400人だとして、うち399人のフォロワー数が10人で、たった1人のフォロワー数が40,000人という外れ値を含めて平均値を計算してしまうと、この場合の平均フォロワー数は、110人ということになってしまうというこです。99%以上の回答者のフォロワー数が10名だとしてもです。

リンクシェア・ジャパン、Twitter(ツイッター)利用実態調査実施

割と近い時期にリンクシェアが登録アフィリエイトのモニター会員を対象に実施したTwitter利用実態調査の結果が掲載されていたのでこちらもみてみます。

こちらは、有効回答者数1,842名のうちTwitterのアカウントを持っているのは34.3%とあるので、Twitterフォロワー数に関する設問の回答者は、632名であると推測できます。




この結果から平均フォロワー数を計算してみます。無論、個別のデータは分かりませんので、0〜49であれば真ん中の25を使っての計算となります。また、カテゴリー別の人数も分かりませんので、上記で計算した632名に構成比を掛けて人数を算出します。



上記による計算で求めた、Twitterの平均フォロワー数は165人ということになります。しかし、フォロワー数が50人未満の回答者で75%を占める分布の中で、165という平均値は何を表している統計値なのでしょうか。

※リンクシェアの調査結果には、平均フォロワー数は記載されていません。

まとめ

FacebookやTwitterの繋がりがどのくらいあるのかは、興味を引ける数値だとは思いますが、データの引用元がなく、数値だけを載せるのは、企業のスタンスとしていかがなものかと思います。

またデータを見る側としては、その値がいつ行われた何の調査から求められているのかとか、アンケート調査であればアンケート実施方法、サンプリング方法、サンプル数なども気にしてみるとよいのではないかと思います。

ネットで様々な情報が収集できる時代なので、「xx白書」みたいなものを図書館に見に行かなくても色々な統計値を取得することができます。また取得した情報から理論を組み立てる能力は、とても大切ですが、数値を使う場合には、その値が何を意味するのかを考えることが重要です。

今日の一曲


Kraftwerk(クラフトワーク)のRadio-Activity(邦題は放射能)は、大学時代の先輩の彼女が買って来てくれた1枚でした。いまでも感謝してます。アルバムタイトルには、Radio-Activityとハイフンが入り、放射能とラジオ活動という両方の側面があり、ジャケットもラジオでした。しかし、デジタルリマスター版では放射能のロゴに変わり、この曲もすっかりと反核歌として演奏されています。日本ライブでも♪STOP Radioactivityと歌われていました。バックの映像では、SCHERNOBYL(チェルノブイリ)、HARRISBURG(スリーマイル島)、SELLAFIELD(ウィンズケール)、HIROSHIMA(広島)と流れていましたが、FUKUSHIMAも追加されるのかと思うと悲しいですね。

Radioactivity - Kraftwerk
Post Date:2010年12月5日 

直帰率の改善(関連記事の表示)

Bloggerで関連記事(関連ブログ)を表示するで、直帰率改善のためにSmart Related Posts Widget for Google Blogger - v2.0を使って関連するブログ記事を掲載する方法を記しましたが、関連記事を表示するようになってから直帰率が改善がされているかを計測してみました。

結果から述べると、直帰率が85.75%から83.62%と2.1ポイント改善することができました。
下表がその結果となります。

直帰率の改善:(Google Analytics)
期間 直帰率 変化率
訪問者全体 新規訪問者 再訪問者  訪問者全体 新規訪問者 再訪問者 
設置前(前月) 85.75% 85.39% 86.85%
サイドバーに設置 85.13% 85.23% 84.94% -0.72% -0.19% -2.20%
ボディー部に設置 83.62% 83.47% 84.19% -1.77% -2.07% -0.88%
※ 前月・・・4週間、サイドバーに設置・・・2週間、ボディー部に設置・・・2週間

関連記事を記事の最後(ボディー部)に挿入することがうまくできなかったので、最初の2週間はサイドバーにだけ表示されていました。しかし、この結果、改善にあたっての仮説を補う面白いことに気が付くことができました。

直帰率改善の仮説

直帰率改善にあたっての仮説は、下記のデータから導き出したものです。

① 来訪者のうち新規訪問者(新規ユーザー)は75%
② 流入の80%は検索エンジンからである

訪問者流入

【仮説】
検索エンジンを経て何かを調べるためにこのブログに初めて訪れた新規訪問者は、サイト構成もしらなければ、他にどんな内容が掲載されているかを知らない。そのため能動的に他の記事を検索する人は少ないはず。しかし関連する記事が他にもあるということが目に留まればもう1ページ閲覧する可能性がある。

結果の考察

上記の仮説に基づき関連記事を表示するように変更しました。サイドバーに関連記事を表示すると再訪問者の直帰率は下がりましたが、新規訪問者では大きな変化は見られませんでした。新規訪問者はボディー部へ関連記事を表示するようになってから大きく改善されました。これは新規訪問者では、本文を読む目の導線上になければ気が付かれないということだと思います。

トータルの変化率でみると再訪問者が3.1ポイント、新規訪問者が2.2ポイントと、変化が大きかったのは再訪問者でした。再訪問者の直帰率が大きく改善されるとはいうのは予想外でした。また再訪問者は記事の最後に関連記事を表示してからも直帰率が改善される結果となりました。

変化率とは

Google Analyticsでも期間比較を行うと変化率が表記されています。変化率とは前と比べてどのくらい変わったかという割合です。前年比120%というような言い方と同様です。

e.g.
Aくんは、毎月のお小遣いが800円だったのが1,000円になりました。またBくんは1,000円が1,250円になりました。どちらの方が前と比べて改善された(変化が大きい)のでしょうか。

Aくん 800円 → 1,000円 200円UP
Bくん 1,000円 → 1,250円 250円UP

上がった金額はBくんの方が大きいです。しかし比率でみると

1,000円÷ 800円×100=125%
1,250円÷1,000円×100=125%

で、共に値上げ前と比べて125%です。変化率はこの比率から100%をマイナスした値になります。つまり上記の変化率は25%で、以前より25%アップしたといえます。

では、デフレの影響でお小遣いが下がった場合には、

Aくん 1,000円 → 800円 200円Down
Bくん 1,250円 → 1,000円 250円Down

800円÷1,000円×100-100%=-20%
1,000円÷1,250円×100-100%=-20%

共に変化率は-20%ということになります。

Bloggerで関連記事を表示する

Bloggerで関連記事(関連ブログ)を表示するでボディ部に関連記事できないと記していましたが、related posts widget でオプション記載部をエスケープしていないと正しく認識されないということが分かり下記のように(赤字部分)変更することで解決しました。

<!-- related posts -->
  <h4>関連記事</h4>
  <div class='related-posts-widget'>
  &lt;!-- {
 related_title:''
 ,thumbs:0
  } --&gt;
  loading..
  </div>
<!-- related posts -->


このコードをテンプレートに埋め込みます。

ブログ(本文)の前に表示する

1.Bloggerの『デザイン → HTMLの編集』 からウィジェットのテンプレートを展開をチェック。
2.テンプレートから <div class='post-header-line-1'> を検索。
3.<div class='post-header-line-1'> の下にコードを張付ける。

ブログ(本文)の後に表示する

1.Bloggerの『デザイン → HTMLの編集』 からウィジェットのテンプレートを展開をチェック。
2.テンプレートから <data:post.body/> を検索。
3.<data:post.body/> の下にコードを張付ける。


今日の一曲


ビートルズの中で好きなアルバムは、と、問われれば迷わずこのREVOLVERをあげます。特にTomorrow Never Knowsは、ワンコードで作られ、テープループを用いたアバンギャルドな一曲となっています。まさにミニマムミュージックの原点がこの曲にあります。リンゴスターのドラムのリフの入り方もとっても格好良いですし、ボーカルの中域を持ち上げたラジオチックな録音の仕方もステキです。限られた機材で工夫を凝らしているこの曲は、昨今のDTMのアンチテーゼとして聴こえてきます。

The Beatles - Tomorrow Never Knows / Revolver
Post Date:2010年10月28日 

きざしKeygramを使う(その2)

きざしkeygramを使うでkeygramを使ってエギングについて調べてみましたが、もう少し違った角度からエギングについて考察していきます。

アオリイカと共に出現するイカの種類

keygramの特徴は連想語です。アオリイカの連想語としては、下図の「イカ」という分類があがります。



アオリイカと同時に書かれているイカの種類は、ひとつは、アオリイカの別名です。『アカイカ』、『ミズイカ』、『モイカ』などは、地方によるアオリイカの別名です。

もうひとつとしては、エギンガーの観点からするとアオリ狙いの外道としてのイカがあげられているのではないかと思います。実際に自身もエギングでケンサキイカ(=アカイカ)、ヤリイカ、コウイカ(=スミイカ)、カミナリイカ(=モンゴウイカ)、ヒイカなどが釣れています。

※アカイカは、アオリイカとケンサキイカ両方の別名として使われています。
※スミイカは、コウイカとカミナリイカ両方の別名として使われています。

エギングで対象となるコウイカとアオリイカを時系列で比較することによって、ブログ掲載時期から釣れる時期の違いを調べてみました。なるべく多くのサンプルを使って比較をするために、アオリイカは『アオリ』と『アオリイカ』を対象とし、コウイカは『コウイカ』、『甲イカ』、『スミイカ』を対象としてみました。また通年を100%として、各月のバラつきを比較しています。



比較しやすいように二つのグラフを重ねてみます。



きざしkeygramを使うでは、アオリイカのピークを5月と10月と記載しましたが、『アオリ』を含めると秋シーズンのピークが9月になります。何れにせよ春シーズンは4月〜6月、秋シーズンは9月〜11月であり、春より秋に多いことがわかります。一方、コウイカの春シーズンは、アオリイカより若干早く終わり、4月〜5月で、ピークは5月です。秋はアオリイカに遅れて10月〜12月でピークは11月です。また厳冬期の1月〜2月でも一定数の話題があることがわかります。

イカの生態から考えると、コウイカもアオリイカと同様に年魚であり、春に産卵のために接岸し、秋には釣れるサイズに成長します。また東京湾では秋から冬にかけて乗合船からテンヤでの釣りが盛んです。

コウイカとスミイカ

アオリイカとコウイカの比較でコウイカにスミイカも加えていましたが、房総では、カミナリイカもまたスミイカと呼ばれています。そこで一旦まとめたコウイカとスミイカを分別してグラフにしてみました。(※カミナリイカはサンプル数が少ないため集計対象にはしていません)


コウイカには、春の大きな山と、秋の小さな山があります。一方、スミイカは、晩秋から冬にかけて大きな山があり、2月まで減少しながらも一定数があります。

同じイカを指すはずのコウイカとスミイカで話題にあがる時期がなぜ違うのかを検証するために下記の2つの仮説を考えてみました。

①コウイカ=スミイカ
であるとすると、関東では前述したようにコウイカをスミイカと呼び、秋から冬がシーズンであることから、関東とは別に春にコウイカを釣る地域がある。

②カミナリイカ=スミイカ
であるとすると、コウイカとカミナリイカで釣れる(釣る)時期が違う

イカ・タコ識別図鑑には【釣り】という項目があり、下記のように記載されています。





イカ・タコ識別図鑑 (釣り人のための遊遊さかなシリーズ)

エギンガーには必需品であるこの図鑑。学術的観点ではなく釣果を確認するための図鑑です。見分けるための特徴が生きた(釣った)イカやタコの写真をベースに【解説】【形態】【分布】【釣り】という4項目に分けて完結に説明されています。また調理方法も掲載されているので、さばき方から食べ方まで網羅されています。

またiPhone版の電子書籍としても発売されています。iPadにも対応しているので大きな画面で検索・閲覧することもできます。

価格:¥1,575(書籍版) ¥900(iPhone/iPod/iPad)






コウイカ
コウイカは、水深10m-100mのやや内湾的な砂泥底にすみ、冬の終わりから春先にかけて浅海に浮上してきて産卵する。この時期に釣ることが多い。

カミナリイカ
コウイカと混同している釣り人が多い。浅海に多くて身近な甲イカであり、大型になるので釣って面白く、食べて美味しい。

【引用:イカ・タコ識別図鑑】
コウイカは春先に釣ることが多いとあるので、春にコウイカを釣る地域があるはずです。この地域による違いを見つけるために、Google Insights for Search を使って『コウイカ』と『スミイカ』が、いつ、どこで、検索されているかを調べてみました。Google Insights for Search では検索語句の人気度を時系列で解析することができます。ネットでみるエギングで、同じく烏賊ネタですが、今回は利用していませんが、Google Trends(Googleトレンド)の使い方や、Google Insights for Searchの使い方にも触れていますので参照ください。



Google Insights for Searchで調べてみると、『コウイカ』は春、『スミイカ』は秋から冬です。また地域別でみると、『スミイカ』は東京で検索されていますが、大阪では『スミイカ』という語彙では検索されていません。

ブログ掲載時期と検索時期についての関係をみると『スミイカ』は、相関係数が0.96と高く、グラフでみてもほぼ重なっていることが分かります。

コウイカも相関係数は0.86と高いのですが、グラフを重ねてみると、秋は検索よりも掲載が上回っています。このことは、秋のコウイカは能動的に釣ったのではなく、受動的に釣れてしまったということを意味しているのでしょうか。

エギンガーが秋に多いという結果と併せて考えると、アオリイカの外道としてコウイカが釣れているのではないかと考えられます。



スミイカをkeygramで調べてみると、『乗合』『出船』などがあがり、『スミイカ乗合』のブログ掲載時期は、下記にある通り、秋から冬にかけてです。



またコウイカでは連想語に『エギ』、『エギング』、『交接』などがあがります。これは、春の交接期にエギングで釣っていることを表しているのではないでしょうか。



上記から仮説①は証明され、西では春の産卵時期に浅海に浮上してくるコウイカをエギングで釣り、東ではスミイカと呼ばれて秋から冬にかけて乗合船でテンヤで釣られるということがわかります。

では、仮説②についてはどうでしょうか。

内房や南房で底をとってエギングをするとカミナリイカが餌木に乗ってきます。餌木に重りを付けてズル引き専門の釣師もいます。そして春シーズンよりも秋シーズンの方がエギングは盛んです。実際、いまの時期の堤防や護岸はスミイカの墨だらけです。しかしながら、今回のkeygramでの調査からは、カミナリイカがスミイカと呼ばれて秋に釣られているということまでを言及するには至りませんでした。

ちなみにコウイカとカミナリイカの違いですが、イカ・タコ識別図鑑によるとコウイカの胴長は10cm-20cm、カミナリイカは10cm-38cmとあり、カミナリイカの方が大型です。またカミナリイカには特徴的な唇のような斑紋があります。下の写真はこの秋釣ったカミナリイカ(モンゴウイカ)です。



拡大してみると斑紋がハッキリとわかります。



そしてこちらがこの春にあげたコウイカです。斑紋はありません。



これもコウイカでしょうか。



今回は、イカという個人的趣味のネタですが、ネットでの話題性を定量的、定性的にみることは、ソーシャルマーケティング時代のマーケッターにとって、とても重要なことだと思っています。また得られた情報から知見を組立てることは、ツールではしてくれないので、色々と試してみると自分の技量を磨けるのではないでしょうか。

今日の一曲

伊豆高原からの帰り、車に乗ってSuono Dolceをかけたら流れていた「のうぜんかつら」。

そのときのツィートは、「おっ、カッコいいね」

イントロ部分と間奏にある、ちょっと鼻にかかった甘い声でのリズムチックな英語の歌詞の部分は心地良く耳に染みいります。

月桂冠のCMで流れた「のうぜんかつら(リプライズ)」が有名だと後に知りましたが、個人的にはこちらのバージョンの方が好きです。

安藤裕子 - Merry Andrew / のうぜんかつら



おっ、カッコいいね。さて東京まで帰りましょうか。 ♪のうぜんかつら/安藤裕子 #SuonoDolceless than a minute ago via Suono Dolce by ニッポン放送
Post Date:2010年10月25日 

きざしkeygramを使う

keygram(キーグラム)とは、「kizasi.jp」 のブログエントリ解析データとブログ解析&ランキングサービス 「blogram」 での解析データを活用した無料のキーワード検索ツールです。

キーワード検索ツールといっても単なるSEO対策用としてのキーワードを探すだけではなく、コトバからコトバの連想ができるのでマーケティングツールとしても活用できるのではないかと思います。

keygram開発ブログの『第1回:コトバをみつける』には下記のように記載されています
ブログは、生活者が日常、自発的に使っているコトバです。この言語使用データを解析することで、コトバを使う人々の感性を知ることができます。そこには、あなたにインスピレーションを与えるような何かがあるはずです。

【中略】

keygram は「keyword + gram」から作った造語です。キーワードをグラム計量して、コトバ探しに役立つエッセンスを抽出するという意味です。


【引用:第1回:コトバをみつける】

keygramのデータ概要

データソース:

2009年1月1日〜12月31日に執筆された約8,600万件のブログ記事。

性別の判定:

SVM(サポートベクタマシン)という機械学習アルゴリズムを使用し、正解データから性別判定に寄与する特徴をプログラムが学習して判定。クロス・バリデーション・テスト(5-fold)では92%の精度で性別判定可能。

年齢の判定:

性別と同じく機械学習アルゴリズムを使用。現在、約80%の精度で判定。10代と40以上の判定は比較的容易。しかし、20代と30代の区切り目の判別はプログラム的に難しい。

keygramでみるエギングの傾向

ブログ・リサーチの活用法法』、『ネットでみるエギング』でネット上で何が検索され、何が語られているかを記したことがありますが、今回はkeygramを使った探索をしてみます。違うツールを使うことで新しい発見もあります。

先ずは『エギング』というコトバで検索します。初期画面では、品詞は名詞系、期間は通年となります。検索結果は下記のように表示されます。






検索結果のコトバから『エギング』をクリックすると、エギングについて記載されている総数とデモグラフィックスを見ることができます。






他のツールで得られる知見と同様にエギングは4月〜6月の春シーズンと9月〜11月にかけて山があり、ピークはそれぞれ5月と10月ではないかということがわかります。






また性別でみると94:6で女性エギンガーが少ないことが分かります。(正確にはエギンガーでブログにアップする女性が少ない)

女性エギンガーが少ないことを検証するために『釣り』で検索をして連想語にあがる『釣果』(簡単な釣り用語)で属性を調べてみました。






『釣果』での男女比は87:13なので、釣りをする女性の中でも女性エギンガーは少ない。と言うことができるかと思います。






エギングもルアーを使った釣法なので、ルアー自体も女性比が低いのかと思い、『ルアー』で調べてみると、88:13と男女比は『釣果』とほぼ同じことから、女性アングラー(ルアー釣り)がエギングを好まない理由があるのでしょうか。

エギング人口

女性エギンガーが少ないと言っても、そもそもエギング人口とはどのくらいなのでしょうか。keygramで求めた数値から算出してみます。『エギング』のブログエントリー(記事数)は11,047件です。また、『釣り』のエントリー数は461,906件です。

ということは、エギング比率は、

11047÷461906≒2.4%

であることが分かります。

釣り人口については、「レジャー白書2010」に見るわが国の余暇の現状」 に掲載されている「釣りの参加人口」1,050万人という数値を利用しました。

エギング人口は、

1,050万人×2.4%≒25万人

と、なります。

また女性エギンガーは、25万×6%=1.5万人

です。

この数字の信憑性は、?????。

ブログでみるアオリイカ

続いて、アオリイカをキーワードとして調べてみます。品詞として形容詞を選択すると、アオリイカに対しての評価や感情が分かります。






抽出されたコトバをidea mapper for iPadを使ってマインドマップ形式でまとめてみました。





「釣果」、「天候」、「感情」、「味覚」と4つに分類することができます。「釣果」では、「サイズが小さい」、「天候」では(波が)「高い」、(風が)「強い」など否定的なコトバが使われますが、しかし感情では総じて好評です。また味についても高評価であることがわかります。

これだけでアオリイカについて書かれているブログの概要を掴むことができます。

idea mapper for iPad

idea mapper for iPad  ¥600

iPadでMindmapを描画できるツールです。ブランチの曲がり具合がほどよく、マインドマップらしい描画ができます。

テキストを配置してからブランチを繋げていくというコンセプトのためマインドマップとは思考方法が異なります。また親ブランチを移動しても子ブランチが移動されないため、描画したマインドマップの整形がスムーズにできないのが難点。


象と散歩:人気の投稿(過去7日間)