第4回

データによるマーケティング

第4回の内容と到達目標

はじめに

最終回となる第4回では、第1回〜第3回で学んだデータプログラミング技術・統計モデルの知識を活用して、企業の「販売マーケティング」活動を分析・考察します。

一般的に(潜在的な)需要を掘り起こすマーケティングという企業活動は「製品(Product)の設計、価格(Price)の決定、お客(需要)との接点となる場所の開拓(Place)、どのような手段でお客の関心を惹起するか(Promotion; 販促)という「4P」に要約されます。そして、企業が直面するのは、「これら4つのPをどのように調整するべきか」というマーケティングミックスという問題です。第4回では、このマーケティングミックスの決定に対して、販売データとそれに対する統計分析を活用して最適なものを探し出す手法について詳述します。

近年、企業が売上・利益を伸ばすための販売マーケティングは折り込み広告や特売情報の発信にとどまらず、IT技術を活用した電子決済におけるクーポンの発行のようなきめ細かな顧客対応も可能になっています。第4回ではこのような柔軟な顧客対応に関しても有益なマーケティング分析手法を身につけます。この手法では、日々の販売活動の記録と小売店舗の地域属性という、長年企業内に蓄積されているデータを活用することに主眼を置いています。伝統的な販促活動をデータに基づいて振り返り、考えられる販促戦略とその結果について科学的な予測を行うことが可能になります。

データについて

このような経営意思決定問題を分析する際には、相応の経営データが必要です。一方でリカレント教育講座のような場に、特定の企業さんが、自社が保有する販売レコードを提供してくれることは基本的にはあり得ないでしょう。しかし例外もあります。

シカゴ大学ビジネススクールの「Kilts Center for Marketing」という機関は、シカゴの「Dominick's Fine Foods (略称DFF; "ドミニク生鮮食品")」という食料品店チェーンの協力のもと、シカゴエリアにあるDFFの83の小売店舗の1989〜1994の5年間にわたる詳細な販売記録を、データベースとして公開しています。各店舗の立地は左図をご覧ください。

このデータベースに含まれる商品は日用品から食料品まで多岐に渡ります。第4回はこのデータベースを使いますが、あまりにデータサイズが大きいため、特定の品目「オレンジジュース」に限定して分析を行います。(なお、この食料品チェーンは2013年にSafeway, Inc.という別のチェーンの子会社となりましたので現在は存在しません)

「オレンジジュース」データセットには、DFFが取り扱う11のブランドのオレンジジュースについて、販売数・価格・店頭広告情報、および各ブランドごとの利益が、83の小売チェーン店舗の週別データとして提供されています。このデータセットは上記マーケティングミックスの問題を分析・考察するために必要な情報を備えています:

  • 「販売数」は各店舗での需要の大きさ、価格と店頭広告情報は4Pの「価格(Price)」「販促(Promotion)」に対応します。

  • このデータセットには83の店舗それぞれについて立地の特徴データが付録しており、販売数と併せることで場所(Place)の情報が利用できます。

  • 11のオレンジジュースブランドにはトロピカーナのような「全国ブランド」とDFFが開発したプライベートブランドが含まれています。これらの情報は「製品(Product)」に対するブランド選択行動を分析する際に役立ちます。

なお、"最適な"ミックスを考える際のKPI(Key Performance Indicator; 重要業績評価指標)として、ここでは各店舗のオレンジジュース販売による「利益」を考えます。

内容

第4回では、利益最大化を目標とする経営意思決定を実行するためのキー概念と統計分析のロジックを紹介し、DFFオレンジジュース販売データを題材としてこれらを実践・習熟します。またマーケティング分析の一連の作業を見通し良くパソコンで実行するためのデータプログラミング技法について学びます。講座の具体的な内容は次の4つのパートに分かれます:


  1. オレンジジュース販売データの見方、マーケティングという観点からどのような方針でデータの分析に切り込んでいくか:お客=需要の反応をみるための価格弾力性といったマーケティングのキーとなる操作概念をいくつか提示します。そして、データの背後にある企業の販売活動と消費者行動の関係を、実用性の高い統計数理モデルで定式化することの意義について説明します。数理モデルがあることで、私たちはこれまで行なったことのない販売活動・出会ったことのない未知の需要に対する予測を科学的に行うことが可能になります。

  2. 現状の把握:83の小売店舗における、これまでの価格設定・販促といった企業側の努力がどのような売り上げ・利益につながったのか、現状を把握しましょう。ここでは第1回・第2回で主に学んだデータ分析のうち「記述統計分析」を各店舗に対して実行する手法を説明します。これによって、価格に対する消費者の反応、プライベートブランドと全国ブランドの違い、消費者行動の各店舗ごとの違いといったことを、これまでの販売実績に基づいて理解することができます。そして、この情報が次の販売予測・利益予測につながっていきます。

  3. 売り上げ・利益予測:販売マーケティングの価値が発揮される局面のひとつが、「予測」です。これまで行なってきた販促活動をどのように増やす・減らすと売り上げや利益はどれだけ変わるのでしょうか。1.で提示した統計数理モデルを実際にオレンジジュースデータを使って推定することで、これらについて確率的な予測を行うことができます。

  4. 各店舗ごとのマーケティング戦略の効果予測:3.で推定した販売マーケティングにおける統計数理モデルは、対象店舗全体にわたる予測を与えてくれます。しかしながら、マネージャーとしてはひとつひとつの店舗について、その店舗の立地属性とお客の性質に対応したより細やかな販売戦略を作るという"マイクロマーケティング"の方向性もあると思います。このような際に役立つのが階層ベイズという統計数理モデルです。3.で導入した統計数理モデルを階層ベイズという手法によって推定します。この作業を通して、オレンジジュースの各ブランドの販売に際して83の店舗それぞれが独自に「店頭マーケティング(店内掲示での特売表示や陳列位置を目立つようにするなど)」をとったときの販売・利益予測を考えます。このマーケティング手法は、各店舗の地域のお客の性質に応じたきめ細かな販売対応ができるという点で、従来の「全店舗一括販促戦略」より優れていると考えられています。実際にいくつかの販促シナリオによる結果をシミュレートし、このことを確認します。

目標

以上の内容から、第4回の目標を次に設定します:

  1. 企業サイドの販売マーケティング活動を、日々の販売データの蓄積から把握するためのデータの見方、記述統計分析の方法を学ぶ。また、そのような分析が可能になるデータフォーマットの作り方についての知見を得る。

  2. 統計数理モデルを使った販売予測・利益予測の方法を学ぶとともに、モデルを推定する際の困難な点・注意すべき点とその対処方法に関するノウハウを学ぶ。

事前の準備(2021/2/28時点)

第4回の受講にあたり、使用データと受講前の予備知識を紹介します。

オレンジジュースデータのダウンロード

  • 販売データはこちらから(Excelファイル)。シート1枚目「oj」("OrangeJuice"の略)にはおよそ10万行のオレンジジュース販売データが、週別・店舗別・ブランド別に入っています。各列の意味については、シート2枚目「変数定義」をご覧ください。特に、11のオレンジジュースブランドは1から11までの数字で符号化されています。各数字と商品名の対応関係は、「変数定義」シート右側の表をご覧ください。

  • 店舗データはこちらから(Excelファイル)。シート1枚目「demog」("demography"の略)には、83のDFF店舗が地理情報付きで入っています。各列の意味は2枚目の「変数定義」シートをご覧ください。

なおこのオレンジジュースデータは、Rの"bayesm"パッケージに入っている「OrangeJuice」というデータを基に、上記シカゴ大学ビジネススクールの「Kilts Center for Marketing」が公開しているDFF店舗情報から私がいくつか追加し、必要な前加工を施してExcelファイル化したものです。

事前知識その1:小売店舗と立地属性

ところで、私にはシカゴの土地勘がありませんので、Dominick's Fine Foods (DFF)のシカゴエリアにおける店舗展開がどういうものかをざっくりとでも知らないと、分析のモチベーションがあがりません(みなさんも同じかと思います)。そこで、この節でDFF小売店舗の立地と地域環境について概観したいと思います。

まずは各店舗の位置関係についてです。店舗データには各店舗の緯度と経度を収録してあります。これを地図上にプロットしてみましょう。第4回で用いる統計分析ソフトウエアRには、「plotly」というインタラクティブな地図を作成する拡張ライブラリがありますので、これを利用します。

店舗データには、「ZONE」という変数が含まれています。DFFは販促のための「値下げ」は83の店舗一律の設定にする一方、「通常価格」は15の各ゾーンごとに異なる設定にしていたようです。それぞれのゾーンではさらに、「通常価格」として「高>中>低・競争価格」の4種類の価格帯を設定していました。最後の「競争価格」というのはDFFでは「Cub-Fighter価格」と呼ばれ、直接の競合相手であったライバルチェーン「Cub Foods」に対抗する価格設定です。

店舗データの緯度経度の列を取得し、各店舗をこのZONE番号ごとに色分けして描画したのが以下の地図です(OpenStreetMapを背景レイヤーに使っています):

地図上に色分けされた各点が、DFFの店舗です。Plotlyを使っているので、各点にマウスを合わせると店舗名と都市名がポップアップされます。地図上でマウスによって拡大縮小も可能です。右の凡例の色は各店舗のZONEを表していますが、それぞれの色の上でマウスでシングルクリックすると地図上の表示が消えます。もう一度クリックすると現れます。この方法を使い、いったん全ての店舗を地図上から消して、次に各ZONEをクリックすることで、そのZONEに属する店舗がどれかが明確に分かるでしょう。

DFFデータは1989年当時のものですが、上述のように既に買収されて存在していません。一方で、OpenStreetMapの地図は比較的最新の地理情報を反映しています。よって、地図上の各点を拡大していくとDFFとは異なる商業施設などが現れることにご注意ください。83の店舗の多くは幹線道路沿いにあり、その多くは(2020年現在)大型商業施設となっています。1989年当時を振り返ると、DFFはおそらくかなり大きな食料品店チェーンであったと推察されます(新潟県民としてはウオロク・原信をイメージするとよいのかもしれません)。

地図から、15のZONEに含まれる店舗は地域的に固まっているわけではないようです。ここから推測されるのは、ZONEは各店舗の商圏に含まれる地域住民の社会属性で定義されているのではないかということです。すなわち住民の経済状況・労働環境・家族構成といった属性に応じて、ZONE店舗ごとの価格設定が決まってくるということです。このことをざっくりと理解するために、上でダウンロードできる店舗データ(demog.xlsx)の内容をZONEごとに調べてみます。83の店舗ごとに社会属性情報が幾つか含まれています。ここでは次の7つの項目に注目します:

  • AGE60: 60歳以上人口の比率

  • EDUC: 大卒以上人口の比率

  • ETHNIC: 黒人・ヒスパニック系人口の比率

  • INCOME: 所得の中央値

  • HHLARGE: 5人以上世帯の比率

  • WORKWOM: 定職についている女性の比率

  • HVAL150: 世帯年収が15万ドル(高所得)の世帯の比率

これらの値をZONEごとに平均をとったのが下表です。集合棒グラフもつけてあります。

最下行に「変動係数」を追加しました。ZONEごとの7つの社会属性の平均値のうち、どの属性がもっともばらついているか、すなわちZONEの違いを際立たせる社会属性は何かを知るために計算しています。すると、ETHNIC(黒人・ヒスパニック住民比率)の変動係数が際立って高く、HVAL150(高所得者比率)も相当な値です。このことから、ZONEは「白人居住比率の高さ」「高所得者比率の高さ」あたりが決定要因になっているのではないかと推察されます。

上のマップで白人比率と高所得者比率が高いZONE14の店舗、例えばBUFFALO GROVEにある「DOMINICKS 112」の近隣をGoogle Mapで見てみると、庭付き一戸建ての閑静な住宅街であることが分かります。一方、ETHNICが高くHVAL150の低いZONE11の店舗、例えば「DOMINICKS 128」の近隣をGoogle Mapで見てみると、DOMINICS 112の近隣とはだいぶ違う雑多なストリートを見ることができると思います。

まとめ:価格設定と需要の関係

小売店の主要なお客さんは近隣住民です。今まで見てきたように、シカゴエリアには人種構成や経済状況の異なる住民が点在していて、ZONEごとの価格設定はこれを反映しているといってもよいかと思われます。そして、これらはオレンジジュースに対する需要の決定要因にもなり得ると考えられます。上でダウンロードしていただいた販売売上データの中には11のブランドがあり、その中には2つのプレミアムブランド、7つの全国ブランド、2つのプライベートブランドがあります。高所得者や高齢者、健康意識の高い消費者はプレミアムブランドを好むだろうし、低所得者は安価なプライベートブランドを買わざるをえないのかもしれません。上の表から、83の各店舗が抱えるお客さん(需要)にはそれなりに多様であることが推測できます。

第4回では、83の店舗が抱える多様な需要を所与として、「どの店舗のどのブランドにどのような価格を設定すると売上や利益が上がるのか」「値下げや陳列の工夫といった販売マーケティングは、どの店舗のどのブランドで効果があがるのか」という問題について、統計的な手法で分析・考察を行う予定です。

終わりに

本ページの文書は定期的に更新されます。次回更新は3月7日の予定です。