top

menu

重回帰モデルによる売上予測

cover

小売や飲食などチェーン企業におけるGIS(地図情報システム)の活用は年々高度化しており、新規出店時の売上予測というテーマでGISと統計解析手法を駆使し、売上予測モデルを構築している企業も多くあります。本コラムでは売上予測手法の中で重回帰分析について解説します。

売上予測とは?

売上予測と言っても様々な手法(例えば重回帰分析、ハフモデル、類似店舗検索など)があり、どれが最適かは一概には言えません。業種業態によって向き不向きがあり、やってみないとわからないというのが現状かもしれません。
各企業が保有しているデータベースを見える化し、データ分析に基いて各種施策を立案・実行するのは、昨今のビジネストレンドとなっています。ただし、企業が保有している店舗データや顧客データのみでは実績を示すに過ぎません。実績値がポテンシャルに対して限界なのかそうではないのかを知る必要があります。一方、GISに搭載されている人口などの各種統計データはまさしく市場ポテンシャルを表すビッグデータです。統計データも分析ニーズに合わせて進化しており、国が調査する国勢調査などの公的な統計だけではなく、最近ではインターネットのオーディエンスデータやGPS位置情報をソースにした新しいエリアマーケティング用データも提供されています。こうしたデータと実績データを組み合わせることによって、自社の売上に貢献するターゲット指標は何かを見出し、売上を説明する計算式を構築する手法が重回帰分析です。

1

重回帰分析とは?

重回帰分析は多変量解析手法のひとつで、「ひとつの成果」に対して「複数の要因」がある場合に、その相関と影響の度合いが測れる分析です。ピックアップした要素の候補を取捨選択しながら、ひとつのモデル(成果を説明する要素の組み合わせ)を作ります。売上を予測したい目的変数とし、それを複数の変数(商圏データなど)で説明する式を、既存店のデータを分析することによって作成します。新規出店時には当然売上は未知数ですが、商圏データは事前に得られるため、売上を逆算することができるわけです。

2

準備するデータレイアウト

まず、必要なデータのレイアウトを下に示しました。自社の店舗リストは当然として、実績を示す売上や面積、駐車場台数などの属性項目もあるとよいでしょう。店舗属性項目によく採用されるものとして席数や営業時間、従業員数、レジ台数などもあります。店舗リストをGISにインポートし、各店舗の商圏データを紐付けます。例えば店舗半径1km商圏内の夜間人口、昼間人口等です。その他に商圏内の競合店舗の要素も、GISがあれば瞬時に集計可能です。

3

売上は目的変数、その他の項目が説明変数の候補となります。このようなデータが重回帰分析のスタート地点となります。次のステップでは、売上に影響を与えるデータ項目を探索していきます。

売上とデータの関係性は?

売上を説明する変数を見つけるための手法の一つに、相関分析があります。売上が上がるのは商圏人口が多いからなのか?商圏内に競合店舗が多いからなのか?売上と変数の関係性を相関係数という数字で読み取ります。相関係数は-1から+1の間に現れ、絶対値が1に近いほど関係性が高いと解釈します。

4
例えば年齢とコレステロールの相関係数が+0.81だった場合、両者には関連性があり、年齢が上がればコレステロール値も上がると解釈できます。相関分析自体はExcelでも可能です。

重回帰モデル式作成

次に実際のモデル式を作成します。大枠の流れとしては、まず売上予測式に採用できそうなデータ項目を選択します。相関係数の高い項目を選択するとよいでしょう。そして選択した項目群のなかで、最適な組み合わせをステップワイズ法によって自動計算します。この方法は異常値が少なく、最も信頼性の高い予測式の組み合わせを算出してくれます。統計解析ソフトや当社商圏分析GIS「MarketAnalyzer™」の重回帰分析機能が必要ですが、結果の解釈もし易いためお薦めです。

5

重回帰モデル評価指標の見方、ポイント(参考)

統計解析ソフトやMarketAnalyzer™の重回帰分析機能で作成したモデル式の評価指標として、代表的なものとその見方を例示します。

7偏回帰係数:他の説明変数の値を変えずに1つの説明変数の値だけを変えた時の、目的変数の変動量
標準誤差 :サンプルを取り直した場合の定数項または回帰係数のバラツキ度合い(標準偏差)。
標準化係数:説明変数が目的変数に与える影響の度合い。大きいほど影響が強い。
t値    :偏回帰係数のt検定の結果。この値の絶対値が大きいほど有意確率が小さくなる。
有意確率 :回帰係数の妥当性の指標。0.05未満ならば妥当であるとみなせる。
VIF    :多重共線性の指標。大きいほど他の説明変数との相関関係を疑う必要がある。

精度向上のためのポイント(参考)

1回の分析で納得できるモデル式が出来上がることは残念ながらほとんどありません。トライアンドエラーを繰り返しながら精度を上げていく必要があります。以下経験上のポイントを幾つかご紹介します。

データを正規化する

実データの数字そのままでは統計処理上、効果が出ない場合もある(対数や率も検討する)。

多重共線性を避ける

投入する項目同士の相関が高いと、実際の精度が悪くなる場合がある。

店舗を分類し、分類ごとにモデル式を作成する

コンセプトや商圏特性が全く異なる店舗同士を同時に投入しない。

最後に

データに基いて意思決定する時代にあって、実績を示すデータと市場を示すデータを組み合わせることは重要です。さらに売上を予測することもデータ分析において頻出する課題ではないでしょうか?売上予測のひとつの手法として重回帰分析を紹介しましたが、作業はGISというツールに任せておき、そこから得られる結果の解釈や運用に注力することが一番重要だと思います。
当社にはデータ分析やGISの運用に関して様々な経験とノウハウがあり、統計学の世界だけではなく、実践的なビジネスマインドを持つスタッフが、高度・高速なツールを用いてお客様がご自身でマーケティングナレッジを蓄積する支援をしています。これからプロジェクトを始める方、現状のプロジェクトに行き詰まった方、お気軽にご相談ください。

お問い合わせはこちらから。