うずまき2017 powered by Jun-Systems

耳管開放症, SAS, 統計解析, 人工知能, プログラミングそれに思考

*

データ分析の重要性とオープンデータ活用の潮流

   


大学院での自分の研究内容がデータ分析を使ったものだからなおさら感じるのですが、
データ分析って結構重要です。

中でも、モデル化なんていうのは結構面白いです。
たとえば、こんなモデルがあったら面白くないですか?

Example Model

「うっ数式かよ意味わかんねーよ」と思わずにちょっと我慢して聞いてほしいのです。
これはそんなに難しい話ではなく、ある1日の売り上げがいくらになるのか予想してみようというモデルです。
(変数は適当につけてます)

というのは、i日目の売り上げのことです。
つまりなら、12営業日目の売上を表します。

そして、というのは、それぞれの変数が売上げに対してどのように影響を与えるのかを表すものです。
売り上げに対してどれぐらい重要なのかを示すぐらいに思っておけばいいです。

たとえば、 ならば、Weekendはとなります。
このWeekendは「ダミー変数」と呼ばれ、もしあるiという日が週末ならWeekend = 1、平日ならWeekend = 0となり、
週末である場合は2000 x 1でSalesに2000という数字が加算されます。
つまり、週末には平均的に2000円売り上げがあがるという意味です。

同じように、たとえばで、その日が雨(Rainy = 1)だったら、
-1200 x 1で、その日の売り上げは1200円下がることになります。

もし、上記Salesのモデルが以下のようになったとしましょう。


今日の情報を「2014年3月15日(土)晴天 特売期間は終了 接客担当はBさん」だとした場合、今日の予想売り上げは…


より、26,200円となります。

このようなモデリングは、ある1年の売り上げを詳細に記録すればするほど、様々なダミー変数を追加してその影響を見ることができます。

天気などの人間が操作できない情報を加えるのは予測精度をあげるという意味では非常に有用です。
しかしながら、いくら人間が操作できない情報がわかっても、それでは売り上げを改善することはできません。
なぜなら、「晴れの日の方が売り上げがいい!」とわかったところで、雨が降っても人間にはどうすることもできないからです。

その一方で、人間に操作できる変数をモデルに放り込むことは、売り上げ改善やマーケティング等といった面で役立つでしょう。
このモデルにも含めましたが、ある特定期間バーゲンセールを行ったあと、その結果をモデルに含めることにより、バーゲンの効果測定を行うこともできます。
また、A、B、Cという3人の接客担当がいたときに、どのスタッフの日に売り上げがいいかという「純粋な影響力」を調べることができます。
ここで「純粋な影響力」と表現したのは、たとえば「本当なら売り上げの成績がいいはずの店員Aさんでも、たまたまその日が雨だったから売り上げが伸び悩んだ」という可能性が考えられるからです。
(もちろん別の方法として、1年通して自分が担当した日の売り上げを単純平均して他の店員と比較しても、ある程度の実績はわかると思います)

データはこんな感じでエクセルにでもまとめていけばいいわけです。
Book1_-_Excel

分析用のソフトや推定方法は、その分析にどれぐらいの人員や時間、資金のコストをかけられるのかで変わってくると思うのでアレなんですが、
比較的大きな企業であればまあIBMのSPSSとか導入できるとすごくいいでしょうね。
SPSSは高いですが分析が比較的簡単ですからね。クリックで進んでいける。

ぼくが普段使っているSASなんかは統計の知識にプラスしてさらにプログラミングが必要になってくることが多い(そして何より高い)ので、導入の障壁はどうしても高くなるだろうと思います。

最近はオープンデータを使ってなんかやれないかなーなんて考えてます。

読んでいただきありがとうございました。
雇い手募集中です。

今回の数式画像はOnline Latex Equation Editorを使用して作成しました。


 - SAS, ウェブマーケティング, ソフトウェア, ビッグデータ, 学問, 統計学

Comment

  1. Johnb984 より:

    Definitely, what a fantastic website and informative posts, I definitely will bookmark your blog.All the Best! aakdbbgdceed

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

  関連記事

no image
横行する似非統計の話
no image
ビッグデータと情報売買
no image
SASでHHI(ハフィンダール指数)を計算するマクロを作った
no image
SAS上でRを走らせよう SAS/IML
SASでランダムサンプリングしてグループ分けするマクロ
no image
ベイズ統計で考える世界: 感度・特異度・尤度比などなど
【忘備録】SASで巨大データセットから先頭100Obsを抽出
SAS超基礎1 データの読み書き
クラウドストレージ入門 – Amazon Driveを例に –
SASでディレクトリ内の全フォルダを自動でライブラリに追加する