[A/B テスト]
A/Bテストという名前は学術用語ではない。
ランダム化比較試験の前提に基づく。
意図しないランダムネスの破壊:A/Aテスト
サンプルサイズ設計が重要。
[BTYD モデル]
BTYD モデルとは、Buy-Till-You-Die の頭文字を取った名称で、顧客の購買行動をモデル化するために利用されるもの。
Pareto/NBDモデル
顧客全体の傾向を推定して、その後に顧客の行動を推定。ベイズ更新ではない。パラメータは得られているが、観測されてない。
超幾何関数を使って期待値を計算。
[MMM]
テレビCM、Web広告、SNS、チラシなど、様々なマーケティング施策がどのように貢献しているかを定量化する統計学的な分析手法。しかし、元々はGoogleに所属する研究者が提案したもので、そのオリジナルの考えからは大分拡大したものになっている。
pymc_marketingを使う。
Roas(ロアス)だけではなく飽和状態も考慮することが大事。
geometric/delayedのどちらを使うかは分析者が選択する。
logistic関数とhill関数、と広告業界で呼ばれている関数を使っている。
[NPS分析]
NPS(ネットプロモータースコア)分析とは、顧客ロイヤルティを定量的に測定し、企業の業績向上につなげるための分析手法。
[カスタムメトリクス設計]
アプリケーションレベルまたはビジネス関連のオーダーメイドメトリクスを設計すること。
[共分散構造分析(SEM セム)]
従来の制度が社員の満足度につながっているか?
新サービスがニーズにマッチしているか?
コンジョイント分析では交互作用のない変数がすでにかなり固まっていて、どれが満足度につながるかをみるが、共分散構造分析は細かい項目をもとにしたパス図が最初にあり、細かい項目をまとめていく。
semopyパッケージを使う。
パス係数の検定を行う。
機械学習の前処理としてやっても悪くはないが、あまりやらない。
[クロンバックのα係数]
アセスメントを構成する尺度がどれくらい安定しているかを示す信頼性の指標の1つであり、尺度を構成する項目の等質性(内的整合性・内的一貫性とも)を算出するもの。
2022年統計検定1級人文に出題された。
[コレスポンデンス分析]
自社と競合他社など複数ブランドのポジションの違いを可視化する分析手法。
真面目に理論を説明しようとすると、特異値分解を使わないとどうしても説明できない部分がある。らしい。
χ二乗距離を導入して計算を行うが、イェーツの補正は行わない。何故なら、イェーツの補正はあくまで検定の精度を上げるための工夫だからである。
[コンジョイント分析]
実際には交互作用無しの分散分析である。
[探索的因子分析]
解釈が難しい共通因子が出てきたときは、元の変数を減らしてみる。
TOEFLのETSがライブラリを公開していることを知る者は少ない。
回帰モデルでは射影先は決まっているが、因子分析ではベクトルを射影する平面を決める。平面は原点を通るようにする。(各パラメータを正規化しておく。)その平面での軸を決めるのが回転。
因みに、主成分分析でも実は回転を使っている。
Rのpsychには「rotate="varimax"」と書いてある。
回転ではL. L. Thurstone(サーストン)の単純構造に基づき、因子負荷量が偏るようにする。
varimax回転は因子負荷量の 二乗の分散(variance)を最大(maxmize)化するような回転である。
主成分分析は、L. L. Thurstone(サーストン)の単純構造に基づかない。総合的な成分を出すようにする。
promaxは2乗ではなく、3乗4乗を使う。また、斜めの軸もありにする。
回転は20種類くらいあるらしい。