何を予測しているのか

3 MODELING: OFFLINE MODEL PERFORMANCE IS JUST A HEALTH CHECK

MLCTで昔からグノシーの関さんが言っていた話だが、実際にモデルの精度改善とKPIとが相関すらないのを図示していて良い。

あと、精度改善してもKPIはサチるからな、という話も言われてみればそりゃそうだ。

ProxyとなるKPI(CTR)に過剰に最適化しても、本当のビジネス指標のCVRは上がらない、という話はCTRに寄せすぎた不快な広告の話を思い出す。

予測のレイテンシーが30%上がると0.5%CVRが下がったので、相関あるか見てみたよという話。

Model redundancy: モデルをコピーしてクラスターにdistribute
In-house developed Linear Prediction engine: 自前で線形予測エンジンを内製。内積を使うモデルを高速化
Sparse model: パラメータ数が減ると計算時間が減る
Precomputation and caching: 特徴空間が小さいときは予測結果をKVSに入れる。大きいときでも高頻度のリクエストをメモリにキャッシュする
Bulking: ネットワーク負荷を減らすためにまとめて1リクエストにする
Minimum Feature Transformation: 特徴計算の回数を減らして高速化する

なお、これらはシンプルなインターフェースでデプロイとmodelのconsumeができるように抽象化されており

をクリアしている。

Issues for label dependent feedback
- Incomplete feedback
  - 特定の条件下（予約時）ではtrueラベルがつくが、そうではない条件のときにtrueラベルがつかず発火しない
- Delayed feedback
  - 数日〜数週間、数ヶ月後にしかtrueラベルが得られないケース。
教師なしのResponse Distribution Charts
- 予測結果のhistogramで判断
- 0-1の中心に高頻度の単峰性の山 → High bias model or high Bayes error in data
- 極端に高頻度なmodeがあるとき → スケールミスか学習データの外れ値
- ノイジーな分布は極端なsparse model
- 双峰性の分布は2クラスをきちんと分類している
便利なヒューリスティクスだけど、modelが高品質かどうかはわからない
estimators（regression?） or rankersには使えない

他で紹介されていないところを中心にメモしたが、論文直接読んだ方が面白い。

Last updated on 2019-11-26

Authors

Principal Software Engineer

Interested in Machine Learning, ML Ops, and Data driven business. If you like my blog post, I’m glad if you can buy me a tea 😉