Peng Ye, et al., Customized Regression Model for Airbnb Dynamic Pricing, KDD2018を読んだ．Airbnbで実際に使われている価格推奨モデルについて，非常にわかりやすくまとめられている．

この分野で初めて読んだ論文．時間はかかったが，読み通すことができた．実装しろと言われてすぐ実装できるとは言えないが，大筋は理解できたと思う．心理的なハードルは下がったので，他の論文もどんどん読んでいきたい．

Abstract

Airbnbの商品は基本的に過去にない唯一のもの．よって，過去の実績をもとに需要曲線を予測するのが非常に難しい．
Airbnbが提案するシステムは３つのモデルで構成される．
- 特定の日にちの予約確率を予測するモデル．
- 特定の日にちの最適な売値を予測するモデル．
- 二番目の予測値を，さらにパーソナライズして売値をサジェストするモデル．
本論文では，二番目の売値予測モデルについて述べる．このモデルは，Price TipsとSmart Pricing toolとして実際にAirbnbのシステムに組み込まれている．A/Bテストでこのモデルの効果を確認した．

Introduction

プラットフォーマーとして，Airbnbは，ホストが設定する価格を直接的に制御していないが，ツールを使って適正値をアドバイスしている．
- Price Tips：暦情報をもとに，適正価格をサジェストする機能．
- Smart Pricing：ユーザが設定した希望価格の下限と上限をもとに，自動的に適正価格を計算する機能．
適正価格は機械学習で算出されており，モデルは日々更新されている．

Airbnbの値付けに関して，いくつかの論文が公開されている[8, 9, 11, 16]．

Dynamic pricing at airbnb

AirbnbでDynamic Pricingするにあたり，大きく２つの課題がある．
Demand Estimation
- 従来は，大量生産品に対するDemand estimationが研究されてきた．この領域では，需要曲線\(F(P)\)を予測することが最大の目的である．ここで，\(P\)は価格．近年では，機械学習を用いて\(F(P)\)を予測するモデルも提案されている[2, 15]．一方で，Airbnbにおける需要曲線は価格\(P\)だけでなく，時間\(t\)や個別の物件\(id\)に依存すると考えられる．
- 需要曲線が時間に依存する原因として，季節性とリードタイムがある．
- 需要曲線が物件に依存する原因として，Airbnbが扱う物件の特殊性と，人気の格差がある．
以上から，需要曲線\(F(P, t, id)\)を予測するのは非常に難しい．
また，我々が提示した価格を，ホストが必ずしも採用しないことも，問題の複雑さを一層増す原因となっている．

Our approach

\(F(P, t, id)\)を適正価格にマッピングするPricing strategy modelを提案する．このモデルは，独自に設定した損失関数を最小化するよう学習したモデルである．
従来手法では，製品の特徴に対して線形な価値関数を想定していた[1, 4, 5]が，我々のモデルは非線形である．
- 需要関数をGradient boosting machine (GBM)で予測する．
- 損失関数はSupport vector regression (SVR)で利用されている\(\epsilon\)-incentive loss functionをもとにしているが，正確な目的変数を持たず，\(\epsilon\)の値をtraining sampleごとに変えている．
本論文の貢献は以下の二点：
- 適正価格の効率を放火する指標を提案する．
- 上記の指標をもとに，適正な価格戦略を学習する回帰モデルを提案する．

Pricing system overview

Airbnbの価格推奨モデルは，以下の３つから成る．
- Booking probability model
- Strategy model
- Personalization
以下では，特にStrategy modelに焦点をあてつつ，それぞれの特徴について述べる¹．

Booking probability model

特定日に予約されるかどうかを，二値の識別問題として解く．
特徴量として，部屋の特徴，季節性，周辺地域の繁忙度などを用いる．
Grandient boosting machine（GBM）で学習する．地理情報を考慮してサンプリングレートを調整したら，精度があがった．

Strategy model

Evaluatinge Price suggestion

特定日の適正価格を推薦するために，回帰問題を解く．
通常の回帰問題と異なり，適正価格が教師データとして与えられないところに難しさがある．加えて，ホストはAirbnbが推奨する価格をそのまま採用するわけではない．
教師データは，以下の4パターンに分類できる．
- ホストが推奨価格より小さい価格を設定し，予約された（a）
- ホストが推奨価格より小さい価格を設定し，予約されなかった（b）
- ホストが推奨価格以上の価格を設定し，予約された（c）
- ホストが推奨価格以上の価格を設定し，予約されなかった（d）
以下のような評価指標を導入した²³．
- Price Decrease Recall (PDR) ：実際に予約されなかったデータのうち，予約されないと予測された（設定価格が推奨価格より大きい）データの割合． \(PDR = \frac{d}{b+d}\)
- Price Decrease Precision (PDP) ：予約されないと予測された（設定価格が推奨価格より大きい）データのうち，実際に予約されなかったデータの割合．\(PDR = \frac{d}{c+d}\)
- Price Increase Recall (PIR) ：実際に予約されたデータのうち，予約されると予測された（設定価格が推奨価格より小さい）データの割合． \(PDR = \frac{a}{a+c}\)
- Price Increase Precision (PIP) ：予約されると予測された（設定価格が推奨価格より小さい）データのうち，実際に予約されたデータの割合．\(PDR = \frac{a}{a+b}\)
- Booking Regret (BR)：\(BR = median_{bookings}(max(0, \frac{P-P_{sug}}{P}))\)⁴
ビジネス的な指標と相関が高かったのは，PDRとBRだった．
- PDRが高いほど，ホストはより市場競争力の高い値付けをしていることになるため，成約率が高まると考えられる．
- BRが小さいほど，成約価格と推奨価格が近いことになるため，ホストからより大きな信頼を勝ち取るれると考えられる．
- 両者はトレードオフの関係にあるため，同時に最適化する必要がある．一般に推奨価格を下げれば下げるほど，PDRが改善するが，BRが悪化する．
- オフラインでの評価では，上記の二指標を用いる．

Objective function

以上の考察を踏まえて，損失関数を設定する．ただし：
- \(\mathbf{x}_i\)：案件\(i\)の特徴量．ホストの設定価格\(P_i\)，我々のモデルが予測した成約確率\(q_i\)，およびその他の市場需要指標を含む．
- \(y_i\)：案件\(i\)の成約状況．成約した場合は\(1\)，成約しなかった場合は\(0\)．
- \(f_{\theta}(\mathbf{x}_i)\)：案件\(i\)の特徴量\(\mathbf{x}_i\)とパラメータ\(\theta\)から推奨価格を計算する関数．
損失関数：\(\mathcal{L} = \mathrm{argmin}_{\theta}\sum_{i=1}^{N}(L(P_i, y_i) - f_{\theta}(\mathbf{x}_i))^{+} + (f_{\theta}(\mathbf{x}_i) - U(P_i, y_i))^{+}\)
- \((\cdot)^{+}\)は\(\mathrm{max}(\cdot, 0)\)を表す．
- 下限：\(L(P_i, y_i) = y_i \cdot P_i + (1-y_i)\cdot c_1 P_i\)．成約した案件については設定価格\(P_i\)を下限とし，成約しなかった案件については\(0 < c_1 \leq 1\)倍に値引きした価格を下限とする．
- 上限：\(U(P_i, y_i) = (1-y_i) \cdot P_i + y_i\cdot c_2 P_i\)．成約しなかった案件については設定価格\(P_i\)を上限とし，成約した案件については\(c_2 \geq 1\)倍に値上げした価格を上限とする．
- このタスクでは最適価格がわからないため，上記のようなヒンジ型の損失関数（\(\epsilon\)-insensitive loss）を定義する．
- なお，\(c_1=c_2=1\)と設定した場合は，\(U=L\)となり，実効的にホストによる設定価格\(P_i\)を教師データとした最適化が行われることになる．
価格計算モデル：\(P_{sug} = f_{\theta}(\mathrm{x}) = P_i \cdot V\)．
- デマンドスコアが高い（\(D \geq 0\)）とき：\(V = 1 + \theta_1 (q^{\phi_H^{-qD}} - \theta_2)\)．
- デマンドスコアが低い（\(D < 0\)）とき：\(V = 1 + \theta_1 (q^{\phi_L^{-(1-q)D}} - \theta_2)\)．
- デマンドスコア\(D\)は，クラスターレベルでガウス正規化されている．\(D\)が大きいとき，クラスター内の他の案件と比較してデマンドが高いことを意味する．
- Demand constraint⁵ \(1 < \phi_L < \phi_H < 2\)は，デマンド曲線の曲がり具合を制御するためのパラメータ．デマンドが大きいときと小さいときで曲がり具合を変えるため，あえて別の定数として定めている．
粒度：基本的に案件レベルでパラメータ学習を行う．しかし十分なデータがない場合は，クラスターレベルや全体レベルで学習したパラメータを用いる場合もある．
制約：\(\theta_1\)や\(\theta_2\)は，現実的な値になるよう上下に制約条件を設けている．
頻度：Sparkを用いて，SGD（Stochastic Gradient Descent）で毎日学習する．

References

個人的に気になったもののみ抜粋．

[1] Yasin Abbasi-Yadkori, Dávid Pál, and Csaba Szepesvári. 2011. Improved Algorithms for Linear Stochastic Bandits. In Proceedings of the 24th International Conference on Neural Information Processing Systems (NIPS’11). Curran Associates Inc., USA, 2312–2320.
[2] Patrick Bajari, Denis Nekipelov, Stephen P. Ryan, and Miaoyu Yang. 2015. Demand estimation with machine learning and model combination. National Bureau of Economic Research (2015).
[4] Wei Chu, Lihong Li, Lev Reyzin, and Robert Schapire. 2011. Contextual Bandits with Linear Payoff Functions. In Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics (Proceedings of Machine Learning Research), Geoffrey Gordon, David Dunson, and Miroslav DudÃŋk (Eds.), Vol. 15. PMLR, Fort Lauderdale, FL, USA, 208–214.
[5] Maxime Cohen, Ilan Lobel, and Renato Paes Leme. 2016. Feature-based Dynamic Pricing. In Proceedings of the 2016 ACM Conference on Economics and Computation. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2737045
[8] hihua Zhang, Rachel J. C. Chen, Lee D. Han, and Lu Yang. 2017. Defining the price of hospitality: networked hospitality exchange via Airbnb. sustainability 9, 1635 (2017).
[9] A Ikkala, T.; Lampinen. 2014. Defining the price of hospitality: networked hospitality exchange via Airbnb. In Proceedings of the Companion Publication of the 17th ACM Conference on Computer Supported Cooperative Work and Social Computing, (Proceedings of Machine Learning Research). Baltimore, MD, USA, 73âĂŞ–176.
[11] Q.; Yang T.; Guo L Li, Y.; Pan. 2016. Reasonable price recommendation on Airbnb using Multi-Scale clustering. In Proceedings of the 2016 35th Control Conference (CCC),. Chengdu, China, 7038âĂŞ7041.
[15] H. Varian. 2014. Big data: New tricks for econometrics. Journal of Economic Perspectives 28, 2 (2014), 3 – 28.
[16] J.L. Wang, D.; Nicolau. 2017. Price determinants of sharing economy based accommodation rental: A study oflistings from 33 cities on Airbnb.com. Int. J. Hosp. Manag. 62 (2017), 120–131.

参考

以下の記事を参考にさせて頂いた．

【KDD2018】論文『Customized Regression Model for Airbnb Dynamic Pricing』を読んでまとめた - 港区で苦しむマーケティングサイエンティストのメモ帳

論文の章構成を一部変更している． ↩
いつもPrecision（精度）とRecall（再現率）を忘れてしまう．Precisionは，正と予測したデータのうち，実際に正であるデータの割合．一方Recallは，実際に正であるデータのうち，正と予測したデータの割合．F値 (F-measure) - 朱鷺の杜Wikiを参考にさせて頂いた． ↩
ややこしい．推奨価格は，予約されうる最大の価格と考えると理解できる．設定価格が推奨価格より大きい場合，Airbnbの予測としては「予約されない」となる．逆に，設定価格が推奨価格より小さい場合，Airbnbの予測としては「予約される」となる． ↩
BRについては，何を表しているかよくわからなかった． ↩
適切な日本語訳が浮かばなかった．デマンド制約？ ↩