確率分布
この記事では、確率分布を使用して訓練済みモデルを解釈する方法について説明します。
任意のバージョンの訓練済みモデルのトレーニング詳細画面には、トレーニング中にモデルが行った予測の確率分布が表示されます。
このチャートの2つの色付き曲線は、モデルがトレーニング中に行った真実と偽の予測の分布を表しています。モデルの訓練プロセスは歴史的なデータを使用し、各訪問が目標とする行動を実際に行ったかどうかを知っているため、歴史的な訪問に対する予測と実際の結果を比較してモデルをテストすることが可能です。この比較の目的は、訓練データセットの一部をテストサブセットとして確保することです。
確率分布は、テストサブセット内の訪問の予測値と実際の値を比較します。行動を行った(Trueクラス)訪問はティール色の曲線の一部として表示され、行動を行わなかった(Falseクラス)訪問はオレンジ色の曲線の一部となります。
理想的な確率分布
以下のリストは、理想的な確率分布の特性を説明しています:
- ティール色とオレンジ色の曲線で示されるTrueクラスとFalseクラスの間には明確な分離があります。これは、モデルが訪問を容易かつ正確に分類できることを示しています。
- 各クラス(曲線)は予測値範囲の一部をカバーしています。Falseクラスは理想的には左側の下位範囲に焦点を当て、Trueクラスは右側の上位範囲に焦点を当てます。
最終更新日 :: 2024年March月29日