混同行列
この記事では、混同行列と、訓練済みモデルの評価にどのように使用するかについて説明します。
混同行列は、訓練済みモデルを評価するための主要なツールです。モデルの作成や再訓練時に自動的に実行される訓練とテストのプロセス中、Tealium Predictは訓練日範囲中の訪問を「真」または「偽」の2つのグループに「分類」しようとします。これらの2つのグループは、ユーザーがモデルの目標属性(例えば、購入したか、メールリストに登録したかなど)を示す行動を実際に行ったかどうかを反映しています。
訓練済みモデルの混同行列にアクセスするには、モデルダッシュボード > モデル詳細を表示 > 訓練 > 訓練詳細を表示に移動します。混同行列を使用すると、真または偽の予測値と真または偽の実際の値を比較することで、これらの予測の精度を簡単に確認することができます。以下の説明にあるように、4つの可能なシナリオがあります。
この比較は、モデルが過去のデータ(訓練日範囲)で訓練することにより可能になります。モデルがデプロイされると、シナリオが変わります。デプロイされたモデルが今日特定の訪問に対して予測を行い、予測時間枠が「次の10日間」である場合、値が真または偽として返るかどうかを判断するためには最大10日間結果が利用できません。
混同行列の象限
以下のリストは、混同行列の4つの象限を説明しています:
- 真の陽性
正しく真を予測(予測は真で、実際には真) - 真の陰性
正しく偽を予測(予測は偽で、実際には偽) - 偽の陽性
誤って真を予測(予測は真だが、実際には偽) - 偽の陰性
誤って偽を予測(予測は偽だが、実際には真)
これらの象限の値を使用して、F1スコア(再現率と精度)の2つの構成要素を計算することができます。
以下のリストは、値の計算方法を説明しています:
- 精度 = (TP + TN) / (TP + FP + FN + TN)
精度は、正しい予測の数を予測の総数で割ったものです。 - 精度
すべての陽性予測のうち、陽性だったものの割合を示します。 - 再現率
陽性予測のうち、正しかったものの割合を示します。
混同行列は、予測された陽性値と予測された陰性値を区別するために0.5の閾値を使用します。
最終更新日 :: 2024年March月29日