ファイルのインポートについて
この記事では、CSVファイルをデータソースとしてインポートする方法について説明します。これにより、オフラインデータを豊かにし、Customer Data Hub内で行動可能にすることができます。
前提条件
- Tealium AudienceStream CDP または
- Tealium EventStream API Hub
正しくインポートするためには、CSVファイルを正しくフォーマットする必要があります。ファイルとデータの形式については、インポート用のCSVファイルを準備するを参照してください。
仕組み
Tealiumサーバーを使用してファイルサービス(Amazon S3バケットなど)に接続し、ファイルを読み込み、データをインポートします。各インポートされた行はイベントとして処理されます。インポート後、データは豊かになり、既存の訪問プロファイルにステッチされ、他のベンダーに送信されます。
レート制限
1秒あたりの処理行数は変動します。レート制限は通常、ピークレートで1秒あたり100行、最低レートで1秒あたり50行となります。
イベント
デフォルトのTealium データ収集の操作順序では、ファイルインポートデータソースからのイベントは_イベント受信_ステップの前に処理され、操作順序は変わりません。
ファイルインポートイベントは、他のデータソースからのイベントと同様にEventStreamとAudienceStreamに送信されますが、以下の重要な例外があります:
- ブラウザ固有の属性:クライアントIPアドレスやユーザーエージェントなどのブラウザ固有の属性は入力されません。
- エンリッチメント:AudienceStreamの事前にロードされた属性に対するエンリッチメントは実行されませんが、First Visitの事前にロードされた属性は例外です。
- 関数:データ変換関数は実行されません。
- 単一ページ訪問:入力イベントは単一ページ訪問/訪問の基準から除外されます。他のデータソースからの単一ページ訪問と訪問はAudienceStreamには保存されません。単一ページ訪問/訪問についての詳細は、AudienceStreamで単一ページ訪問はどのように処理されますか?(Tealiumのログインが必要)を参照してください。
- 訪問の長さ:ファイルインポートイベントによって開始された訪問は60秒間続きます。
- 訪問IDのマッピング:ファイルインポートデータソースの構成でAudienceStreamの訪問ID属性をマッピングすると、訪問IDは選択した列の値に直接構成されます。
さらに、ファイルインポートデータソースからの入力データに以下のイベント属性を使用することができます:
_source_file
(String) - イベントに関連するファイルの名前。_file_line_num
(Integer) - イベントに関連するファイルの行。
ファイルインポートデータソースの構成
ファイルインポートをデータソースとして構成するには2つのステップがあります:
-
列のマッピングとファイル転送サービスの構成
ファイルインポートデータソースを構成するには、CSVファイルの列をTealiumのイベント属性にマッピングし、ファイル転送サービスを選択します。列のマッピングを補助するために、列ラベルと最大1,000行のデータを含むサンプルCSVファイルをアップロードします。
-
ファイルをファイル転送サービスにアップロードする
データソースの構成が完了したら、CSVファイルをファイルサービスにアップロードします。ファイルのアップロードはTealiumの外部で行われます。
ステップ1:CSV列のマッピングとファイル転送サービスの構成
列のマッピング
列のマッピング構成は、CSVファイルの各列に対応するイベント属性を決定します。列名はCustomer Data Hubの属性名とは異なることが多いため、このマッピングによりデータが正しくインポートされます。例えば、CSVファイルにはpostalCode
という名前の列があるかもしれませんが、対応するイベント属性はcustomer_zip
という名前なので、これらの列を関連付けるためにマッピングする必要があります。
マッピングは、既存のイベント仕様に基づいて構成することも、カスタムイベントとして構成することもできます。
イベント仕様マッピング
CSVファイルの各行はイベントとして処理されます。イベント仕様マッピングを選択すると、列マッピングテーブルでイベント属性が事前に選択されます。各行は選択した仕様のイベントとして処理されます。例えばtealium_event = "purchase"
。
カスタムマッピング
カスタムイベントマッピングを選択する場合、各CSV列に対応するイベント属性を指定します。各行は以下のイベント識別子でイベントとして処理されます:
tealium_event = "imported"
訪問IDのマッピング
インポートされたデータがウェブ、モバイル、HTTP APIなどの他のソースとステッチされるようにするためには、ファイルインポートソースファイルの各行に一意の訪問IDの列があることを確認します。その後、訪問IDの列と対応するイベント属性を訪問ID属性(AudienceStreamでの訪問識別のための一意の属性タイプ)にマッピングします。マッピングされたイベント属性の値はtealium_visitor_id
属性に割り当てられ、既存の訪問プロファイルに直接マッチします。
AudienceStreamでの訪問IDマッピングについての詳細は、ファイルインポートデータソースを使用した訪問識別を参照してください。
ファイル転送サービス
ファイル転送サービスは、インポートするファイルをアップロードするための安全な場所です。Tealiumは以下のファイル転送サービスをサポートしています:
-
Amazon S3 (Tealiumバケットまたは自分のバケット) - TealiumはAWSネットワークを通じて直接Tealium S3バケットにアクセスするためのVPCエンドポイントを使用します。
S3バケットに大量のファイルを保存すると、読み取り時間が遅くなる可能性があります。効率的な読み取り時間を維持するために、処理済みのファイルを定期的にS3バケットから削除することをお勧めします。
-
Microsoft Azure File/Blob Storage
-
FTP/SFTP - 以下の認証方法をサポートしています:
- パスワード
- プライベートキーファイルのアップロード
- キーペアの生成
Tealium S3ファイル保持
ファイルインポート構成でTealium S3バケットを使用することにより、以下のファイル保持ポリシーに同意したことになります:
- 1-3年 - Tealium S3バケットにファイルをアップロードしてから1年後、ファイルは長期保存用のリポジトリに移動されます。ファイルは最大3年間アクセス可能です。長期保存からファイルを取得すると、要求されたアイテムのサイズと数に応じて最小から適度なサービス料が発生します。ファイルを取得するには、Tealiumサポートに連絡してください。
- 3年以上 - Tealium S3バケットにファイルをアップロードしてから3年後、ファイルは永久に削除されます。ビジネスケースが3年以上の保存を必要とする場合は、長期データ保持期間を顧客契約に明示的に記載する必要があります。長期保持ポリシーを要求するには、Tealiumサポートに連絡してください。
ステップ2:ファイルをファイル転送サービスにアップロードする
ファイルインポートデータソースの構成が完了したら、選択したファイルサービスにファイルをアップロードします。
Tealiumは以下の操作順序でファイルをインポートします:
- 新しいファイルの確認
システムは10分ごとにファイル転送サービスをチェックして新しいファイルがないか確認します。 - 新しいファイルのコピー
新しいファイルが検出されると、それはファイル転送場所からコピーされ、Customer Data Hubで処理されます。 - ファイル名のプレフィックスをファイルインポートデータソースにマッチさせる
ファイル名のプレフィックスは、ファイルのデータをインポートする際にどのファイルインポートデータソースを使用するかを識別するために使用されます。 - ファイルの処理
ヘッダーラインが読み取られ、インポートされる属性が識別されます。ヘッダーラインを読み取った後、以下の処理が行われます:-
訪問の検索 — 訪問IDはAudienceStreamで訪問レコードを検索するために使用されます。既存の訪問レコードが見つからない場合は新たに作成されます。
同じ訪問IDの行をグループ化すると、インポート時間が短縮されます。
-
属性のエンリッチメント - 訪問レコードは、インポートされた属性とアカウント内の既存のエンリッチメントに基づいてエンリッチメントされます。
-
最終更新日 :: 2024年March月29日