GA4の「リピーター」はなぜ不正確か
GA4の「Returning Users(リピーター)」という指標を見て、「うちのサイトのリピーター率は○○%だ」と報告している方は多いでしょう。しかし、この数字は実態と大きく乖離している可能性があります。
GA4がリピーターを判定する仕組みは、ブラウザに保存されたファーストパーティCookie(_ga)の有無です。2回目以降のアクセスで既存のCookieが検出されれば「Returning User」、検出されなければ「New User」として分類されます。
問題は、「Cookie=人」ではないということです。1人のユーザーが複数のデバイスやブラウザを使えば、それぞれに異なるCookieが発行されます。逆に、家族共有のPCでは複数人が同一Cookieを共有することもあります。つまり、GA4の「リピーター数」は「リピートしたCookieの数」であり、「リピートした人の数」ではありません。
あるECサイトの調査では、会員IDベースの実際のリピーター率が38%であったのに対し、GA4の表示は22%に留まっていたという事例があります。約16ポイントもの乖離は、マーケティング予算配分の判断を誤らせるのに十分な大きさです。
Cookie依存の具体的な問題点
Cookieベースの計測が引き起こす問題を、より具体的に掘り下げていきます。
ITP(Intelligent Tracking Prevention)の影響
AppleのSafariに搭載されているITPは、トラッキング用Cookieの有効期限を大幅に短縮します。現在のITPでは、JavaScriptで設定されたCookieの有効期限が最大7日に制限されています。つまり、1週間以上間をあけて再訪問したSafariユーザーは、すべて「新規」としてカウントされます。
日本のモバイルブラウザシェアにおいてSafari(iOS)は約65%を占めます。つまり、モバイルユーザーの大半でリピーター計測が正確に行えない状況です。
Cookie削除とシークレットモード
プライバシー意識の高まりにより、定期的にCookieを削除するユーザーが増えています。また、シークレットモード(プライベートブラウジング)ではCookieがセッション終了時に自動削除されるため、シークレットモードを常用するユーザーは毎回「新規」として記録されます。
ブラウザのプライバシー強化トレンド
Google Chromeもサードパーティ Cookie廃止の方向で動いており、ファーストパーティCookieに対しても今後さらなる制限が加わる可能性があります。Cookie依存の計測は、年を追うごとに精度が低下していくリスクがあります。
User ID計測の仕組みと設定方法
Cookieの限界を補完するために、GA4では「User ID」という仕組みが用意されています。自社サービスの会員IDをGA4に送信し、Cookieではなく会員IDをキーにしてユーザーを識別する方法です。
GTM(Googleタグマネージャー)での設定
- データレイヤーの準備:ログインしたページで、
dataLayer.push({user_id: '会員ID'})を出力する - GTM変数の作成:データレイヤー変数として「user_id」を定義する
- GA4設定タグへの追加:GA4設定タグの「ユーザープロパティ」に「user_id」フィールドを追加し、作成した変数を割り当てる
- GA4管理画面での有効化:「管理」>「データの表示」>「レポート用識別子」で「混合」を選択する
gtag.jsでの設定
GTMを使わずにgtag.jsを直接実装している場合は、gtag('config', 'G-XXXXXXX', {'user_id': '会員ID'})のように、configコマンドにuser_idパラメータを追加します。
注意点として、User IDには個人を特定できる情報(メールアドレス、電話番号など)をそのまま送信してはいけません。ハッシュ化した会員IDや、内部的なユニークIDを使用してください。
クロスデバイストラッキングの実践
User IDを設定する最大のメリットは、クロスデバイストラッキング(デバイスを超えたユーザー追跡)が実現することです。
現代のEC購買行動では、「スマホで商品を見つけ、PCで比較検討し、タブレットで購入する」といったマルチデバイスジャーニーが一般的です。User IDなしでは、この行動が「3人の新規ユーザー」として記録されます。User IDがあれば、これが「1人のリピーターの購買プロセス」として正しく認識されます。
Googleシグナルとの併用
GA4では、User IDに加えて「Googleシグナル」という識別方法も利用できます。これはGoogleアカウントにログインしているユーザーのデータをもとに、クロスデバイスの紐付けを行う機能です。
GA4のレポーティング・アイデンティティを「混合(Blended)」に設定すると、User ID > Googleシグナル > デバイスID(Cookie)の優先順位でユーザーが識別されます。これにより、ログイン済みユーザーはUser IDで、未ログインだがGoogleにログインしているユーザーはGoogleシグナルで、それ以外はCookieで識別するという多層的な計測が可能になります。
GA4のユーザースコープとセッションスコープ
リピーター分析の精度を上げるには、GA4のデータモデルにおける「スコープ」の概念を理解する必要があります。
ユーザースコープ
ユーザー全体に紐づく属性です。「新規/リピーター」の区分、User ID、ユーザープロパティなどがこのスコープに該当します。一度設定されると、そのユーザーの全セッションに適用されます。
セッションスコープ
個別の訪問(セッション)に紐づく属性です。流入元、ランディングページ、セッション中のイベントなどがこのスコープです。同じリピーターでも、セッションごとに異なるチャネルから来訪することがあります。
スコープの混同による分析ミス
よくある間違いは、セッションスコープの指標をユーザースコープの分析に混ぜてしまうことです。例えば、「リピーターのコンバージョン率」を算出する際、分母にセッション数を使うか、ユーザー数を使うかで結果が大きく変わります。リピーターは複数セッションを持つため、セッションベースのCVRはユーザーベースより低く出る傾向があります。正確な分析には、目的に応じてスコープを正しく選択することが重要です。
正しいリピーター数の算出方法
ここまでの知識を踏まえ、自社サイトの「真のリピーター数」を把握するための実践的な方法を紹介します。
方法1:GA4 + User ID(推奨)
User IDを導入済みの場合、探索レポートで「ユーザーID」ディメンションを使い、2回以上セッションを持つユーザーをカウントします。これが最も精度の高いリピーター数です。ただし、非ログインユーザーは含まれないため、全体像を把握するには方法2との併用が必要です。
方法2:GA4 + BigQueryエクスポート
GA4のデータをBigQueryにエクスポートすると、イベントレベルのローデータにアクセスできます。SQLクエリでuser_pseudo_idごとのセッション数を集計し、2セッション以上のユーザーを抽出することで、Cookie精度ではあるもののより柔軟なリピーター分析が可能です。
方法3:専用CRM分析ツールの活用
最も手軽かつ高精度な方法は、GA4データを連携できるCRM分析ツールを導入することです。User IDとCookieの情報を統合し、独自のアルゴリズムで名寄せを行うことで、GA4単体では実現できない精度のリピーター分析を実現します。
計測環境の整備チェックリスト
最後に、正確なリピーター計測を実現するための環境整備チェックリストを用意しました。自社の計測環境を確認してみてください。
- GA4のプロパティ設定:データ保持期間は14ヶ月に設定されているか(デフォルトは2ヶ月)
- User IDの実装:ログインユーザーに対してUser IDが正しく送信されているか
- Googleシグナルの有効化:「管理」>「データの収集」でGoogleシグナルがオンになっているか
- レポーティング・アイデンティティ:「混合(Blended)」が選択されているか
- イベント計測の確認:session_start、first_visit、login、purchaseなどの主要イベントが正しく発火しているか
- クロスドメイン設定:複数ドメインを運用している場合、クロスドメイントラッキングが設定されているか
- 内部トラフィックの除外:社内IPからのアクセスがフィルタリングされているか
- BigQueryエクスポート:ローデータ分析のためにBigQuery連携が設定されているか
上記のすべてを整備するのは工数がかかります。特にUser IDの実装は開発リソースが必要です。まずは現状の計測環境で何ができていて何が不足しているかを把握し、優先度の高い項目から段階的に改善していきましょう。
Cookieの壁を超えて、「個客」を見よう
RFマトリクスはGA4のデータを連携するだけで、Cookie制約を超えた「ユーザー単位」の分析を実現。正確なリピーター数の把握から、セグメント別の施策実行まで、ワンストップでサポートします。