광고 기여 측정에서의 개인 정보 보호: Apple SKAN과 Google Attribution Reporting

팀민트 기술블로그·2022년 12월 12일
6
post-thumbnail

최근 개인 정보 보호에 대한 인식이 높아지면서 Google, Apple과 같은 매체에서 다양한 조치가 이루어지고 있습니다. 대표적으로 Apple은 2021년 4월, iOS 14부터 ATT(App Tracking Transparency) 정책을 적용하며 퍼블리셔의 IDFA 활용에 대한 사용자 동의를 Opt-in으로 변경한 사건이 있었습니다. 이로 인해 광고 성과 저하 및 CRM의 부각 등 광고 업계 전반에 많은 영향을 미치고 있는데요. Google도 이런 변화에 발 맞춰 2023년에 향상된 개인 정보 보호를 목적으로 한 Privacy Sandbox를 웹과 안드로이드에 적용하겠다고 발표하였습니다.

이 문서에서는 앱 설치 광고의 성과를 분석하는 기여 분석 에 잠재되어 있는 개인정보 침해 가능성을 Apple과 Google이 어떻게 방지하는지 확인합니다. 이를 위해서 먼저 기여 분석이 어떤 식으로 동작하는지 살펴보겠습니다.

광고 기여 분석

김마켓은 카카오톡을 사용하던 중에 중고 의류 거래 플랫폼에서 게재한 광고 AD_1을 보게 되었다. 별 관심이 없던 김마켓은 광고를 무시하고 지나갔지만 같은 서비스의 다른 광고 AD_2를 보게 되자 옷을 구경하고 싶어서 광고를 클릭해 본다. 그러자 중고 의류 거래 플랫폼의 앱을 설치하는 앱스토어로 이동하게 되고, 앱에서 보여주는 다양한 의류들을 구경하던 중 마음에 드는 옷을 발견하고는 회원가입 → 카트 담기 → 구매하기에 이른다.

김마켓이 위 상황을 겪는 동안 어떤 이벤트들이 발생했을까요? 순서대로 적어보면 다음과 같습니다.

초록색 영역과 파란색 영역에 주목해 주세요. 색은 각 이벤트를 수집하는 주체가 다르다는 것을 나타냅니다. 광고 성과에 대한 이벤트인 초록색 영역은 Google 애즈, 메타 등 매체에서 수집하고, 인앱 이벤트인 파란색 영역은 보통 AppsFlyer나 Airbridge와 같은 MMP(모바일 측정 파트너, Mobile Measurement Partner)에서 집계합니다.

초록색: (광고 성과) Google 애즈, 메타 등 광고 매체에서 집계
파란색: (설치 및 전환 등 인앱 이벤트) 앱스플라이어, 에어브릿지 등 MMP의 SDK로 집계

광고주는 따로 떨어져 있는 광고 성과 데이터와 인앱 이벤트를 합쳐서 더 멋진 인사이트를 얻을 수 있습니다. 예를 들면 이벤트 1, 이벤트 6을 합쳐서 광고 AD_2를 통해서 10$의 매출 발생 이라는 귀중한 정보를 얻을 수 있죠. AppsFlyer, Airbridge와 같은 MMP가 제공하는 인사이트는 이러한 과정으로 생성됩니다.

정보) IDFA(광고주 식별자)는 Apple에서 iOS 기기마다 고유하게 부여하는 식별자 입니다.

하지만 문제는 여기에서 발생합니다. 서로 다른 곳에서 집계된 데이터를 합치기 위해서 유저를 특정하는 빨간색 영역인 IDFA라는 민감한 정보를 활용해야 하는데, 이것이 개인정보 침해로 이어질 수 있다는 점입니다. 그래서 Apple과 Google은 광고 성과 분석 과정에서 발생하는 개인정보 침해 가능성을 제거하기 위해 각각 SKAdNetwork, Attribution Reporting이라는 솔루션을 제안합니다.

SKAdNetwork (SKAN)

The ad network API helps advertisers measure the success of ad campaigns while maintaining user privacy. - Apple

출처: [https://www.dataseat.com/blog/the-evolution-of-skadnetwork](https://www.dataseat.com/blog/the-evolution-of-skadnetwork)

출처: https://www.dataseat.com/blog/the-evolution-of-skadnetwork

Store-Kit Ad Network(SKAN)은 Apple에서 개인 정보를 보호하면서 앱 설치 광고 성과를 측정할 수 있도록 도와주는 프레임워크 입니다. 2018년에 버전 1.0이 출시된 이후로 현재는 버전 4.0까지 출시된 상태인데요. 이 문서에서는 SKAN의 주요 동작 방식을 가장 잘 담고 있는 버전 2.2를 기준으로 설명합니다. SKAN 4.0 버전이 궁금하신 분은 이 문서를 참고해 주세요.

SKAN 동작 방식

SKAN은 광고 노출 시점부터 시작하여 광고 성과에 대한 데이터를 특정 엔드포인트에 전송하는 postback을 전송하기까지 아래의 과정을 수행합니다.

  1. 김마켓이 카카오톡에 게시된 광고 AD_1, AD_2를 보거나 클릭한 내역이 사용자 모바일 기기에 기록됩니다.
  2. 김마켓이 광고 클릭을 통해 중고 의류 거래 플랫폼 앱을 설치하면 모바일 기기는 이 설치에 기여한 광고를 결정합니다. 이 경우에 AD_2가 됩니다.
  3. 김마켓이 앱을 시작하면 postback을 전송하기까지 기다리는 24시간 타이머가 동작합니다.
  4. 김마켓이 앱을 사용하는 동안 (회원가입, 장바구니, 구매) 앱 광고주가 설정해둔 전환 값이 기록됩니다. 각 전환이 발생할 때마다 postback 타이머는 다시 24시간을 기다리도록 갱신됩니다.
    • postback의 전환 값은 최대 6비트(0~63) 입니다.
  5. 마지막 전환으로부터 24시간이 지나면서 타이머가 만료되면 추가로 0~24시간의 대기 시간을 거친 뒤 postback을 전송합니다.
    • postback은 앱 설치 후 단 1회만 전송됩니다. (SKAN 4.0 부터는 multi-postback이 도입되었습니다)

SKAN의 포스트백이 전송되기까지 모든 과정은 사용자의 기기에서만 진행됩니다. 광고주가 받게 되는 postback에는 개인을 특정하는 IDFA 정보가 포함되지 않기 때문에 결과적으로 개인 정보 보안이 향상됩니다.

SKAN Postback 예시

SKAN의 마지막 단계에서 전송되는 postback은 실제로 아래와 같은 JSON 형태로 전송됩니다.

{
  "version" : "2.2",
  "ad-network-id" : "com.example",
  "campaign-id" : 2, // AD_2
  "transaction-id" : "6aafb7a5-0170-41b5-bbe4-fe71dedf1e28",
  "app-id" : 525463029, // 중고거래 앱 ID
  "attribution-signature" : "MEYCIQDTuQ1Z4Tpy9D3aEKbxLl5J5iKiTumcqZikuY/AOD2U7QIhAJAaiAv89AoquHXJffcieEQXdWHpcV8ZgbKN0EwV9/sY",
  "redownload": false,
  "source-app-id": 1234567891, // 카카오톡 앱 ID
  "fidelity-type": 1, // 
  "conversion-value": 3 // 구매 conversion value
}

version: SKAdNetwork 버전입니다.

ad-network-id: Apple에서 기여 측정 대상으로 포함하는 ad network들 중 하나의 id 입니다.

app-id: 설치한 광고주 앱의 App ID 입니다.

transaction-id: postback의 ID를 나타냅니다. 만약 같은 transaction-id의 postback이 전송된다면 중복된 요청이라는 의미이므로 중복 처리가 필요합니다.

redownload: 앱이 재설치 되었는지의 여부를 나타냅니다.

source-app-id: 기여한 앱의 id를 나타냅니다.

attribution-signature: Apple이 전송한 postback임을 검증할 수 있는 signature 입니다.

Attribution Reporting

Privacy Sandbox는 온라인 개인 정보를 보호하고 기업과 개발자의 성공적인 디지털 비즈니스 구축을 위한 도구를 제공하는 기술 개발을 목표로 합니다. Privacy Sandbox는 온라인 콘텐츠와 서비스를 모든 사용자에게 무료로 제공하도록 지원하면서 크로스 사이트 추적과 크로스 앱 추적은 줄여줍니다. - Google

Apple에서 IDFA 사용을 Opt-in으로 변경한 것과 마찬가지로 Google은 2023년 후반에 크롬에서 서드 파티 쿠키를 제한할 예정이라고 합니다. 동시에 기존의 광고주 경험을 해치지 않도록 하는 여러 가지 제안을 담은 Google의 Privacy Sandbox가 진행 중인데 그 중 하나가 바로 Attribution Reporting 입니다.

Attribution Reporting은 SKAN과 마찬가지로 앱 설치 광고 성과 분석 과정에서 개인 정보가 침해되는 상황을 방지되기 위한 솔루션 입니다. Attribution Reporting은 크게 2가지 방식의 광고 성과 리포팅을 제공합니다.

1. Event-level Reporting

Event-level Reporting은 Apple의 SKAN과 유사하게 동작합니다. 다만 Apple이 SKAN을 모바일 앱 설치 전환에 한정한 것과 비교했을 때, Google은 브라우저에서 일어나는 전환을 측정하는 것에 초점을 두고 있습니다.

  1. 애드테크 측에서 광고주의 광고를 지면에 노출합니다.
  2. 브라우저는 중고 의류 거래 플랫폼의 광고주가 게시한 광고 AD_2에 김마켓이 노출되었음을 기록합니다.
    • 같은 광고주의 다른 광고에 노출되면 해당 광고의 ID로 덮어 씁니다.
  3. 김마켓이 중고 의류 거래 웹사이트로 이동하여 회원가입 -> 물건담기 -> 구매를 진행합니다.
  4. 구매 전환이 발생했을 때, 애드테크는 광고주를 대신하여 브라우저에 보고서 전송을 요청합니다.
    • Event-level Reporting의 경우 최대 3비트(0~7)의 전환값을 사용할 수 있습니다.
  5. 보고서는 전환 후 수일 ~ 몇 주 후에 브라우저에서 전송됩니다.

전송된 보고서는 개인 정보 보안을 더 향상하기 위해 아래와 같은 전략을 사용합니다.

  • 지연 전송 (delay): SKAN과 마찬가지로 개인 특정 요인을 제거하기 위해 무작위 간격을 두고 보고서를 전송합니다.
  • 노이즈 (noise): SKAN에는 없는 기능으로, 전환 데이터가 일정 비율(Chrome에서는 5%)로 임의의 값으로 대체됩니다.

2. Aggregatable Reporting

Google은 SKAN에는 없는 Aggregatable Reporting이라는 새로운 전송 방식을 제안합니다.

  1. Event-level Reporting과 비슷한 과정으로 보고서를 집계합니다. Event-level Reporting과 다른 점은 딜레이가 짧고 3비트 보다 더 상세한 전환값을 지정할 수 있습니다. 또한 브라우저는 해당 보고서의 내용을 애드테크가 알 수 없도록 암호화하여 전송합니다.
  2. 애드테크는 암호화된 보고서들을 모아서 집계 서비스에 전송합니다. 집계 서비스는 해당 보고서들을 직접 확인할 수 있는 신뢰된 서버입니다.
  3. 집계 서비스는 애드테크가 지정한 방식에 따라 보고서들을 집계하여 돌려줍니다.

Event-level Reporting은 개인 특정의 위험을 피하기 위해서 전환값을 최대 3비트만 사용할 수 있다는 제약이 있는데요. Aggregatable Reporting은 해당 제약을 제거하는 대신, 광고주가 직접 그 전환값을 확인할 수 없도록 보고서를 암호화 합니다. 그리고 보고서들을 신뢰된 집계 서비스에서 집계하여 개인 정보를 보안하고, 결과적으로 광고주가 최종 보고서를 받을 수 있도록 합니다.

SKAN과 Attribution Reporting의 비교

공통점

  • 광고 기여 분석을 위하여 광고 성과와 인앱 이벤트를 합치는 과정이 분리된 장소에서 일어납니다.
    • 광고 성과와 인앱 이벤트를 각각 열람할 수 있는 광고주가 원하는 인사이트를 얻기 위하여 유저의 ID를 활용하는 것이 문제의 원인이였습니다. Google과 Apple은 이를 해결하기 위해서 광고주가 필요한 종합 데이터(postback, reporting)를 대신 생성하고 이 과정에서 민감한 정보를 조회할 수 없도록 막는 방식을 채택했습니다.
  • User Privacy를 향상하기 위해서 다양한 기법을 동원합니다.
    • 지연 전송(delay)
      • 이벤트를 in-time으로 보내면 유저가 특정될 수 있는 가능성이 증가합니다. 이를 방지하기 위해서 SKAN은 최대 24시간(SKAN 3.0), AR의 Event-level reporting은 최대 30일의 딜레이가 존재합니다.
      • 광고 성과를 거의 실시간으로 확인하던 기존의 방식과 비교하면 성과 분석에 많은 딜레이가 존재하기 때문에 마케터들이 지표를 분석하는데 큰 장애로 작용할 것 같습니다.
    • 전환 비트수 제한
      • 퍼블리셔가 전환 이벤트 전송 시, 너무 많은 정보를 싣지 못하도록 데이터 양을 제한합니다. SKAN은 6비트 (64가지 전환), AR은 3비트 (8가지 전환) 만을 표현할 수 있습니다. 이는 전환 이벤트를 유저를 특정하는 데 사용할 수 없도록 제한한 조치입니다.

차이점

  • AR의 Aggregatable Reporting 방식이 SKAN에는 아직 존재하지 않습니다. 또한 SKAN 4.0에서는 AR이 지원하지 않는 다양한 새로운 기능들이 추가되고 있습니다. 개인 정보 보안이라는 철학은 공유하지만 기술적 방식에서 조금씩 차이가 있습니다.

결론

한 매체에 따르면 국내 아이폰 사용자의 37%가 앱 개인정보 추적에 동의했다고 합니다. 적은 숫자는 아니지만 광고 성과를 분석하기에 충분한 규모는 아니지 않을까 예측합니다. 이에 따라 SKAN과 Attribution Reporting은 앞으로 더 성공적인 앱 설치 광고 성과를 분석하기 위한 필수 데이터로 자리 잡을 것 같습니다. AppsFleyer, Airbirdge 등 대부분의 MMP가 이러한 움직임에 대응하고 있습니다.

구글도 2023년부터 본격적으로 Privacy Sandbox를 출시할 계획을 가지고 있습니다. 개인적으로 광고주, 매체, 대행사 등 광고업의 다양한 이해관계자들 모두에게 많은 영향을 줄 수 있는 지각 변동이 될 것이라고 생각합니다. 개인정보 보안과 관련해 어떤 변경사항이 발생할지에 대해 인지하고 적절한 방식으로 대응할 수 있다면 이러한 변화를 새로운 기회로 삼을 수 있을 것 같습니다. 😊

profile
디지털 마케팅의 새로운 아이콘, 팀민트의 이야기를 만나보세요

0개의 댓글