몇 년전 미국 유통업체 ‘타깃(Target)’이 임신부 옷, 신생아용 가구 등 임신부들에게 보낼만한 쿠폰 우편을 한 여고생에게 보내 화제가 된 적이 있습니다. 당시 그 학생의 아버지는 고등학생에게 이런 우편을 보냈다고 타깃에게 항의를 했지만 며칠 뒤 그 학생은 실제로 임신 중이었던 것으로 확인됐습니다.
이는 빅데이터 분석 사례로 가장 많이 언급되는 것 중 하나입니다. 타깃이 그 여고생이 임신부라고 예측할 수 있었던 것은 바로 데이터 분석 덕분이었습니다.
이러한 예측 모델은 보통 상관관계 분석을 활용해 개발됩니다. 고객들의 특성과 고객들이 구매한 상품의 관계를 분석해 가장 상관성(연관성) 높은 것들을 찾아내는 것이죠. 타깃은 이 상관관계 분석을 통해 ‘임신부’와 ‘무향 티슈나 마그네슘 보충제 등 구매’의 상관성이 높았던 사실을 찾아낸 것입니다.
물론 ‘임신부=무향 티슈 등 구매’가 100% 성립되는 것은 아니고 그럴 가능성이 높다는 의미입니다. 타깃 사례의 경우는 임신부가 무향 티슈나 마그네슘 보충제를 구매할 확률이 87%였다고 합니다.
이러한 예측 모델은 마케팅에 주로 활용됩니다. 예를 들어 ‘5세 자녀를 가진 고객’과 ‘장난감 구매’의 상관성이 높다는 사실을 발견을 했다면, 모든 고객에게 장난감 할인쿠폰을 제공하는 것보다 5세 자녀를 가진 고객에게 제공하는 것이 더 마케팅 효율이 높아질테니까요.
해당 쿠폰을 받은 고객은 장난감을 구매할 생각이 없었다가도 할인 쿠폰을 받으면 ‘할인 기회가 있을 때 아들에게 장난감 하나 사주는 것도 좋지 않을까?’라는 생각을 갖게 되지 않을까요. 또 고객 입장에서도 자녀가 없는 고객이 장난감 할인 쿠폰을 받으면 ‘스팸’으로 여기지만 5세 자녀가 있는 고객이 동일한 쿠폰을 받았다면 스팸보다는 ‘정보’로 여길 가능성이 높죠. 데이터 분석을 활용한 예측 마케팅은 고객을 스팸으로부터 자유롭게 해줄 수도 있습니다.
그래서 많은 기업들이 사용하는 방법이 회원가입입니다. 기업들은 회원가입을 하는 고객에게 할인쿠폰이나 적립금 등을 제공하면서 회원가입을 유도합니다. 회원가입을 통해 기업들은 우선 고객의 성별이나 나이, 사는 곳 등의 일반적인 상태를 알게 되고 구매 활동 데이터를 수집하게 됩니다.
좋은 점이 있다면 좋지 않은 점도 있겠죠? 최근 고객정보와 구매패턴 정보를 기업이 활용하는 것에 대한 부정적인 시각도 높아지고 있습니다. 기업들은 고객 개인이 누군지 알기 위한 정보(개인식별정보)를 활용하는 것이 아니라 가령 ‘20대 여성보다 30대 여성이 화장품 구매 건수가 높다’라는 정도의 정보(비식별정보)를 활용하기 때문에 ‘빅브라더’ 의 우려는 없다고 합니다.
하지만 그럼에도, 기업이 내가 무엇을 살지 미리 예측할 수 있다고 생각하면 약간은 찜찜한 기분이 드는 것도 사실입니다. 아마도 기업들은 고객들이 찜찜한 기분이 들지 않는 수준에서 데이터 분석을 활용한 마케팅을 하는 것이 기업의 노하우로 자리잡지 않을까하는 생각이 듭니다.