비즈스프링의 매거진

‘숫자를 돈으로 바꾸는 데이터 읽기의 기술’을 읽고

비즈스프링

2020.05.18 20:07
  • 1402
  • 콘텐츠에 ‘좋아’해줘서 고마워요 -
    0
  • 3

아래 동료분들에게 전합니다 :D

 

– 이제 막 데이터 분석을 시작했다.

– 트래픽 변화 보는 것 외에는 어디서부터 무엇을 시도해야 할지 모르겠다.

– 가벼운 마음으로 쉬어가고 싶다.

 

 

얼마전 ‘숫자를 돈으로 바꾸는 데이터 읽기의 기술’ (차현나 지음) 이라는 책을 읽었습니다. 데이터 분석 전문지식이 없어도 데이터 분석 관련하여 쉽게 읽을 수 있다는 평이 있어 읽게 되었는데요, 데이터 분석을 시작하는 초심자로서 ‘구슬이 서 말이어도 꿰어야 보배’ 정신을 실천하고자 데이터 분석 기술 관련 책을 읽고 시도해본 내용을 공유합니다. 

 

‘숫자를 돈으로 바꾸는 데이터 읽기의 기술’은 크게 세가지 항목을 다루고 있습니다.

① 데이터로 알 수 있는 정보들과 ② 그 정보를 얻기 위해 해야할 질문들, 그리고 ③ 조직 내에서 데이터를 활용하는 방법입니다. 온라인 데이터 뿐만 아니라 영수증을 비롯한 오프라인 데이터에 대한 이야기까지 다루고 있어서 어렵지 않게 읽을 수 있습니다.

 

온라인 비즈니스에서 ‘데이터 분석’을 하는 이유는 비즈니스의 특성에 따라 다를 수 있겠지만 거시적으로 보면 소비자의 마음을 알고, 소비자의 브랜드경험을 개선시켜 비즈니스 성과를 향상시키기 위해서일 것입니다. 이 책은 우리가 알고싶어하는 우리 고객의 마음은 요소를 나누어보면 알 수 있다고 이야기 합니다. 고객은 단일 요소를 통해 소비를 결정하지 않고 복합적인 이유로 구매를 결정하기 때문입니다. ‘복합적인 이유’는 거창한 이유가 아니라, 우리가 어떤 제품이나 서비스를 구매할 때 색, 모양, 품질, 제조사, 호환성.. 등 여러가지 요소를 두고 생각해보는 것을 의미합니다. 그런데 어떤 것을 요소로 나누라는 것이며 또 어떻게 나누어야 하는 것일까요. 이 책을 통해 남기고자 하는 것이 그 답을 줍니다. 

 

저는 이 책을 통해 앞으로 아래 두 가지를 간직하고 또 실천하고자 합니다. 

1. 데이터에 육하원칙을 부여한다.

2. 데이터에 속성을 부여한다. 

 

데이터를 ‘누가’, ‘언제’, ‘어디서’, ‘무엇을’, ‘왜’, ‘어떻게’와 연관지어 생각하는 것과 데이터에 여러가지 속성을 부여하여 쪼개서 또는 결합해서 분석하는 것입니다. 3C를 기준으로 육하원칙을 부여하여 분석할 수 있습니다.

 

 

 

3C는 Customer(고객), Campaign(캠페인), Content(상품/콘텐츠)를 의미하는데요, 예를 들면, 아래와 같이 생각하거나 질문해 볼 수 있습니다. 이 글을 읽고 계신 여러분도 여러분의 비즈니스에 맞는 질문들을 상상해보세요. 바보같은 질문이란 없습니다. 내 의식의 흐름대로 맡겨봅시다. 

 

- Customer x Who: 우리의 고객은 누구인가? 단순 성별 또는 직업으로 대표되는 것이 아니라 어떤 취향/라이프 스타일을 갖고 있는가?

- Customer x When: 우리의 고객은 언제 반응하는가? 어느 계절에 특히 반응하며 어떤 상황에서 우리의 제품이나 서비스를 필요로 하는가?

- Customer x Why: 우리의 고객은 왜 우리 제품/서비스를 구매하는가? 왜 안 사는가?

- Campaign x Where: 어떤 장소에서 우리 브랜드를 검색할까? 어떤 장소에서 우리 광고가 효과적일까? 야외용품 키워드 광고는 야외에서 검색해서 클릭할까? 집이나 회사 등에서 미리 준비한 다음에 가져갈까? 키워드 광고 클릭 IP 들을 토대로 실내/외 정보를 알 수 있지 않을까? IP 대역대를 통해서 내부 와이파이 망과 외부 LTE 망을 구분할 수 있을까? 실내에서 반응하는 키워드 광고의 특징이 있을까?

- Content x Where: 우리 온라인몰은 어디에 노출될 때 효과적인가? 어디에 있어야 하는가? 우리 오프라인 몰은 어떤 위치에 있을 때 효과적인가?

- Content x How: 상품을 어떻게 제시하면 사는가? 동일한 상품이라도 기능을 강조하면 더 잘 팔리는가?

 

그렇다면 이 질문들에 대한 답은 어떻게 확인할 수 있을까요? 영원한 답은 없겠지만 현재 상황에서의 진단은 내릴 수 있습니다. 저는 이 책에서 말하는 것처럼 ‘요소를 나누어’ 그 데이터에 속성을 부여하여 보기로 했습니다.

 

수집 중인 데이터에 한하여 당장 확인해볼 수 있는 항목으로 도전합니다.

 

 

 

3C 중 Content (상품)와 How 를 통해 “상품을 어떻게 제시하면 사는가? 동일한 상품이라도 기능을 강조하면 더 잘 팔리는가? 상품명을 어떻게 설정해서 노출시켰을 때 관심을 가질까?” 질문의 답을 구해보려 합니다. 로거의 ‘상품별 주문/매출액’ 리포트에서는 상품별 상세 페이지 조회수와 해당 상품의 주문수량과 매출액을 알 수 있습니다. 

 

 

  

 Logger에서 제공하는 '상품별 주문/매출액' 리포트

 

*방문수 : 상품 상세페이지 조회수

 

 

예를 들면, 아래와 같이 제품의 특징 중 한 가지를 머릿말로 붙여 노출시키는/판매하는 쇼핑몰이 있습니다.

건강식품부터 화장품, 생활가전까지 다양한 카테고리의 제품을 다루는 온라인 쇼핑몰입니다.

 

 

 

 

[개성인삼농협], [식약처인증], [특허 받은], [명품소금], [캘빈클라인], [롭스 판매상품], [백화점 판매상품] 이런 식입니다. 같은 상품이라도 정의된 상품 노출텍스트에 따라 효과가 다를까? 궁금했습니다. 

 

 

아래 순서로 작업을 진행했습니다.

 

1. ‘상품별 주문/매출액’ 리포트를 엑셀 파일로 다운로드합니다.

 

2. 노출된 상품명에 포함된 ‘ [ ] ‘ 머릿말의 문자열을 추출합니다.

 

 

 

 상품명에서 [ ] 사이의 타이틀 문자열만 추출

 

 

3. 상품명에 포함된 머릿말을 훑어보고 속성을 부여하여 그룹화합니다.

 

저는 아래와 같이 상품명 머릿말의 ‘요소를 나누어’ 보았습니다.

 

- 브 (브랜드): 삼성, CJ, cj, 정관장, 광동, 이경제, 보령, 상아, 농협, 동아, 한삼인, 코리아나, 원장, 쿠첸, 오뚜기, 위니아, 동원, 이츠웰, 웰라이프, 박준, 일양, 더락갈비, 광명, GS, gs, 피에르, 클리오, 오리온, 프로스펙스, 프라하, 발렌티노루디, 종근당, 잇츠스킨, 연세, 테팔, 디노보, 메디하임, 베르사체, 장대원, 롯데, 사조, 이롬, 대웅, 키친아트, 크롬바커, 견미리, 댕기머리, Tommy, 최유라, FILA, fila, 엘지, LG, lg, 스타벅스, 일양약품, 아모레, 유한양행, 켈로그, 바세린, 코리아나화장품

- 성 (성분강조): %, 함량, 함유, 성분, 약산성

- 지 (지역언급): 대한민국, 한국, 베트남, 독일, 영국, 캐나다, 이태리, 러시아, 미국, 스위스, 중국, 스페인, 안면도, 제주, 필리핀, 해외

- 퀄 (퀄리티): FDA, 전통, 특허, 정품, 인증, 납품, 품질, 명품, 안정성

- 판 (판매처): 홈쇼핑, 백화점, GS25, 편의점, 코스트코, 올리브영, 롭스, 약국, 병원, 면세점, 드럭스토어, 대형마트, 홈앤쇼핑, 홈플러스, 롯데마트, 이마트

 

복잡해보이지만, 노출되는 상품명 머릿말에 ‘%’ , ‘함량’, ‘함유’ 와 같은 키워드가 포함되면 ‘성(성분강조)’ 속성을 부여하는 것입니다. 

 

4. 속성별 상품 상세 페이지 조회수와 주문수량, 매출액, 상품 상세페이지 조회당주문율, 상품 상세 페이지 조회당매출액 데이터를 확인합니다.

 

 

 

 속성 부여 결과

 

하나의 상품명에 두가지 이상의 속성을 포함하는 경우도 있었습니다.

예를 들면, 아래의 경우처럼요.

 

[100% 국내산 고려홍삼] ㅇㅇ홍삼골드 70ml x30포 (쇼핑백 동봉) ⇒ 브성

[고품질 100% 국내산/홈쇼핑판매상품]26년전통 명품 호박 약과 (20개입) ⇒ 성퀄판

 

‘브’ (브랜드) 키워드와 ‘성'(성분강조) 키워드를 모두 가진 ‘브성’ 유형, ‘성’ (성분강조) 키워드와 ‘퀄’ (퀄리티), ‘판’ (판매처) 속성의 키워드를 모두 포함하는 ‘성퀄판’ 유형 등입니다. 

 

5. 속성별 데이터를 시각화하여 비교합니다.

 

속성에 해당하는 상품 수가 일정하지 않기에 단순 상품 상세 페이지 조회수나 매출액의 합으로 확인하는 것은 적절치 않다고 판단하여 상품 상세페이지 조회수당 주문수량과 상세 페이지 조회수당 매출액을 통해 비교해보았습니다. 결과는 아래와 같았습니다.

 

 


 

 

붉은색으로 표현된 선은 해당 기간 내 ‘전체’ 상품의 데이터입니다. 속성 유형 중 전체 상품의 데이터보다 효과적이라고 판단되는 유형들이 눈에 띕니다. 효과적인 속성 또는 속성들의 결합으로 상품명을 변경해보고 다시 확인해보고 싶다는 생각이 듭니다. (물론 구글 옵티마이즈와 같은 A/B 테스트 솔루션들도 있습니다.) 

 

 

데이터 분석 체력을 기른다는 마음으로..

 

데이터 분석 체력을 기른다는 마음으로 일련의 작업을 마치고 이 글을 작성하고 있습니다. 물론 한계도 있습니다. 아쉬운 것은 상품별 노출수를 분석할 수 없었다는 것입니다. 온라인 쇼핑몰 내 해당 상품의 노출수 데이터가 있었다면 상품 속성별 노출 대비 상품 상세페이지 조회수를 알 수 있기 때문에 고객들의 관심을 끈 상품명 속성을 확인하여 좀 더 풍부한 분석을 할 수 있었을 것입니다. 이 점은 매우 아쉽지만.. 좌절하거나 괜히 했다 생각하지 않습니다. 

 

이 책에서 제시한 것처럼 하나의 상품을 상품명 내 포함된 ‘요소를 나누어’ 직접 시도해보면서 데이터 전처리과정을 직간접적으로 경험하기도 했으며, 어떤 데이터를 확보하면 좀 더 의미있는 진단을 하여 액션 할 수 있을지 생각할 수 있었고 또 다른 요소들과도 결합하여 확인해보고 싶은 의지가 생겼기 때문입니다.

또 다른 여러가지 상상을 하거나 질문을 만들어 볼 수 있습니다. Content 와 How를 결합하여 ᅳ“상품을 ‘어떻게’ 제시하였을 때 효과적일까?” 를 하나로 묶고ᅳ 육하원칙을 붙여보는 것입니다. 

 

- ( Content x How ) x What : 특정 카테고리 제품군에서 효과적인 제품명 속성이 있을까? 있다면 무엇일까?

- ( Content x How ) x When : 건강식품 안전성에 대한 사회이슈가 있다면, 건강식품 카테고리의 상품명은 ‘[FDA승인]’, ‘[식약처인증]’으로 했을 때 효과적일까?

- ( Content x How ) x ( Customer x Who ) : 특정 제품명 속성에 반응하는 고객들의 특성은 무엇일까?

 

각종 툴을 도입하여 데이터를 수집하면서도 데이터 분석을 어디서부터 어떻게 해야할지 모르겠다는 분들이 많습니다. 막연히 고민만 하는 것보다 3C를 기준으로 육하원칙과 결합하여 상상해보고 질문에 대한 답을 찾아보는 것을 권장합니다. 일단 해보면 어떤 데이터를 놓치고 있었고, 어떤 액션을 취해야하는지 살펴볼 수 있는 기회가 생기기 때문입니다.

 

하지만, 우리의 근무시간은 한정되어 있고 일은 항상 많지요? 저도 잘 압니다! 직접 해보시기 힘들거나 ‘이런 것도 궁금하다’ 하는 점 있다면 여기 이메일주소( cx@bizspring.co.kr )로 질문을 주세요. 호기심을 던져주신 여러분을 대신하여 여러가지 노가다 작업도 해보고 시행착오도 해보고 그 결과를 공유하겠습니다.