소셜로그인 중단 안내

계정으로 로그인 기능이 2023년 11월 16일 중단되었습니다.

아이보스 계정이 사라지는 것은 절대 아니며, 계정의 이메일 주소를 이용해 로그인 하실 수 있습니다.

▶️ 자세한 공지사항 확인

(우뇌) 마케터의 시선으로 데이터 분석하기 - 프롤로그

2023.10.10 17:43

우뇌

조회수 4,557

댓글 20

1편 보러가기 : 상관관계 분석

2편 보러가기 : 회귀분석


안녕하세요, 우뇌 입니다.


이번 글을 시작으로 데이터마케팅에 대해서 사수없는 마케터 분들이 또는 데이터 팀이 없는 회사에서 데이터마케팅을 혼자서 할 수 있게 도와주는 글을 시리즈로 써보고자 합니다.


이 글을 쓰는 목적은 제가 마케팅 밥을 먹은지 어언 10년이 넘었는데, 데이터에 대해서 모두가 어려워하고 모두가 힘들어 하시는 모습을 보면서 많이 안타까웠기 때문입니다.


그래서 제가 알고 있는 또는 제가 도와드릴 수 있는 부분을 최대한 도와드리고 싶습니다.


강의로도 만들어볼까 했는데, 그러면 이 업계에서 배움이라고 하는 것이 특정 분들에게 쏠리게 되어 제가 원하는 “대한민국 마케팅 업계의 긍정적 영향/변화” 가 일어나지 않을 것 같아 정말 무료로 다 공개하고자 합니다.


저는 돈을 바라는 사람이 아니니까요.




아래는 현재 생각하고 있는 목차 입니다. 뭐 상황에 따라 이 부분은 유동적으로 변화할 가능성이 어느정도는 있겠지만, 저는 최대한 바꾸지 않으려고 합니다.


그리고 저는 전문적으로 데이터 분석을 공부하고 전공한 사람이 아닌 지라 틀릴 수도 있습니다. 즉, 반박 시 님 말이 맞다는 뜻 이죠.


목차


0. 프롤로그 - 데이터분석의 개념 탑재하기

1. 상관관계 분석

2. 회귀분석(선형, 다중선형, 다항)

3. 수익한계분석

4. 시계열분석

5. 검색량 트렌드 분석

6. 피크탐색, 평균검색량, 계절성 분석, 이동평균분석

7. 자기상관함수(분석)

8. 푸아송분포

9. t-검정

10. z-검정


무슨 목차가 11개나 되나 싶으시겠지만, 거의 전 글과 이어지거나 매우 짧게 여러분들이 바로 바로 써먹을 수 있게 하나씩 떠먹여드릴겁니다.


또는 너무 짧을 경우 그냥 몇개씩 묶어서 연재할 예정입니다.


그러니 많이 읽어주시고, 많이 실습해주세요.


건강한 마케팅 업계를 만들고 싶고, 예산에만 치우치는 마케팅 업계, 영업만 치중하는 마케팅 업계가 너무 싫습니다.


지금 이 글을 읽고 계시는 여러분들이 모두 발전하셔야 우리 마케터를 바라보는 시선도 바뀔거라 믿습니다.


많이 많이 읽어주시고 많이 많이 퍼뜨려 주세요.


오늘은 프롤로그 부터 시작할 것이고, 많은 마케터 분들에게 데이터 분석의 “개념” 을 먼저 설명드리고자 합니다.


개념이 탑재 되지 않는다면, 같은 분석을 해도, 같은 결과를 봐도 해석을 전혀 다르게 할 수 있는 문제가 발생할 수 있습니다.


자, 그럼 시작하겠습니다.


1. 상관관계와 인과관계


이건 정말 엄청 많은 마케터, 사업주 분들이 잘못 알고 계신 개념입니다.


상관관계와 인과관계를 같다고 생각하시는 건데요.


상관관계가 있다고 해서 인과관계가 있는 건 아니라는 거죠.


예를 들면 이런 겁니다.


“네이버 타임배너광고를 시작하니 클릭수가 엄청나게 찍혀 DAU가 늘었다. 그러므로 타임배너 광고는 DAU를 늘리는 실질적인 매체다.”


어…아닙니다.


광고의 클릭수가 올라갔다고 해서, 또는 DAU가 늘어났다는 “경향성”이 있을 뿐 확실한 인과관계로 명제를 완성하기에는 무리가 있습니다.


이건 명백하게 틀린 명제에요.


오히려 둘의 관계는 인과관계가 아닌 상관관계로 먼저 놓고 생각하시는 게 맞습니다.


여기서 상관관계란, 두 지표가 얼마나 “의존적” 인가 에 대한 것 입니다.


반면, 인과관계란, 하나의 지표로 인해 다른 지표가 변하는 원인과 결과를 말합니다.


예를 들어서, 광고를 껐을 때 DAU가 줄어드는 것은 상관관계일 수 있겠죠? 그런데, 광고를 껐는데 DAU가 줄지 않았어요!


왜? 프로모션을 했거든요! 그리고 그 프로모션 한다는 소식을 광고로 알리지 않고 카톡 CRM을 활용해서만 플레이를 했어요.


이 경우에는 광고 클릭 수가 영향을 준것이 전혀 아니죠?


DAU와 프로모션 실행 유무에 대해서 DAU가 유지된 걸 수도 있고요, 또는 기깔난 CRM 문구 덕분에 이러한 결과가 나타난 것일 수도 있고요.


실제로 국가 정책에서도 이를 오해해서 일어난 사건사고가 많습니다.


몇 가지 꼽을 건데요.


미국 보건국에서 아이스크림과 소아마비 발생 빈도의 상관관계를 밝혀내고 “아이스크림은 소아마비를 초래한다.” 는 발표를 낸 적이 있었죠.


지금 들으면 이게 무슨 소리일까 싶잖아요?


네, 잘못 된 분석이에요. 상관관계는 다른 요소를 고려하지 않고 딱 이 2가지만 보는 경우거든요.


실제로는 소아마비가 여름에 주로 발병하는데, 아이스크림이 하필 여름에 많이 소비되죠?


그래서 이건 상관관계를 인과관계로 오해해서 발생한 문제 입니다.


한 가지 또 예를 들어볼까요?


아주 대표적인 오해죠.


치마길이가 짧아지면 경기가 좋아진다.


이 명제는 대단히 틀렸습니다.


여기에 나름 그럴듯한 이유까지 붙여놨습니다. “소비의 대부분은 여자들에 의해 결정되고, 여자들의 전망에 따라 경기가 결정된다.”


네, 아니죠.


그렇게 따지면 매년 여름에는 경기가 좋고 매년 겨울에는 경기가 안좋겠네요.


실제 경제학 쪽에서는 그냥 속설로 치부할 뿐 전혀 인과관계에 대해 입증되지 않았습니다. 설사 “관계가 있는 것 처럼 보여도 이는 우연에 기인한다.” 고 하죠.


98년 IMF를 생각해볼까요? 그 때는 무슨 롱스커트가 유행했습니까? IMF 사태의 원인은 명백하게 나와있죠?


거기에 그 어떤 경제학자도 치마 길이를 근거로 들지 않습니다.


자, 이제 감이 조금 잡히실까요?


상관관계와 인과관계는 명백히 다르며, 인과관계를 증명해내기 위해서 하나만 보고 결정할 수 없다.


고로, 하나만 보고 속단하지 말자.


데이터 분석의 기본 중의 기본 입니다.



2. 차이가 나면 의미가 있다.


우리 흔히 A/B 테스트 많이 하시죠?


특히 뭐 광고 소재라던가 그런걸로 많이 하실 것 같아요.


안하고 계신다면…….문제가 크니 지금 당장 하시구요.


본론으로 들어가면, 주로 A/B 테스트의 결론을 내리거나, 포트폴리오/이력서 쓰실 때 이런 표현을 제가 많이 보는데요.


이 A/B 테스트에서 A안과 B안의 전환율 차이가 0.12% 났다. 고로 전환율이 더 높은 B안이 우수한 소재다.


이렇게 결론을 내리거나.


CPC 400원을 370원까지 내리는 것을 성공했다, 고로 나는 쩌는 마케터다!


라고 소개를 하거나….ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ


이런 경우가 있습니다.


네, 대단히 틀린 부분이죠.


전환율 0.12% 차이는 이건 우연에 의해서라도 발생할 수 있어요. CPC 역시 저정도 범위는 우연에서라도 발생할 수 있습니다.


의미가 있으려면 적어도 절대값들의 차이가 크고, 상대값 역시 차이가 크게 나야죠.


전환율 같은 경우라면 적어도 1% 이상은 나야 의미가 있는 거고 CPC도 100원 이상이 나야 의미가 있는 것 아닐까요?


이렇게 생각하시면 됩니다.


귤 한 봉지 라고 하면 거기 귤이 몇 개 들었을까요?


귤 10개 들은거나 6개 들은거나 똑같이 귤 한 봉지 아닌가요?


근데 가격은 똑같이 1000원으로 같으면, 우리 10개 주는 곳 가지 않아요?


만약 10개로 똑같다고 해도 무게가 더 무거운쪽으로 가지 않나요?


이렇게 차이가 명확히 있고 모두가 받아들일 수 있을 정도의 gap이 있어야 합니다.


그렇다면 A/B 테스트 할 때 저렇게 차이가 났다면 어떻게 해야할까요?


기간을 조금 더 늘려보거나, 혹은 다른 지표를 뜯어보거나 그래야겠죠?


다른 의미있는 지표가 있는지 말이에요.


이 부분 역시 앞선 상관관계와 인과관계의 개념이 올바르게 탑재되어있지 못해서 발생할 수 있는 오류 입니다.


3. A/B 테스트


이전에 제가 진행했던 강의에서도 제가 엄청 강조하면서 설명했었고, 실제로도 몇 번 글에서 언급했었고, 저희 직원 분들에게도 상당히 강조했었던 부분 입니다.


A/B 테스트란 그냥 서로 다른 소재 올려놓고 뭐가 더 많이 팔렸느냐~


를 보는게 아닙니다.


가장 중요한 부분이 바로 “변수통제” 또는 “변인통제” 입니다.


아예 A/B 테스트를 정의하는 명제는 다음과 같습니다.


“웹 로그 분석 또는 온라인 마케팅에 있어, A와 B 둘 중 더 나은 것을 찾기 위해 두 개 이상의 변수를 통제하여 진행하는 테스트”


자, 여기서 중요한 부분은 뭐다?


“두 개 이상의 변수를 통제하여 진행하는 테스트”


입니다.


그렇다면 뭐죠? 변수값을 하나만 가져야 한다는 말이죠?


이해되셨을까요?


즉, 아예 다른 이미지 소재 두 개 올려놓고 어떤게 나을까? 하고 기대하는게 아니라는 거에요.


의미있어보이는 한 가지 요소를 변형해서 테스트를 해보라는 것이죠.


예를 들면, 자동차가 달리는 듯한 느낌을 주는 검은색 차량의 소재가 더 전환이 잘 나올지, 정차되어있는 검은색 차량의 소재가 더 나을지, 자동차가 달리고 있지만 흰색 차량의 소재가 더 나은지, 카피가 짧은게 더 나은지 등등등


이런 요소들입니다.


A/B테스트는 이렇게 진행하셔야 되는 것이고, 이게 “정석” 입니다.



4. 마치며


사실 더 써야 되는 개념적인 요소가 많이 있습니다.


모수의 의미, 페르소나의 의미, 그래프 제대로 읽기 등등등 탑재해야 되는 개념들이 원래는 더 됩니다.


그 부분은 앞으로 시리즈를 지속하며, 서술하도록 하겠습니다.


아, 그리고 이 시리즈는 Chat GPT-4와 함께 합니다.


아마 다음 1편 부터 GPT-4를 활용해서 어떻게 명령을 내리는 것인지 하나 하나 알려드릴 예정인데요.


하나도 어렵지 않습니다.


각 분석법의 개념을 머릿속에 탑재하고 그대로 GPT에게 명령만 내리면 되는 부분입니다.


그리고, GPT의 어떤 기능들을 사용할 지만 아시면 됩니다.


고로 다음편이 업데이트 되면 그때 GPT-4 결제를 해주시면 참 좋을 것 같습니다.


참고로 전 오픈ai 한테 뭐 받은 것 없고요, 지분은 더더욱 없습니다.(줬으면 좋겠네요 ㅠㅠ)


그러면 가까운 시일 내에 돌아오도록 하겠습니다.


안녕! 우-바


우뇌 드림.

데이터데이터분석
목록글쓰기
댓글 20
댓글 새로고침
로그인 후 더욱 많은 기능을 이용하세요!아이보스 로그인