
데이터 기반 리텐션 전략 [실행 가능한 고객 메트릭 설계부터 이탈을 막는 전략 실행까지]
- 원서명Fighting Churn with Data: The science and strategy of customer retention 1st Edition (ISBN 9781617296529)
- 지은이칼 골드(Carl Gold)
- 옮긴이장훈
- ISBN : 9791161759937
- 42,000원
- 2025년 07월 21일 펴냄
- 페이퍼백 | 572쪽 | 188*235mm
- 시리즈 : 데이터 과학
판매처
YES24책 소개
소스 코드 파일은 여기에서 내려 받으실 수 있습니다.
https://github.com/AcornPublishing/9791161759937
책 소개
고객 이탈, 데이터로 잡다 — 실전 분석 가이드의 모든 것!
‘이탈 예측’에서 ‘실질적 행동 변화’까지, 데이터 담당자를 위한 완벽 로드맵
이 책은 구독 서비스뿐만 아니라 반복 고객이 중요한 모든 비즈니스 현장에서 고객 이탈(Churn) 문제를 효과적으로 해결할 수 있도록 돕는 실전형 데이터 분석 방법론을 담고 있다. 이 책은 단순한 예측 모델 구축에 머물지 않고, 실제로 이탈률을 줄이고 고객 가치를 높이는 실행 가능한 전략까지 제시한다.
저자 칼 골드는 세계 각지 다양한 업계에서 수집한 로데이터를 바탕으로, 고객 행동 데이터를 면밀히 분석하여 ‘실행 가능한 고객 메트릭’을 도출해낸다. 또한, 데이터 과학자와 분석가, 머신러닝 엔지니어 등 현업 데이터 담당자를 위해 치밀하게 설계된 분석 과정, 파이썬과 SQL 활용법, 그리고 실제 기업의 벤치마크 사례를 풍부하게 제공한다.
특히 실무적 관점에서 데이터 기반 이탈 분석의 난관들과 함정을 솔직하게 조명하고, 분석 결과를 팀과 비즈니스 의사결정에 효과적으로 전달하는 방법까지 상세하게 안내한다. 따라서 핵심 개념을 누구나 쉽게 이해할 수 있도록 설명하며, 코딩에 익숙하지 않은 독자도 사례 연구와 요약, 실무 팁을 통해 주요 내용을 빠르게 흡수할 수 있다.
이 책은 오늘날 모든 산업이 ‘서비스로서(as a service)’로 전환되고 반복 고객의 중요성이 커지는 상황에서, 데이터로 고객 이탈을 줄이고 지속 가능한 성장을 이루고자 하는 기업과 데이터 전문가라면 반드시 읽어야 할 책이다.
내용 소개
1. “이탈”을 꿰뚫어라 — 반복 고객의 비밀을 풀 열쇠
이탈(Churn)은 제품과 서비스를 제공하는 모든 기업이 반드시 맞닥뜨려야 할 현실적인 문제이자, 비즈니스의 생존 그 자체를 좌우하는 지표다. 『데이터 기반 리텐션 전략』은 고객이 왜 이탈하는지, 이탈을 어떻게 정의하고 어디서부터 측정할지, 그 복잡한 본질을 세분화하여 설명해 준다. 구독제이든, 일반 반복 거래든, 충성고객이 핵심인 사업이라면 반드시 이탈의 정밀한 본질을 이해해야만 한다. 이 책은 표피적인 데이터 해석을 넘어서 실제 데이터 기반의 ‘이탈’ 싸움이 어떻게 가능한지 안내해 준다.
2. 실전에 강해져라 — 데이터를 “쓸모 있는 정보”로 바꾸는 방법
이 책은 단순한 이탈률 계산을 넘어, 서비스 내 모든 사용자 행동 데이터를 행동 메트릭으로 전환하는 방법과 노하우를 구체적으로 제공한다. 또한 파이썬과 SQL 중심의 코드, 명확한 품질관리(QA) 절차, 행동 메트릭과 이탈의 연결고리에 대한 단계별 접근법으로 실질적인 문제 해결 실력까지 갖추게 해준다. 데이터를 제대로 다루고 싶다면, 단순히 많은 데이터를 수집하는 차원을 넘어 중요한 신호를 찾고 실전 분석으로 이어지는 방법을 이 책에서 배울 수 있다. 게다가 실무자 중심의 설명과 폭넓은 예제를 추가해, 책을 읽는 누구나 ‘내 비즈니스에 바로 적용할 수 있다’는 자신감을 안겨준다.
3. 데이터가 전략이 되는 전쟁 — 예측을 넘어 ‘바꿀 수 있는 행동’에 집중하라
이 책은 ‘데이터를 전략으로, 그리고 실질적인 변화로 연결해주는 것’에 진심을 다한다. 또한 분석 결과를 실제 비즈니스 개선·제품/마케팅/고객지원 정책에 녹여낼 수 있는 실전적 접근법을 제시한다. 이 책은 단순 예측을 뛰어넘어, 전략적으로 고객 세그먼트화, 타깃팅, 행동 변화 유도까지 실제로 바꾸는 방법을 알려주며, 이에 더해, 로지스틱 회귀와 머신러닝 분석, 그리고 중복 데이터와 정보 과부하를 현명하게 다루는 노하우까지 제공한다. 반복 고객이 곧 수익이고, 성장이며, 미래임을 아는 이들에게 강력 추천하고 싶은 실전형 무기다.
고객 이탈이라는 피할 수 없는 난제를 데이터와 실전 전략으로 돌파하고 싶은 독자라면, 지금 이 책을 선택하길 바란다.
추천의 글
“이 책은 희귀하다. 명쾌하고 설득력 있으며 재미까지 있다. 구독 기반 비즈니스를 운영하는 사람이라면 반드시 읽어야 할 책이다. 당신의 상사에게 한 권 선물하라.”
-티엔 쯔오(Tien Tzuo)의 ‘추천의 글’ 중
주오라(Zuora)의 창립자이자 CEO
“이 포괄적인 가이드는 단계별 예제와 함께 이탈 분석에 대한 심층적인 인사이트를 제공하는 필수 무기와 같다.”
-켈룸 프라바스 세나나야케(Kelum Prabath Senanayake)
에코웍스(Echoworx)
“이론과 훌륭한 코드 샘플로 가득 찬 이탈에 대한 훌륭한 탐구서”
-조지 토마스(George Thomas)
맨해튼 어소시에이츠(Manhattan Associates)
“이탈과 관련된 거의 모든 것을 알려준다. 이 책은 명료한 언어, 상세한 설명, 실제 사례 연구에 대한 면밀한 분석으로 가득하다.”
-프라부티 프라카시(Prabhuti Prakash)
시네크론(Synechron)
이 책의 대상 독자
이 책의 주요 독자는 데이터 과학자, 데이터 분석가, 머신러닝 엔지니어다. 온라인 제품이나 서비스를 이해하고 이탈을 방지해야 하는 업무를 맡고 있다면 이 책이 큰 도움이 될 것이다. 또한 이 책은 컴퓨터 과학 및 데이터 과학을 전공하는 학생이나, 코딩을 알고 있으며 일반적인 기업에서 데이터 과학의 핵심 영역에 대해 더 많이 배우고 싶은 사람에게도 매우 적합하다. 이 책은 로데이터에서 시작하며 다루는 모든 분석 작업에 필요한 배경지식을 제공하기 때문에, 소규모 회사의 이탈 분석 프로젝트를 진행하며 배우는 데이터 과학의 완벽한 실습 과정이라 할 수 있다(샘플 데이터셋도 함께 제공된다).
이탈 예측과 머신러닝에 대해 다루는 이 책의 3부 8장과 9장은 해당 주제에 대한 경험이 없는 사람에게는 다소 난이도가 높을 수 있다. 이러한 배경지식이 없더라도 8장과 9장에서 알아야 할 모든 것을 배울 수 있지만, 권장되는 온라인 자료를 읽으려면 추가 시간을 투자해야 할 수도 있다.
이 책은 코딩을 하지 않는 비즈니스 전문가도 반드시 읽어야 하는 책이다. 이 책에는 실제 기업의 독특한 이탈 사례 연구가 있으며, 이탈 분석에 일반적으로 사용되는 데이터, 해당 데이터를 실행 가능한 인텔리전스로 전환하는 데 사용되는 관행, 그리고 가장 일반적인 결과들을 설명한다. 특히 이 책은 데이터 결과를 비즈니스 담당자에게 효과적으로 전달하는 방법을 강조하고 있으며, 따라서 모든 중요한 핵심 포인트는 전문 용어가 아닌 일반적인 용어로 설명되어 있다. 그렇기에 이탈에 관심이 있지만 코딩을 모르는 경우, 이 책에서 명확하게 표시된 핵심 포인트를 훑어보고 코딩과 수학은 건너뛰는 것이 좋다. 그런 다음 개념을 실제로 적용하는 데는 개발자 중 한 명에게 이 책을 공유하고 도움을 받는 것이 효과적일 것이다.
이 책의 구성
이 책은 3개의 주요 부분으로 구성되어 있다. 1부에서는 이탈의 정의와 측정 방법, 기업이 일반적으로 이탈을 이해하고 줄이는 데 도움이 되는 데이터, 그리고 데이터를 효과적으로 활용하기 위한 준비 과정을 설명한다.
■ 1장에서는 이 분야에 대한 전반적인 소개와 사례 연구를 소개하며, 이 책을 통해 여러분이 자신의 제품 및 서비스에 도움이 될 만한 유형의 인사이트를 강조한다.
■ 2장에서는 이탈 고객을 식별하고 다양한 방법으로 이탈을 측정하는 방법을 설명한다. SQL 코드는 이 장에서부터 등장한다.
■ 3장에서는 대부분의 온라인 기업이 수집하는 사용자의 이벤트 데이터로 고객 메트릭을 계산하는 방법을 소개한다.
■ 4장에서는 2장의 이탈 데이터와 3장의 메트릭을 결합하여 이탈을 이해하고 이탈과 싸우기 위한 분석 데이터셋을 만드는 방법을 설명한다. 이 책의 핵심 기술을 담고 있는 2부에서는 고객 행동이 이탈 및 리텐션과 어떻게 연관되는지 이해하고 이러한 지식을 활용하여 이탈 감소 전략을 추진하는 데 중점을 둔다.
■ 5장에서는 행동과 이탈 사이의 관계를 이해하고 설명하는 주요 방법인 코호트 분석의 한 형태를 설명한다. 또한 5장에는 많은 사례 연구 예제가 포함되어 있으며 코드는 파이썬으로 작성되어 있다.
■ 6장에서는 다루기 어려울 만큼 큰 데이터를 처리하는 방법을 살펴본다. 대부분의 회사 데이터셋에는 근본적으로 같은 행동을 나타내는 밀접하게 관련된 측정값이 있다. 이러한 중복되는 정보를 어떻게 처리하는지가 중요하다.
■ 7장에서는 메트릭 생성에 대한 주제로 돌아가 5장과 6장의 정보를 사용해 가격 민감도와 효율성 같은 복잡한 고객 행동을 설명하는 데 도움이 되는 고급 메트릭을 설계한다.
3부에서는 회귀와 머신러닝을 활용한 예측을 다룬다. 이탈을 줄이는 데 있어 예측은 좋은 메트릭을 확보하는 것보다는 덜 중요하지만, 유용할 수 있다. 다만 예측을 제대로 수행하려면 몇 가지 특별한 기술이 필요하다.
■ 8장에서는 회귀를 통해 고객 이탈 확률을 예측하는 방법과 고객 생애 가치 계산을 비롯한 예측 결과를 해석하는 방법을 설명한다.
■ 9장에서는 머신러닝과 이탈 예측의 정확도 측정 및 최적화에 대해 설명한다.
■ 10장에서는 이탈과 관련된 인구통계 또는 기업통계 데이터를 분석하고 우수 고객을 위한 유사 고객을 찾는 방법에 대해 다룬다.
대부분의 독자는 처음부터 시작하여 1부와 2부를 읽어야 한다. 이러한 기술을 배우고 적용한 후, 예측을 하거나 유사 고객을 찾아야 한다면 3부를 계속 읽으면 된다. 이미 고급 분석을 사용하고 있다면 1부를 건너뛰고 2부 또는 3부부터 시작할 수 있다. 이 책의 목적상 고급 분석을 사용하고 있다는 것은 이미 좋은 고객 메트릭을 보유하고 있으며 이탈 고객을 식별하고 측정할 수 있음을 의미한다. 그렇지 않다면 1부부터 시작하라.
목차
목차
- 추천의 글
- 머리말
- 감사의 글
- 지은이 소개
- 옮긴이 소개
- 옮긴이의 말
- 들어가며
- 1부 무기고 구축하기
- 1장 이탈의 세상
- 1.1 이 책을 읽는 이유
- 1.1.1 일반적인 이탈 시나리오
- 1.1.2 이 책의 주제
- 1.2 이탈과의 싸움
- 1.2.1 이탈을 줄이는 개입
- 1.2.2 이탈과의 싸움이 어려운 이유
- 1.2.3 뛰어난 고객 메트릭: 이탈과 싸우기 위한 무기들
- 1.3 일반적인 데이터 분석 책과의 차별점
- 1.3.1 실무적이고 상세한 내용
- 1.3.2 시뮬레이션 사례 연구
- 1.4 사용자가 반복적으로 상호 작용하는 제품
- 1.4.1 유료 소비재
- 1.4.2 B2B 서비스
- 1.4.3 광고 기반 미디어와 앱
- 1.4.4 소비자 피드 구독 서비스
- 1.4.5 부분 유료화 비즈니스 모델
- 1.4.6 인앱 결제 모델
- 1.5 비구독 서비스의 이탈 시나리오
- 1.5.1 이탈로 간주되는 휴면 상태
- 1.5.2 무료 평가판 전환
- 1.5.3 업셀링/다운셀링
- 1.5.4 다른 예/아니요(이항) 고객 예측
- 1.5.5 고객 행동 예측
- 1.5.6 이탈과는 다른 사용 사례
- 1.6 고객 행동 데이터
- 1.6.1 일반적인 상품 카테고리에서의 고객 이벤트
- 1.6.2 가장 중요한 이벤트
- 1.7 이탈과 싸우는 사례 분석
- 1.7.1 Klipfolio
- 1.7.2 Broadly
- 1.7.3 Versature
- 1.7.4 소셜 네트워크 시뮬레이션
- 1.8 뛰어난 고객 메트릭에 대한 사례 연구
- 1.8.1 활용도
- 1.8.2 성공률
- 1.8.3 단가
- 요약
- 2장 이탈 측정
- 2.1 이탈률의 정의
- 2.1.1 이탈률과 리텐션율의 계산
- 2.1.2 이탈률과 리텐션율의 관계
- 2.2 구독 데이터베이스
- 2.3 기본적인 이탈 계산: 순 리텐션
- 2.3.1 순 리텐션 계산
- 2.3.2 SQL 순 리텐션 계산
- 2.3.3 순 리텐션 해석하기
- 2.4 표준 계정 기반 이탈
- 2.4.1 표준 이탈률 정의
- 2.4.2 이탈 계산을 위한 외부 조인
- 2.4.3 SQL을 통한 표준 이탈 계산
- 2.4.4 표준 이탈률 사용 시기
- 2.5 비구독 제품의 활동(이벤트 기반) 이탈
- 2.5.1 활성 계정 및 이벤트로 인한 이탈 정의하기
- 2.5.2 SQL을 통한 활동 이탈 계산
- 2.6 고급 이탈: 월간 반복 수익(MRR) 이탈
- 2.6.1 MRR 이탈 정의 및 계산
- 2.6.2 SQL을 사용한 MRR 이탈 계산
- 2.6.3 MRR 이탈 vs 계정 이탈 vs 순 (리텐션) 이탈
- 2.7 이탈률 측정 변환
- 2.7.1 생존자 분석(고급)
- 2.7.2 이탈률 전환
- 2.7.3 SQL에서 모든 이탈 측정 기간 변환하기
- 2.7.4 이탈 측정 기간 선택하기
- 2.7.5 계절성과 이탈률
- 요약
- 3장 고객 측정
- 3.1 이벤트에서 메트릭으로
- 3.2 이벤트 데이터 웨어하우스 스키마
- 3.3 단일 기간의 이벤트 집계
- 3.4 메트릭 기간 정의의 세부 사항
- 3.4.1 주간 행동 주기
- 3.4.2 메트릭 측정의 타임스탬프
- 3.5 다양한 시점의 측정
- 3.5.1 측정 기간 중첩
- 3.5.2 메트릭 측정 타이밍
- 3.5.3 메트릭 측정값 저장
- 3.5.4 시뮬레이션 예제에 대한 메트릭 저장
- 3.6 이벤트 속성의 합계 및 평균 측정
- 3.7 메트릭 품질 보증
- 3.7.1 시간 경과에 따른 메트릭 변화 테스트
- 3.7.2 메트릭 품질 보증(QA) 사례 연구
- 3.7.3 메트릭이 있는 계정 수 확인
- 3.8 이벤트 QA
- 3.8.1 시간 경과에 따른 이벤트 변화 확인
- 3.8.2 계정당 이벤트 확인
- 3.9 행동 측정을 위한 측정 기간 선택
- 3.10 계정 유지기간 측정
- 3.10.1 계정 유지기간 정의
- 3.10.2 계정 유지기간의 재귀적 테이블 표현식
- 3.10.3 계정 유지기간 SQL 프로그램
- 3.11 MRR 및 기타 구독 메트릭 측정하기
- 3.11.1 메트릭으로서 MRR 계산하기
- 3.11.2 특정 금액의 구독
- 3.11.3 구독 단위 수량을 메트릭으로 계산하기
- 3.11.4 메트릭으로서의 청구 기간 계산하기
- 요약
- 4장 갱신 및 이탈 관찰
- 4.1 데이터셋 소개
- 4.2 고객 관찰 방법
- 4.2.1 관찰 리드 타임
- 4.2.2 갱신과 이탈의 시퀀스 관찰
- 4.2.3 구독 데이터셋 생성 개요
- 4.3 구독에서 활성 기간 식별하기
- 4.3.1 활성 기간
- 4.3.2 활성 기간 저장 스키마
- 4.3.3 진행 중인 활성 기간 찾기
- 4.3.4 이탈로 끝나는 활성 기간 찾기
- 4.4 비구독 제품의 활성 기간 확인
- 4.4.1 활성 기간 정의
- 4.4.2 이벤트에서 데이터셋을 형성하는 프로세스
- 4.4.3 활동 주 계산을 위한 SQL
- 4.5 관찰 날짜 선택
- 4.5.1 이탈과 비이탈 관찰의 균형 맞추기
- 4.5.2 관찰 날짜 선택 알고리듬
- 4.5.3 관찰 날짜 SQL 프로그램
- 4.6 이탈 데이터셋 내보내기
- 4.6.1 데이터셋 생성 SQL 프로그램
- 4.7 세분화를 위해 현재 고객 내보내기
- 4.7.1 활성 계정 및 메트릭 선택하기
- 4.7.2 메트릭 기반의 고객 세분화
- 요약
- 2부 전쟁 개시
- 5장 메트릭을 통해 이탈 및 행동 이해하기
- 5.1 메트릭 코호트 분석
- 5.1.1 코호트 분석의 기본 개념
- 5.1.2 파이썬 코호트 분석
- 5.1.3 제품 사용 코호트
- 5.1.4 계정 유지기간 코호트
- 5.1.5 청구 기간에 대한 코호트 분석
- 5.1.6 코호트의 최소 크기
- 5.1.7 유의미한 코호트와 그렇지 않은 코호트의 차이
- 5.1.8 대다수의 고객 메트릭이 0인 메트릭 코호트
- 5.1.9 인과관계: 메트릭이 이탈의 원인인가?
- 5.2 고객 행동 요약
- 5.2.1 메트릭의 분포 이해하기
- 5.2.2 파이썬으로 데이터셋의 요약 통계 계산하기
- 5.2.3 희귀 메트릭 제외하기
- 5.2.4 데이터 품질 보증에 비즈니스 담당자 참여시키기
- 5.3 메트릭 점수화
- 5.3.1 메트릭 점수의 기본 개념
- 5.3.2 메트릭 점수 알고리듬
- 5.3.3 파이썬으로 메트릭 점수 계산하기
- 5.3.4 점수 메트릭을 사용한 코호트 분석
- 5.3.5 월간 반복 수익에 대한 코호트 분석
- 5.4 원치 않거나 유효하지 않은 관찰 삭제하기
- 5.4.1 이탈 분석에서 미결제 고객 제거하기
- 5.4.2 파이썬에서 메트릭 임곗값을 기준으로 관찰값 제거하기
- 5.4.3 희귀 메트릭 분석에서 0인 측정값 제거하기
- 5.4.4 이탈 행동: 이탈률 증가와 관련된 메트릭
- 5.5 코호트 분석을 통한 고객 세분화
- 5.5.1 세분화 프로세스
- 5.5.2 세그먼트 기준 선택하기
- 요약
- 6장 고객 행동 간의 관계
- 6.1 행동 간의 상관관계
- 6.1.1 메트릭 쌍 간의 상관관계
- 6.1.2 파이썬으로 상관관계 조사하기
- 6.1.3 상관 행렬을 사용해 메트릭 집합 간의 상관관계 이해하기
- 6.1.4 사례 연구의 상관 행렬
- 6.1.5 파이썬에서 상관 행렬 계산하기
- 6.2 행동 메트릭 그룹의 평균 내기
- 6.2.1 상관관계가 있는 메트릭 점수를 평균 내는 이유
- 6.2.2 가중치 행렬을 사용해 점수를 평균 내기(적재 행렬)
- 6.2.3 적재 행렬 사례 연구
- 6.2.4 파이썬에서 적재 행렬 적용하기
- 6.2.5 메트릭 그룹 평균 점수에 대한 이탈 코호트 분석
- 6.3 상호 연관된 메트릭 그룹 발견하기
- 6.3.1 상관관계를 군집화하여 메트릭 그룹화하기
- 6.3.2 파이썬에서 상관관계 군집화하기
- 6.3.3 점수 평균을 점수로 만드는 적재 행렬 가중치
- 6.3.4 메트릭 그룹화 및 그룹화된 코호트 분석 코드 실행하기
- 6.3.5 군집화를 위한 상관관계 임곗값 선택하기
- 6.4 비즈니스 담당자에게 상호 연관된 메트릭 그룹 설명하기
- 요약
- 7장 고급 메트릭으로 고객 세그먼트화하기
- 7.1 비율 메트릭
- 7.1.1 비율 메트릭을 사용해야 하는 경우와 그 이유
- 7.1.2 비율 메트릭을 계산하는 방법
- 7.1.3 비율 메트릭 사례 연구 예시
- 7.1.4 시뮬레이션된 소셜 네트워크에 대한 추가 비율 메트릭
- 7.2 합계 메트릭의 비율
- 7.2.1 합계 메트릭의 백분율 계산하기
- 7.2.2 두 메트릭에 대한 합계 메트릭의 백분율 사례 연구
- 7.2.3 여러 메트릭에 대한 합계 메트릭의 백분율 사례 연구
- 7.3 변화를 측정하는 메트릭
- 7.3.1 활동 수준 변화 측정하기
- 7.3.2 극단적인 이상값(팻 테일)이 있는 메트릭의 점수
- 7.3.3 마지막 활동 이후 시간 측정하기
- 7.4 메트릭 기간 조정하기
- 7.4.1 긴 메트릭을 짧은 기간으로 조정하기
- 7.4.2 새 계정에 대한 메트릭 추정하기
- 7.5 사용자 메트릭
- 7.5.1 활성 사용자 측정
- 7.5.2 활성 사용자 메트릭
- 7.6 어떤 비율을 쓸 것인가?
- 7.6.1 왜 비율을 사용하며, 그 외에는 무엇이 있는가?
- 7.6.2 어떤 비율을 쓸 것인가?
- 요약
- 3부 특수 무기와 전술
- 8장 이탈 예측
- 8.1 모델을 사용해 이탈 예측하기
- 8.1.1 모델을 사용한 확률 예측
- 8.1.2 인게이지먼트 및 리텐션 확률
- 8.1.3 인게이지먼트 및 고객 행동
- 8.1.4 관찰된 이탈률과 S 곡선을 일치시키는 오프셋
- 8.1.5 로지스틱 회귀 확률 계산
- 8.2 데이터 준비 검토
- 8.3 이탈 모델 피팅하기
- 8.3.1 로지스틱 회귀 분석 결과
- 8.3.2 로지스틱 회귀 코드
- 8.3.3 로지스틱 회귀 결과 설명하기
- 8.3.4 로지스틱 회귀 사례 연구
- 8.3.5 보정 및 과거 이탈 확률
- 8.4 이탈 확률 예측하기
- 8.4.1 예측을 위한 현재 고객 데이터셋 준비하기
- 8.4.2 세그먼트화를 위한 현재 고객 데이터 준비하기
- 8.4.3 저장된 모델을 사용해 예측하기
- 8.4.4 예측 사례 연구
- 8.4.5 예측 보정 및 예측 추이
- 8.5 이탈 예측의 함정
- 8.5.1 상관 메트릭
- 8.5.2 이상값
- 8.6 고객 생애 가치
- 8.6.1 CLV의 의미
- 8.6.2 이탈에서 기대 고객 생애까지
- 8.6.3 CLV 공식
- 요약
- 9장 예측 정확도와 머신러닝
- 9.1 이탈 예측의 정확도 측정하기
- 9.1.1 이탈에 표준 정확도 측정을 사용하지 않는 이유
- 9.1.2 AUC로 이탈 예측 정확도 측정하기
- 9.1.3 향상도를 통한 이탈 예측 정확도 측정
- 9.2 과거 정확도 시뮬레이션: 백테스트
- 9.2.1 백테스트의 목적과 이유
- 9.2.2 백테스트 코드
- 9.2.3 백테스트 고려사항 및 위험 요소
- 9.3 회귀 제어 매개변수
- 9.3.1 회귀 가중치의 강도와 개수 제어하기
- 9.3.2 제어 매개변수를 사용한 회귀 분석
- 9.4 테스트를 통한 회귀 매개변수 선택(교차 검증)
- 9.4.1 교차 검증
- 9.4.2 교차 검증 코드
- 9.4.3 회귀 교차 검증 사례 연구
- 9.5 머신러닝을 통한 이탈 위험 예측
- 9.5.1 XGBoost 학습 모델
- 9.5.2 XGBoost 교차 검증
- 9.5.3 XGBoost와 회귀의 정확도 비교
- 9.5.4 고급 메트릭과 기본 메트릭 비교
- 9.6 머신러닝 예측을 통한 고객 세그먼트화
- 요약
- 10장 이탈 인구통계 및 기업통계
- 10.1 인구통계 및 기업통계 데이터셋
- 10.1.1 인구통계 및 기업통계 데이터의 유형
- 10.1.2 소셜 네트워크 시뮬레이션을 위한 계정 데이터 모델
- 10.1.3 인구통계 데이터셋 SQL
- 10.2 인구통계 및 기업통계 카테고리의 이탈 코호트
- 10.2.1 인구통계 카테고리에 대한 이탈률 코호트
- 10.2.2 이탈률 신뢰 구간
- 10.2.3 신뢰 구간으로 인구통계 코호트 비교하기
- 10.3 인구통계 카테고리 그룹화하기
- 10.3.1 매핑 딕셔너리로 그룹 대표하기
- 10.3.2 그룹화된 카테고리를 사용한 코호트 분석
- 10.3.3 카테고리 그룹 디자인하기
- 10.4 날짜 및 숫자 기반 인구통계에 대한 이탈 분석
- 10.5 인구통계 데이터를 통한 이탈 예측
- 10.5.1 텍스트 필드를 더미 변수로 변환하기
- 10.5.2 범주형 더미 변수만으로 이탈 예측하기
- 10.5.3 더미 변수를 숫자 데이터와 결합하기
- 10.5.4 인구통계와 메트릭을 결합하여 이탈 예측하기
- 10.6 인구통계 데이터로 현재 고객 세그먼트화하기
- 요약
- 11장 이탈과의 싸움을 주도하기
- 11.1 이탈과 싸우기 위한 계획 세우기
- 11.1.1 데이터 처리 및 분석 체크리스트
- 11.1.2 비즈니스 체크리스트에 대한 커뮤니케이션
- 11.2 자신의 데이터로 책의 코드 실행하기
- 11.2.1 이 책의 데이터 스키마로 데이터 불러오기
- 11.2.2 자신의 데이터로 코드 실행하기
- 11.3 이 책의 코드를 다른 환경으로 이식하기
- 11.3.1 SQL 코드 이식하기
- 11.3.2 파이썬 코드 이식하기
- 11.4 추가 학습 및 연락하기
- 11.4.1 저자의 블로그 사이트와 소셜 미디어
- 11.4.2 이탈 벤치마크 정보 자료
- 11.4.3 이탈에 대한 기타 정보 자료
- 11.4.4 이탈에 도움이 되는 제품
- 요약
- 찾아보기