보유를 통한 고객 평생 가치 — Python, Pandas 및 Numpy

구독 기반 예

Unsplash에 Efe Kurnaz의 사진

이를 고객 평생 가치에 대한 입문서로 고려하십시오.이 세 부분은 이해하기가 매우 쉽고 LTV에 대한 좋은 소개를 제공합니다. Part 1 에서는 논리적 인 부분을 살펴 봤으니 관심이 있으시면 가서 확인해보세요! (작은) Part 2 에서는 코호트 유지가 고객의 평균 가중 수명에 어떻게 추가되는지에 대한 예를 보여주었습니다. 그리고 여기 Part 3에서는 고객 LTV를 추정하기 위해 사용하고 개선 할 수있는 Python 청사진 코드를 추가했습니다.

부품 및 내용

1 부 : 코호트 유지, CLV 또는 LTV를 통한 고객 평생 가치 추정

2 부 : 가중 코호트 수명, 코호트 유지의 합계, 증거가 아니라 실험

3 부 : 보유를 통한 고객 평생 가치 — Python, Pandas 및 Numpy

여기서 시작하기 전에 LTV는 재정적 측정이 아니라 단순한 추정치이지만 단순한 추측보다 훨씬 더 나은 근사치를 허용한다는 점을 다시 한 번 강조하고 싶습니다. 가장 중요한 LTV 사용 중 하나는 지출에 대한 합리적인 한도를 설정할 수 있기 때문에 고객 확보 비용에 대한 벤치 마크입니다.

목적

시리즈의 목적은 과거 추세의 외삽을 사용하여 고객 평생 가치를 추정 할 수있는 간단한 기술을 자세히 설명하는 것입니다. Python에서는 Pandas 및 NumPy를 사용하여 수행 할 수 있습니다. 거의 쉬워지지 않습니다. 따라서이 게시물에서는 개별 LTV 예측을 포함하는 고급 기술을 파헤 치지 않을 것입니다. 이에 대해 별도의 블로그 게시물을 작성할 생각입니다. 마지막으로, 하단에 나열된 몇 가지 추가 기능 개선 사항을 고려하고 싶을 것입니다.

데이터 세트 및 가정

이 게시물에서는 더미 월간 구독 데이터를 생성 할 것입니다. 우리는해야합니다 고객 ID , 가입 날짜 , 성숙을 취소 가입까지하거나 현재 날짜 및 평균까지 가입 값 .

이 글에서는 34 개월 분량의 데이터를 생성하겠습니다. 이 정도의 데이터가 없다면 코호트 행동과 평생에 대해 더 많은 가정을해야합니다. 유지 곡선을 매핑하고 감쇠율을 사용하는 것이 이러한 목적에 도움이 될 수 있습니다.

Python 구현

더미 데이터

전반적으로 시리즈의 Part I에 제시된 논리를 따를 것입니다. 1) 코호트 매트릭스를 얻습니다. 2) 한계 보유율 확보 3) 한계 유지율을 외삽한다. 4) (3)을 사용하여 (1)을 외삽하십시오. 코호트 별 예상 수명은 행별 포인트 (4)의 합계입니다.

시작하려면 구독 용 데이터 세트가 필요합니다. 코호트를 위한 더미 데이터 생성 및 시각화에 대한 좋은 아이디어가 있는 Python 블로그 게시물로 코호트 분석 에서 몇 가지 기술을 선택했습니다 .

다음은 생성하는 데 사용할 몇 가지 도우미 함수입니다. a) 고객 목록 b) 구독 날짜, 구독의 만기 및 가치 c) a와 b를 하나의 데이터 프레임으로 가져옵니다.

고객 이름에 대한 도우미 기능, Fabian Bosler 및 그의 블로그 게시물 제공
무작위 구독 날짜 및 결과 데이터 프레임에 대한 도우미 기능

모두 합쳐지면 4000 개의 행이있는 랜덤 데이터 프레임은 다음과 같습니다. 마지막 열은 동질 집단에 해당하는 구독 날짜의 월초입니다.

코호트 유지

코호트 유지는 획득 한 고객의 성숙도 T에 도달 한 비율입니다.이 경우 성숙도는 구독이 취소 될 때까지의 시간 또는 — 구독이 현재 날짜까지 활성 상태 인 경우 구독 시작일과 오늘 사이의 시간입니다.

유용한 기능은 보존을 위해 히트 맵을 그리는 것입니다.

데이터에서 도달하는 방법 중 하나는 2 단계입니다. 1) 위의 데이터 프레임을 피벗하여 성숙도에 도달 한 코호트 고객 수를 얻습니다. 2) T + 1에서 T까지 모든 고객을 더합니다. T + 1에서 활성은 T에서 활성이었습니다.

집단 데이터 피봇
구독자 수 롤백

활성 구독자 수를 코호트 크기로 나누면 마지막으로 각 값이 [0,1] 사이 인 삼각형 유지 매트릭스에 도달합니다. 아래의 유지 매트릭스를 기반으로 평균 수명 및 평생 가치에 대한 가정을 이미 만들 수 있으며 이는 마케팅 캠페인에서 고객 그룹을 선택하는 데 유용 할 수 있습니다.

위에서 만든 히트 맵 플로팅 기능을 적용하여 코호트가 34 개월 동안 유지하는 방식을 살펴볼 수 있습니다.

코호트 유지를있는 그대로 아래에서 추정 한 버전을보고 비교할 수 있습니다.

한계 보유

한계 유지율은 약간 다릅니다. T + 1 열마다 T ≠ 1이고이를 T로 나눕니다. 결과적으로 다음 달에 다시 구독 한 전월 구독자 비율을 얻습니다.

행렬을 외삽하기 위해 이전 N 개 행의 평균을 취합니다.

한계 유지율이 매트릭스에서 평균화되고 외삽되는 방식을 볼 수 있습니다. 한계 유지율의 변화가 예상되는 경우 조정을위한 좋은시기입니다.

한계 코호트 유지 추정

모든 것을 하나로 통합

외삽 된 한계 유지율 및 코호트 유지 매트릭스가 준비되면 코호트에 대한 유지 매트릭스를 외삽 할 수 있습니다.

히트 맵에서 코호트 유지가 어떻게 추정되는지 확인할 수 있습니다.

코호트 유지 추정

평생과 가치

코호트에서 평균 고객의 수명 또는 평균 코호트 수명은 성숙기에 걸친 유지 비율의 합계입니다.

추가 개선

분명히이 방법은 코호트의 평균 수명과 가치를 제공하므로이 획득 시간에 사용 된 CAC와 비교할 수 있습니다. 획득 시간에 맞게 조정 된 LTV "평균 이상"으로 목표를 설정하려는 경우에도 유용 할 수 있습니다. 그러나 특정 개별 고객의 LTV를 예측하려는 상황이있을 수 있습니다 . 이를 위해 나중에 다룰 예측 모델링을 사용할 수 있습니다 .

또 다른 개선점은 구독 가치에 운영 마진 을 추가하는 것 입니다. 고객 획득 비용과 더 나은 비교 기반을 제공합니다. 차이는 고객이 유치되고 첫 주문이 배송되면 비즈니스에 얼마나 남았는지 알려줍니다.

의 개념을 잘 알고있는 이러한 우리의 사람을위한 할인 금융 ( DEF .에서 Investopedia :. 지불의 현재 가치 또는 미래에 수신하는 지불의 흐름을 결정하는 과정) -이 될 수 있습니다 귀하의 견적에 포함됩니다.

고려할 수있는 또 다른 개선 사항은 비즈니스의 계절 성과 수행중인 외삽에서 고려하는 것입니다. 히트 맵을 보면 계절성을 알 수 있습니다. 패턴은 매우 분명하고 대각선을 형성 할 가능성이 높습니다.

계절 성과 유사하게, 기본 지식을 기반으로 도입하고 싶은 코호트 또는 한계 유지에 대한 조정이 있을 수 있습니다 . 예를 들어 유지율에 영향을 미치거나 참여도를 높이기 위해 캠페인을 실행하는 경우 계산에 변화율을 포함 할 수 있습니다. A Spreadsheet for Calculating Subscription Lifetime Value 에서 영감을 얻을 수 있습니다 . 이것은 정말 깔끔한 블로그 게시물입니다. 스프레드 시트가 있습니다.

당신이 알아 차렸을지도 모르지만, N 개의 값을 사용할 수있는 경우, 코드는 N의 윈도우로 단순 롤링 평균을 취합니다. 코호트 크기 가중치는 가중 평균에 사용할 수 있습니다 .

마지막으로, 코호트 및 주변 행렬의 절반이 코드에서 요소별로 채워져 있기 때문에 더 큰 행렬 에서 계산이 느리게 실행될 수 있으므로 개선의 여지가 있습니다.

마지막으로 복사에 관심이있는 분들을 위해 Colab 노트북을 공유합니다. https://colab.research.google.com/drive/1Viht58-NSW-IdjBP1ksbrX7_q4DSN5h3?usp=sharing

저와 연결하고 싶다면 LinkedIn과 Twitter에서 저를 찾을 수 있습니다.

https://www.linkedin.com/in/areusova/
https://twitter.com/khunreus

잘있어!

Suggested posts

양자 컴퓨팅 Pt를위한 프로그래밍. 1 : NumPy

이제 양자 컴퓨팅이면의 물리학을 배우기 시작 했으므로 "이봐, 실제로 양자 컴퓨터를 사용하려면 실제로 양자 장치를 손으로 만들어야합니까?"라고 궁금해 할 것입니다. 답은 양자 컴퓨터를 컴퓨터라고 부르는 이유가 있습니다. 프로그래밍이 가능합니다! 이 시리즈에서는 수학 개념을 시뮬레이션하고 양자 컴퓨터에서 실행하는 소프트웨어를 구축하는 방법을 배우게됩니다. 깨끗하고 현대적이며 라이브러리가 풍부한 언어이기 때문에 Python을 사용하여 코드를 작성할 것입니다.

IBM Watson Studio의 AutoAI 노트북으로 마술사 코드 깨기

IBM Watson Studio의 AutoAI 노트북으로 마술사 코드 깨기

가장 유명한 행동 강령 중 하나입니다. "마술사는 절대 비밀을 밝히지 않습니다." 그러나 청중이 너무나 놀라워 서 '방금 일어난 일'이라는 느낌에 놀라서 비밀을 밝히지 않는 것이 거의 잔인한 순간이 있습니다.

Related posts

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

고유 분해 및 SVD에 유용한 기저의 선형 대수 개념 이해이 기사에서는 고유 분해 또는 특이 값 분해 (SVD)와 같은 행렬 분해 방법을 이해하는 흥미로운 방법 인 기저 개념에 대해 알아 봅니다. 정의 기본은 벡터 공간 (벡터 집합)을 설명하는 데 사용되는 좌표계입니다.

판다와 에라스무스 연구 교환 분석

판다와 에라스무스 연구 교환 분석

Erasmus 프로그램 2011-12에서 발생한 20 만 개의 연구 교환으로 데이터 세트를 분석 한 결과 1987 년 이후 Erasmus 프로그램은 매년 수십만 명의 유럽 학생들에게 한 학기 또는 1 년을 해외에서 보낼 기회를 다른 유럽에서 보낼 수있는 기회를 제공합니다. 경제적 인 지원뿐만 아니라 쉬운 교환 과정을 제공합니다. 유럽의 다양한 사람, 언어 및 문화에 대한 마음과 마음을 열어주는 정말 귀중한 경험입니다.

데이터 과학을위한 8 가지 기본 통계 개념

… 평범한 영어로 설명

데이터 과학을위한 8 가지 기본 통계 개념

통계는 "수량 데이터의 수집, 분석, 해석 및 표현을 다루는 수학의 한 분야"입니다. 프로그래밍과 기계 학습을 혼합하면 데이터 과학의 핵심 기술에 대해 꽤 잘 설명 할 수 있습니다.

데이터 과학의 9 가지 거리 측정

일반적인 거리 측정의 장점과 함정

데이터 과학의 9 가지 거리 측정

감독되거나 감독되지 않는 많은 알고리즘은 거리 측정을 사용합니다. 유클리드 거리 또는 코사인 유사성과 같은 이러한 측정은 종종 k-NN, UMAP, HDBSCAN 등과 같은 알고리즘에서 찾을 수 있습니다.