본문 바로가기

데이터과학

RFM 분석

RFM은 가치있는 고객을 추출해내어 이를 기준으로 고객을 분류할 수 있는 매우 간단하면서도 유용하게 사용될 수 있는 방법으로 알려져 있어 마케팅에서 가장 많이 사용되고 있는 분석방법 중 하나이다. RFM은 구매 가능성이 높은 고객을 선정하기 위한 데이터 분석방법으로서, 분석과정을 통해 데이터는 의미있는 정보로 전환된다.

RFM은 Recency, Frequency, Monetary의 약자로 고객의 가치를 다음의 세 가지 기준에 의해 계산하고 있다.

· Recency - 거래의 최근성: 고객이 얼마나 최근에 구입했는가?

· Frequency - 거래빈도: 고객이 얼마나 빈번하게 우리 상품을 구입했나?

· Monetary - 거래규모: 고객이 구입했던 총 금액은 어느 정도인가?

모형

· Scoring 기법: RFM의 요인을 각각 5등급으로 등간격으로 분류하는 방법이다.

현재 개발된 RFM 모형은 크게 4가지로 분류 할 수 있다. 이 문서의 내용들은 정설이 아니며 신뢰하기 어려움을 전제로 참고해야한다.

· 모델1. RFM 각 요소의 20% rule의 적용

· 모델2. 비율 척도에 의한 양적인 정도의 차이에 따른 등간격의 5등급 분류

· 모델3. 상하 20%를 제외한 등간격 척도에 의한 그룹 분류

· 모델4. 군집 분석에 의한 각 요소 별 5개의 그룹 분류

Data Mining 기법을 이용한 모형

회귀분석

· 선형 회귀 분석을 이용한 모형: 고객의 구매 최근성, 구매 빈도, 구매 금액 등 고객의 수익 기여도를 나타내는 세가지 지표들의 선형결합으로 세가지 지표들을 점수화 한다.

· 다중 회귀 분석을 이용한 모형: 각 고객의 구매 행동을 나타내는 R,F,M의 변수들을 독립변수로하고 고객의 미래 구매 행동을 예측하는 기법.

· 신경망을 적용한 모형: 로지스틱 회귀 모형을 보완하는 차원에서 연구.

· 확률적 RFM모형:Colombo와 Weina의 확률적인 RFM모형은 과거의 고객의 응답 이력으로 고객의 미래 응답을 예측하는 행동모델이다.

RFM은 수입의 80%는 20%의 고객으로부터 기인한다는 파레토법칙에 기반을 두고 있다.

파레토 법칙(Pareto principle, law of the vital few, principle of factor sparsity) 또는 80 대 20 법칙은 '전체 결과의 80%가 전체 원인의 20%에서 일어나는 현상'을 가리킨다. 예를 들어, 20%의 고객이 백화점 전체 매출의 80%에 해당하는 만큼 쇼핑하는 현상을 설명할 때 이 용어를 사용한다. 2 대 8 법칙라고도 한다.

● 통화한 사람 중 20%와의 통화시간이 총 통화시간의 80%를 차지한다.

● 즐겨 입는 옷의 80%는 옷장에 걸린 옷의 20%에 불과하다.

● 전체 주가상승률의 80%는 상승기간의 20%의 기간에서 발생한다.

● 20%의 운전자가 전체 교통위반의 80% 정도를 차지한다.

● 20%의 범죄자가 80%의 범죄를 저지른다.

● 성과의 80%는 근무시간 중 집중력을 발휘한 20%의 시간에 이뤄진다.

● 두뇌의 20%가 문제의 80%를 푼다. 우수한 20%의 인재가 80%의 문제를 해결한다. 혹은 뇌의 20프로만 사용하여 문제 해결에 필요한 80%를 해결한다

● 운동선수 중 20%가 전체 상금 80%를 싹쓸이한다.

● 인터넷 유저의 20%가 80%의 양질의 정보를 생산한다.

롱테일 현상은 파레토 법칙을 그래프에 나타냈을 때 꼬리처럼 긴 부분을 형성하는 80%의 부분을 일컫는다. 파레토 법칙에 의한 80:20의 집중현상을 나타내는 그래프에서는 발생확률 혹은 발생량이 상대적으로 적은 부분이 무시되는 경향이 있었다. 그러나 인터넷과 새로운 물류기술의 발달로 인해 이 부분도 경제적으로 의미가 있을 수 있게 되었는데 이를 롱테일이라고 한다. 이는 기하급수적으로 줄어들며 양의 X축으로 길게 뻗어나가는 그래프의 모습에서 나온 말이다. 2004년 와이어드지 20월호에 크리스 앤더슨(Chris Anderson)에 의해 처음으로 소개되었으며 이후 책으로 나와 베스트 셀러가 되었다. 이러한 분포를 보여주는 통계학적 예로는 부의 분포, 단어의 사용빈도 등이 있으며 크리스 앤더슨에 의해 소개된 롱테일부분을 경제적으로 잘 활용한 사례로는 아마존의 다양한 서적 판매 사례 등이 있다. 롱테일 마케팅(long tail marketing)은 인터넷을 통해 수요가 매우 낮을 것 같은 잠재적인 고객들을 저 비용으로 찾아 마케팅 하는 것을 말한다. 수요가 낮을 것 같은 고객들을 대상으로 한다는 특징이 있다. 인터넷을 이용해 잠재 고객을 찾는데 비용이 많이 들지 않는다.

RFD분석의 변형

RFD – Recency, Frequency, Duration은 시청률 / 독자 / 웹서핑 지향 비즈니스 제품의 소비자 행동을 분석하는 데 사용할 수있는 RFM 분석의 수정된 버전입니다. (예 : Wikipedia에서 웹 서퍼가 보낸 시간)

RFE – 최근성, 빈도, 참여(Engagement)는 RFD 분석의 보다 광범위한 버전으로, 방문 기간, 방문당 페이지 또는 기타 이러한 메트릭을 포함하도록 참여를 정의 할 수 있습니다. 참여(Engagement)는 웹접속기간, 웹접속 당 웹페이지수 등 다양하게 사용된다.

RFM-I – 최근성, 빈도, 금전적 가치 – 상호 작용은 고객과의 마케팅 상호 ​​작용의 최신 성과 빈도를 설명하기 위해 수정 된 RFM 프레임 워크 버전입니다 (예 : 매우 빈번한 광고 참여의 가능한 억제 효과를 제어하기 위해).

RFMTC – 최근성, 빈도, 금전적 가치, 시간, 이탈률 - I-Cheng 등이 제안한 증강 RFM 모델. (2009). 이 모델은 확률 이론에서 Bernoulli 시퀀스를 활용하고 다음 판촉 또는 마케팅 캠페인에서 고객이 구매할 확률을 계산하는 공식을 생성합니다. 모델은 수혈 및 CDNOW 데이터 세트와 같은 데이터 세트를 위해 Alexandros Ioannidis에 의해 구현되었습니다.

(출처 : 위키백과)