preloader

Kupuj, dopóki nie padniesz

To, wbrew pierwszym skojarzeniom po lekturze 4 słów tytułu, nie jest felieton pastwiący się nad rozdętym konsumpcjonizmem charakterystycznym dla pierwszych dwóch dekad XXI wieku. To krótki tekst z pogranicza statystyki i marketingu o tym, kiedy rozpoczęto modelowanie transakcji klientów i jak z tych poszukiwań powstało jedno z ciekawszych rozszerzeń pakietu statystycznego R.

Dobrym wstępem do rozważań o modelowaniu zachowań klienta jest zrozumienie dwóch wymiarów, które opisują relacje klient-organizacja.    

(“Probability Models for Customer-Base Analysis”, Peter S. Fader, 2009)

   

Pierwszym z nich jest kontrakt, czyli formalne zobowiązanie do korzystania z usług danej firmy, które odnawia się (lub nie) co pewien określony czas. Relacje dzielimy więc na kontraktowe i nie związane kontraktem. Druga perspektywa to szanse na transakcje (opportunities for transactions). Są dobra i usługi, które moglibyśmy konsumować codziennie – podstawowe artykuły spożywcze, espresso w kawiarni za rogiem, wysłany sms, codzienna gazeta. Są jednak też takie, które kupujemy rzadziej, ponieważ ze swojej natury nie są dostępne każdego dnia. Aby nie szukać daleko, szansa na przekazanie 1% naszego podatku na organizację pożytku publicznego pojawia się dokładnie raz w roku, i chociaż byśmy bardzo chcieli – tylko raz na 365 dni możemy dokonać takiej “transakcji”.

Zdecydowanie trudniejszym analitycznie kawałkiem są relacje, których nie reguluje żadna umowa, ponieważ tam swoboda konsumenta (i związana z nią nieprzewidywalność) jest największa. Tę klasę problemów próbuje się zredukować do (tylko) dwóch (ale) nietrywalnych pytań:

1. Jakie jest prawdopodobieństwo tego, że Kowalski jest ciągle naszym klientem?
2. Jakie jest prawdopobobieństwo tego, że Kowalski pojawi się w naszym sklepie w nadchodzącym tygodniu/miesiącu?

Pierwsze próby rozwiązania tego problemu pojawiły się w późnych latach ’50 ubiegłego wieku, a ich autorem był Andrew Ehrenberg – pierwsza osoba w historii, w której biografii na wikipedii padają słowa “statistician and marketing scientist”. Jego praca “The Pattern of Consumer Purchases” opublikowana w Journal of the Royal Statistical Society w maju 1959 była pierwszą próbą przybliżenia częstotliwości zakupów znanym rozkładem. Ehrenberg przekonywał, że to Rozkład Pascala (negative binominal distribution) pozwoli znaleźć odpowiedź na 2 wspomniane pytania. Na bazie jego rozważań, w latach ’80 i ’90 powstały konkurencyjne podejścia, które postulowały, że odpowiedzi na dwa pytania wymagają jednak dwóch rożnych rozkładów. W efekcie powstały 3 grupy modeli, którymi można przybliżać empiryczne dane o transakcjach pojedynczych klientów.

 
(“Database Marketing” Blattberg, Kim & Neslin (2008) Springer (International Series in Quantitative Marketing)

Właśnie te trzy grupy modeli zostały umieszczone w pakiecie “BTYD – buy ’til you die“, którego pierwsza wersja ukazała się w 2012, a najbardziej rozległa aktualizacja pochodzi z listopada ubiegłego roku. Nazwa pakietu jest grą słów, rymowaną parafrazą amerykańskiego “shop till you drop’, która oznacza dokładnie to samo – “kupuj do upadłego”. Pakiet zawiera funkcje, które budują prosty log transakcji, wyznaczają paramatery rozkładów, a także pozwalają estymować parametry dla każdego klienta. Możemy więc każdemu klientowi np. raz w tygodniu wyliczyć prawdopodobieństwo tego, czy wciąż jest naszym klientem oraz czy w ciągu najbliższych 7 dni pojawi się u nas w sieci.

O wykorzystaniu tych danych na poziomie oprogramowania do zarządzania kampaniami trzeba napisać osobny tekst, ale intuicyjnie wiadomo, że osoby, których prawdopodobieństwo pojawienia się w sklepie wynosi 0,85 nie potrzebują tak silnej zachęty jak Ci, dla których ten parametr nie przekracza 0,45. Z drugiej strony, jeżeli mamy ograniczony budżet komunikacyjny i musimy zwiększyć liczbę odwiedzających nasz sklep, ten sam parametr pozwoli nam odnaleźć w bazie tych, którzy z największym prawdopodobieństwem odpowiedzą na nasze zaproszenie do sklepu. Drugi z estymowanych parametrów – prawdopodobieństwo tego, że ktoś nadal jest naszym klientem – może być wyzwalaczem do kampanii reaktywacyjnych. Wystarczy prosta reguła biznesowa, że jego spadek poniżej 0,7 spowoduje automatyczną wysyłkę bonu rabatowego, by zbudować podstawowy proces zapobiegający churnowi. Na podstawie danych historycznych BTYD wyznacza także oczekiwaną liczbę transakcji dla każdego noowopozyskanego klienta. To szczególnie ważne w kontekście rozważań na temat wysokości inwestycji w rozwój bazy. A wszystko to za pomocą kilku prostych komend, przez które za rękę prowadzi “Buy ’Til You Die – Walkthrough“.