Pornografia danych i przepowiednie
Lech C. Król
Marketing w Praktyce nr 3 / 2016 / Narzędzia z tematu numeru: Human to human marketing / artykuł z wydania drukowanego
Na przestrzeni wieku niezliczone pokolenia pracowników kreacji, strategów, prezesów, dyrektorów sprzedaży, specjalistów do spraw marek, badaczy i tym podobnych wymyślało koncepty, plany, reklamy, spierając się ze sobą, czego nie robić i co robić i jak to robić. Ostatnio do tej urokliwej dyskusji włączył się nowy, nad wyraz aktywny uczestnik – komputer.
Słynne powiedzenie „Jeśli nie potrafisz tego zmierzyć, nie potrafisz tym zarządzać” doskonale oddaje tendencje biznesowe współczesnego świata. Niezliczone ilości KPI, wskaźników efektywności, zapełniają strony firmowych prezentacji, dowodząc lub zaprzeczając sensowności podejmowanych decyzji. Idea stojąca u podstaw tego podejścia jest prosta – wpływ wybranych zmiennych na osiągane wskaźniki pozwala w prosty sposób ustalić, które z działań przekładają się na pozytywne rezultaty, dając przesłanki do dalszych optymalizacji.
Kilka dekad temu, praktyczne zastosowanie tego konceptu było niewykonalne, ponieważ życie rzadko kieruje się prostymi relacjami. Jednak rosnąca wykładniczo moc obliczeniowa komputerów przyszła biznesowi z pomocą. Systemy takie z nadludzką prędkością i dokładnością przeprowadzają wielowymiarowe statystki i analizy. Z łatwością wykryją, że wielkość sprzedaży piwa zależy nie tylko od temperatury, ale także dnia tygodnia – weekendy, oraz miesiąca – okresy wakacyjne i wyjazdowe.
Tak stworzony algorytm z łatwością zoptymalizuje budżet kampanii mediowej, intensyfikując wydatki w czasie wzmożonego popytu, a zmniejszając je, gdy konsumenci chętniej sięgają po inne napoje. Niestety, podejście takie ma kilka poważnych mankamentów.
Błędne korelacje wciągają
Przyjmijmy, że analiza danych wykazała powiązanie pełni księżyca ze wzrostem sprzedaży wina. Natura ludzkiej psychiki – narrative fallacy – sprawi, że z łatwością stworzymy sobie logiczną teorię wyjaśniającą istnienie udowodnionego statystycznie zjawiska: wino kojarzy się z romantycznymi spotkaniami, a te w srebrnym blasku księżyca są jeszcze bardziej romantycznie.
Uspokojeni taką logiką możemy zwiększymy liczbę reklam emitowanych w czasie pełni, powodując – jakże inaczej – wzrost wartości sprzedaży wina właśnie w tym czasie. Nawet jeśli korelacja była zwykłym zbiegiem okoliczności. Sami wprowadziliśmy do systemu nową regułę; nawet jeśli takiej reguły dotychczas nie było.
Jeśli myślisz, że błędne korelacje są rzadkimi przypadkami, zachęcam do lektury, z której niezbicie wynika, że małżeństwa w Północnej Karolinie są silnie kryminogenne, a wielkość sprzedaży kwaśnej śmietany jest ściśle powiązana ze śmiertelnością motocyklistów.
Pozbawiona zrozumienia, komputerowa wyliczanka sprawia, że wierzymy w rzeczy absurdalne, podejmując działania, które potwierdzą nasze błędne rozumowania. Co gorsza, im dłużej ten stan trwa, tym ciężej nam rozstać się z przyjętym przekonaniem (reguła zaangażowania).
Niewiedza mami i samouspokaja
Drugi, poważny problem polega na tym, że czasem nie wiemy, czego nie wiemy. Z analogiczną łatwością pomijamy zmienne istotne dla danego zagadnienia, jak tworzymy nonsensowne powiązania pomiędzy nieskorelowanymi zdarzeniami.
Zjawisko to doskonale obrazują tak zwane testy A/B, pozwalające – w teorii – porównać efektywność dwóch lub więcej wersji reklam. Testy te, w swoim założeniu, mają położyć kres pytaniom typu „czy ten pomysł jest lepszy od tamtego” – w praktyce najczęściej pomagają zdecydować „czerwony czy zielony”, „logo tu, czy tam” albo „kup teraz” kontra „zamów teraz”.
Istnieje wiele problemów z przygotowaniem i prowadzeniem testów A/B, jednak najczęstszym jest niewiarygodność uzyskanych statystyk. W przypadku testu dwóch wersji reklamy, z których jedna osiąga poziom konwersji w wysokości 5 proc., a druga 6 proc., wydaje się, że mamy oczywistego zwycięzcę. W praktyce czysty przypadek może sprawić, iż zbyt mała próbka pokaże nam całkowicie fałszywy obraz – aby osiągać 75 proc. pewności, musimy przeprowadzić 2750 testów – po 1375 każdej z reklam. Wymóg 99 proc. wymaga już 13 788 testów1. Przy kilku zmiennych liczba porównań rośnie wykładniczo – trzeba porównać wszystkie możliwe kombinacje, każda z każdą – i koszt samego testu może stać się niedorzecznie wysoki. Oczywiste zafałszowanie wynika z rozmiarów testu – który z definicji jest ograniczony. Dla komputera nie ma to znaczenia. Wypluje odpowiednie cyferki, pomimo iż będą one pozbawione sensu. Pomimo to wiele agencji – w szczególności typu performance – mami klientów pseudowynikami; o wiele łatwiej jest pokazać cyferki, niż przekonać junior brand managera, że nie jest najlepszym copywriterem na świecie.
Życzeniowe fałszowanie rzeczywistości
Inną klasą problemów jest sytuacja, gdy w efekcie prowadzonych przez nas działań konsumenci wpływają na siebie nawzajem. Jednym z pięknych przykładów takiego zjawiska są celebryci znani z tego, że… są znani. Przeprowadzono wiele eksperymentów badających zjawisko samospełniającej się przepowiedni.
„Samospełniająca się przepowiednia wynika z przyjęcia fałszywych założeń, które wywołują nowe zachowania, sprawiając, że oryginalnie fałszywe zachowanie staje się prawdą. Ta zwodnicza prawdziwość samospełniającego się proroctwa utrwala błędne założenia. Prorok będzie mógł przytoczyć prawdziwy przebieg wydarzeń jako dowód, że miał rację od samego początku2”.
Bez internetu trudno było stworzyć kontrolowane warunki umożliwiające weryfikację tej tezy, postawionej przez Roberta K. Mertona w 1948 roku. Dopiero eksperyment Matthew J. Salganika and Duncan J. Wattsa z 2005 roku udowodnił, iż percepcja popularności utworów muzycznych wpłynęła na uczestników testu, przemieniając najgorsze gnioty w przeboje. Co prawda najlepszym utworom udało się co nieco odrobić straty, nawet w tak zafałszowanym świecie, jednak bez wątpienia ludzie lubią to, co lubią inni ludzie.
Prawdopodobnie najciekawszym – a na pewno najpopularniejszym na świecie – przykładem takiego fałszowania rzeczywistości jest algorytm dobierania treści w serwisie Facebook. Pomijając szczegóły techniczne, Facebook wyświetla ci to, co lubisz… z małym zastrzeżeniem: trudno ci będzie polubić coś, czego nie widzisz, prawda?
W praktyce reklamowej oznacza to dwie rzeczy: z jednej strony systemy automatycznego dobierania treści mogą tworzyć samospełniające się przepowiednie, budując pozory fałszywej efektywności. Z drugiej, skoro fałsz staje się prawdą… Niestety, nie sposób przewidzieć jak efektywny byłby algorytm, naprawdę określający nie tylko, co lubisz, ale i co powinieneś lubić.
Dane wrażliwe v. prawo do intymności
Kolejnym poważnym problemem komputerowych systemów są przypadki, gdy system wie coś, czego wiedzieć nie powinien. W analogowym świecie zdobywanie informacji o konsumentach związane było z przeprowadzaniem kosztowych i długotrwałych badań. Dziś mamy Big Data.
Świat – dosłownie – zalewany jest przez dane. Każdy z nas – świadomie lub nieświadomie – buszując po sieci pozostawia tysiące śladów. Używając smarfonów – świadomie lub nieświadomie – udostępnia informacje o swojej lokalizacji. Uruchamiając aplikacje, grając w gry, wyszukując informacje… – świadomie lub nieświadomie – zdradza swoje upodobania i zainteresowania. Dane takie są używane do optymalizacji komunikacji marketingowej. Wszystko wygląda dobrze, dopóki ograniczamy się do określonej kategorii wnioskowań i typów danych – niewielki odsetek ludzi irytuje fakt pojawiania się w reklamach produktów, których obecnie szukają. Mało kto jest zbulwersowany propozycjami egzotycznych wycieczek, które – dziwnym trafem – idealnie pasują do naszych marzeń i możliwości finansowych.
Zaawansowane systemy reklamowe potrafią więcej. Doskonale znany jest przypadek firmy Target, która wiedziała o ciąży nastolatki, zanim o tym fakcie dowiedział się tata rzeczonej panny3. Analiza – z pozoru niewrażliwych – danych doprowadziła do poważnego zamieszania rodzinno-biznesowego.
Statystycznie rzecz biorąc oglądasz pornografię. I – również statystycznie rzecz biorąc – preferujesz kilka dostępnych tam kategorii. Czy chciałbyś podzielić się tymi danymi z jakąś agencją reklamową? W oczywisty sposób firmy wyłączają pewien typ danych ze swojej analizy. Amazon z premedytacją pomija część kategorii w swoich rekomendacjach. Ale robi to wskutek osobistej interwencji Jeffa Bezosa; czasem trudno określić, gdzie przebiega moralna i etyczna granica.
Przyjmijmy, że kupiłeś inteligentną żarówkę. Możesz z drugiego końca świata, przez internet, uruchomić ją, zmienić kolor oraz jasność. Możesz ustawić ją jako budzik, który łagodnym rozjaśnieniem wydobędzie cię z objęć Morfeusza. Niby nic groźnego, więc jaki miałby być problem z udostępnieniem takich danych? Wyobraź sobie, że firma obsługująca system przekaże informacje, że kilka tygodni temu usunięto poranny alarm, a zamiast tego lampka włączana jest ręcznie o różnych porach nocy… Jakie wnioski można z tego wyciągnąć? Stres? Choroba? Utrata pracy? Takie dane mogłyby zainteresować bank, u którego starasz się o kredyt. Albo firmę oferującą środki nasenne. Albo…
W artykule z lutego 2012 roku analitycy z Facebooka pochwalili się4 zdolnością do przewidywania, jak trwały jest twój związek. W kolejnej publikacji5 wykazano możliwość identyfikacji, z kim pozostajesz w związku na podstawie samej struktury twoich znajomych…
Wielki brat analityk już czeka
Niepokojące jest pytanie, co jeszcze można wywnioskować z Big Data. Rozważając odpowiedź, warto pamiętać, że Big Data jest nieuporządkowanym zbiorem danych, pochodzących z najróżniejszych źródeł o różnych strukturach. Co więcej, dziś większość z tych danych pochodzi z internetu. W nieodległej przyszłości zacznie powstawać w urządzeniach typu IoT… w twoim domu, w samochodzie, w sklepie, który odwiedzasz. Nadchodzi czas, w którym trudno będzie mówić o jakiekolwiek anonimowości. W przyszłości śledzić nas będzie nie Wielki Brat, ale Wielki, Który Śledził, Analizował, Liczył, Porównywał.
Dziś wiele rzeczy wymyka się prostej policzalności, którą stosują współczesny komputery. W przyszłości ich algorytmy dojrzeją, ale długo jeszcze będą algorytmami. Bez człowieka, który oceni kontekst, moralność i etykę stosowanych rozwiązań, nie da się zrozumieć istoty sprawy ani wskazać granicy, której taka maszyna nie powinna przekroczyć. Dlatego, pomimo że cybernetyczny mózg dziś pozostawił nas daleko w tyle pod względem operacyjnym, nie powinniśmy oddawać mu pełnej kontroli. Fakt, że potrafisz coś zmierzyć, nie znaczy, że potrafisz tym zarządzać. Bezrefleksyjnie uradowani z rosnących KPI nie możemy powierzyć maszynie decyzji, co i jak robić. Choćby dlatego, że na końcu, to człowiek odpowiada wobec innych ludzi. Przynajmniej na razie.
ARTYKUŁ Z WYDANIA DRUKOWANEGO
Lech C. Król, Agencja Adwertajzing.
Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.
- 1 http://www.testsignificance.com/
- 2 http://www.jstor.org/stable/4609267?seq=1#page_scan_tab_contents
- 3 http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html?_r=3&pagewanted=1&hp
- 4 https://www.facebook.com/notes/facebook-data-science/flings-or-lifetimes-the-duration-of-facebook-relationships/10152060513428859
- 5 http://arxiv.org/pdf/1310.6753v1.pdf