Autor: Aleksander Piński

Dziennikarz ekonomiczny, autor recenzji książek i przeglądów najnowszych badań ekonomicznych

Snajper statystyki

Rankiem 6 listopada 2012 r., w dniu wyborów prezydenta USA, statystyk Nate Silver podał któremu z kandydatów - Obamie czy Romneyowi - przypadną głosy elektorów w każdym z 50 stanów. Nie popełnił ani jednego błędu. Kilka tygodni wcześniej wyszła jego książka The Signal and The Noise: Why So Many Predicions Fail – but Some Don`t.
Snajper statystyki

35-letni Silver ukończył z wyróżnieniem ekonomię na University of Chicago. Potem przez trzy i pół roku pracował jako konsultant w firmie konsultingowej KPMG w Chicago. I jak powiedział w jednym z wywiadów, jest to rzecz której najbardziej żałuje w życiu (spędzenia tyle czasu w pracy, której nie lubił). W 2004 r. rzucił ją i zaczął utrzymywać się wyłącznie z gry w pokera on-line. Jednak jeszcze w czasie pracy dla KPMG zaczął pracować nad statystycznym systemem prognozowania wyników graczy w baseball (nazwał go PECOTA, co jest skrótem od Player Empirical Comparison and Optimisation Test Algorithm). Sport ten bowiem jego druga pasja, poza matematyką.

Sprzedał PECOTA-e  firmie Baseball Prospectus (zajmuje się statystycznymi analizami gry w baseball) i jednocześnie zaczął pisać dla ich portalu teksty o sabermetrii (nauka zajmująca się zastosowaniem statystyki i ekonometrii w baseball-u). W sumie napisał ich ponad 200. Oprócz tego nieregularnie pisywał o baseball-u do magazynów „Sports Illustrated”, „Slate” i dziennika „The New York Times”.

Pod koniec 2007 r. zaczął publikować blog pod pseudonimem „Poblano”. Dokonywał w nim statystycznych analiz politycznych sondaży w sposób, który przyciągnął wielu matematycznych „laików”. To wówczas po raz pierwszy pokusił się o prognozy wyników prawyborów prezydenckich w USA, które okazały się być bardziej trafne, niż te wykonane przez uznanych prognostyków. Były one szeroko komentowane, m.in. w „The New York Times”. Pojawił się także jako komentator m.in. w telewizji CNN.

Wówczas założył własną stronę z blogiem fivethirtyeight.com (obecnie jest na stronie „The New York Times”). Nazwa – 538 – to liczba elektorów w Kolegium Elektorów Stanów Zjednoczonych. W listopadzie 2008 r. podpisał kontrakt z Penguin Group USA na  napisanie dwóch książek. Dostał za to 700 tys. dol. zaliczki. A w 2009 r. magazyn „Time” umieścił go na liście 100 Najbardziej Wpływowych Ludzi Świata”.

The Signal and The Noise („Sygnał i szum: Dlaczego tak wiele prognoz się nie spełnia, a niektóre okazują się trafne”) ukazała się na kilka tygodni przez wyborami prezydenckimi w USA (dokładnie 27 września 2012 r.) i w pierwszym tygodniu sprzedaży pojawiła się na 12 miejscu listy bestsellerów (kategoria non-fiction) dziennika „The New York Times”. Kiedy okazało się, że Silver trafnie wytypował wynik wyborów prezydenckich jej sprzedaż (i tak niezła) w największej księgarni internetowej amazon.com wzrosła o 800 proc. W kwietniu 2013 r. książka ukazała się w Wielkiej Brytanii pod lekko zmodyfikowanym tytułem: The Signal and the Noise: The Art and Science of Prediction („Sygnał i szum: Sztuka i nauka prognozowania”).

Silver pisze, że podstawą jego prognoz jest teoria brytyjskiego matematyka Thomasa Bayesa (1701-1761). Zajmował się on prawdopodobieństwem warunkowym zdarzeń. Silver wyjaśnia tę teorię na podstawie przykładu o zdradzie. Otóż załóżmy, że czytelnik mieszka z partnerką i po powrocie z podróży służbowej znajduje nieznajomą sztukę bielizny w swojej szufladzie. Powstaje pytanie: jakie jest prawdopodobieństwo tego, że  partnerka zdradza czytelnika? Otóż teoria Bayesa jest w stanie odpowiedzieć na to pytanie, o ile czytelnik zechce oszacować prawdopodobieństwo trzech zdarzeń.

Pierwsze to prawdopodobieństwo tego, że bielizna znajdzie się w szufladzie pod warunkiem, że hipoteza o zdradzie jest prawdziwa. Silver zakłada, że wynosi ono 50 proc. Drugie to prawdopodobieństwo zdarzenia, iż bielizna zostanie znaleziona a partner nie zdradza – 5 proc. (przykładowe wytłumaczenia tego zdarzenia jest takie, że bielizna jest prezentem dla partnera, który nie został jeszcze zapakowany). Trzecie wreszcie to prawdopodobieństwo zdrady zanim znaleźliśmy bieliznę. Tutaj Silver wspiera się badaniami statystycznymi, które podają, iż jest to średnio 4 proc.

Z teorii Bayesa wynika, przy powyższych założeniach, iż prawdopodobieństwo tego, że partner zdradza jest „zaledwie” 29 proc. a więc znacznie mniejsze, niż by się intuicyjnie wydawało. Otóż tak niski wynik bierze się stąd, że zdrada jest relatywnie rzadkim zdarzeniem.

Dalej Silver pokazuje jak można teorie Bayesa zastosować w praktyce. I podaje przykład ataków z 11 września 2001 r. Przed tą datą większość Amerykanów w ogóle nie brała pod uwagę możliwości, że zderzenie samolotu w wieżami World Trade Center może być atakiem terrorystycznym. Tymczasem po pierwszej kolizji wszyscy byli tego praktycznie pewni. Czy z teorii Bayesa można wyciągnąć podobny wniosek?

>>czytaj też: Ślepa wiara we wskaźniki może być zgubna

Załóżmy, że prawdopodobieństwo ataku terrorystycznego na wieżowce na Manhattanie, przed atakiem z 11 września 2001 r., wynosiło 1 do 20 000, czyli 0,005 proc. Prawdopodobieństwo zderzenia samolotu z budynkiem w wyniku wypadku jest równie niskie. W ciągu 25 tys. dni przed 11 września 2001 r. były dwa takie przypadki. Jeden w 1945 r.(uderzono Empire State Building), a drugi w 1946 r. (trafiono w budynek na 40 Wall Street). To oznacza, że prawdopodobieństwo podobnego wypadku wynosi 1 do 12 500. Z teorii Bayesa wynika, że po pierwszym zderzeniu samolotu z wieżą World Trade Center prawdopodobieństwo tego, że było ono wynikiem ataku terrorystycznego wzrosło z 0,005 proc. do 38 proc. Po drugim do 99,99 proc.

Powyższy przykład pokazuje dlaczego Silver regularnie aktualizuje swoje prognozy w miarę jak pojawiają się nowe informacje. I dlaczego ostatnią prognozę w wyborach prezydenckich  w USA podał w dniu głosowania. Chodzi też o to, że wraz ze zbliżaniem się do dnia wyborów precyzja sondaży rośnie. Na przykład pięć punktów procentowych przewagi na dzień przed wyborami do senatu przekłada się na wygraną w 95 proc. przypadków. Taka sama przewaga na rok przed rozstrzygnięciem wyborców, daje wygraną tylko w 59 proc.

Specyfika prognozy Silvera polega też na tym, że stara się on unikać jednoznacznych stwierdzeń. Kiedy na przykład 2 listopada 2010 r. opublikował prognozę liczby mandatów z Izbie Reprezentantów, które wygrają Republikanie, przedstawił go w formie wykresu, na których każdemu możliwemu scenariuszowi przyporządkował prawdopodobieństwo. Najbardziej prawdopodobna opcja to taka, w której Republikanie uzyskiwali od 45 do 65 mandatów (ostatecznie uzyskali 63).

Signal and the Noise to nie jest książka dla tych, którzy mdleją na widok wzoru matematycznego. Prognozowanie to jednak przede wszystkim statystyka, a ta nie może się obyć bez liczb. Z drugiej strony jednak książka Silvera nie jest przeznaczona do akademickich rozważań tylko dla masowego czytelnika. Dlatego matematyki w tej książce jest tylko tyle, ile być musi, by zgłębić temat. A te wzory, które są, giną w olbrzymiej liczbie anegdot, ciekawostek historycznych czy fragmentów rozmów jakie Silver odbył ze znanymi naukowcami z różnych dziedzin, takimi jak na przykład ekonomiści Jeffrey Sachs czy Daniel Kahneman.

Wszechstronność zainteresowań Silvera widoczna jest także po tematyce poszczególnych rozdziałów: od pokera i szachów, przez prognozy pogody i wytłumaczenie dlaczego nie potrafiono przewidzieć ostatniego kryzysu ekonomicznego aż po kwestie zmian klimatycznych. Podsumowując: książka do przeczytania dla każdego z wyjątkiem uczulonych na matematykę.

OF

Otwarta licencja


Tagi


Artykuły powiązane

Tydzień w gospodarce

Kategoria: Trendy gospodarcze
Przegląd wydarzeń gospodarczych ubiegłego tygodnia (30.05–03.06.2022) – źródło: dignitynews.eu
Tydzień w gospodarce

Tydzień w gospodarce

Kategoria: Raporty
Przegląd wydarzeń gospodarczych ubiegłego tygodnia (16–20.05.2022) – źródło: dignitynews.eu
Tydzień w gospodarce