Miliard cen z internetu zmienia pomiar inflacji

Olbrzymie zbiory danych, tzw. big data, zmieniają świat, nawet ekonomię. Massachusetts Institute of Technology opracował w ramach projektu miliarda cen, który dzięki internetowi pozwala tworzyć dzienne wskaźniki zmian cen w wielu krajach.
Miliard cen z internetu zmienia pomiar inflacji

Infografiki: OF/LR

Liran Einav i Jonathan Levin zwrócili uwagę w niedawnej publikacji, że „rewolucja, która dokonała się w minionym dziesięcioleciu w dziedzinie danych, przypuszczalnie wywrze dalszy i głęboki wpływ na badania ekonomiczne” oraz pomiary (zob. L. Einav, J. Levin, Economics in the Age of Big Data, „Science” 346[6210], 2014 r., 1243089). Do ważnych obszarów, na które już wpływają te nowe źródła danych, należą pomiar stopy inflacji oraz inne statystyki dotyczące cen.

Dobrze znane są problemy towarzyszące pomiarowi stopy inflacji. Wiele z nich ma związek z ograniczeniami danych pierwotnych o cenach i z tym, że podstawowa procedura stosowana do zbierania tych danych od dziesięcioleci pozostaje prawie bez zmian. Szczególnie należy zwrócić uwagę na to, że bardzo wielu pracowników krajowych urzędów statystycznych co miesiąc odwiedza setki sklepów, aby gromadzić ceny dóbr z uprzednio ustalonego koszyka towarów i usług.

Dla niektórych użytkowników tych danych proces ten jest zbyt kosztowny i złożony, a często również za wolny. Rzadkie zbieranie próbek i wolne aktualizacje zawartości koszyków komplikują dostosowania konieczne z powodu zmian jakości oraz wprowadzania nowych towarów.

Robert Groves opisuje ponadto wiele innych problemów, na które się natrafia przy tradycyjnym zbieraniu danych podczas sondaży, m.in. wzrastające odsetki osób decydujących się nie brać udziału w takich badaniach (zob. R.M. Groves, Three Eras of Survey Research, „Public Opinion Quarterly”, 75[5], 2011 r., s. 861–871). Wprawdzie niedawne kryzysy gospodarcze skłoniły decydentów politycznych i inne podmioty wykorzystujące te statystyki do domagania się danych częściej aktualizowanych i dokładniejszych, ale przez kurczące się zasoby przeciążone są krajowe urzędy statystyczne, których praca jest nieodzowna, co omawiają Katharine Abraham, Steven Davis i John Haltiwanger (zob. Don’t Starve the BLS, „Roll Call”, październik 2015 r.).

Jest więc naturalne, że z tych przyczyn zainteresowanie budzą wielkie zbiory danych ogólnie, a ceny ze źródeł internetowych w szczególności, o czym piszemy w materiale przygotowywanym obecnie do publikacji (A. Cavallo, R. Rigobon, The Billion Prices Project: Using Online Data for Measurement and Research, „Journal of Economic Perspectives”, 2016 r., w przygotowaniu).

Co prawda dane dotyczące cen są rozproszone, gdyż występują w setkach witryn internetowych i na tysiącach stron tych witryn, ale osiągnięcia w dziedzinie oprogramowania do zautomatyzowanego zbierania informacji z materiałów publikowanych online obecnie umożliwiają każdemu projektowanie i stosowanie olbrzymich zbiorów danych internetowych. Można zbierać szczegółowe informacje dotyczące każdego dobra, a produkty nowe i znikające z rynku bez trudu można wykryć i znaleźć informacje o nich. Zbieranie danych online odbywa się tanio, szybko i dokładnie, przez co jest to idealne uzupełnienie tradycyjnych metod zbierania cen, szczególnie w kategoriach towarów, które często pojawiają się w internecie.

Po raz pierwszy wykorzystaliśmy dane internetowe do konstruowania wskaźników zmian cen towarów i usług konsumpcyjnych z powodu manipulowania w Argentynie w latach 2007-2015 statystykami dotyczącymi inflacji. Używając danych internetowych zbieranych każdego dnia z witryn olbrzymich detalistów, Alberto Cavallo wykazał, że chociaż rząd argentyński informował o średniej stopie inflacji wynoszącej 8 proc. rocznie w latach 2007-2011, z danych online wynikało, że stopa ta przekraczała 20 proc., co było zgodne z szacunkami części lokalnych władz i pewnych argentyńskich ekonomistów, a także z wynikami sondaży prowadzonych w celu ustalenia oczekiwań inflacyjnych gospodarstw domowych (zob. A. Cavallo, Online and Official Price Indexes: Measuring Argentina’s Inflation, „Journal of Monetary Economics” 60[2], 2013 r., s. 152–165).

Wykresy dotyczące stopy inflacji w Argentynie ukazują, jak utrzymywały się między nimi różnice. Używanie cen zamieszczanych na stronach internetowych ma wiele zalet, a należy do nich możliwość zbierania ich z odległych miejsc, co okazało się szczególnie przydatne w 2011 r., kiedy rząd argentyński zaczął nakładać grzywny i wywierać naciski na argentyńskich ekonomistów, aby przestali zbierać niezależnie dane. Manipulacje oficjalnymi danymi praktykowano prawie przez dziewięć lat. Skończono z tym dopiero w grudniu 2015 r., gdy wybrano nowy rząd (chociaż w Argentynie nadal nie ma oficjalnego wskaźnika zmian cen towarów i usług konsumpcyjnych).

Wykres-1-Roczna-stopa-inflacji-w-Argentynie-560

Argentyńska porażka statystyczna miała korzystny skutek uboczny. Ukazała bowiem, że ceny zamieszczane w internecie mogą się przydać do ustalania stopy inflacji. Wychodząc z tego założenia, w 2008 r. opracowaliśmy w Massachusetts Institute of Technology tzw. projekt miliarda cen, aby naszymi pracami objąć inne kraje, w tym USA. W 2010 r. zbieraliśmy każdego dnia 5 mln cen podawanych przez ponad 300 detalistów z 50 krajów. Tylko w USA każdego dnia zbierano pół miliona cen. Dodajmy dla porównania, że Amerykański Urząd Statystyk Zatrudnienia zbiera mniej więcej 80 tys. cen miesięcznie albo co dwa miesiące.

Nasze podejście różni się od wielu innych prób użycia wielkich zbiorów danych w ekonomii, gdyż nie skupiamy się na prognozach, lecz na pomiarach. Większy zbiór danych nie musi jednak oznaczać lepszych informacji. W naszym przeświadczeniu wykorzystanie internetu to po prostu nowa metoda zbierania danych, która umożliwia docieranie do potrzebnych nam informacji. Nadal jednak przestrzegamy, aby stosować się do podstawowych zasad tradycyjnych programów zbierania danych, np. konieczności posiadania reprezentatywnej próbki.

Z tego powodu np. skupiamy się na olbrzymich sprzedawcach detalicznych wykorzystujących różnorodne kanały, sprzedających zarówno w internecie, jak i poza siecią, np. sieci Walmart, i nie zajmujemy się firmami prowadzącymi sprzedaż detaliczną wyłącznie online, które wciąż mają stosunkowo mały udział w handlu detalicznym. Również dlatego przede wszystkim zbieramy ceny dóbr należących do kategorii uwzględnianych w oficjalnych koszykach stosowanych do wyznaczania zmian cen towarów i usług konsumpcyjnych (stopy inflacji CPI), dla których są dostępne wagi o wielkościach zależnych od wydatków konsumentów.

We wspomnianej wyżej przygotowywanej do publikacji analizie przedstawiamy kilka przykładów tego, jak ceny online można efektywnie wykorzystywać jako alternatywne źródło informacji o cenach, umożliwiające konstruowanie wskaźników cenowych, które odwzorowują zachowanie oficjalnych wskaźników zmian cen towarów i usług konsumpcyjnych. W otwierającym tekst wykresie pokazujemy przebieg wskaźnika dziennych zmian cen online w USA, który od kilku lat niewiele się różni od oficjalnie publikowanej stopy inflacji CPI.

W naszej analizie podkreślamy także znaczenie dwóch cech wskaźników cen internetowych, omawiając je tam szczegółowiej.

Po pierwsze, wskaźniki wyznaczane na podstawie cen online wykazują zdolność do zbliżania się do hedonicznie dostosowanych wskaźników cen w sektorach z dużą liczbą dóbr, które pojawiają się na pewien czas w nakładających się na siebie cyklach (jest tak np. ze sprzętem elektronicznym).

Po drugie, wydaje się, że w wielu krajach wskaźniki ustalane według cen online mogą antycypować zmiany oficjalnej stopy inflacji CPI. Ta antycypacja wydłuża się poza okresy opóźnienia publikacji, co świadczy o tym, że ceny internetowe często wcześniej się dostosowują do zagregowanych wstrząsów.

Dane internetowe mogą także zmienić wyniki empirycznych badań makroekonomicznych i międzynarodowych. W szczególności zbiory danych internetowych konstruowane po to, aby były dostosowane do konkretnych potrzeb badawczych, mogą się przyczynić do złagodzenia błędów poznawczych i interpretacyjnych oraz innych empirycznych problemów. Bardzo często występują one w tradycyjnych zbiorach danych przygotowywanych w innych celach, dotyczą mianowicie zbierania próbek, endogeniczności, pominiętych zmiennych oraz błędów w wartościach zmiennych.

To naturalne jednak, że się zastanawiamy, czy ceny internetowe różnią się od cen zbieranych w sklepach tradycyjnych, gdzie nadal odbywa się olbrzymia większość transakcji. Aby udzielić odpowiedzi na to pytanie, przeprowadziliśmy niedawno badania polegające na zakrojonym na wielką skalę porównaniu cen online i offline w ponad 50 firmach z sektora handlu detalicznego z dziesięciu krajów. Alberto Cavallo wykazał, że w ponad 70 proc. przypadków ceny są identyczne i chociaż zmiany cen nie następują w tym samym czasie, częstotliwość tych zmian i ich średnia wielkość wyglądają bardzo podobnie we wszystkich badanych zbiorach (zob. A. Cavallo, Are Online and Offine Prices Similar? Evidence from Large Multi-Channel Retailers, NBER Working Paper 22142, 2016 r.).

Można jednak również zaobserwować znaczne różnice między detalistami, sektorami i krajami, co nakazuje zachować ostrożność i powstrzymać się przed wyciąganiem mocnych wniosków z publikacji, które za podstawę miały dane dotyczące konkretnych krajów, branż czy firm z sektora handlu detalicznego.

Pewnym obszarem makroekonomii, w którym dane dotyczące cen internetowych mogą znacznie zmienić wcześniejsze wyniki, jest piśmiennictwo poświęcone lepkości cen, co wykazał Alberto Cavallo (zob. A. Cavallo, Scraped Data and Sticky Prices, NBER Working Paper 21490, 2015 r.). Np. ceny internetowe cechują się bardzo odmiennym rozkładem statystycznym wielkości zmian cen (to należy do najważniejszych danych statystycznych w tym piśmiennictwie) w porównaniu z rozkładem, który można uzyskać na podstawie danych w skali mikro używanych do wyznaczania stopy inflacji CPI czy danych zbieranych podczas skanowania kodów kreskowych towarów w sklepach detalicznych.

Głównym powodem jest to, że ceny internetowe nie mają średnich czasowych, powszechnych w przypadku danych uzyskiwanych podczas skanowania kodów kreskowych towarów w sklepach detalicznych, ani cen przypisanych, powszechnie występujących w oficjalnych danych w skali mikro, które tworzą wielką liczbę małych, błędnych zmian cen. Różnice te widać na wykresach ukazujących rozkład statystyczny wielkości zmian cen.

Wykres-3-Rozkład-statystyczny-wielkości-zmian-cen-560

Ceny internetowe można także wykorzystywać do badania światowych cen względnych oraz ich powiązań z kursami walutowymi. Np. prowadzone z użyciem danych internetowych testy „prawa jednej ceny” (określa ono, że nie powinno być wielkich ani trwałych różnic między cenami identycznych towarów w różnych krajach przy przeliczeniu ich na tę samą walutę) dają nam bardziej szczegółowy obraz tego, kiedy i gdzie to prawo dobrze działa.

Autorzy istniejących publikacji są zgodni co do tego, że występują wielkie i trwałe różnice między cenami faktycznymi a cenami, których należy się spodziewać zgodnie z prawem jednej ceny. Przeniesienie nominalnych kursów walutowych na ceny względne jest niewielkie (i odwrotnie), co powoduje utrzymujące się wstrząsy działające na realne kursy walutowe, zanikające dopiero po latach.

Odchylenia mogą być także bardzo duże w przypadku danych internetowych, ale Alberto Cavallo, Brent Neiman i Roberto Rigobon wykazali, że prawo jednej ceny sprawdza się w krajach używających tej samej waluty (zob. A. Cavallo, B. Neiman, R. Rigobon, Currency Unions, Product Introductions, and the Real Exchange Rate, „Quarterly Journal of Economics” 129:2, 2014 r.; A. Cavallo, B. Neiman, R. Rigobon, The Price Impact of Joining a Currency Union: Evidence from Latvia, „IMF Economic Review” 63[2], 2015 r., s. 281–297).

Co więcej, gdy dopasowanie towarów między krajami jest ściślejsze, są solidne dowody, że ceny względne i nominalne kursy walutowe zmieniają się w sposób znacznie bardziej zbliżony, niż wcześniej zakładano, co świadczy o wyższych współczynnikach przenoszenia i mniej trwałych zmianach realnych kursów walutowych.

Wielkie zbiory danych będą stale wykorzystywane

Projekt miliarda cen to tylko jeden z przykładów wykorzystania źródeł wielkich zbiorów danych w ekonomii. Do innych przykładów należą rozmaite rodzaje danych zbieranych automatycznie ze stron internetowych, np. informacji o sile roboczej i nieruchomościach, danych z telefonów komórkowych, zdjęć satelitarnych – np. wykorzystali je Vernon Henderson, Adam Storeygard i David Weil – i wielu innych czujników, które w coraz większym stopniu stają się częścią naszego codziennego życia (zob. J.V. Henderson, A. Storeygard, D.N. Weil, Measuring Economic Growth from Outer Space, „American Economic Review”, 102[2], s. 994–1028).

W naszym przeświadczeniu technologie stosowane do tworzenia wielkich zbiorów danych budzą największe zainteresowanie przez to, że dzięki nim ekonomiści (szczególnie zajmujący się makroekonomią i ekonomią międzynarodową) wreszcie zyskują możliwości skończenia z tym, iż dane uważa się za coś „danego”, i zaangażowania się osobiście w proces zbierania danych.

Od wielu lat o wynikających z tego korzyściach mówią prominentni ekonomiści, np. Zvi Griliches (zob. Z. Griliches, Data and Econometricians–the Uneasy Alliance, „The American Economic Review” 75[2], 1985 r., s. 196–200; Z. Griliches, Productivity, R&D, and the Data Constraint, „The American Economic Review” 84[1], 1994 r., s. 1–23).

Wiele rządów aktywnie poszukuje alternatywnych źródeł danych (zob. C. Bean, Time to rethink the way we measure economic activity, VoxEU.org, 2016 r.), ale wykorzystanie ich będzie zależeć nie tylko od woli decydentów politycznych czy statystyków pracujących nad tą dziedziną, lecz także od zaangażowania większej liczby ekonomistów i pracowników naukowych, którzy przyczynią się do ustalenia, jak najlepiej zbierać, traktować i wykorzystywać te nowe źródła informacji.

Alberto Cavallo jest profesorem wykładającym problematykę informatyki i zarządzania oraz ekonomię stosowaną na Sloan School of Management przy Massachusetts Institute of Technology

Roberto Rigobon jest profesorem wykładającym ekonomię stosowaną na Sloan School of Management przy MIT

Artykuł po raz pierwszy ukazał się w VoxEU.org (tam dostępna jest pełna bibliografia) i można go przeczytać tutaj. Tłumaczenie i publikacja za zgodą wydawcy

 

Infografiki: OF/LR
Wykres-1-Roczna-stopa-inflacji-w-Argentynie-560
Wykres-3-Rozkład-statystyczny-wielkości-zmian-cen-560

Tagi