Archiwum kategorii: Ludzie

Sondaże przedwyborcze i efekt peletonu

Poniżej przyglądam się pewnym tendencjom, które pojawiły się w ostatnich latach w sondażach przedwyborczych. Podstawowy wniosek, jaki można wysnuć, mówi, że wzrosła zbieżność predykcji sondażowych, ale spadła ich łączna jakość. Wydaje się, że można to wyjaśnić “efektem peletonu”.

Wyniki badań przedwyborczych przynoszą nam pewną wiedzę zarówno o wynikach nadchodzących wyborów, jak i o przemianach w sektorze badania opinii. Ten wpis jest głównie o tych drugich. Swoje obserwacje oparłem na traktowanych porównawczo sondażach przedwyborczych z lat 2011, 2015, 2019 i 2023 (dane znormalizowane1).

TL;DR: Ludzie nie zmieniają poglądów tak szybko, jak skaczą słupki – waga kampanii jest przeceniana; z wyników sondaży da się wyczytać jak zmienia się sama technologia tego fachu; sondaże “czytają” inne sondaże.

Zacznijmy od tego, że doszukiwanie się trendów w traktowanych łącznie sondażach w czterech ostatnich wyborach było głównie rzeźbieniem w szumie. Jeśli coś było widać, to systematyczne niedoszacowanie jednych komitetów i przeszacowanie innych – właśnie to pokazuje wykres powyżej. Są na nim odchylenia od wyniku wyborów. Tu i dalej konsekwentnie pomijam CBOS z powodów, które streszczam w przypisie2.

Od 2011 roku stabilnie przeszacowane były duże partie i “stare marki” (w 2011 SLD, w 2015 PO, a w 2019 PiS), a niedoszacowane – „nowe marki” o mniejszym poparciu (w 2011 Ruch Palikota, w 2015 Kukiz i .Nowoczesna, w 2019 Koalicja Polska i Konfederacja, a w 2023 Trzecia Droga). Są to względnie regularne prze- i niedoszacowania. Realnie nie było silnego klarownego „trendu” (patrz wykres powyżej).

Szeroko komentowane międzysondażowe „skoki” poparcia (zwykle ze wskazaniem „źródeł wzrostu/spadku” – co jest zawsze tak urocze) były przede wszystkim artefaktami. Owe artefakty miały najprawdopodobniej dwojakie źródło: sam błąd pomiaru, jak i strategię badawczą sondażowni. Pokażę to na liczbach, ale najpierw musicie przecierpieć akademickie przynudzania na temat wyliczania błędów losowych.

Przy wynikach sondaży podawany jest często „maksymalny błąd oszacowania”. Prawie zawsze (zawsze?) jest zwyczajnie niepoprawny, ponieważ ustala się go jedynie na podstawie liczebności próby. Jest on zaniżony, ponieważ nie uwzględnia paru rzeczy. Nie chodzi tu jedynie o błędy systematyczne, które mają wiele źródeł: brzmienie pytań, ich kolejność, korelacje odmów z poglądami itd. (nie będę brnął w ten wątek – te błędy są i tyle, trzeba mieć ich świadomość i starać się je minimalizować). Już sam błąd losowy jest większy niż podawany. Dzieje się tak, ponieważ wszystkie (prove me wrong!) ośrodki badawcze stosują kwotowanie lub wagi analityczne. W przypadku pierwszego w ogóle nie powinno się liczyć błędu jak przy SRS, w przypadku drugiego jest on wyraźnie większy (zmniejsza się effective sample size).

Tzw. „maksymalny błąd oszacowania” łatwo obalić patrząc na jego weryfikację wyborczą. Statystycznie tylko 5 oszacowań punktowych na 100 powinno odchylać się o więcej niż dwa błędy standardowe od wyniku PKW. W ciągu 10 dni przed wyborami w 2019 odchyleń tych było 44 na 85! (zaznaczone na czerwono w tabelce poniżej)

Tylko nie tłumaczcie tego „trendem”, proszę…

Oczywiście niektórzy pomylili się bardziej niż inni. Jednak żadna pracownia nie była stabilnym liderem predykcji na przestrzeni wielu lat – sukces nie jest więc replikowalny. Nie da się jednoznacznie wskazać “najlepszej kuchni”. Tej “kuchni” przede wszystkim praktycznie nie znamy. Publikowane notki zawierają jedynie informacje szczątkowe – nic tam nie ma o doborze respondentów, response rate, ważeniu, za mało jest o filtrowaniu. Trudno więc ocenić realne obciążenie poszczególnych wyników. Informacje metodologiczne traktowane są w znacznej mierze jak sekret korporacyjny, a nie sposób na budowanie społecznej wiarygodności. (Tym elementem powinny próbować się wyróżnić większe pracownie – zwłaszcza w kontekście tendencji o których napiszę dalej.)

Czy bez wiedzy insiderskiej da się coś powiedzieć o współczesnej “kuchni”? Wydaje mi się, że tak.

Tu wróćmy do ważenia. Można je przeprowadzić wg szeregu różnych kryteriów, np. cech społeczno-demograficznych, retrospektywnych deklaracji ws. wcześniejszych głosowań itp., a dokładny wybór sposobu ważenia i filtrowania jest zawsze w pewnym stopniu arbitralny. To powoduje, że nie mamy przeważnie do czynienia z “czystymi” sondażami (w sensie surowego rozkładu odpowiedzi), a z sondażowymi prognozami (dane przetworzone ekspercko). Co ważne – komponent arbitralny pozwala uwzględnić w nich dodatkowe informacje kontekstowe… w tym średnią wyników innych pracowni.

Update: Poniżej przedstawiam przeciętne odchylenie pojedynczego wyniku sondażu od ich łącznej średniej w miesiącu poprzedzającym wybory parlamentarne (tylko komitety “ponadprogowe”). Jak widać, od 12 lat rozrzut wyników systematycznie zmniejsza się.

Rosnąca zbieżność wyników sugeruje, że pracownie starają się lekko nawigować względem siebie, co jest decyzją względnie racjonalną biznesowo, zwłaszcza w przypadku ośrodków robiących tanie badania, świadomych słabości własnych danych. jest to po prostu optymalizacja jakości do kosztu z wykorzystaniem darmowego “surowca”. Większość sondaży zamawiają media, im zależy na klikalności/oglądalności, ale nie są w stanie zapłacić kilkuset tysięcy złotych w każdy weekend. Powstaje więc wiele sondaży względnie tanich, o niższych standardach, niż akademickie. Reprezentatywność tych sondaży jest względnie niska. Dostępne są jednak średnie z wielu sondaży, czyli ekwiwalent “powiększenia próbki”. Dlaczego nie skorzystać?

Jak wie każdy zawodowy kolarz, nie oglądanie się na resztę peletonu jest ryzykowne. Jazda z „peletonem” stanowi rodzaj ubezpieczenia. Większa zbieżność powoduje, że cały sektor sondażowy pospołu wygra lub przegra. Kto jest w stawce, ten może przynajmniej nie wypadnie z rynku. Co więcej, uwzględnianie wyników innych sondaży jest jak jechanie za plecami konkurenta – trochę lżej się pedałuje.

O ile “efekt peletonu” (tzw. herding) jest racjonalny z punktu widzenia przynajmniej części pracowni badawczych, to niekoniecznie jest on korzystny dla konsumentów sondaży. Większa spójność wyników tworzy pozór pewności prognozy. Gdyby nie wspomaganie zbieżności wyników (zwłaszcza większych partii), bardziej wiarygodna byłaby też średnia z wielu sondaży. Wykorzystywanie informacji kontekstowej dokłada bowiem nowe źródło błędu systematycznego. Wracając do metafory kolarskiej – często peleton wjeżdża na metę jako pierwszy, ale nie raz zdarza się, że oglądanie się na siebie nawzajem prowadzi do przesadnego obniżenia wspólnego tempa. Wówczas peleton przegrywa.

Źródło: wiktionary.org

Jakościowej korekty prognoz – jeśli nastąpi – można oczekiwać dopiero w ostatnim tygodniu przed wyborami, tuż przed klarowną weryfikacją jakości oszacowań. Wszelkie wcześniejsze odchylenia można tłumaczyć “trendami poparcia”, które są w zasadzie nieweryfikowalne.

„Korekta” na ostatniej prostej nie zawsze jest skuteczna (choć zakładam, że wszyscy dokładają wówczas większych starań), ale okazała się taka w 2015 roku. Tu jednak znajdujemy dodatkową przesłankę, aby sądzić, że trafne ważenie odgrywa bardzo dużą rolę w poprawnym szacowaniu wyników. W maju 2015 odbyły się wybory prezydenckie. Retrospektywne pytanie o sposób głosowania w maju były jesienią znacznie lepszą „kotwicą” kalibracji wag, niż gdy czyni się to w oparciu o deklarację głosowania cztery lata wcześniej. Po prostu fakt, że ktoś zadeklarował głosowanie na Dudę/Komorowskiego był znakomitym predyktorem głosowania w październiku. To dlatego udało się wówczas stworzyć lepsze oszacowania. W tygodniu przed tymi wyborami na 66 oszacowań punktowych (11 sondaży * 6 komitetów z > 5pp) powyżej błędu losowego znalazło się jedynie 15 (wciąż więcej niż oczekuje statystyka indukcyjna, ale porównajcie to z ponad połową przekroczeń w 2019!)

15 X poznamy nie tylko zwycięzcę wyborów, ale również zwycięzcę prognoz. Czy będzie to zwycięstwo wypracowane na podstawie finezyjnej metodologii, żelaznej dyscypliny i pełnej poświęceń pracy ankieterów? Mam nadzieję. Ale trudno będzie wykluczyć zwykły fart. Socjologia w zakresie prognoz rywalizuje raczej z meteorologią czy sejsmologią, a niż z astronomią. Z dwutygodniowym wyprzedzeniem bardzo trudno przewidzieć czy potrzebny będzie parasol.

Na koniec niezbędny jest DISCLAIMER: Nie oznacza to wcale, że sondaże i prognozy są bezwartościowe i że nic nie wiadomo. Przeciwnie, dzięki sondażom wiemy całkiem sporo i możemy być świadomymi wyborcami. Ale warto znać specyfikę tego “barometru” i brać na nią poprawkę.

PS. Wiadomo już, które sondaże okazały się najbliższe wynikom wyborów (przy czym można to mierzyć na kilka różnych sposobów):
https://x.com/spoleczenstwopl/status/1732776755264405598?s=20

Przypisy:

  1. Wyniki podawane przez poszczególne pracownie nie są bezpośrednio porównywalne, choćby ze względu na rozbieżne odsetki odpowiedzi “nie wiem”. Żeby zestawiać je między sobą i z PKW, powinny sumować się do 100. Właśnie temu służy normalizacja. Warto zauważyć, że czym wyższy odsetek odpowiedzi “nie wiem”, tym łatwiej jest później pracowni bronić się, że to właśnie w niej zaszyte były brakujące punkty procentowe. Skoro i tak stosowane są wagi, a niezdecydowani są dopytywani o poglądy, prognozy powinny to uwzględniać. ↩︎
  2. CBOS od dawna mierzy się z silnym house effect, którego jest świadom i którego mimo wszystko nie koryguje. Zachowuje natomiast względnie spójną metodologię, dość istotną z punktu widzenia śledzenia trendów – co jest pewną wartością tych badań (#reliablebiaspride). Powoduje to, że CBOSu nie należy traktować jak podmiotu z rynku sondaży przedwyborczych. Jego nadrzędnym celem nie jest prognoza wyniku PKW. Waży tylko na demografikach. Nie ma medialnych zleceniodawców, ale mecenasa, który (jak sądzę) za bardzo nie życzy sobie jakichkolwiek nowinek. ↩︎

Jak dyplom wpływa na dochód?

Istnieją różne motywacje kontynuowania nauki na studiach wyższych, ale perspektywa podwyższenia dochodu jest z pewnością jedną z ważniejszych. Od kilku lat, dzięki programowi MNiSW Ekonomiczne Losy Absolwentów (ELA) mamy możliwość śledzenia tego, jak młodzi ludzie radzą sobie na rynku pracy po uzyskaniu dyplomu. Na tle innych badań dochodów, wyniki zawarte w zbiorze danych ELA są wyjątkowe, ponieważ pochodzą z rejestrów ZUS, a nie z badań sondażowych. Charakteryzują się więc znacznie większą dokładnością i pokryciem całej populacji. ELA zawiera kilkanaście wskaźników charakteryzujących aktywność zawodową po ukończeniu poszczególnych kierunków studiów, ale nas interesować tu będzie mediana dochodu uzyskiwanego rok po ukończeniu studiów. Z jednej strony okres 12 miesięcy to stosunkowo mało, aby absolwent ustabilizował swoją sytuację zawodową, ale z drugiej uchwycenie dochodu w tym właśnie momencie pokazuje położenie na rynku pracy, będące bezpośrednim następstwem studiów oraz – co wiemy z innych badań – jest wyraźnie skorelowane z dochodem uzyskiwanym w późniejszych etapach kariery. Dane analizowane poniżej dotyczą absolwentów z 2015 roku.

Co pokazują wykresy?

Na poniższym wykresie prezentujemy fragment tego zróżnicowania. Skupiliśmy się na najpowszechniej dostępnych kierunkach studiów oraz uczelniach z głównych ośrodków akademickich (w istocie z miast wojewódzkich oraz dodatkowo z Gliwic i Częstochowy). Ograniczyliśmy się też do absolwentów studiów dziennych drugiego stopnia lub jednolitych. Wszystko to miało na celu większe wystandaryzowanie (porównywalność) rezultatów.

Wartości przedstawione na wykresie pochodzą z prostego modelu regresji i pokazują o ile dochód jest większy (wartości z plusem) lub mniejszy (z minusem) od wartości referencyjnej. Tę ostatnią stanowił poziom dochodu uzyskiwany rok po zakończeniu dowolnych innych studiów drugiego stopnia (czyli kierunków innych niż, te wymienione na wykresie – w praktyce chodzi o kierunki rzadziej obecne na uczelniach). Wartość ta wynosi 2.442 zł brutto (mediana dochodu ze wszystkich źródeł). Nie wchodząc w statystyczne szczegóły trzeba dodać, że to są wartości uzyskane przy kontroli ośrodka akademickiego (więc niejako niezależne od premii za konkretną uczelnię i lokalizację miejsca pierwszej pracy).

Wykres 1. Przeciętna premia dochodowa za ukończenie kierunku

Zarabiać jak filolog ugrofiński

Pierwszą obserwacją płynącą z danych ELA jest ogromne zróżnicowanie dochodów absolwentów poszczególnych kierunków. Nie jest zaskoczeniem to, że w czołówce rankingu kierunków uporządkowanych pod względem medianowego dochodu znajdują się absolwenci nauk technicznych: informatycy, absolwenci kierunku automatyka i robotyka, czy mechanika i budowa maszyn. Zaskakuje raczej to, że tuż za nimi plasują się absolwenci (w zasadzie głównie absolwentki) pielęgniarstwa – znacznie wyżej niż kierunku lekarskiego, choć nie jest to porównanie w pełni rzetelne (wejście w zawód lekarski poprzedzone jest stażem i rezydenturą). Wysokie medianowe zarobki uzyskiwane tuż po studiach w zawodach związanych ze wspomnianymi kierunkami wiążą się z dużym bieżącym popytem na takie kwalifikacje. Gdybyśmy przyjrzeli się szczegółowo również pozostałym, rzadziej pojawiającym się w ofercie uczelni kierunkom, to znajdziemy wśród nich również inne, których absolwenci już na staracie kariery zarabiają przeciętnie ponad 5.000 zł (np. telekomunikacja, metody ilościowe w ekonomii). Rynek hojnie wynagradza również rzadkie, wąskie specjalizacje humanistyczne, takie jak niektóre filologie (ugrofińska na UW daje rok po jej zakończeniu przeciętnie 5.371 zł).

Dolna część wykresu zawiera głównie kierunki, które można określić jako „para-akademickie” czy „zawodowe”, np. kosmetologia, turystyka i rekreacja, fizjoterapia. Prowadzą one przeważnie do pracy w sektorze usług osobistych, która nie wiąże się z tak wysokimi zarobkami jak w zawodach specjalistycznych. Obok nich pojawiają się kierunki społeczne i humanistyczne, które z kolei oferują wiedzę mniej sprofilowaną zawodowo. Choćby z tej racji wejście na rynek pracy jest dla ich absolwentów względnie trudniejsze (zwłaszcza w wymiarze dochodu). Dodatkowo wiele z tych kierunków ma charakter masowy, więc wytwarzają dużą podaż przy względnie niskim popycie. Dane ELA pokazują również, że odsetek absolwentów, którzy mieli za sobą doświadczenie bezrobocia w rok po zyskaniu dyplomu w dużej mierze oddaje to, co widać na wykresie 1. Ci, który nie wpadli w bezrobocie, znaleźli zatrudnienie poniżej kwalifikacji. Czas spędzony na rynku pracy będzie zapewne działał na ich korzyść, jednak dodatkowe doświadczenie nie zamknie obserwowanej luki płacowej.

Nie tylko kierunek, ale także miasto

Wybór kierunku studiów silnie wpływa na dochód, ale siła dyplomu różni się również pomiędzy ośrodkami akademickimi. Również te zróżnicowania są spore i potwierdzają to, co o nierównościach dochodowych w Polsce wiadomo od dawna (wykres 2. – ze statystyczną kontrolą kierunków). Siła „nabywcza” dyplomów jest największa w przypadku politechnik i uniwersytetów w dużych miastach – Warszawie, Gdańsku, Krakowie czy Wrocławiu. Przeciętny dochód absolwenta spada wraz z peryferyjnością uczelni. Absolwenci uczelni kieleckich, białostockich, czy rzeszowskich zarabiają (po tych samych kierunkach) kilkaset złotych mniej, niż studenci z dyplomem uzyskanym w dużych warszawskich uczelniach. Na przykład absolwent informatyki w Warszawie dostanie przeciętnie 5.800 zł brutto, a z Białegostoku 4.500 zł. Nie ma wątpliwości, że za różnice te odpowiada nie tylko jakość edukacji, ale również specyfika lokalnych rynków pracy. Relacja pomiędzy studiami a pracą nie sprowadza się jedynie do faktu, że absolwenci uczelni w mieście A najczęściej podejmują pracę w mieście A. Znaczenie mogą mieć również takie czynniki jak rozeznanie w ofertach pracy, czy doświadczenia zawodowe zdobyte jeszcze w czasie nauki (np. staże). Gdybyśmy chcieli rzetelnie orzekać o różnicy kompetencji stojącej za dyplomami tego samego kierunku w różnych ośrodkach, powinniśmy porównywać osoby, które znalazły się na jakimś „trzecim”, zewnętrznym rynku pracy (np. za granicą).

Wykres 2. Miasta akademickie wg przeciętnej premii dochodowej absolwentów

Podsumowując

ELA dostarcza niezwykle cennych informacji na temat położenia absolwentów i wiedzę tę można wykorzystać do reformowania niektórych polityk publicznych. Wydaje się, że szczególna troska powinna być skierowania do humanistów i absolwentów nauk społecznych. Zapotrzebowanie na nich niewątpliwie istnieje, ale (a) jest w niektórych “tradycyjnych” specjalnościach mniejsze niż podaż, (b) wymaga nieco innych kompetencji, niż te obecnie oferowane. Nie chodzi  o zamienienie uniwersytetów w szkoły zawodowe, ale o to, aby studia humanistyczne i społeczne nie kształtowały absolwenta zgodnie z kanonami akademickimi sprzed 20 czy 30 lat. Biegłość w językach obcych, obeznanie z technologiami informatycznymi, podstawy programowania, kompetencje organizacyjne – to są rzeczy niezbędne do dobrego odnalezienia się na współczesnym rynku pracy.

Infografika “Społeczeństwo obywatelskie czy koalicja politycznych plemion?”

Czy polskie społeczeństwo jest koalicją zwaśnionych plemion czy raczej deliberującą wspólnotą obywatelską? Odpowiedzi na to pytanie szukaliśmy, tworząc wspólnie z Kubą Wysmułkiem infografikę, która podsumowuje wybrane wyniki kończącego się właśnie projektu “Ludzie w sieciach” (realizowany w ISP PAN ze środków NCN).

(kilknij, aby zobaczyć w pełnej rozdzielczości)

“Ludzie w sieciach”

Dwa demograficzne mity

The Economist opublikował niedawno daily chart, którego tytuł w kontekście panujących nastrojów społecznych brzmi jak prowokacja: Why Europe needs more migrants. Każdy kto zna “Ekonomistę” wie jednak, że to pismo reprezentujące trzeźwy, ekonomiczny racjonalizm w opozycji do wszelkich ideologicznych idiosynkrazji, więc jeśli prowokuje, to przede wszystkim do myślenia.

Choć o sytuacji demograficznej już pisaliśmy, i to dosyć obszernie, na moment wracam więc do tego tematu. Trudno oprzeć się bowiem wrażeniu, że ktokolwiek się nim zajmuje w debacie publicznej – od rządzących po Make Life Harder – myślenie to jest obciążone: (a) fiksacją na dzietności, (b) marginalizacją ekonomicznej roli imigracji. Zrekapituluję krótko te dwa błędne mniemania.

“Mit dzietności” zakłada, że (1) wyższa dzietność może samodzielnie rozwiązać problemy demograficzne współczesnej Polski, a także, że (2) zapewnienie zastępowalności pokoleniowej jest dziś w Polsce realne. Aby najprościej wyjaśnić na czym polega mylność tych przekonań zacznijmy od możliwie najprostszej ilustracji – sztafety pokoleń. Na wykresie poniżej przedstawione zostały liczebności 10-letnich kohort wiekowych współczesnych Polek (dane GUS z VI 2017). Ograniczymy się do kobiet, ponieważ to właśnie ich bezpośrednio dotyczą statystyki dzietności. Przeciętny wiek urodzenia dziecka to obecnie 29 lat. Przyjmując kilka interpretacyjnych uproszczeń możemy więc spojrzeć na te kohorty jako na sekwencję grup matek i córek oddzielonych od siebie interwałem 30 lat. Takiej interpretacji można postawić szereg słusznych zastrzeżeń1, ale mimo wszystko będzie to wystarczające przybliżenie realnych prawidłowości.

Wielkość kohort demograficznych w populacji współczesnych Polek (stan na 30 VI 2017 wg GUS)

Do oznaczenia na wykresie poszczególnych “sztafet pokoleniowych” użyłem osobnych palet kolorystycznych. Kobiety w wieku 60-69 lat to “kohorta matek” dla kobiet w wieku 30-39 lat, te z kolei to “statystyczne matki” dziewczynek w wieku 0-9 lat. Analogiczną relację możemy zdefiniować dla dzisiejszych pięćdziesięcio- i dwudziestolatek, a także dla czterdziesto- i nastolatek.

Co widzimy na wykresie? Jeśli porównamy kohortę 60-69 z ich “córkami”, to widać, że kobiety urodzone tuż po II wojnie światowej wydały na świat przeciętnie więcej niż jedną córkę. Nie zmienia tego nawet wzięcie pod uwagę rosnącej śmiertelności kobiet po 50-tce – owe “ubytki” skompensowane są szarą “czapką” na dwóch ostatnich słupkach (śmiertelność młodszych kobiet jest niska, została więc pominięta). Dla kolejnych grup wiekowych ta tendencja wyraźnie się zmienia. Córki kobiet w wieku 50-59 lat, czyli dzisiejsze 20-latki, są mniej liczne niż ich matki. Dramatyczny spadek zaczyna się jednak dopiero w kolejnych grupach. Sukcesję ponad 3 milionom dzisiejszych 30-latek zapewnia zaledwie 2 miliony dziewczynek poniżej 10 roku życia.

Co z tego wynika? Po pierwsze trzeba rozumieć, że żaden ze słupków nie powiększy się już samym ruchem naturalnym. Dzisiejsza kohorta nastolatek nie zrobi się większa niż 2 miliony. Niezależnie więc od wskaźnika liczby urodzeń, nie zwiększy się liczba przyszłych matek. Nawet gdyby trend niskiej dzietności został kompletnie zatrzymany, nie ma powrotu do liczebności Polek z wyżu lat 1980-ych.

Ale czy ten trend można zatrzymać? Współczynnik dzietności (przeciętna liczba dzieci przypadających na kobietę w wieku rozrodczym) wynosi w Polsce niewiele ponad 1,3 (czyli statystycznie każda matka ma ok. 2/3 córki). To bardzo mało, ale w Europie jedynie dwa kraje balansują na poziomie odtwarzalności pokoleń, czyli mają ten współczynnik na poziomie około 2, są to Francja i Irlandia. Przypomnijmy jednak – jest to poziom odtwarzalności, a nie przyrostu, więc dylemat dotyczy samego utrzymania liczebności tych najmniej licznych kohort (sic!). Co więcej, takiej energii w płodzeniu dzieci nie obserwujemy nigdzie na wschód od Renu, a my wypadamy pod tym względem blado nawet na tle samych sąsiadów (zob. interaktywny wykres na Google).

Aby osiągnąć przeciętną dzietność na poziomie 2 – której Polska w ogóle nie notowała od 1991 roku – kobiety musiałyby rodzić w wyraźnie młodszym wieku i w związku z tym masowo rezygnować z innych życiowych planów. Nie chodzi nawet o realizację marzeń o karierze na szczytach władzy i bogactwa, czy o podróży dookoła świata, ale o rzeczy znacznie bardziej rudymentarne, takie jak studia. Przypomnijmy, że współczynnik skolaryzacji brutto na poziomie szkolnictwa wyższego wynosił na początku lat 1990-ych niewiele ponad 10%, ale w 2010 roku przekroczył 50%. Już sama masowość studiów wyższych przesuwa większość decyzji prokreacyjnych na okres po 25. roku życia. Do pewnych rzeczy po prostu nie ma powrotu, chyba, że w scenariuszu Handmaid’s Tale.

Warto także pamiętać, że programy child benefit, analogiczne do 500+, posiada większość państw europejskich, więc ze względu na konwergencję tak instytucji, jak stylów życia względnie bezpieczne wydaje się założenie, że dzietność w Polsce może w nadchodzących latach wzrosnąć, ale co najwyżej do poziomu 1,5-2,0. W najbardziej optymistycznym z tych scenariuszy (i biorąc na razie w nawias migracje) za 40 lat wykres “sztafety matek i córek” wyglądałby mniej więcej tak jak na wykresie poniżej2. Czarne obrysy oddają wielkość kohort z pierwszego wykresu, czyli tych dzisiejszych. Globalnie oznacza to spadek populacji o około 28% (przypomnijmy – to wersja optymistyczna!). Ale – i to jest szczególnie uderzające – w wersji „pesymistycznej” (czyli przy współczynniku dzietności na obecnym poziomie 1,3), sprawa przedstawia się w zasadzie niewiele gorzej – spadek wyniesie 33%. Jak widać optymizm i pesymizm w sprawie dzietności niewiele się różnią – konik i tak już uciekł. Wyższy współczynnik urodzeń w ogólnym rozrachunku może nieco poprawić sytuację demograficzną, ale fiksowanie się na dzietności jako rozwiązaniu problemu starzenia się społeczeństwa jest nieracjonalne.

“Sztafeta demograficzna” z poprzedniego wykresu za 40 lat przy założeniu o rosnącej dzietności.

Przejdźmy zatem do kwestii imigracji. W dobie kryzysu migracyjnego jest to sprawa drażliwa, ponieważ została spleciona z gorącymi wątkami politycznymi, w tym z lękami o bezpieczeństwo i tożsamość. Jednak niezależnie od towarzyszących jej emocji warto patrzeć na nią trzeźwo – system emerytalny potrzebuje czynnych zawodowo, a rozwijająca się gospodarka – rąk do pracy. Jest jasne, że firmy będą poszukiwały pracowników nawet jeśli rodzima podaż się wyczerpie. Presja popytu na pracownika odczuwana jest na razie głównie w postaci rekordowo niskiego poziomu bezrobocia, ale gospodarka już od dawna “zasysa” też pracowników z zagranicy.

Kwestię emigracji i imigracji zarobkowej, jak wszystkie inne zjawiska ekonomiczne, wypada rozpatrywać w kategoriach podaży i popytu. Patrząc na dane GUS dotyczące ruchów ludnościowych do i z Polski widzimy, że wciąż więcej osób wyjeżdża, niż przyjeżdża. Poniższy wykres pokazuje migracje na stałe, czyli (wg GUS) na co najmniej 12 miesięcy. Czarna ramka pokazuje ubytki ludnościowe, zaś czerwone wypełnienie – stopień ich bieżącego uzupełniania przez przybyszy z zagranicy. Są to jedynie przybliżenia i nie uwzględniają wszystkich rodzajów przepływów ludnościowych (o tym za chwilę), jednak ta wystandaryzowana miara daje pewne pojęcie o atrakcyjności migracyjnej naszego kraju. W ostatnich latach wciąż więcej ludzi długotrwale opuszczało Polskę, niż do niej na stałe przybywało, choć widać jednocześnie trend zmniejszania się tej różnicy. W odróżnieniu od kwestii przyrostu naturalnego, tu państwo ma realny i dużo bardziej znaczący wpływ na konsekwencje demograficzne – oznacza to, że w odróżnieniu od wykresu ilustrującego odtwarzalność pokoleniową, tu dużo trudniej przewidzieć dalszy trend bez wiedzy o konkretnych decyzjach politycznych. Jednak ze względu na wspomniane kwestie popytowo-podażowe, instytucjonalny wpływ na bilans migracyjny również nie jest nieograniczony.

Stosunek emigracji (czarna ramka) do imigracji (czerwone wypełnienie), dane GUS.

Tu dochodzimy do mitu nr 2. Jest nim przekonanie, że polityka imigracyjna może sprowadzać się do zamknięcia drzwi na osoby spoza Unii Europejskiej (czy szerzej rozumianego Zachodu). Jest tak, ponieważ Polska wraz z Chorwacją, Rumunią i Bułgarią zamyka stawkę, jeśli idzie o poziom życia szeroko rozumianego Zachodu. Sami imigranci również dokonują wyborów, więc obie strony potrafią być swoiście „wybredne”. Jedynie kraje najbardziej zamożne, takie jak Wielka Brytania, USA czy Niemcy mogą regulować napływ imigrantów jedynie przez selekcję negatywną.

Jedna z lansowanych obecnie koncepcji zakłada, że imigrację można skutecznie zastąpić reemigracją i repatriacją, a liczba emigrantów z Polski i osób polskiego pochodzenia jest do tego wystarczająca. Jednak największe zagraniczne społeczności polskie są na Zachodzie (dwa największe ośrodki to USA i Niemcy), więc jest to równoznaczne z oczekiwaniem porzucenia przez ludzi lepiej płatnej pracy i lepszych perspektyw życiowych, jakie oferują im te kraje. Na wschód od Polski największym ośrodkiem jest natomiast Białoruś, ale zamieszkuje tam ok. 300 tys. osób deklarujących polskie pochodzenie, więc nawet przyciągnięcie całej mniejszości polskiej z terenu byłego ZSRR – biorąc w nawias realne możliwości i koszty – miałaby marginalne skutki ekonomiczne (dodajmy, że w okresie 1997-2016 Polska wydała 5908 formalnych wiz repatriacyjnych). Być może niektórzy dopatrują się także szansy w negatywnym rezultacie negocjacji dotyczących Brexitu. Zostawmy jednak różnego rodzaju złudzenia i przyjrzyjmy się faktom.

Realnie rzecz biorąc, doraźne rozwiązanie braku dodatkowych rąk do pracy trafiło się Polsce wyjątkowym zbiegiem okoliczności. To czego nie widzimy na powyższym wykresie to liczna rzesza pracowników przyjeżdżających na krótki okres. Liczbę formalnie wydanych nowych zezwoleń na pracę ilustruje kolejny wykres (poniżej), a trzeba mieć na względzie, że jest ona dużo niższa niż realna liczba pracujących w Polsce Ukraińców3. Począwszy przynajmniej od 2014 roku napływ siły roboczej do Polski jest zatem realnie większy niż odpływ, ponieważ podaż pracy skutecznie „suplementowana” jest masowymi przyjazdami krótkookresowymi z Ukrainy (ponad 80%). Warto w tym kontekście postawić pytanie: kto zastąpiłby tych pracowników, gdyby na Ukrainie panował pokój i kwitła gospodarka?

Liczba cudzoziemców (w tys.), którzy otrzymali pozwolenie na pracę w Polsce, dane GUS.

Dla kogo, poza mieszkańcami pogrążonej w kryzysie i wojnie domowej Ukrainy, Polska jest dziś atrakcyjnym kierunkiem emigracji? Kraje, z których napływ ludzi w ostatnich pięciu latach nasilał się i wynosił więcej niż 1500 osób to: Białoruś, Mołdawia oraz Indie. Wyraźnie osłabł natomiast napływ z Chin (prawie sześciokrotnie w ostatnich 6 latach). Wydaje się jasne, że różnica stopnia rozwoju między krajami musi być wystarczająca, by łączny, relatywny koszt emigracji (w tym ten psychologiczny) był mniejszy niż względne korzyści potencjalnego imigranta. Białoruś ma niższe niż Polska PKB per capita (również to liczone w sile nabywczej), ale leży blisko, więc bezpiecznie można założyć, że wszystkie kraje lepiej od niej rozwinięte nie staną się źródłem napływu pracowników do Polski. Na tej zasadzie możemy bezspornie wykluczyć kraje takie jak Gabon, Meksyk czy Iran. Do tej grupy należy też zapewne Botswana, Tajlandia, Chiny, Brazylia czy Algieria. Jednocześnie mieszkańcy krajów bardziej oddalonych od Polski geograficznie i kulturowo niż Ukraina i Białoruś, ponoszą niewątpliwie znacznie większe koszty takiej migracji.

Jeśli w Polsce istnieją silne idiosynkrazje dotyczące kierunków migracji i możliwości integracji cudzoziemców (a debata publiczna jasno wskazuje, że tak jest), warto postawić klarowne pytanie o to, jak owe preferencje przekładają się na konkretne polityki publiczne. A może liczymy jedynie na kryzysy w nieodległym otoczeniu międzynarodowym?


1. Mediana wieku urodzeń stale zmienia się (rośnie), a jej wariancja jest oczywiście spora, więc część dziewczynek z grupy 0-9 jest w istocie córkami kobiet należących do kohorty 10-19, a inna część – kohorty 50-59. Jednak takie “przesunięcia” i nieregularności dotyczą wszystkich kohort, więc ich efekty w większości znoszą się. Zatem choć nie mamy tu substancjalnie trafnego opisu rzeczywistości, to oddaje on faktycznie wpisane w nią trendy.

2. Zakładam tu stopniowe, liniowe dochodzenie dzietności do poziomu 2.0.

3. Pozwolenia są przedłużane na podstawie oświadczenia pracodawcy, a tych wg UDSC było w 2016 roku 1,26 mln – ta liczba może być z kolei zawyżona w stosunku do realnie pracujących. ZUS podaje liczbę 270 tys. zarejestrowanych Ukraińców.

Dwa wykresy o starzeniu się polskiego społeczeństwa

O starzeniu się społeczeństwa i kryzysie demograficznym dyskutuje się w Polsce już od paru lat, a jedną z ważnych przesłanek stanowią prognozy ludnościowe GUS. Konsekwencje zmian w strukturze demograficznej społeczeństwa są wielorakie, od wpływu na szkolnictwo, przez bilansowanie się systemu emerytalnego, po proporcje opieki nad osobami najmłodszymi i najstarszymi (zarówno w skali sektora usług, jak w indywidualnym budżecie czasu każdego z nas). Zamiast patrzeć wprzód (prognoza), poszukując alternatywnych scenariuszy ludnościowych, postanowiliśmy spojrzeć wstecz i pokazać kwestię starzenia się społeczeństwa w dwóch prostych wykresach ilustrujących wieloletnie trendy.

Pierwszy wykres przedstawia “starzenie się społeczeństwa” w sposób dosłowny – jako wzrastającą w czasie medianę wieku w podziale na płeć. Gdyby ustawić całe społeczeństwo w dwuszeregu – od najmłodszych do najstarszych – to w roku 1950 mężczyzna pośrodku swojego rzędu miałaby 24 lata, a kobieta – 27 lat (ten drugi rząd byłby po prostu wyraźnie dłuższy). W roku 2015 środki tych szeregów wypadały na 38 i 41 roku życia. Co istotne, stabilny trend utrzymuje się od początku lat 70-ych. Zatem mimo, że o problemie demograficznym intensywnie dyskutuje się w Polsce od stosunkowo niedawna, to sytuacja i prognozy nie mogą być jakimkolwiek zaskoczeniem od bardzo dawna. Co również znamienne – cezura roku 1989 praktycznie nie jest na wykresie widoczna (poza okresowym wzrostem różnicy między kobietami i mężczyznami), więc zmiany ustrojowe, gospodarcze i inne nie zapisały się dystynktywnie na procesie starzenia społeczeństwa. Wszystko to dobitnie pokazuje, że kryzys demograficzny nie dopadł Polski znienacka, ogólna tendencja utrzymuje się od ponad 40 lat.

mediana_2

Drugi, równie prosty wykres, daje dodatkowy wgląd w charakter trendu. Widzimy na nim podstawowe komponenty procesu starzenia się społeczeństwa – zmieniającą się proporcję ludzi młodych do ludzi starych. O ile w roku 1950 osoby w wieku 65+ stanowiły zaledwie 5% populacji (na czym ważyły także straty wojenne), to z czasem ich udział stabilnie rośnie (drobne fluktuacje związane są z sekwencją wyżów  i niżów), by w 2015 roku stanowić już 16% społeczeństwa. Według GUS w roku 2050 odsetek ten, w każdym z czterech rozpatrywanych przez demografów scenariuszy, wyniesie ponad 30%. Z kolei dzieci w wieku do 14 lat (czyli tzw. wieku “przedprodukcyjnym”) stanowiły ponad 1/3 wszystkich Polaków w roku 1960 (szczyt okresu “baby boom”), ale z czasem ten odsetek szybko spadał. Okresowa “górka” w latach 80-ych to czas, w którym powojenni “baby-boomerzy” założyli rodziny. Spadek udziału dzieci w społeczeństwie wyhamowuje dopiero mniej więcej w dobie akcesji Polski do UE, co jest w istocie drugim “echem” powojennej eksplozji urodzeń (tym razem to wnuki “baby-boomerów” zakładają rodziny). W zależności od scenariusza GUS przewiduje, że udział osób najmłodszych wyniesie w 2015 roku od 11% do 14%, a więc tak czy owak jeszcze nieco spadnie.

Wykres pokazujący co się dzieje na końcach piramidy populacyjnej dobitnie przekonuje, że prognozy wybiegające o 35 lat wprzód nie są “wróżbiarstwem”, ponieważ podstawową przesłanką stanu ludności w danym momencie jest uprzedni potencjał reprodukcyjny. Dzisiejsze dzieci, to jutrzejsi rodzice. Dziś wiemy zatem, że jutrzejszych rodziców jest ponad dwukrotnie mniej niż 40 lat temu, więc ewentualna endogeniczna (“samodzielna”), krótkookresowa korekta demograficznego trendu jest możliwa tylko w wąskim zakresie. Nawet jeśli założymy, że wyraźnie wzrośnie przeciętna liczba urodzeń, to przecież wymnażamy ją przez liczbę matek, których w najbliższych latach wciąż będzie ubywać. Obecnie kobiet w wieku 20-34 lat jest 4,1 miliona, za 15 lat będzie ich 2,8 mln (tyle liczy dzisiejsza kohorta dziewczyn w wieku 5-19 lat, zob. raport GUS).

mlodzi_starzy

Czy to wszystko znaczy, że przyszłość demograficzna Polski ziści się ściśle według scenariuszy GUS? Otóż niekoniecznie. Najsłabszym ogniwem predykcji demograficznej są bilanse migracyjne. Jej autorzy opierali się na tendencjach z ostatnich lat, przewidując, że emigracja będzie przez jakiś czas przeważała nad imigracją, a około roku 2035 zbilansują się one. Jest to bardzo statyczna i konserwatywna przesłanka. Już w tej chwili mówi się przeważnie o około milionie Ukraińców pracujących w Polsce, ale ta liczba stale rośnie. Liczba pochodzących z różnych stron świata chętnych do osiedlenia się nad Wisłą oraz liczba chętnych do wyjazdu z Polski za pracą są pochodną różnic rozwoju gospodarczego. Znaczenie ma nie tylko poziom życia tutaj, ale także poziom życia w innych krajach. W sytuacji wzrostu PKB i przy brakach w sile roboczej nasz kraj zaczyna “demograficzne ssanie”, podczas gdy kraje ogarnięte kryzysami, wojną i opresywne wobec własnych obywateli “wypychają” część swojej ludności. W tej sytuacji utrzymywanie predykcji o ujemnym do zerowego bilansie migracyjnym wydaje się nierealistyczne. Napływ ludzi do pracy oznacza równocześnie napływ młodszych roczników, a więc potencjalną zwyżkę przyrostu naturalnego. Podczas gdy medianowy Polak zbliża się do pięćdziesiątki, medianowy mieszkaniec wielu krajów tzw. globalnego południa to piętnastolatek. Różnice cywilizacyjne są więc jednocześnie różnicami wiekowymi. Nasilanie się zewnętrznych “uzupełnień demograficznych” już od dawna jest udziałem społeczeństw zachodnich, a Polacy – wedle wszelkich kryteriów – stopniowo dołączają do tej grupy.

Czy to rychło zatrzyma “starzenie się” społeczeństwa? W 2014 GUS przewidywał, że wzrost mediany wieku nieco spowolni po roku 2040, ale w 2050 wyniesie ona ponad 50 lat. Nawet przy ostrej korekcie założeń dotyczących migracji nie można przewidywać, że w ciągu jednego pokolenia obecny trend zostanie odwrócony. Na pewno więc “starzenie się” nie zostanie powstrzymane w krótkim czasie – wymagałoby to ogromnej fali imigracyjnej, na którą Polska niekoniecznie jest gotowa politycznie i społecznie. Paradoksalnie jednak obniżenie wieku emerytalnego, bez żadnych dodatkowych korekt, może jeszcze zwiększyć “demograficzne ssanie” Polski, ponieważ w perspektywie kilkunastu lat relacja liczby pracujących do liczby pobierających świadczenia może okazać się tak niekorzystna, że potrzebna będzie natychmiastowa interwencja – albo nagłe podniesienie wieku emerytalnego albo szersze otwarcie drzwi dla imigrantów zarobkowych. Trzeba bowiem pamiętać, że nawet wzrost urodzeń wynikający z programów demograficznych państwa (jak 500+) nie wpłynie na liczebność rodzimej siły roboczej i zmianę dynamiki ludnościowej wcześniej niż za 20-30 lat. Obecnie przeciętny wiek podjęcia pierwszej pracy to ok. 22 lata, a mediana wieku urodzenia pierwszego dziecka wynosi ponad 27 lat. Co więcej, jeśli nastąpi szybki wzrost dzietności, to w populacji większy będzie nie tylko udział osób w wieku “poprodukcyjnym” (na emeryturę zaczynają właśnie przechodzić “baby-boomerzy”), ale również w wieku “przedprodukcyjnym”, a w konsekwencji kategoria osób pracujących może okazać się zbyt mała, by podołać niezbędnym obciążeniom fiskalnym na rzecz niepracujących (alternatywą jest szybki wzrost zadłużenia państwa, a więc przerzucenia dzisiejszych kosztów emerytalnych na kolejne pokolenia).

Postęp cywilizacyjny przynosi nieodwracalne, z punktu widzenia demografii, skutki kulturowe. Trudno dziś przewidywać, że młodzi ludzie masowo zechcą rezygnować z osobistego rozwoju w okresie młodzieńczym, w tym np. ze studiów czy podróży, by bardzo wcześnie oddawać się rodzicielstwu. Zaskoczeniem byłby także nagły wzrost liczby zawieranych małżeństw czy stabilnych związków w ogóle, a to one stanowią podstawę biograficznego zabezpieczenia w sytuacji posiadania dzieci (chodzi o rozłożenie ciężarów wychowawczych, nie tylko finansowych). Paradoksalnie więc sama finansowa łatwość utrzymania dzieci niekoniecznie najefektywniej służy zwiększeniu ich liczby – jeśli spojrzeć na to szerzej, bywa wprost odwrotnie (kiedyś trudniej było wykarmić dzieci, a rodziło się ich więcej). Kolejny paradoks – na tę sytuację wpływają także zmiany dotyczące seniorów, którzy zachowując względną sprawność fizyczną i intelektualną w momencie przejścia na emeryturę coraz częściej wybierają inne priorytety niż “pełnoetatowa” opieka nad wnukami. Jedni przeżywają drugą młodość, inni skupiają się na swoim zdrowiu i dobrostanie, a widząc poprawiającą się sytuację materialną swoich pracujących dzieci, mogą czuć się moralnie zwolnieni z konieczności bezpośredniej pomocy (oferując w zamian np. dodatkową pomoc finansową). Z kolei państwo bezpośrednio dotując dzieci zwiększa nie tylko prawdopodobieństwo samego ich posiadania (w relacji proporcjonalnej do dochodów rodziców), ale także zainteresowanie jakością opieki i edukacji. Często – znów paradoks – może to oznaczać rezygnację z publicznego przedszkola i szkoły, a więc podkopywać inne inwestycje państwa w tym obszarze. Te same pieniądze (prywatne inwestycje w edukację dzieci) mogłyby przecież zapewnić całodzienną, dobrej jakości opiekę nad dziećmi (zajęcia dodatkowe) ulokowaną na terenie macierzystej szkoły (bez konieczności wożenia dzieci na zajęcia pozalekcyjne. Chodzi także o łatwość zapewnienia potomstwu dobrej i łatwo dostępnej opieki zdrowotnej. Globalnie decyzja o posiadaniu i liczbie dzieci zależy bowiem nie tyle od stanu portfela, co od trudności związanych z godzeniem roli rodzica z innymi życiowymi potrzebami (praca zawodowa, samorealizacja). Wzrost dziennego spożycia kalorii mógł spowodować przejście demograficzne w neolicie, ale nie spowoduje go w epoce nowoczesnej antykoncepcji, miłości romantycznej i marzeń wziętych z Instagrama. Programy socjalne mogą zapewnić wzrost urodzeń w pewnych granicach, ale z pewnością samodzielnie nie zatrzymają kryzysu demograficznego. Nie gwarantuje tego również sam zwrot ku bardziej tradycyjnym wartościom, ponieważ pod pewnymi względami spowalnia on rozpoczęcie aktywności prokreacyjnej (pieczołowity dobór partnera, wartość wstrzemięźliwości seksualnej). Młodociana matka zachodząca cyklicznie w ciążę, to efekt nie tyle konserwatywnych wartości, co słabej edukacji i braku perspektyw życiowych.

Wiemy już, że ważną konsekwencją programu bezpośredniej premii finansowej za dzietność okazało się zmniejszenie liczby dzieci żyjących w ubóstwie. Trudno to przecenić. Jednocześnie nie wiemy jeszcze jakie będą efekty demograficzne 500+, ale możemy bezpiecznie założyć, że wyraźnie większe wśród uboższych niż wśród bogatych. Skoro oba efekty dotyczą głównie ludzi mniej zamożnych, należałoby rozważyć, czy w programie tym nie wprowadzić progu dochodowego, a zaoszczędzonych środków nie skierować na programy: (a) adaptacji i integracji imigrantów (nauka języka, zapobieganie gettoizacji), a nawet “drenażu mózgów” (masowe programy stypendialne uzupełniające ubytki, będące skutkiem “drenażu” z Polski) oraz (b) pośrednich (instytucjonalnych) inwestycji w dostępność, kompleksowość i jakość publicznych usług wychowawczo-edukacyjnych. Programy te mogą być zresztą w pewnej mierze współzależne, a ten drugi posiadałby równocześnie walor istotnego wyrównania szans, co jest ważne o tyle, że szkolnictwo jest w Polsce z każdym rokiem coraz mniej egalitarne. Oba miałyby zapewne mniejszy efekt doraźny, ale w dłuższej perspektywie ich zignorowanie może okazać się bardzo kosztowne społecznie.

Nature vs nurture

Trwające właśnie Igrzyska Olimpijskie zdają się po raz kolejny rozstrzygać stary problem – talent (“nature”) czy praca i warunki (“nurture”). O talencie można by zakładać, że jest w populacji świata rozłożony losowo, jednak niektóre wielkie państwa mają zaskakująco mało medali – jak Indie (1 brązowy przy 1236 mln populacji), albo nie mają ich wcale – jak Meksyk (0 medali na 117 mln). Węgry, o populacji niewiele większej niż stolica tego ostatniego, mają 6 złotych (łącznie 13). Ale najbardziej “efektywne” w dziedzinie sportu okazują się dotychczas Grenada, Bahamy i Nowa Zelandia.

W Internecie istnieje wygodna porównywarka, obejmująca osiągnięcia medalowe państw począwszy od roku 1896: http://www.medalspercapita.com/.

Medale per capita w RIO

Kilka danych o niedzielnym biegu na piątkę w Białymstoku

W ramach imprezy biegowej Białystok Półmaraton 2016, odbył się bieg towarzyszący na  5 km. Z ciekawości zrobiłam analizę podstawowych danych, które “wybiegali” uczestnicy.

Na metę dobiegło 621 zawodników. Poniższy wykres pokazuje rozkład czasu na tym dystansie w podziale na płeć. Wysokość słupka informuje ile osób dobiegło na metę w danym czasie. Widać, że niewielka grupa najszybszych mężczyźni potrzebowała na to około 15 min (najlepszy wynik biegu to 14:58 min!), a kolejna grupa to osoby z czasem około 18 minut. W tej drugiej grupie pojawiają się już kobiety (najszybsza dotarła na metę po 17:33 min).

czas

Te same wyniki przedstawiam poniżej na wykresie skrzypcowym. Pod względem interpretacji jest zbliżony do powyższego histogramu z tą różnicą, że jest bardziej wygładzony i nie są widoczne na nim skoki (zamiast surowych danych użytych do histogramu, używa się tu jądrowego estymatora gęstości). W środku skrzypieć znajduje się dodatkowo wykres skrzynkowy, na podstawie którego można powiedzieć coś o różnicach w medianie (czyli tego jak szybko dobiegła połowa kobiet i mężczyzn) i zróżnicowaniu. Widać tu wyraźniej, że wyniki kobiet skoncentrowane były mocniej wokół czasu przeciętnego wynoszącego nieco poniżej 30 minut (średnia biegu kobiet wynosiła 29:57). Skrzypce mężczyzn są bardziej rozciągnięte, co oznacza, że ich wyniki były bardziej zróżnicowane. O ile wielu “niedzielnych” biegaczy i biegaczek mogłoby rywalizować na równych zasadach (spora grupa kobiet pobiegła szybciej niż wynosi męska mediana), o tyle istotne różnice uwypuklają się na krańcach rozkładu.

violin

Ile lat będziemy zdrowi?

Eurostat opracował niedawno ciekawy wskaźnik informujący o oczekiwanej liczbie lat przeżytych w zdrowiu. Zgodnie z definicją chodzi o brak poważnych i umiarkowanych chorób, które w istotny sposób ograniczałyby aktywność życiową. Pamiętać jednak trzeba, że wskaźnik ten wyliczony został w oparciu o dane dotyczące dzisiejszej populacji i nie powinien być interpretowany jako informacja o tym, ile lat żyć będziemy w przyszłości.

Podobnie jak w przypadku ogólniejszego wskaźnika – przewidywanej długości życia, tak i w przypadku długości zdrowego życia podstawowym czynnikiem różnicującym jest płeć i kraj.

Na poniższym wykresie pokazujemy te różnice. Słupki z prawej strony od zera wskazują na kraje, w których dłużej żyją kobiety, a z lewej te, gdzie dłużej w zdrowiu żyją mężczyźni. Największa różnica na rzecz kobiet występuje w krajach Europy Środkowo-Wschodniej, a im dalej na zachód tym staje się ona mniejsza. W Holandii, Danii, Włoszech, czy Finlandii dłużej żyją  mężczyźni, w tym pierwszym kraju aż o 5 lat. W oczy rzuca się też spore zróżnicowanie między krajami, w których kobiety są dłużej zdrowe – Łotyszki mają aż 5 lat przewagi nad Łotyszami, a Hiszpanki pół roku wobec Hiszpanów. Wychodzi na to, że przeciętne małżeństwo na Łotwie składa się ze względnie kwitnącej żony i schorowanego męża, a w Holandii odwrotnie. Ciekawie byłoby przyjrzeć się stylom życia rodzin w tych krajach.

01_roznica

Ciekawie wyglądają też międzykrajowe różnice w długości zdrowego życia po ukończeniu 65 lat. Tutaj dystans między płciami nie jest już tak duży, ale różnice między poszczególnymi krajami są bardzo wyraźne. Najdłużej na emeryturze będą żyć obywatele bogatych krajów północnych: Norwegii, Szwecji, czy Islandii. Na dole wykresu ponownie znalazły się kraje środkowej Europy. Wiele prawidłowości w kohorcie osób powyżej 65 roku różni się wyraźnie od tych obserwowanych na wykresie wyżej (wystarczy przyjrzeć się Holandii). Oznaczać to może m.in. że subiektywna definicja męskiej i kobiecej ciężkiej choroby różni się między krajami. Za różnicami może więc stać nie tylko względy medyczne, ale i świadomość zdrowotna.

plot_04

Informacje przedstawione na tych wykresach są kluczowe dla projektowania wielu polityk społecznych, a przede wszystkim systemu emerytalnego i zdrowotnego, które dla budżetów wielu krajów będą stawały się coraz większym obciążeniem.

Czy internetowe “lajki” mają znaczenie?

Kwestia tego, jakie znaczenie mają “lajki” i inne formy wyrażania opinii w sieci jest  często traktowana ambiwalentnie. Ukuto nawet termin “kliktywizm” (clicktivism) dla tej formy płytkiego aktywizmu obywatelskiego. W Internecie łatwo znaleźć także memy w tym duchu (zob. poniżej). Kliktywizm łatwo scharakteryzować w kategoriach procesów opisywanych przez Roberta Putnama w jego głośnej książce “Bowling Alone” (dzisiejsze zaangażowanie obywatelskie w USA ma jego zdaniem powierzchowny charakter, a sektor obywatelski pozostawiony został aktywistom “sprofesjonalizowanym”).

Czy "lajk" może uratować komuś życie?

Czy “lajk” może uratować komuś życie?

Zostawiając z boku kwestię tego, czy to dobrze, czy źle, że ludzie wyrażają swoją opinię w łatwy i często anonimowy sposób za pośrednictwem Internetu, warto zwrócić uwagę na to, że informacje gromadzone w serwisach społecznościowych można potraktować jako źródło danych socjologicznych i politologicznych. Przykładu dostarcza niepewna i zmieniająca się sytuacja na Ukrainie. Losy niektórych części tego kraju decydują się na podstawie – czy może pod pretekstem – referendum. Przy takim stanie rzeczy opinia, nawet ta powierzchowna i efemeryczna, może mieć geopolityczne znaczenie. W przypadku, gdy inne formy badania opinii są trudne do przeprowadzenia, sensowną ich alternatywną staje się obserwowanie trendów w serwisach społecznościowych. Ciekawą ilustrację znajdziemy na ukraińskim blogu poświęconym wynikom tamtejszych wyborów. Na stronie http://statistika.in.ua/vk/pislyamaidan zamieszczona została interaktywna mapa, która pokazuje ilu użytkowników z określonej miejscowości “polubiło” profil “Euromajdanu” lub “Antymajdanu”.

Mapa, sporządzona przy pomocy serwisu Google, przedstawia liczbę “lajków”, które zostały w poszczególnych miejscowościach przyznane przez użytkowników bądź to profilowi “Euromajdanu” (kolor czerwony), bądź profilowi “Antymajdanu” (kolor granatowy) w serwisie VKontakte (rosyjski odpowiednik Facebooka). Biały kolor oznacza względną równowagę zwolenników i przeciwników Majdanu, natomiast odcienie pośrednie świadczą o stopniu przewagi określonej strony. We Lwowie 99% użytkowników opowiedziało się za pierwszym, z kolei w Doniecku 78% za drugim. Ukraińscy komentatorzy twierdzą, że istnieją dziś nie dwie, ale trzy Ukrainy, powołując się właśnie na fakt, że obok jednoznacznie prozachodniego Centrum i Zachodu oraz względnie prorosyjskiego Donbasu i Krymu (Wschód), istnieje umiarkowanie prozachodni Połdniowy-Wschód. Co najważniejsze  – obserwacje wywiedzione z danych portalu społecznościowego potwierdzają mapy dotyczące proporcji grup etniczno-językowych oraz wyniki badań sondażowych (np. http://zn.ua/UKRAINE/mneniya-i-vzglyady-zhiteley-yugo-vostoka-ukrainy-aprel-2014-143598_.html). Z tych ostatnich dowiadujemy się, że o ile legalność rządu Jaceniuka uznaje 57% mieszkańców obwodu mikołajewskiego, o tyle już tylko 17% donieckiego i ługańskiego. W pozostałych obwodach wygląda to tak: chersoński 50%, dniepropietrowski 48%, odeski 41%, zaporożski 35%, charkowski 33%. Wziąwszy pod uwagę wariancję “braków zdania” (od 11% do aż 25%), wyniki dosyć wyraźnie korespondują z danymi, które widać na mapie internetowych “lajków”.

Warto rozważyć co może stanąć na przeszkodzie traktowania “kliktywizmu” jako źródła danych o nastrojach społecznych. Zrobię to w kontekście trzech podstawowych kryteriów, jakie musi spełnić rzetelne badanie socjologiczne (zob. http://www.spoleczenstwo.pl/pliki/sondaze-ISadowski.pdf).

(1) Najpoważniejszym problemem jest autoselekcja – populacja użytkowników może się wyraźnie różnić od reszty populacji. Zazwyczaj chodzi o wiek i kategorie dotknięte cyfrowym wykluczeniem. Warto jednak zauważyć, że problem autoselekcji jest tym poważniejszy, im bardziej hermetyczna jest podnoszona kwestia i mniej popularny portal będący źródłem danych. Jeśli mamy do czynienia z portalem “masowym”, a analizowana kwestia dotyka jakoś jego wszystkich użytkowników (i mobilizuje do zajęcia stanowiska), wówczas wypaczenie związane z autoselekcją staje się mniejsze. O opiniach osób starszych i tych, które nie korzystają z Internetu możemy wnioskować na podstawie tego, jak klikają młodsi członkowie ich rodzin. Dzieje się tak zwłaszcza w sytuacji (ewidentnej na zamieszczonej mapie) dyfuzji poglądów.

(2) Wiarygodność opinii. W sytuacji, gdy opinia nie jest wyrażana anonimowo, a przede wszystkim jest ona wypowiadana wobec własnych znajomych, a nie np. ankietera, jej wiarygodność należy ocenić na nie mniejszą niż w przypadku sondażu. Skłonny jestem twierdzić, że z socjologicznego punktu widzenia deklaracje polityczne na fb są nawet bardziej znaczącą formą artykulacji, niż odpowiedź na pytania w traktowanym jako poufny wywiadzie.

(3) Interpretacja wskaźnika. Interpretacja “lajku” jest niekiedy trudniejsza niż w przypadku pytania sondażowego. Niektórzy użytkownicy VKontakte mogli “polubić” określony profil tylko po to, by śledzić informacje, które są tam zamieszczane (a więc z ciekawości, a nie jako wyraz poparcia). Często jest to wybór porównywalny z tym, którego dokonujemy kupując określoną gazetę. Choć więc można mieć pod tym względem pewne zastrzeżenia, nie stanowi to poważnego zagrożenia dla formułowanych wniosków w sytuacji, o której tu akurat mowa. Przy napiętej sytuacji politycznej wybór mediów jest silnie skorelowany z wyborem światopoglądowym.

PS. Innej interesującej ilustracji podziału na Ukrainie dostarcza mapa tzw. Leninopadu (goo.gl/UqSYQn).

Orientacje geopolityczne na Ukrainie

Ukraińska Prawda opublikowała dziś wyniki najnowszego sondażu dotyczącego geopolitycznych orientacji ukraińskiego społeczeństwa (http://www.pravda.com.ua/news/2014/04/5/7021480/). Sondaż przeprowadzono w drugiej połowie marca 2014 na próbie 1200 osób. Co ciekawe – gazeta twierdzi, że badanie objęło wszystkie regiony – w tym Krym, należy więc domniemywać, że był to sondaż telefoniczny.

Postanowiłem zilustrować wyniki za pomocą pakietu ggplot2. Załączony wykres dobitnie pokazuje jak głęboko spolaryzowane są sympatie na Ukrainie i jak skomplikowana jest w związku z tym wewnętrzna sytuacja polityczna. Globalnie odnotowany został wzrost orientacji na integrację z Unią Europejską. W sierpniu 2012 jedynie co trzeci mieszkaniec Ukrainy deklarował, że w referendum zagłosowałby za akcesją do UE, zaś obecnie odsetek ten wynosi 53% (za przystąpieniem do Unii Celnej z Rosją chciałoby głosować 28% badanych). Jak liczna była podpróbka krymska i jak wyglądałyby wyniki, gdyby ją pominąć, gazeta niestety nie informuje.

Kliknij, by powiększyć

Kliknij, by powiększyć