Big Data

wallpaper-hd-facebook-world-network

Zwlekałem z pisaniem tego postu od kilku dni będąc przekonanym, że lada chwila na jakimś z polskich portali pojawi się tłumaczenie całości. Przecież to taki ciekawy temat, do tego Polak w roli głównej, więc spokojnie można by dać charakterystyczny nagłówek w rodzaju „Cały Zachód zachwycony! Wszyscy podziwiają niesamowite przełomowe rewolucyjne odkrycie Polaka” i zbierać żniwa kliknięć, ale cóż. Chyba się na to nie zanosi, więc do dzieła.

W sobotę szwajcarskie czasopismo Das Magazin opublikowało śledztwo dziennikarskie o tym jak technologie spersonifikowanej reklamy w sieci Facebook wpłynęły na wyniki wyborów w USA i referendum o wyjściu Wielkiej Brytanii z UE. Jak podkreśla Spiegel, wielu dziennikarzy już nazywa tę śledztwo „tekstem roku”. W nim jest wszystko: i najnowsze technologie; i uniwersalna broń, która trafiła z dobrych rąk w złe; i codzienne śledzenie każdego z nas; i enigmatyczni zleceniodawcy; i przemiana żebraka w księcia (i odwrotnie).

Artykuł jak najbardziej zasługuje na to, by przeczytać go w całości. Ja zaś jedynie wybrałem z niego kilka ciekawych akapitów.

Pojęcie Big Data oznacza to, że wszystko co robimy – w internecie czy offline – pozostawia ślad cyfrowy. Zakup kartą kredytową, zapytanie w Google, spacerek ze smartfonem w kieszeni, każde polubienie w sieci społecznościowej: to wszystko się zachowuje. Przez długi czas nikt nie mógł zrozumieć, do czego dobrego mogłyby się przydać te dane – poza chyba przypadkami, kiedy na głównej Facebooka wyskakuje reklama środków na nadciśnienie, ponieważ niedawno pytaliśmy Google’a „jak obniżyć ciśnienie”. Niejasne było także to, czym jest Big Data dla ludzkości – wielkim zagrożeniem czy wielkim osiągnięciem? Po 9 listopada znamy na to odpowiedź. Zarówno za kompanią wyborczą Trumpa w internecie, jak i za kompanią poparcia Brexit stoi jedna i ta sama firma zajmująca się badaniami Big Data: Cambridge Analytica i jej dyrektor Alexander Nix. Ten, kto chce poznać naturę tych głosowań (oraz naturę tego, co czeka Europę w ciągu najbliższych miesięcy), powinien zacząć od ważnego wydarzenia, które miało miejsce w 2014 roku w brytyjskim Uniwersytecie Cambridge. A konkretnie, na katedrze psychometrii Kosińskiego.

Psychometria zwana niekiedy psychografią stanowi próbę pomiaru osobowości ludzkiej. We współczesnej psychologii standardem jest tzw. „metoda oceanu” (według liter OCEAN, anagramu pięciu pomiarów w języku angielskim). W latach 1980. dwaj psychologowie dowiedli, że każda cecha charakteru może zostać zmierzona za pomocą pięciu pomiarów. Jest to tak zwana wielka piątka: otwartość (w jakim stopniu jesteś gotowy na nowe?), sumienność (na ile jesteś perfekcjonistą?), ekstrawersja (jaki masz stosunek do społeczeństwa?), życzliwość (na ile jesteś przyjazny i gotowy do współpracy?) i neurotyzm (czy łatwo się wyprowadzasz z równowagi?) Na podstawie tych pomiarów można dokładnie zrozumieć, z jakim człowiekiem ma się do czynienia, jakie są jego chęci i strachy, wreszcie, jak on może się zachowywać. Problem był jednak ze zbieraniem danych: żeby cokolwiek zrozumieć o człowieku, musiał on najpierw wypełnić ogromną ankietę. Lecz później pojawił się internet, potem Facebook, potem Kosiński.

W 2008 roku student z Warszawy Michał Kosiński rozpoczął nowe życie: dostał się na prestiżowy angielski Cambridge, do Centrum Psychometrii, Laboratorium Cavendisha, pierwszego laboratorium psychometrii na świecie. Wraz z kolegami z roku wymyślił i uruchomił on aplikację dla Facebooka pod nazwą MyPersonality. Użytkownik musiał odpowiedzieć na ogromną liczbę pytań („czy łatwo cię wyprowadzić z równowagi w stanie stresu? Czy masz skłonność do krytykowania otaczających ciebie ludzi?”), uzyskując potem swój „profil osobowości”, zaś twórcy aplikacji dostawali bezcenne dane osobowe. Zamiast danych tuzina kolegów z uczelni, twórcy pozyskali informację o setkach, tysiącach, a później i milionach ludzi. Dwaj doktoranci zebrali w ten sposób największy „plon” danych w historii badań psychologicznych.

Proces, który Kosiński i spółka opracował w ciągu następnych kilku lat, jest stosunkowo prosty. Po pierwsze, testowany otrzymuje listę pytań, test online. Z odpowiedzi na niego uczeni obliczają jego wartości osobowe. Dalej Kosiński z zespołem badają aktywności testowanego: polubienia i udostępnienia na Facebooku, a także jego płeć, wiek i miejsce zamieszkania. W ten sposób badacze uzyskują powiązania. Zwykła analiza danych w sieci może dać ciekawe wnioski. Na przykład, jeśli mężczyzna jest podpisany na profil brandu kosmetyków MAC, z wysokim prawdopodobieństwem jest on gejem. Przeciwnie, mocny wskaźnik heteroseksualności – jeśli człowiek dał lajka hiphopowemu zespołowi Wu-Tang Clan z Nowego Jorku. Fan Lady Gagi z dużym prawdopodobieństwem jest ekstrawertykiem, zaś człowiek lajkujący filozoficzne posty – introwertykiem.

Kosiński z kolegami nieustannie doskonalili swój model. W 2012 roku Kosiński udowodnił, że analizy 68 polubień na Facebooku wystarczy, by określić kolor skóry testowanego (z 95% prawdopodobieństwem), jego homoseksualność (88% prawdopodobieństwa) oraz poparcie Demokratycznej czy Republikańskiej partii USA (85% prawdopodobieństwa). Jednak proces idzie jeszcze dalej: rozwój intelektualny, preferencje religijne, pociąg do alkoholu, palenia czy narkotyków. Dane pozwalały nawet się dowiedzieć, czy rodzice badanego rozwiedli się zanim on ukończył 18 lat czy nie. Model okazał się na tyle dobry, że możliwym stało się przewidywanie odpowiedzi testowanego na pewne pytania. Podniecony sukcesem, Kosiński pracował dalej: wkrótce model potrafił rozpoznawać osobowość testowanego po dziesięciu zbadanych lajkach lepiej niż jego koledzy z pracy. Po 70 lajkach – lepiej niż przyjaciel. Po 150 lajkach – lepiej niż rodzice. Po 300 lajkach – lepiej niż partner.

Kosiński z ekipą mogą oceniać ludzi według Wielkiej piątki kryteriów na podstawie ich avatara czy zdjęcia profilowego. Albo nawet według liczby znajomych: dobre kryterium ekstrawersji! Ale my także podajemy dane, gdy jesteśmy offline. Czujnik ruchu w smartfonie pokazuje, czy wymachujemy ręką z nim, jak daleko jeździmy (koreluje z niestabilnością emocjonalną). Jak podkreśla Kosiński, smartfon to ogromny kwestionariusz psychologiczny, który chcąc nie chcąc musimy wypełniać. Co szczególnie istotne, działa to również w odwrotnym kierunku: można nie tylko tworzyć z danych portret psychologiczny, można też szukać spośród tych portretów potrzebne. Na przykład, zaniepokojeni ojcowie, podenerwowani introwertycy, zwolennicy demokratów, którzy się nie określili z wyborem. Generalnie rzecz biorąc, Kosiński wynalazł wyszukiwarkę ludzi.

Firma zakupuje dane personalne ze wszystkich możliwych źródeł: katastry, programy bonusowe, książki telefoniczne, karty klubowe, subskrypcje, dane medyczne. W USA da się kupić niemal każde dane personalne. Jeśli chcesz się dowiedzieć, dajmy na to, gdzie mieszkają kobiety-żydówki, można spokojnie kupić bazę danych. Później Cambridge Analytica porównuje te dane z listami zarejestrowanych zwolenników partii republikańskiej i danymi według lajków-udostępnień na Facebooku – i oto mamy profil osobowy według „metody oceanu”. Dane cyfrowe przekształcają się w ludzi ze strachami, dążeniami i zainteresowaniami – i z adresami zamieszkania.

Jak powstrzymać elektorat Clinton przed głosowaniem

W dzień trzeciej debaty między Trumpem a Clinton ekipa Trumpa wysłała do sieci (przeważnie Facebook) ponad 175 tys. różnych wariacji przesłań. Różniły się one jedynie najmniejszymi detalami, po to by maksymalnie dokładnie pod względem psychologicznym dostosować się do konkretnych odbiorców informacji: tytuły i podtytuły, kolory tła, wykorzystanie foto i wideo w poście: „W ten sposób możemy dotrzeć do potrzebnych wsi, dzielnic czy budynków, nawet do konkretnych ludzi”. W dzielnicy Little Haiti w Miami puszczona została informacja o wycofaniu się fundacji Clintonów z udziału w likwidacji następstw trzęsienia ziemi w Haiti – po to by zniechęcić mieszkańców do głosowania na Clinton. Miało to też inne zadanie: powstrzymać elektorat Clinton (na przykład wahających się lewaków, Afroamerykanów i młodych kobiet) przed urną wyborczą, „tłumić” ich wybór, jak to ujął jeden z pracowników Trumpa. Wykorzystywano tak zwane „ciemne posty” Facebooka: płatne ogłoszenia na stronie głównej, które były wyświetlane tylko pewnej grupie osób. Na przykład Afroamerykanom pokazywano posty z filmikami, na których Clinton porównywała czarnych mężczyzn do drapieżników.

Całość jest niezwykle interesująca. Wielka szkoda, że w Polsce nie ma żadnych stron publikujących tłumaczenia artykułów zagranicznych. Ja niestety nie mam czasu na przetłumaczenie całości, podaję więc linki do artykułu we wrogich j. niemieckim i rosyjskim. Wersji angielskiej nie znalazłem, ale polecam mimo wszystko poszperać, a coś na pewno się znajdzie.

      Buggles-Video-Killed-The-Radio-Star
Podziel się: