Metody badania i odkrywania miasta oparte na danych web

Page 75

8 State of Digital, How to recognize Twitter bots: 7 signals to look out for, http://www.stateofdigital.com/how-to-recognize-twitter-bots-6-signals-to-look-out-for. 9 The Sunday Times, Secret deals turn heat on World Cup, http://www.thesundaytimes. co.uk/sto/news/uk_news/fifa/article1420147.ece.

brak informacji oznacza brak zabójstwa czy brak dotyczących go raportów? Niestety, nie da się tego zrobić. Ten błąd jest nieodłącznym elementem każdego projektu wykorzystującego dane. Żadna organizacja, nawet policja czy służba zdrowia, nie jest wszechwiedząca – zawsze będzie brakowało pewnych danych. Niestety, określenie, jakich danych brakuje, to bardzo czasochłonny proces. Z tego powodu trzeba się konsultować z ekspertami, aby potwierdzić, czy zgromadzone przez nas dane zgadzają się z ich doświadczeniem w danej dziedzinie. Konieczne są także wyprawy w teren

po to, aby samodzielnie ocenić sytuację. Dziennikarstwo danych polega na przekształcaniu konkretnych przypadków w statystyki i wiedzę, a nie na ich lekceważeniu. Innym problemem związanym z wywiadem otwartoźródłowym jest sprawdzanie poprawności danych. Z jednej strony nie da się przecież poświęcić wielu dni na weryfikację każdej pojedynczej informacji w bazie. Z drugiej jednak strony baza taka nie przedstawia żadnej wartości, jeśli zawiera błędne informacje. Trzeba więc znaleźć równowagę pomiędzy celami i zasobami. W przypadku dochodzenia w sprawie wypadków samochodowych można z dużą dozą prawdopodobieństwa uznać, że relacje z kont na Twitterze są wystarczająco wiarygodne, pod warunkiem, że nie publikują ich roboty oraz że użyto w nich prawdziwych zdjęć8. Jednak badając powiązania korupcyjne pomiędzy politykami, należy koniecznie zdobyć niepodważalne fakty. Najważniejsze to określić udział procentowy błędnych danych w bazie z pomocą specjalisty statystyka. Może się okazać, że występujące błędy polegają na zawyżonej w stosunku do rzeczywistej wartości (na przykład według relacji wypadek miał miejsce o 17.00, podczas gdy w rzeczywistości była to 16.00), a czasem wartości zaniżonej (godzina 16.00 zamiast 17.00). W końcowym rozrachunku takie błędy mogą się wzajemnie uśrednić i nie mieć negatywnego wpływu na wartość analizy, a sprawdzanie każdego elementu danych nie będzie potrzebne.

a The Migrants Files, http:// themigrantsfiles.com.

Jak informować o wynikach Dziennikarstwo danych jest równie dobrym narzędziem do prowadzenia badań, jak i do przekazywania faktów. Pewne zdarzenia lepiej opisuje się przy pomocy słów. W czerwcu 2014 roku „The Sunday Times” opublikował wyniki dziennikarskiego śledztwa prowadzonego z wykorzystaniem milionów dokumentów uzyskanych od informatora (nie był to wywiad otwartoźródłowy). Płynący z nich wniosek, że Katar nie zdobył prawa do organizacji Mistrzostw Świata 2022 w ramach uczciwych starań, lecz w wyniku korupcji9, był tak dobitny, że słowa wystarczyły. Ale na przykład projekt Migrant Files10, polegający na zliczaniu imigrantów, którzy

71


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.