Page 28

KLUCZ DO PRZYSZŁOŚCI–

BIG DATA Dlaczego Hindusi w końcu odnoszą suk-

ces w walce z kłusownikami tygrysów?

Jak to się stało, że po raz kolejny udało Ci się uniknąć korków na „Zakopiance”? Jak zdiagnozować stan Twojego związku z drugą osobą? Czy języki, jakimi posługują się ludzie na całym świecie, posiadają więcej szczęśliwych niż smutnych słów? Okazuje się, że aby zdobyć odpowiedzi na te pytania, wystarczy dysponować wielkimi zbiorami danych. Pojęcie Big Data pojawia się w środowisku

jest jednak najważniejszy: 90% z tych 5 zettabaj-

analityków od kilku lat. Co ono dokładnie ozna-

tów zostało wygenerowane przez ostatnie 2 lata.

cza? Zgodnie z najbardziej intuicyjną definicją,

Obrazuje to lawinowy wręcz przyrost danych i ich

jest to analiza zbiorów danych tak ogromnych, że

niewyczerpane źródło do analiz. Słychać również

przy jej sporządzaniu niemożliwe jest użycie tra-

głosy, że w porównaniu do ropy naftowej, będącej

dycyjnych narzędzi. Firma Forrester definiuje dla

głównym surowcem XX wieku, w XXI takim su-

danych zasadę czterech wymiarów 4V – volume

rowcem będą właśnie dane.

(ilość), variety (różnorodność), velocity (szybkość

Jak powszechnie wiadomo, tygrysy żyjące na

napływania), value (wartość). Mamy do czynienia

wolności w Indiach są zagrożone wyginięciem ze

z ogromnymi zbiorami danych (często liczonymi

względu na kłusownictwo. Kości tygrysów są bar-

w petabajtach). Pochodzą one z rozmaitych źródeł,

dzo cenione w chińskiej medycynie. Przez wiele lat

wymagają poświęcenia uwagi, gdyż często brakuje

problem kłusownictwa był bardzo trudny do zwal-

im spójności. Docelowo dąży się do tego, aby dane

czenia, gdyż kłusownicy poruszali się w małych gru-

napływały i były analizowane w czasie rzeczywi-

pach i pojawiali bardzo nieregularnie, tylko w sobie

stym, a wyodrębniane tylko najważniejsze wnioski

doskonale znanych miejscach. Przełom nastąpił

spośród gigantycznych ilości informacji nieistot-

w sierpniu 2014 r., kiedy to ekolog Koustubh

nych.

Sharma na łamach magazynu „Wright” zaproSkąd wzięło się zapotrzebowanie na Big

ponował estymację prawdopodobieństwa wy-

Data? Liczby mówią same za siebie: każdego dnia

stąpienia kłusownictwa na terenie całych Indii.

w Internecie powstaje 2,5 tryliona bajtów danych.

Dzięki temu udało się zlokalizować 73 tzw. „hot

Dla przypomnienia, trylion to jedynka i osiemna-

spots”, czyli miejsc, gdzie to prawdopodobień-

ście zer. Ile danych powstało od momentu stwo-

stwo jest bardzo wysokie. Aby stworzyć swój

rzenia Internetu? Szacunkowe dane mówią o 5

model, Sharma napisał kod komputerowy oparty

zettabajtach. To tak, jakby zapełnić danymi 4 mld

o 25000 punktów danych zlokalizowanych w 605

dysków o pojemności 256 GB. Ostatni argument

okręgach. Zbiór danych obejmuje obserwacje od 26

Profile for Magazyn Deal

Magazyn Deal XXII  

XXII numer Magazynu Deal wydawanego przez SKN Inwestor działające przy Wydziale Ekonomiczno-Socjologicznym Uniwersytetu Łódzkiego.

Magazyn Deal XXII  

XXII numer Magazynu Deal wydawanego przez SKN Inwestor działające przy Wydziale Ekonomiczno-Socjologicznym Uniwersytetu Łódzkiego.

Advertisement