100930748

Page 1


Spi S treści

„O co w tym chodzi?”

Najważniejsze zasady Data Science

Przy całej uwadze poświęconej najwyraźniej nieskończonemu potencjałowi technologii i różnorodnym możliwościom, jakie oferuje ona sprytnym przedsiębiorcom, ktoś mógłby zapytać po co w ogóle zajmować się Data Science. Czemu po prostu nie opanować technologii. W końcu to one napędzają świat i nie widać żadnych oznak spowolnienia ich rozwoju. Czytelnik zainteresowany rozwojem swojej kariery zawodowej może uważać, że wiedza o tym, jak opanować nową technologię, zagwarantuje mu powodzenie.

Łatwo jest uznać technologię za siłę, która zmienia świat – zawdzięczamy jej komputery osobiste, internet, sztuczne organy, autonomiczne pojazdy, system GPS, ... Niewielu ludzi myśli o Data Science jako o sile napędowej wielu z tych wynalazków. Właśnie dlatego powinieneś przeczytać tę książkę zamiast książki poświęconej technologii –żeby coś zmienić, musisz poznać sposób, w jaki to coś działa.

Nie powinniśmy uważać danych za nudnego, ale przydatnego przodka, a technologii za szykownego nastolatka. Znaczenie Data Science nie sprowadza się do wyjaśnienia, że technologia potrzebuje danych jako jednego z wielu swoich składników. W ten sposób zaprzeczylibyśmy pięknu danych i wielu ich interesującym zastosowaniom, zarówno w pracy, jak i zabawie. W skrócie, rozwój technologii byłby niemożliwy bez Data Science i  vice versa. To znaczy, że poznanie podstaw Data Science otwiera wiele drzwi, bo specjaliści danych potrzebni są w wielu dziedzinach. Data Science jest wyjątkowo obiecującym obszarem prac i badań.

Część I wprowadzi Cię w świat wszechobecnych danych i najważniejszych zasad

Data Science, które pomogą Ci pogłębić posiadaną wiedzę. Pojęcia przedstawione w trzech pierwszych rozdziałach dadzą Ci zarys obrazu, w jaki sposób dane dotyczą Ciebie, i pozwolą Ci się zastanowić nie tylko nad tym, jak Ty i Twoja firma mogą z nich skorzystać, ale również nad tym, jak możesz użyć danych do rozwoju swojej kariery i nie tylko.

Dokąd zmierzamy

W rozdziale 1 zrobimy pierwsze kroki naszej wędrówki po Data Science. Wyjaśnię w nim, jak my wszyscy, żyjąc w erze komputerów, przyczyniamy się do gigantycznego przyrostu danych. Następnie przejdę do odpowiedzi na pytania, jak ludzie gromadzą i pracują z danymi oraz – przede wszystkim – jak można użyć danych z korzyścią dla różnorodnych projektów prowadzonych w ramach Data Science i poza tą dziedziną. Przekonamy się, że jednym z problemów dotyczących Data Science nie jest jej trudność, ale to, że dla wielu osób obszar Data Science pozostaje niejasny. Dopiero gdy zdamy sobie sprawę z ogromnej ilości danych i poznamy metody ich zbierania, będziemy mogli zastanowić się nad różnorodnymi sposobami pracy z danymi. Osiągnęliśmy poziom rozwoju technologicznego pozwalający gromadzić i przechowywać dane na potrzeby najróżniejszych branż – wystarczy spojrzeć na liczbę ogólnie dostępnych zbiorów danych i projektów rządowych mających na celu zestawienie danych zbieranych przez różne instytucje kulturalne i polityczne. Jednak wciąż relatywie mało osób wie, jak dostać się do tych danych i jak je przeanalizować. Bez specjalistów rozumiejących ich przydatność, te wspaniałe zbiory danych będą się tylko kurzyły. Ten rozdział odpowiada na pytania, dlaczego właśnie teraz Data Science stała się ważna, dlaczego nie jest tylko chwilową modą i dlaczego warto rozważyć jej użycie w codziennej pracy.

W drugiej części rozdziału szczegółowo wyjaśnię, czemu gwałtowny rozwój technologii nie pozwala nawet na chwilę wstrzymać badań w zakresie Data Science. Jakiekolwiek byłyby nasze obawy względem nadchodzącego świata, nie możemy przestać zbierać, przechowywać i używać danych. Niemniej nie możemy zignorować faktu, że dane jako takie nie są etyczne lub nieetyczne i że otwiera to pole do nadużyć. Ci z Was, którym kwestie etyczne leżą na sercu, mogą wziąć sprawę w swoje ręce i dołączyć do dyskusji prowadzonych przez międzynarodowe instytucje powołane w celu rozwiązywania etycznych problemów wynikających z używania danych. Temat ten jest tak wciągający, że poświęciłem mu osobny punkt rozdziału 3 – Ciemna strona sztucznej inteligencji.

przyszłość to dane

Wszystko, każdy proces, każde urządzenie, wkrótce będzie sterowane danymi. To całkowicie zmieni sposób prowadzania biznesu. Przewiduję, że w ciągu 10 lat od każdego pracownika, we wszystkich firmach, będzie się oczekiwało umiejętności pracy z danymi oraz zdolności analitycznych, dzięki którym wypracuje on dodatkową wartość dla firmy. Nie tak bardzo zwariowany pomysł, jeśli wziąć pod uwagę, że teraz od wielu osób spodziewamy się umiejętności posługiwania się systemem płatności mobilnych i cyfrowym portfelem Apple Pay, który zadebiutował na rynku w roku 2014.

W rozdziale 2 wyjaśnię, że każdy aspekt naszego życia wiąże się z danymi. Dane nami kierują, a ich siła rośnie wraz z ich ilością. Chociaż technologia dopiero niedawno, jak na całą historię ludzkości, stała się ważną częścią naszego życia, dane zawsze odgrywały w nim zasadniczą rolę. Nasze DNA zawiera najbardziej podstawowe dane na nasz temat. To one nami sterują: odpowiadają za sposób, w jaki patrzymy, za kształt naszych kończyn, za budowę i działanie naszych mózgów i za zakres emocji, których doświadczamy. Jesteśmy pojemnikami na dane, chodzącymi pamięciami przenośnymi biochemicznych informacji, przekazującymi je naszym dzieciom i programującymi je mieszanką danych naszych i naszego partnera. Brak zainteresowania danymi oznacza brak zainteresowania najważniejszymi zasadami naszego istnienia.

Z tego rozdziału dowiesz się, jak dane są używane w różnych obszarach. Żeby to zilustrować, posłużyłem się przykładami bezpośrednio nawiązującymi do teorii hierarchii potrzeb Maslowa, teorii, która powinna być znana wielu studentom, przedsiębiorcom i menedżerom. Jeżeli nie znasz teorii Maslowa, nie martw się – wyjaśnię ją i jej związek z danymi w rozdziale 2.

Hamowanie postępu

W ostatnim rozdziale części I przyjrzę się bieżącemu stanowi badań nad sztuczną inteligencją, jej potencjalnym zastosowaniom i związanymi z nimi zagrożeniami. Rozwój sztucznej inteligencji pośrednio wpłynął na różne obszary naszego życia. Pojawiły się pytania o przyszłość specjalistów danych, jak również badaczy i praktyków, wykraczające poza obszar Data Science. Jeżeli planujesz karierę specjalisty danych, ten rozdział może dostarczyć inspiracji na zagospodarowanie nisz tak bardzo potrzebujących wykwalifikowanych fachowców.

Żeby uzupełnić przykłady z rozdziału 2, zawierającego przekonujące przykłady użycia danych w codziennym życiu, w rozdziale 3 zwracam uwagę na pięć najbardziej obiecujących zastosowań sztucznej inteligencji w biznesie. Różnorodność zastosowań sztucznej inteligencji może utrudniać ich poznanie. Ten rozdział dostarczy

Ci podstawowych informacji o najważniejszych trendach użycia SI i zachodzących w nich zmianach.

Pozytywny wpływ sztucznej inteligencji jest oczywisty, ale nie powinien nas zaślepić. Dlatego w rozdziale 3 znajdziemy też informacje o zagrożeniach bezpieczeństwa wynikających z danych i ich użyciu przez sztuczną inteligencję oraz o tym, jak specjaliści danych mogą rozwiązywać takie, bieżące i przyszłe, problemy. Etyka jest fascynująca ze względu na jej wpływ na kierunki rozwoju Data Science. Na podstawie tego, co wiemy na temat metod zbierania danych i sposobów ich użycia przez maszyny i usługi online, etyka danych wyznacza obszar dialogu między ludźmi a technologią.

Część II

„Gdzie i jak je znajdę?”

Gromadzenie i analiza danych

Jak to zwykle bywa, to co najlepsze, jest trudne do osiągnięcia. Projekty, w których używa się danych, doskonale ilustrują tę tezę. Celem tego typu projektów jest wydobycie z danych czegoś nowego, jako że zadaniem specjalistów danych jest rozwiązanie istniejących problemów. Zaczynając nowy projekt, lubię wyobrażać sobie, że rozmawiam z danymi. Poznaję je, żeby mieć pewność, że będę mógł je uczciwie zaprezentować i że moi klienci oraz sponsorzy projektu odniosą z nich maksimum korzyści. Z własnego doświadczenia, oraz z doświadczeń moich współpracowników, wiem, że samo poznanie danych potrafi otworzyć oczy i dostrzec możliwości zmian na lepsze. Dotyczy to wszystkich firm, z którymi pracowałem, a zakres zmian zawsze był szeroki – od sposobu wykonywania konkretnych zadań po strukturę organizacyjną. Czasami uzyskane wyniki były bezpośrednio związane z problemami biznesowymi, o których rozwiązanie zostaliśmy poproszeni. Równie często udawało nam się rzucić światło na aspekty działalności biznesowej niewidoczne wcześniej dla klienta. A zatem w danych tkwi ogromny potencjał. To właśnie sprawia, że praca z nimi jest tak ekscytująca. Dane zawsze coś nam powiedzą, czasami będzie to nowa informacja, a czasami nie. Dane pozwalają badać różne możliwości i testować różne hipotezy. Robimy to, zadając różne pytania, przekształcając dane na różne sposoby i analizując je przy użyciu różnych algorytmów.

proces Data Science

zRozumIenIe

I PRzygotowAnIe dAnych pobranie, wyczyszczenie i przygotowanie danych do analizy. sprawdzenie kompletności danych. usunięcie anomalii i ocena jakości danych.

wIzuAlIzAcjA dAnych zamiana skomplikowanych spostrzeżeń na łatwe do zrozumienia wizualizacje i animacje. na tym etapie wcielasz się w artystę – uwalniaj swoją wyobraźnię.

rysunek ii.1. Proces Data Science

zRozumIenIe PRoblemu bIznesowego jaki jest cel analizy? na jakie pytania chcesz znaleźć odpowiedzi? określenie zakresu projektu.

AnAlIzA dAnych tworzenie modeli uczenia maszynowego, wydobywanie informacji ukrytych w danych, analiza tekstów – lista zadań jest długa. to najbardziej twórczy etap projektów Data science.

PRzedstAwIenIe wynIków spostrzeżenia muszą być zrozumiałe, żeby można było na ich podstawie podjąć decyzje. przedstaw wyniki, używając języka zrozumiałego przez twoich odbiorców mówiąc w skrócie – „uprość to, co złożone”.

Dane mają ogromy potencjał, ale wydobycie ukrytych w nich informacji może być skomplikowane. Szczególnie, jeżeli danych jest dużo, są one różnorodne i porozrzucane między różnymi systemami, a firma nie wie dokładnie, gdzie i jak przechowuje swoje dane. Wtedy właśnie z pomocą przychodzi proces Data Science. To sprawdzona i niezawodna metoda prowadzenia projektów, pozwalająca uporządkować dane niezależnie od ich ilości i rodzaju. Proces Data Science przeprowadzi Cię przez cały projekt, od jego zaplanowania po wdrożenie. Po raz pierwszy opracowany przez Joe Blitzsteina i Hanspetera Pfistera opisuje on każdy etap projektu, zaczynając od zgromadzenia danych po zaprezentowanie wyników w prosty i przekładający się na decyzje biznesowe sposób.

Przyjrzyjmy się lasom losowym nieco dokładniej, na konkretnym przykładzie.

STUDIUM PRZYPADKU

BcG – wyszukiwanie najlepszych lokalizacji pod nowe oddziały banku

Algorytm lasów losowych świetnie nadaje się do rozwiązywania złożonych problemów, z którymi drzewa decyzyjne nie radzą sobie najlepiej. Gdybyśmy na przykład, mieli znaleźć najlepsze lokalizacje pod nowo otwierane oddziały banku na podstawie wzorców ukrytych w wielu zmiennych, użylibyśmy lasu losowego.

Mieszkam w Australii i kiedy chcę zarejestrować się jako nowy klient banku, szukam takiego, który ma wygodnie zlokalizowane oddziały. Chciałbym, żeby oddział banku znajdował się blisko mojego domu, w pobliżu miejsca pracy i sklepów, w których robię zakupy. Jeśli bank ma też oddział blisko plaży, tym lepiej. Nie ma nic gorszego od konieczności jechania przez całe miasto tylko po to, żeby porozmawiać z konsultantem lub zrealizować czek.

Banki wiedzą, że dostępność ich oddziałów jest głównym powodem, dla którego potencjalni klienci je wybierają. Ale muszą też mieć pewność, że nowo otwarty oddział nie przyniesie im strat. Artem Vladimirov, czołowy konsultant ds. analityki w Boston Consulting Group (BCG), dostał od jednego z banków należących do grupy kapitałowej, który chciał rozwinąć swoją działalność na terenie całej Australii, takie zadanie do rozwiązania.

Artem najpierw przeanalizował dane demograficzne klientów banku, żeby poznać ich liczbę w poszczególnych okręgach mieszkalnych Australii. Zauważył, że ponieważ oddziały baku nie były równomiernie rozmieszczone w całym kraju, brakuje mu danych z niektórych okręgów. Żeby móc obliczyć zyskowność oddziałów otwartych w tych okręgach, Artem przeprowadził analizę porównawczą okręgów „znanych” i „nieznanych” bankowi, używając do tego celu ogólnie dostępnych, rządowych danych demograficznych. Na podstawie takich informacji demograficznych jak średni wiek, procent mężczyzn i kobiet, wykształcenie i koszt życia, Artem uzupełnił braki w danych. Pozwoliło mu to oszacować prawdopodobieństwo otworzenia zyskownego oddziału w nowym okręgu, którego mieszkańcy byli podobni do mieszkańców okręgu „znanego” bankowi. Żeby rozwiązać postawiony przed nim problem Artem użył lasów losowych:

Użyliśmy całej bazy klientów banku do nauczenia algorytmu lasów losowych związku między danymi demograficznymi klientów a ich rentownością. Predykcje zostały wykonane dla okręgów, w których istniały już oddziały banku, a więc pozostało nam jedynie sprawdzić, czy otwarcie oddziału w nowym okręgu przyniesie zyski przez porównanie danych demograficznych jego mieszkańców (SuperDataScience, 2016).

nie jest gorsza niż trafność losowego zgadywania. Algorytm lasów losowych uwzględnia oba te założenia. (przyp. tłum.).

Po zidentyfikowaniu interesujących dla banku okręgów Artem sprawdził dane na temat konkurencji i liczby oddziałów innych banków w poszczególnych okręgach. Raz jeszcze użył lasów losowych do oszacowania procentowego udziału w rynku, jaki bank może uzyskać w tych okręgach, otwierając w nich swoje oddziały

Las losowy nie zawiera opisów zwracanych przez siebie predykcji. W tym przypadku

Artem nie musiał wytłumaczyć, które zmienne demograficzne miały największy wpływ na otrzymane predykcje, co pozwoliło mu ominąć problem przetwarzania danych osobowych i precyzyjnie wskazać te okręgi, w których otwarcie oddziału będzie dla banku najkorzystniejsze.

Kroki budowania lasów losowych

1. Wybierz liczbę drzew, które chcesz zbudować. W wielu programach domyślną wartością tego hiperparametru będzie 10. Liczba, którą wybierzesz, zależy od kontekstu konkretnego zadania. Mniej drzew może oznaczać mniej dokładne predykcje. Jednocześnie możesz bezpiecznie zbudować tyle drzew, ile tylko chcesz, nie martwiąc się, że algorytm lasów losowych nadmiernie dopasuje się do danych treningowych7.

2. Naucz klasyfikator na podstawie danych treningowych. Model nauczony na danych treningowych może być użyty do predykcji, czyli do uzupełnienia danych testowych o wartość zmiennej wyjściowej. Porównując wyniki predykcji z rzeczywistymi wartościami zmiennej wyjściowej, będziemy mogli zmierzyć jakoś (np. trafność) klasyfikatora.

Algorytm lasów losowych wylosuje ze zwracaniem z danych treningowych N podzbiorów, gdzie N jest liczbą drzew decyzyjnych wybranych w pierwszym kroku. Ponieważ używana jest metoda losowania ze zwracaniem, te same obserwacje mogą trafić do wielu podzbiorów, ale żaden z tych podzbiorów nie będzie taki sam jak pozostałe.

Po utworzeniu podzbiorów każdy z nich zostanie użyty do zbudowania osobnego drzewa decyzyjnego. W ten sposób poszczególne drzewa decyzyjne będą nauczone na osobnych podzbiorach danych treningowych, i nie będą znały wszystkich danych. To rozwiązanie pozwala zagwarantować różnorodność i niezależność drzew decyzyjnych – cechy, które dają lasom losowym „siłę tłumu”.

7 Zostało sprawdzone, że o ile tylko dysponujesz co najmniej kilkuset obserwacjami opisanymi przez co najmniej kilkanaście zmiennych, jakość modelu lasów losowych osiągnie maksimum dla mniej więcej 50 drzew decyzyjnych. Dalsze ich zwiększanie nie ma znaczącego wpływu na poprawę wyników, a wydłuża czas uczenia modelu (przyp. tłum.).

Wynika z tego, że do poprawienia dokładności predykcji wystarczy nauczyć algorytm lasów losowych na większym zbiorze danych – im więcej będzie zawierał przykładów, tym dokładniejsze będą predykcje zwracane przez algorytm.

Drzewa decyzyjne czy lasy losowe?

Chociaż algorytm lasów losowych można uznać za „nowszą wersję” drzew decyzyjnych, oba mają swoje zalety i wybór jednego z tych algorytmów zależy od postawionego zadania. Jeśli dysponujesz niewielkim zbiorem danych, użycie lasów losowych może dać nieoptymalne wyniki, bo algorytm niepotrzebne podzieli Twoje dane na podzbiory. W takim przypadku użyj drzew decyzyjnych, które nie tylko są szybsze, ale również pozwalają w prosty sposób interpretować zwracane predykcje. Ale jeśli pracujesz z dużym zbiorem danych, lasy losowe dadzą dokładniejsze, choć trudniejsze w interpretacji wyniki8.

algorytm k najbliższych sąsiadów

Algorytm k najbliższych sąsiadów (k-NN) używa wykrytych w danych wzorców do przypisania nowych obserwacji do właściwych kategorii. Powiedzmy, że lekarka z San Francisco przeczytała o rosnącej liczbie zachorowań na cukrzycę w Stanach Zjednoczonych i chce zapobiec epidemii wśród swoich pacjentów. Pani doktor wie, że cukrzycy typu 2 łatwiej jest zapobiegać, niż leczyć. Zwróciła się do specjalisty danych z prośbą o zbudowanie modelu, który na podstawie danych jej pacjentów, z których część choruje na cukrzycę, określi prawdopodobieństwo, z jakim ta choroba może w przyszłości dotknąć nowych pacjentów.

Pani doktor liczy, że na podstawie predykcji modelu będzie mogła wcześniej zidentyfikować pacjentów z grupy podwyższonego ryzyka i pomóc im zachować zdrowie dzięki badaniom profilaktycznym i konsultacjom dotyczącym zdrowego trybu życia. Z doświadczenia wie, że dwoma czynnikami mającymi istotny wpływ na zapobieganie chorobie są liczba ćwiczeń tygodniowo i waga. Zadaniem specjalisty danych jest teraz zbudowanie modelu, który wiarygodnie klasyfikowałby pacjentów jako należących do grupy podwyższonego ryzyka.

Czego możesz się spodziewać po algorytmie k najbliższych sąsiadów?

Algorytm k-NN analizuje „podobieństwo”. Jego działanie polega na obliczeniu odległości między nową obserwacją a przykładami treningowymi. Ponieważ w tym

8 Ponieważ końcowy wynik jest obliczany na podstawie predykcji zwróconych przez poszczególne drzewa decyzyjne, prześledzenie reguł, na podstawie których został on zwrócony, będzie bardzo trudne.

10 wskazówek od McCol dotyczących budowania

sieci k ontaktów

Caroline McColl pomogla wielu specjalistom danych w znalezieniu ich wymarzonej pracy. Podkreśla ona rolę sieci kontaktów i podaje 10 wskazówek pomagających zbudować zawodową sieć kontaktów (SuperDataScience, 2017b):

1. Wybierz specjalizację lub branżę, w której chciałbyś pracować (będzie bardziej prawdopodobne, że odpowiednio się przygotujesz i znajdziesz pracę, która sprawi Ci przyjemność).

2. Znajdź trzech mentorów, którzy pomogą Ci pokierować rozwojem kariery (mentorzy mogą Ci podpowiedzieć, gdzie szukać pracy, pomogą zidentyfikować Twoje silne i słabe strony, nawiązać kontakty z innymi specjalistami danych).

3. Współpracuj z osobami, których umiejętności uzupełniają Twoje (specjaliści danych, którzy odnieśli największy sukces, zaczynali jako samodzielni konsultanci – zaangażuj do projektu osoby, które posiadają takie umiejętności, których Tobie brakuje).

4. Zorganizuj i poprowadź wydarzenie, nawet jeśli miałoby wziąć w nim udział tylko pięć osób (fakt, że zorganizowałeś wydarzenie, dowodzi Twojego zaangażowania oraz chęci uczenia się od innych i dzielenia się z nimi swoją wiedzą).

5. Organizuj lub występuj w podcastach poświęconych Data Science (podcasty są prostym sposobem zaistnienia w świecie Data Science i przekazania własnych pomysłów międzynarodowej publiczności).

6. Stwórz kompletny profil na LinkedIn i dodaj do niego wszystkie projekty, w jakich brałeś udział (LinkedIn jest świetnym sposobem pokazania się firmom szukającym specjalistów danych, a im więcej zobaczą one informacji o Twoich projektach, tym lepiej).

7. Wyznacz sobie cotygodniowe, osiągalne cele (jeśli masz wątpliwości, czy uda Ci się je zrealizować, zacznij od łatwych celów i stopniowo przechodź do trudniejszych).

8. Bierz udział w konferencjach i spotkaniach poświęconych interesującej Cię dziedzinie (bądź na bieżąco i pozostań aktywny – świat Data Science to bardzo aktywna społeczność).

9. Pisz bloga i publikuj prace naukowe (takie artykuły, jeśli są dobrze napisane i udostępnione, mogą znacząco pomóc w ugruntowaniu pozycji eksperta w danej dziedzinie).

10. Pomagaj w nawiązywaniu kontaktów innym, nawet jeśli nie przyniesie Ci to bezpośredniej korzyści (korzystasz z pomocy i rad innych osób, a więc

Twoim obowiązkiem jest odwdzięczyć się przez wniesienie własnego wkładu do społeczności Data Science).

ubieganie się o pracę

Powinno już być dla Ciebie oczywiste, że Data Science nie osiągnęła jeszcze dojrzałości jako osobna dziedzina nauki, a wiele firm dopiero zaczyna tworzyć reguły prowadzenia projektów Data Science. Jeśli jesteś absolwentem uczelni, pewnie nie jest Ci obce zastosowanie paradoksu paragrafu 22 do rynku pracy – większość stanowisk wymaga doświadczenia, ale nie jesteś w stanie zdobyć pierwszej pracy, chyba że masz już doświadczenie.

Według mnie, jeśli nawet w opisie stanowiska znalazł się wymóg 5–10-letniego doświadczenia, i tak powinieneś zgłosić swoją kandydaturę. Stanowiska w obszarze Data Science nadal są nieprecyzyjnie określone, a wakaty na stanowiska analityka danych są średnio o pięć dni dłużej otwarte niż w przypadku innych stanowisk. Czytaj między wierszami ogłoszeń, a zastanawiając się nad własnym doświadczeniem, uwzględnij to, jak długo uczysz się Data Science (czy to na uczelni, czy samodzielnie), i jak długo praktykujesz w tej dziedzinie6.

Zdobycie rzeczywistego doświadczenia jest łatwe – wystarczy, że wrócisz do wymienionych w pierwszej części publicznych zbiorów danych i przećwiczysz na nich cały opisany w książce proces Data Science. Platformy takie jak Kaggle czy SuperDataScience również regularnie publikują konkursy i wyzwania. Ich podjęcie to świetny sposób na zdobycie praktycznego doświadczenia. Nie wstydź się chwalić tego typu doświadczeniami i potraktuj je jako okazję do zaprezentowania swoich umiejętności. Firmy doceniają kandydatów, którzy aktywnie pracują z danymi.

Firmy szukają kandydatów, którzy przede wszystkim: 1) rozumieją dane, 2) potrafią rozwiązywać ich problemy i 3) pomogą im osiągnąć przewagę nad konkurencją. Przekonaj je w swojej aplikacji, że potrafisz osiągnąć te cele – pracodawcy muszą być pewni, że wyniki projektów Data Science przełożą się na poprawę ich wyników finansowych.

6 Nawet Artem Vladimirow, którego poznaliśmy w rozdziale 6, rozpoczął pracę w obszarze Data Science ze względnie małym doświadczeniem w tej dziedzinie. Gdy dołączył do firmy Deloitte, miał dyplom z rachunkowości i nie umiał nawet programować. Dziś Artem odniósł ogromny sukces w Data Science, rozwiązuje najtrudniejsze problemy biznesowe i prowadzi wykłady na całym świecie.

Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.