Page 1

INTRO TO DATA SCIENCE

Горан Митров Душко Клинчаров Проф. м-р Зоран Милевски


КРАТКО ИНФО ЗА НАС  Студенти на ФИНКИ (3 година)  Демонстратори по предметите: структурно програмирање, објектно-ориентирано програмирање, оперативни системи, вовед во информатика


INFORMATION EXPLOSION 90% of data ever created was created in the last 2 years


BIG DATA  Причината за појава на Data Science како термин

 Податоци големи и по бројност и по обем  Неудобни за складирање, транспортирање и анализирање


ШТО СОДРЖИ BIG DATA  Секој клик, like, коментар на социјалните мрежи  Локации кои сме ги посетиле ( Google Maps – timeline)  Пребарувања на Google или било која друга страна  Сите останати податоци кои сме ги внеле во некој веб формулар  И многу други работи...


ПОЈАВА НА BIG DATA


IoT – INTERNET OF THINGS


INTERNET OF THINGS Зошто?  Сакаме да ги контролираме работите (преку клик на телефон да се пушти рерна за затоплување на јадење и кога ќе стигнеме дома јадењето да е топло)  Сакаме да автоматизираме (кога термометарот ќе измери дека во собата е топло, да се вклучи клима уредот)  Сакаме работите да ги правеме побрзо (плаќање на сметки од дома)


Обичен фрижидер

Држи ладно и не први ништо друго

INTERNET OF THINGS


Интелигентен фрижидер

Те известува за тоа што имаш внатре

Те известува кога има производ со поминат рок

(Во иднина) – Нарачување на производи преку интернет

INTERNET OF THINGS


DATA SCIENCE


КАДЕ СЕ ЗАЧУВАНИ СИТЕ ОВИЕ ПОДАТОЦИ? Data center

Database Management System


СТАТИСТИКА


НЕКОИ ПОИМИ ОД СТАТИСТИКА Хистограм

Box Plot анализи


НЕКОИ ПОИМИ ОД СТАТИСТИКА Табела на контингенција


СКЛАДИШТА НА ПОДАТОЦИ (DATA WAREHOUSE)  Податоци од повеќе извори (на пример складиште за маркети Тинекс од базите во Кавадарци, Скопје, Битола итн.)

 Временска димензија и историски податоци

 Погодни за анализа на податоците или OLAP (On-line analytical processing)


СКЛАДИШТА НА ПОДАТОЦИ (DATA WAREHOUSE)

Ѕвезда шема (Star schema)


СКЛАДИШТА НА ПОДАТОЦИ (DATA WAREHOUSE)

Податочна коцка (Data cube)


СКЛАДИШТА НА ПОДАТОЦИ (DATA WAREHOUSE)


БИЗНИС ИНТЕЛИГЕНЦИЈА  Стратегии и техники користени од корпорациите за анализа на податоците и поддршка при донесување на одлуки за бизнисот.  Спој помеѓу бизнис светот и светот на податоците.


БИЗНИС ИНТЕЛИГЕНЦИЈА


ПОДАТОЧНО РУДАРЕЊЕ (DATA MINING)


АЛГОРИТМИ ЗА НАОЃАЊЕ ЗАВИСНОСТИ ВО ПОДАТОЦИТЕ Класификација

• постои дискретен атрибут според кој се врши поделба (пр. пол)

Кластерирање

• не постои атрибут според кој се врши поделба (пр. поделба на купувачи во маркет)


АЛГОРИТМИ ЗА НАОЃАЊЕ ЗАВИСНОСТИ ВО ПОДАТОЦИТЕ Регресија

• постои реална вредност која треба да ја предвидиме (пр. температура)

Асоцијативни правила

• Наоѓање на предмети кои често се појавуваат заедно (пр. пелени и пиво)


ПОДАТОЧНО РУДАРЕЊЕ (DATA MINING) Детекција на аутлаери (Outlier Detection) Можна примена: Детекција на измами при трансакции со банкарски картички.


ПОДАТОЧНО РУДАРЕЊЕ (DATA MINING) Дрво на одлука (Decision Tree)

Креаторите на ова дрво го креирале како решение на тоа дали да чекаат слободна маса во ресторан


Datasciencef  

Intro to Data science Горан Митров Душко Клинчаров Проф. м-р Зоран Милевски

Datasciencef  

Intro to Data science Горан Митров Душко Клинчаров Проф. м-р Зоран Милевски

Advertisement