__MAIN_TEXT__

Page 1

Истражувачки алатки во економијата Перспектива на тинк-тенк Марјан Петрески

Поддржано од:


Истражувачки алатки во економијата Перспектива на тинк-тенк

Проф. д-р Марјан Петрески

Рецензент Проф. д-р Игор Величковски


Цивика мобилитас е проект на Швајцарската агенција за развој и соработка (SDC), кој го спроведуваат NIRAS од Данска, Македонскиот центар за меѓународна соработка (МЦМС) од Македонија и Шведскиот институт за јавна администрација (SIPU) од Шведска Содржината на оваа книга е единствена одговорност на Finance Think – Институт за економски истражувања и политики, Скопје и на ниту еден начин не може да се смета дека ги одразува гледиштата на Цивика мобилитас, Швајцарската агенција за развој и соработка (SDC) или организациите што ја спроведуваат.

Издавач: Finance Think – Институт за економски истражувања и политики, Скопје Автор: Марјан Петрески Дизајн и печат: Контура / Милош Ѓуроски Рецензент: Игор Величковски

Лектор на македонски јазик: Анета Василевска - Љубецкиј Тираж: 150 примероци Бесплатен/некомерцијален примерок

CCIP - Каталогизација во публикација Национална и универзитетска библиотека "Св. Климент Охридски", Скопје 330:005.311(035) ПЕТРЕСКИ, Марјан Истражувачки алатки во економијата : перспектива на тинк-тенк / Марјан Петрески. - Скопје : Финанце тхинк, 2018. - 121 стр. : илустр. ; 30 см Библиографија: стр. 119-121 ISBN 978-608-65704-5-3 а) Економски истражувања - Методи и техники - Прирачници COBISS.MK-ID 107419402


Содржина 1.

ВОВЕД ............................................................................................... 5 КОЈА Е ЦЕЛТА НА ОВАА КНИГА? ........................................................................ ЗОШТО Е ВАЖНО ДА СЕ АНАЛИЗИРААТ ЕКОНОМСКИТЕ ПОДАТОЦИ? ................................ ЗА КОГО Е НАМЕНЕТ ОВОЈ ПРИРАЧНИК? ............................................................... КАКО Е ОРГАНИЗИРАН ОВОЈ ПРИРАЧНИК? .............................................................

2.

5 6 7 8

КВАНТИТАТИВНИ МЕТОДИ ВО ЕКОНОМИЈАТА ............................... 11 КВАНТИТАТИВНА АНКЕТА ............................................................................... 11 Која е популацијата на анкетата?........................................................ 12 Како да изберам примерок? ................................................................ 12 Како да ги поставам прашањата? ........................................................ 16 Администрирање на анкетата .............................................................. 18 Кодирање и подготовка за натамошно користење ................................ 21 СОБИРАЊЕ СЕКУНДАРНИ ПОДАТОЦИ.................................................................. 21 СТАТИСТИЧКА АНАЛИЗА ................................................................................ 23 Описна статистика ............................................................................. 23 Нормален распоред ............................................................................ 38 Интервал на доверба .......................................................................... 44 Тестирање статистички хипотези ......................................................... 46 Регресија ........................................................................................... 66

3.

КВАЛИТАТИВНИ МЕТОДИ ВО ЕКОНОМИЈАТА ................................. 87 КВАЛИТАТИВНА АНКЕТА ................................................................................ 87 ИНТЕРВЈУ ................................................................................................ 88 ФОКУСНА ГРУПА ......................................................................................... 90 ПРАШАЛНИК „ДЕЛФИ“ ................................................................................. 95 НАБЉУДУВАЊЕ .......................................................................................... 97

4. ПРЕТОЧУВАЊЕ РЕЗУЛТАТИ И НАОДИ ВО ИНФОРМАЦИЈА РАЗБИРЛИВА ЗА ЈАВНОСТА .................................................................. 99 ГРАФИКОНИ И ИНФОГРАФИКОНИ .................................................................... 101 Основни графикони .......................................................................... 101 Комбинирани графикони и информации ............................................ 107 ДРУГИ ФОРМИ НА ВИЗУАЛИЗАЦИЈА НА ЕКОНОМСКИ ПОДАТОЦИ ................................. 115 КОМУНИКАЦИЈА ....................................................................................... 115 5.

БИБЛИОГРАФИЈА ......................................................................... 119

3


ВОВЕД


1. Вовед Секој од нас е корисник на економско истражување. Ја добиваме информацијата на еден или друг начин и потоа го употребуваме нашето критично резонирање за да го разбереме економскиот и социјален контекст во кој живееме. Ваков процес се случува секојдневно: кога бараме работа, кога ја споредуваме сопствената плата со просечната во земјата, кога пресметуваме колку пораснала пензијата и дали е тоа доволно за да го задржи или зголеми животниот стандард на примателите. Информациите ги добиваме на различни начини, а најчесто преку медиумите за масовно информирање и социјалните медиуми. Тие информации може да се базираат на анкети, интервјуа со засегнатите страни, испитување на јавното мислење, па сè до големи сетови податоци што ги собира и ги објавува, во агрегирана форма, Државниот завод за статистика. Методите за економско истражување се алатки што се користат за да се објаснат економските и социјални феномени.

Која е целта на оваа книга? Оваа книга има цел да служи како прирачник што ги претставува фундаментите на економските истражувачки техники и методи. Нејзина основа цел е да го воведе читателот во сет од методи и алатки објаснувајќи му како да ги користи, кога да ги користи и да го советува да ги избегне проблемите што може да настанат при нивна несоодветна употреба. Оваа цел е ставена во контекст на работењето на еднаен тинк-тенк. Следниве секции се осврнуваат на следниве прашања:      

Што е метод? Кога треба да се користи? Што треба да се земе предивид? Што е излезна информација? Како да се користи излезната информација? Примери од практиката.

5


Зошто е важно да се анализираат економските податоци? Колкава е вашата плата? Имајќи ја предвид просечната плата во земјата, дали сте финансиски богати или сиромашни? Што треба, а што може да преземе владата за вашата плата да расте? Ова се сет прашања што си ги поставува секој. Но, не секој може да даде одговор на нив. Причините може да се повеќе, од кои ќе наведеме две: недоволната достапност и / или транспарентност на економските податоци; и, недоволната информираност и / или свесност на (дел од) граѓаните за општите економски движења, нивното дефинирање и значење во општиот економски дискурс. На пример, често индивидуите донесуваат заклучок за платите во една земја врз основа на својата лична плата затоа што се недоволно информирани или се недоволно вешти да го разберат концептот на просечна плата. Но, примерот со платата може да се генерализира на повеќе феномени во економијата, вработувањето, иселувањето, примањето социјална помош, буџетските прашања.... Последното прашање од почетокот на оваа секција си го поставува и владата. Но, и владата не секогаш може да даде најпрецизен одговор. Причината за тоа често е недостигот од т.н. истражувачки докази, односно научно темелени истражувања што го испитале референтниот феномен – на пример, тој за платата – и кои примениле ригорозни економски методи, дошле до одредени заклучоци и даваат препораки што треба да спроведе владата. Во земји како Македонија, дури и капацитетите за интерно создавање научни докази во рамки на самите владини институции се во процес на постојана надградба, па затоа често е потребна помош од надворешни лица – научници и истражувачи, а неретко и од меѓународни финансиски институции, кои за оваа цел често даваат и техничка помош. Оттука, на прашањето зошто е потребно да се анализираат економските податоци, може да се дадат три генерални одговори. Прво, за да може промените во економската политика и реформите да се темелат на докази од истражувачки наоди. Земјите во развој, како Македонија, често се посегнуваат кон прифаќање решенија што успеале на друго место. Иако тој пристап не е за целосно отфрлање, научните истражувања и анализи на економските податоци, всушност, ги одразуваат националниот (локалниот) контекст и специфики и треба да се применуваат дури и тогаш кога се увезува решение за некој економски проблем. Второ, анализите на економските податоци се неопходни за информирање, едуцирање и за подигнување на општото ниво на свесност на економските агенти (граѓаните и фирмите, во најширока смисла на зборот) затоа што тие се тие што, на крајот, го сочинуваат економскиот систем (покрај владата) на една земја. И, трето, анализите на економските податоци се клучни за врамување и за насочување на дискурсот на јавната дебата. Во ситуација на отсуство на податоци, анализи и на истражувања, јавната 6


економска дебата станува субјективна, пристрасна и често политички обоена. Наспроти тоа, бројките се конкретни, а барем тие се предност на економската и на социјалната научна сфера, за разлика од други сфери каде што во преден план е силата на аргументот, а помалку силата на бројката (такви сфери се, на пример, демократијата, човековите права, интегративните процеси и сл.).

За кого е наменет овој прирачник? Прирачникот е напишан на начин што е доволно разбирлив за пошироката јавност. Но, бидејќи прирачникот става акцент на користењето истражувачки методи во тинк-тенковите (мисловните лаборатории, институти), неговата примарна употреба се однесува токму за нив, како и за организациите што по својот опсег на дејствување се блиски на тинк-тенковите, а тоа се универзитетите и граѓанските организации. Имено, според македонскиот Закон за здруженија и фондации, тинк-тенкови всушност, и не постојат како правна категорија. Но, во практиката, граѓанските организации што во својата дејност вршат и научни истражувања се неформално означени како тинк-тенкови. Оттука, во правна смисла, се тие се граѓанска организација, но, во суштинска смисла, се научно-истражувачка организација. Сепак, прирачникот може лесно да се користи и од поширок круг засегнати страни: аналитичари во министерствата, локалната самоуправа, јавните претпријатија и, секако, во приватниот сектор, односно на секое место каде што се создава научно истражување од сферата на економијата. На сите нив, прирачникот ќе им помогне во изборот на соодветните методи, ќе им даде совет при донесувањето одлуки за креирање на соодветната комбинација од методи, како и за планирањето на вкупната истражувачка стратегија во која е потребно да се донесат одлуки за тежината што треба да ја даде истражувачот на различните елементи. Прирачникот ќе биде од голема помош и при структурирањето предлози за истражувања што корисниците сакаат да ги поднесат за финансирање кај донаторската заедница.

7


Како е организиран овој прирачник? Прирачникот е фокусиран врз методите за собирање и за анализа на економски податоци. Оттука, неговата структура е релативно едноставна. Двете клучни поглавја на прирачникот се:  

Квантитативни методи на истражување Квалитативните методи на истражување

Сепак, со оглед на тоа дека овој прирачник ги анализира овие методи од перспектива на еден тинк-тенк, овие две поглавја се збогатени со трето поглавје: Преточување резултати и наоди во информација разбирлива за широката публика во кое ќе се фокусираме врз техниките за визуализација на економските податоци и наоди, како и врз значењето на традиционалните и социјални медиуми за широката разбирливост на економските информации.

8


Пред да почнеме со подетална елаборација на квантитативните и на квалитативните методи за економско истражување, корисно е да направиме јасна дистинкција меѓу двете, врз основа на неколку карактеристики, во табелата што ја преземаме од MacDonald и Headlam (2009): Квантитативни Да се измерат работите во обид да се објасни набљудуваното

Квалитативни

Корисност

Воопштување, предвидување, причинско-последични објаснување

Контекстуализација, интерпретација, разбирање на различните гледишта

Алатки

Алатки за собирање нумерички податоци

Инструментот за собирање податоци е самиот истражувач

Собирање податоци

Структурирано

Неструктурирано

Излезни информации

Во форма на бројки и на статистика

Во форма на зборови, слики и предмети

Примерок

Често голем број случаи ја претставуваат засегнатата популација. Случаен избор

Често мал број случаи што не се избрани со случаен избор. Респодентите се избираат со методи што не се засновани на веројатност (на пример, врз база на искуство или погодност)

Објективни / Субјективни

Објективни – бараат прецизно мерење и анализа

Субјективни – важно е толкувањето на настаните од самите индивидуи

Улога на истражувачот

Тежнее да остане објективно одделен од предметот на истражување

Тежнее да стане субјективно поврзан со предметот на истражување

Цел

Анализа Статистичка Извор: MacDonald и Headlam(2009), стр. 9.

Целосен и детален опис на тоа што се набљудува

Интерпретативна

9


КВАНТИТАТИВНИ МЕТОДИ ВО ЕКОНОМИЈАТА


2. Квантитативни методи во економијата Економијата е квантитативна наука. Во најширока смисла на зборот, таа се занимава со производството и со потрошувачката на добрата и на услугите. Оттука, неа, главно, ѝ се својствени квантитативните методи за да може да ги мери овие големини и да ги испитува нивните интеракции. Дури и во двете генерални поделби – микроекономија и макроекономија – таа се темели на квантитативни елементи. Микроекономијата ги анализира интеракциите на индивидуите, домаќинствата, фирмите и на пазарите, додека макроекономијата се занимава со целата економија и со прашањата на агрегатно производство, потрошувачка, штедење и инвестиции, со прашањата на факторите на производство – трудот, капиталот и земјата, како и со јавната политика што ги адресира овие прашања – монетарната, фискалната и другите видови економска политика. Оттука, за да се соберат и анализираат податоците за сите овие променливи, потребни се квантитативни истражувачки методи, преку кои таквите податоци се мерат, класификуваат и се воспоставуваат врски меѓу нив. Сепак, мора да се спомене дека економијата, а особено микроекономијата, сè повеќе се потпира и врз квалитативни методи на истражување. Особено кога треба да се анализираат реакциите на индивидуите и на фирмите, тогаш е потребно да се разбере контекстот во кој се случуваат одредени интеракции, поради што се користи некој квалитативен метод на истражување, што е предмет на дебата во следниот дел од овој прирачник.

Квантитативна анкета Анкетата е, да ја наречеме, основна алатка за собирање примарни податоци. Генерално, таа претставува процес низ кој на испитаниците им се поставуваат прашања на кои треба да дадат одговор. Инструментот на анкетата се нарекува прашалник. Карактеристично е што анкетата може неформално да се подели на квантитативна и на квалитативна, односно да биде во основата и на квалитативните и на квантитативните истражувачки методи. Разликата меѓу двете е во видот на прашањата што се поставуваат: доколку се од нумерички и претежно егзактен карактер, тогаш таа анкета може да се нарече квантитативна; доколку собираат квалитативна информација што се изразува преку зборови и описи, тогаш станува збор за квалитативна анкета. Во економијата, разбрана како во описот од почетокот на овој дел, анкетата е вообичаено квантитативна. На пример, Државниот завод за статистика спроведува неколку анкети во делот на пазарот на труд и на животниот стандард: анкета за работната сила, анкета за приходите и за условите на живеење, анкета за структурата на заработката, анкета за потрошувачката на 11


домаќинствата. Сите тие, по својата природа, се претежно, ако не и целосно, квантитативни анкети бидејќи поставуваат прашања за висината на примањата во едно домаќинство по разни основа (плата, кирија, дивиденда, хонорар итн.), за потрошувачката, за статусот на пазарот на трудот, за редица демографски карактеристики (завршено образование, пол, брачен статус) итн. Квантитативната анкета се користи кога треба да се создаде нов сет примарни податоци од голем број извори (на пример, од индивидуи или домаќинства), кои одговараат на анкетните прашања. Неодамна, Finance Think – Институтот за економски истражувања и политики дизајнираше и спроведе (преку соодветна агенција за теренско собирање податоци) анкета за квалитетот на животот во Македонија во 2017 година. Анкетата интегрира повеќе елементи од постојните анкети, како доходот, потрошувачката, статусот на пазарот на труд, карактеристиките на пензионерите и сл. Анкетата е доминантно квантитативна бидејќи, главно, се карактеризира со прашања што бараат прецизни, категорички или нумерички одговори. При дизајн на анкета од ваков тип, потребно е да се имаат предвид неколку прашања.

Која е популацијата на анкетата? Популацијата е различна во секоја анкета. За сите споменати анкети, популацијата се најчесто совпаѓа со населението на една земја. Но, популацијата во една анкета првенствено зависи од истражувачкото прашања. На пример, една од целите на наведените анкети е да ја измерат невработеноста во Македонија. Оттука, популацијата на тие анкети е вкупното население во Македонија, или во најмала рака, населението посторо од 15 години. Но, ако истажувачкото прашање е одредување на просечната пензија во Македонија, тогаш популацијата се сведува само на лицата со статус пензионер. Популацијата често може да се утврди преку податоци што се добиваат преку пописот. Но, ако од која било причина популацијата не е позната, тогаш тоа може да внесе пристрасност врз подоцнежните заклучоци, како и да ја компромитира нивната статистичка значајност.

Како да изберам примерок? Примерокот е еден дел од популацијата. Примерокот е тој сегмент што ќе биде предмет на собирање податоци, односно врз кој ќе биде спроведена анкетата. Избирањето на примерокот е круцијален, ако не и најважен дел при спроведување на која било анкета. Валидноста на добиените резултати есенцијално зависи од конструкцијата на примерокот. Оттука, за да може добиените резултати за примерокот да бидат соодветни за целата популација

12


(што во статистиката се нарекува статистичко заклучување), примерокот треба да биде репрезентативен. Репрезентативност на примерокот. Примерокот е репрезентативен кога тој е точна репликација на популацијата. Идеално, примерокот треба да ја отсликува популацијата по сите карактеристики. Но, во применетата работа, се води сметка примерокот да е репрезентативен по неколку, релативно основни, карактеристики. На пример, ако во Македонија една половина од населението е од машки пол, а една половина од женски, тогаш секој примерок, чијашто цел е да изведе заклучоци за целата популација, треба да е конструиран од една половина мажи и од една половина жени. На национално ниво, репрезентативноста вообичаено се постигнува преку т.н. стратификација на примерокот, и тоа на две нивоа: регионално и урбанорурално. Имено, прво се дефинира големината на примерокот, а потоа во рамки на таа големина се определува колку испитаници ќе бидат вклучени во секој регион, во согласност со учеството на населението од секој регион во вкупното население. Во вториот чекор, во рамки на секој регион се врши поделба на бројот на барани испитаници на рурални и на урбани области, сразмерно на учеството на урбаното и на руралното население во вкупното население на тој регион. Во третиот чекор, во секој стратум (на пример, урбан дел во секој регион) се врши случаен избор на испитаници, што е најчесто случајност во изборот на адресите што ќе се посетат од страна на испитаникот. Рамка на примерокот. Рамката претставува листа на сите членови на целната популација од која се избираат членовите на примерокот. Рамката на примерокот мора да е точна, комплетна, ажурирана и соодветна за тематиката на анкетата. Од неа, потоа, се избира примерокот преку случаен или стратифициран избор, како што опишавме во претходниот параграф. На пример, ако истражувачкото прашање се однесува на студентската популација, тогаш во рамката на примерокот ќе бидат опфатени сите студенти според нивниот упис во студентските регистри. Кога вакви регистри се користат за дефинирање на рамката на примерокот, од особена важност е тие да се целосни, информациите содржани во нив да бидат точни и прецизни и, секако, да бидат ажурирани (Edwards et al. 2007). Доколку одредени лица (фирми, итн.) од регистарот се недостапни поради неажурирани или неточни информации, тогаш немаат иста веројатност да бидат избрани како другите лица, што ќе внесе пристрасност во примерокот и, оттука, пристрасност во сите натамошни пресметки. Во применетата работа често вакви регистри не постојат или се целосно неажурирани во ситуации кога отсуствува попис во подолг временски период. Во таков случај, истражувачот треба да состави сопствена рамка на примерокот. Ова се чини е тешка и скапа задача. Важно е при нејзиното спроведување да може да се добие надворешна валидација на нејзината опфатност, ажурност и точност.

13


Испитаник. Штом биде определена адресата што ќе биде посетена од страна на лицето за спроведување на анкетата, важно е кој ќе одговара на прашањата. Голем дел од националните анкети имаат дел што се однесува на целото домаќинство и индивидуални анкети. На индивидуалните анкети одговара секој член на домаќинството (најчесто постарите од 15 години или, во зависност од темата на анкетата, секое лице што е предмет на анкетата – на пример, пензионери). Но, постојат специфики околу одговарањето на анкета што се однесува на целото домаќинство. Вообичаено, тоа го прави главата на домаќинството и се остава простор самото домаќинство да утврди кој е глава на домаќинството. Во случаи, пак, кога станува збор за анкета што се однесува за целото домаќинство или за индивидуални прашања, но е предвидено да ги одговори само едно лице, вообичаено е тоа лице да се избере по случаен избор. Најчесто, случајниот избор се прави така што се анкетира лицето, чијшто роденден доаѓа прв по денот на анкетирањето (и тоа е вообичаено возрасно лице што може да даде соодветни одговори. Сличните правила важат и кога се прават анкети во фирми. Во секој случај, тематиката на анкетата треба да кореспондира со профилот на лицето што одговара. На пример, ако се испитуваат причините за високата неактивност на жените, тогаш би било невообичаено одговори на таква анкета да дава маж. Тогаш, испитаникот ќе биде специфициран како жена во секое избрано домаќинство, на возраст 18-64 години, чијшто роденден доаѓа прв по денот на анкетирањето. Ваквото специфицирање овозможува да се постигне задоволителна стапка на одговори и да се добијат колку што е можно попрецизни одговори. Соодветност на големината на примерокот. Целта при анализите базирани на примерок избран преку избор заснован на веројатност е заклучоците да може да се воопштат и да бидат валидни за целата целна популација. Ова е процес на статистичко заклучување. Колку што е поголем примерокот, толку е помала веројатност за грешка во статистичкото заклучување. Оттука, изборот на примерок заснован на веројатност е компромис меѓу точноста на наодите и напорот да се соберат податоците (Saunders et al. 2016). Големината на избраниот примерок ќе зависи од точноста што сакаме да ја постигнеме при статистичкото заклучување, маргината на грешка што е прифатлива, видот на анализа што ја спроведуваме и големината на нашата целна популација. Притоа, нема конкретно правило за тоа колкав треба да биде примерокот. Но, големината на примерокот е важна за нормаленоста во распоредот на податоците. Имено, колку што примерокот е поголем, толку распоредот повеќе ќе се доближува до нормален распоред, што е основата на теоремата за централно ограничување, која е особено важна кога популацијата не е нормално распоредена или чијшто распоред е непознат. Статистичарите покажаа дека големина на примерокот од најмалку 30 лица најчесто резултира со распоред на примерокот околу средната вредност, кој е многу близок до нормалниот распоред. Оттука, литературата препорачува дека 30 опсервации се најмалиот број опсервации што треба да се земе при 14


креирање на секој примерок (за дискусија види Kar and Ramalingam, 2013). Но, препораката дека колку што е поголем примерокот, толку е поголема веројатноста тој поблиску да ја отсликува целата популација е валиден и значи дека секогаш кога другите услови го дозволуваат тоа, примерокот треба да биде многу поголем од 30. Ова е познато и како Законот на големите броеви. Што ако некој не сака да одговори или е недостапен? Главен проблем при спроведувањето анкета е стапката на одговарање на анкетата. Во Македонија, тоа е особен проблем, поради слабата свесност дека резултатите од анкетата може да се искористат за подобрување на некој општественоекономски процес. Ова не треба да се занемарува ако лицата што не одговараат на анкетата не се случајни. На пример, да претпоставиме дека 100 лица примиле обука за напредни ИТ-вештини. По една година откако ја добиле таа обука, се спроведува анкета за тоа дали се вработиле и колку заработуваат за да може да се процени ефективноста на обуката. За време на спроведувањето на анкетата, 50 од лицата (значи 50 проценти) биле недостапни, односно не можеле да бидат најдени на постојните адреси и телефонски броеви. За другите 50 проценти се покажува дека вработеноста се зголемила за 10 проценти, исто колку и нивната просечна плата. Дали овој заклучок е соодветен, односно дали важи за целата популација од 100 обучени ИТ-лица? Секако дека не. Да претпоставиме дека недостапните 50 лица се иселиле од земјата и дека, всушност, сите се вработиле, и нивната плата, во споредба со состојбата пред обуката, се зголемила за 100 проценти. Значи, за целата популација од 100 обучени лица, порастот на вработеноста и на плата ќе биде многу поголем од тоа што го заклучивме првично. Стапката на неодговарање на анкетата, во овој случај, ни покажува дека може значајно да ги искриви добиените заклучоци. Ова се случува тогаш кога тие што не одговараат или што се недостапни се систематски поинакви од тие што одговориле на анкетата. Оттука, при собирањето на анкетните прашалници, од особена важност е да се собере информација и за причината за неодговарање, која може да биде различна: недостапност поради неможност да се воспостави контакт, поради неможност за лоцирање, потоа достапност, но одбивање да се одговори, и неподобност на испитаникот. Најчестата причина за неодговарање е одбивањето на испитаникот да одговори. Затоа, секоја анализа е важно јасно да ја специфицира вкупната стапка на одговарање, која е однос меѓу вкупниот број одговорени прашалници и бројот на примерокот (намален за бројот на неподобни испитаници) (Neuman, 2014). Алтернативно, именителот може да се намали и за износот на лица што биле недостапни, со што се добива активна стапка на одговарање.

15


Како да ги поставам прашањата? При поставување на прашањата во квантитативна анкета, може да се појават неколку аспекти, кои ги елаборираме подолу. Воведен дел од прашалникот. Прашалникот е неопходно да содржи воведен дел, во кој ќе се објасни целта на анкетата и ќе се дадат дополнителни детали што може да бидат од особена важност кога се поставуваат сензитивни прашања (на пример, тие што се поврзани со доходот, со здравјето, со политичката активност и сл.). Во овој дел, исто така, е неопходно да нагласи дека станува збор за анонимна анкета и дека резултатите добиени од неа ќе се користат само на агрегиран начин. На крајот, се наведува и институцијата што го спроведува истражувањето, со цел да се зголеми кредибилитетот на целиот процес и да се зголеми веројатноста дека испитаникот ќе учествува во анкетирањето и ќе даде веродостојни одговори. Тематски секции во прашалникот. Особено кога станува збор за подолги прашалници (кои, грубо кажано, се сите што имаат повеќе од 25 прашања), тогаш е неопходно соодветно секционирање на прашањата. Најчест е случајот кога тие се делат во поттеми. На пример, во анкетата за квалитет на животот во Македонија 2017 година, се содржани околу 100 прашања, групирани во следниве поттеми: демографски карактеристики (пол, возраст, образование и сл.), здравствена состојба на испитаниците, социо-економска состојба и средства на домаќинството, потрошувачка на домаќинството, доход во домаќинството (плата, пензија, кирија, камата, дивиденда, социјални примања, дознаки од странство), пазар на труд: статус и карактеристики на работното место, кариерна патека и мината заработка на пензионери. Вообичаено е да се почне со поопшти и помалку сензитивни прашања, што најчесто се сведува на демографските карактеристики. Потоа, сензитивноста на прашањата може да се зголемува, со оглед на тоа дека, како што напредува анкетирањето, и довербата на испитаникот во процесот се зголемува. Затворени, наспроти отворени прашања. Прашањето е од затворен тип кога анкетираното лице може да избере една или повеќе од понудените можности. Прашањето е од отворен тип кога е оставен простор да се даде квантитативен или квалитативен одговор. Оттука, квантитативната анкета најчесто поставува затворени прашања, иако содржи и отворени прашања на кои одговорот се дава во нумеричка форма, и најчесто просторот за слободно толкување е мал (На пример: „Впишете ја вашата возраст“). Прашања што се непристрасни. Непристрасност во поставувањето на прашањата е од особена важност со цел анкетираните лица да не се почувствуваат дискриминирани или навредени по полова, етничка, возрасна или друга припадност. Дополнително, доколку прашањето се карактеризира со висока сензитивност и постои каков било ризик да биде протолкувано како

16


навредливо, вообичаено е да се постави во трето лице, односно како да се однесува на општ случај, и да биде проследено со соодветен вовед / елаборација. Прашања што не се директни. За одредени теми, лицата тежнеат да се преценуваат или потценуваат. Најтипичен е доходот. Доколку се постави прашање за тоа каде лицето се рангира во однос на својата заработка (сиромашен, средна класа, богат), тогаш постои тенденција лицата да се рангираат пониско од тоа што е објективна состојба, особено во земји во кои сиромаштијата е раширен економски проблем. Затоа, анкетата треба ваквите појави да ги процени преку објективни показатели. Во овој случај, тоа би бил показателот за доходот, за кој е важно испитаникот да одговори што поточно. Потоа, со помош на меѓународните стандарди за дефинирање на статусот сиромашен, ќе се определи дали одредено домаќинство е навистина сиромашно или не. Вакви се сите прашања што упатуваат на перцепции (и кои технички припаѓаат на квалитативната анкета, која ја обработуваме подолу). Ваквите прашања не треба да се избегнуваат, но истовремено треба да се постават и прашања со кои појавата ќе се оцени на објективен (ако е можно нумерички) и непристрасен начин, а одговорите ќе се споредат. Категориски, наспроти нумерички одговори. Прашањата во квантитативната анкета најчесто ги собираат овие два вида квантитативни податоци. Категориските податоци се однесуваат на прашања, чиишто одговори може да се класификуваат во две или повеќе категории според карактеристики што ја идентификуваат или опишуваат променливата или што ја ставаат во некакво рангирање (Berman Brown and Saunders, 2008). Според тоа, тие може да бидат описни и ранг-категории. На пример, сите вработени може да се класификуваат на: вработени кај работодавец, самовработени, самовработени што вработуваат други лица, неплатени семејни работници. Оттука, видот вработеност е описна категориска променлива. Ваквите категории треба да бидат прецизно дефинирани и меѓусебно да се исклучуваат, што подразбира дека испитаникот може да се класификува само во една од нив. Иако се описни, категориите потоа може да се нумерираат и квалитативната информација да се користи како квантитативна. Рангираните (или ординални) податоци се попрецизна форма на категориски податоци, со оглед на тоа дека е позната релативната позиција на секој одговор (секоја категорија). Најчесто цитиран пример на ранг-податок е задоволството од работата, при што испитаникот е прашан да го рангира своето задоволство на скала од 1 до 5, при што 1 означува најниско, а 5 највисоко задоволство од работата. Нумеричките податоци содржат вредности што се измерени или изброени како квантитативни големини. Тие се попрецизни од категориските податоци и за нив може да се користи поширок опсег на статистички алатки за анализа. Нумеричките податоци се прекинати или непрекинати. Непрекинатите 17


податоци (или континуирани податоци) се тие што може да ја примат која било вредност. Примери има многу: температура, висина, ширина, должина итн. Прекинатите податоци, од друга страна, примаат конечен број вредности на скала со цели броеви. На пример, бројот на деца, бројот на корисници на мобилни телефони, бројот на вработени и сл. Повеќе аспекти за прашањата во прашалникот елаборираме во делот за квалитативна анкета. Значаен дел од тие прашања може да бидат корисни и при поставувањето на квантитативната анкета.

Администрирање на анкетата Администрирањето (спроведувањето) на анкетата е често техничка работа, која бара време и ресурси, кои најчесто се потценети. Од добрата подготовка за спроведување на анкетата зависи и квалитетот на одговарањето од страна на анкетираните лица. Прво, потребно е да се предвиди време да се пушти пилот на анкетата на неколку лица од блиското опкружување, со цел да се процени дали сите прашања се доволно јасни, недвосмислени и непристрасни. Вториот важен аспект е логичкиот редослед во одговарањето, со оглед на тоа дека не треба сите учесници да одговорат на сите прашања, што ќе биде одредено од нивните одговори. Со напредокот на технологијата и со користењето прашалници внесени во преносни компјутери и таблети од страна на лицата што ќе ја спроведуваат анкетата, овој проблем се надмина бидејќи логичкиот редослед на прашањата го контролира компјутер и со тоа се оневозможуваат човечки грешки. Слична корисност постои и при употребата на прашалници што се доставуваат по електронски пат (е-пошта). Користењето електронска евиденција на одговорите од анкетираните лица има уште една предност: внесување на податоците веќе не е потребно како посебна фаза бидејќи тие се веќе внесени од лицето што ја спроведува анкетата на самото место на одговарање на прашалникот. Но, видот на администрирање на анкетата – поштенски, телефонски, по епошта или теренски - е од особена важност за квалитетот на добиените одговори и за стапката на одговарање на анкетата. Кога се работи за анкети од големо значење (како што се националните анкети за животниот стандард и за пазарот на труд), тогаш речиси секогаш се спроведува теренска анкета. Одлуката каков тип анкета ќе се спроведе зависи и од темата, големината на популацијата и од примерокот и сл. Администрирање анкета со електронски платформи. Денес е вообичаено да се користат електронски платформи за собирање одговори на анкетни прашалници. Без оглед на тоа како прашалниците се доставуваат – телефонски, по електронска пошта или на самото место – електронските платформи овозможуваат поголема прецизност во запишувањето на 18


одговорите и помала склоност кон грешки при т.н. разгранувачки прашања. Една од најпознатите вакви платформи е Survey Monkey (https://www.surveymonkey.com/).

Survey Monkey има три главни столба: дизајн на прашањата, собирање на одговорите и анализа на резултатите. Платформата нуди повеќе видови прашања што може да се постават при дизајнот на прашалникот: избор на една од повеќе можност, избор на повеќе од повеќе можности, избор од опаѓачко мени, впишување одговор на празно поле, рангирање понудени одговори итн. Во полето Logic може да се задава структура на прашалникот, односно прескокнување и логичен редослед на поставените прашања, при што овој процес во целост го контролира софтвер и е надвор од влијанието на испитувачот или испитаникот.

19


По дизајнирањето на прашалникот, платформата нуди мноштво опции преку кои може да се испрати до избраниот примерок, додека делот за анализа на одговорите нуди опции за прикажување на индивидуалните одговори, како и агрегатна анализа на описната статистика (ја елаборираме подолу) и некои прелиминарни трендови во податоците. Сепак, треба да се забележи дека оваа анализа треба да биде проследена со продлабочена анализа за врските меѓу променливите, како што дискутираме во делот за статистичка анализа подолу.

20


Кодирање и подготовка за натамошно користење По собирањето на сите одговорени анкети, следува фазата за кодирање и за подготовка за натамошно користење. Ако анкетата била администрирана електронски, тогаш тоа што се добива како аутпут најчесто е документ во „Ексел“ или друг сроден документ во кој секој ред претставува одделно анкетирано лице, додека во колоните се содржани прашањата (променливите). Најчесто, кодирањето подразбира недвосмислено специфицирање и поврзување на колоните со анкетните прашања, за што најчесто се подготвува т.н. книга на кодови, во која се обележани прашањата и значењата на одговорите (на пример, дека 1 означува маж, а 0 жена). Оттука, кодирањето е процес во кој се доделува код (најчесто нумерички) на секој можен одговор во анкетата. Со помош на ваквото кодирање и подготовка, податоците се подготвени за натамошна анализа, на која се осврнуваме подоцна во овој текст.

Собирање секундарни податоци Секундарните податоци се однесуваат на информации што се веќе собрани, најчесто од страна на националниот завод за статистика или од други владини или приватни агенции. Оттука, истражувачот се јавува како корисник на овие податоци, а не и како нивни собирач, што значи дека тој не го контролира процесот на избор на прашањата што ќе бидат поставени, ниту изборот на примерок, но е длабоко инволвиран во анализа на овие податоци и во интерпретацијата на наодите. Истражувачката работа во економијата, всушност, често се потпира на секундарни податоци, најчесто обезбедени преку националниот статистички систем. Ова е така затоа што процесот на собирање примарни податоци е често многу скап, а дури и кога е возможен, тој најчесто не може да си ги дозволи привилегиите за анкетирање голем примерок колку што може да направи националната статистика. Дополнително, друг важен извор на секундарни податоци се административните податоци што ги водат различните владини агенции (на пример, износот и видот на приходите што ги остварува секоја индивидуа, а кои се водат при Управата за јавни приходи, за даночни цели). Ваквите податоци се секогаш точни, или значајно поточни од анкетните податоци, и најчесто се однесуваат на целата популација. Оттука, доколку се достапни, нивното користење има неприкосновен приоритет во однос на користењето анкетни податоци. Секундарните податоци се особено корисни при спроведувањето т.н. импактна евалуација. Импактната евалуација е ригорозен квантитативен метод со кој се проценува влијанието (ефектот) од одредена политика. На пример, заинтересирани сме да видиме дали грантот за самовработување што го 21


доделува Агенцијата за вработување има ефект врз вработеноста и приходот на тие што го добиле. За да се осознае ова, неопходно е да се оцени состојбата пред грантот да биде доделен. Ова е т.н. базично сценарио, во кое или се собираат примарни податоци (најчесто преку квантитативна анкета) или се собираат секундарни податоци, ако постојат такви. Потоа, по случаен избор се избираат лица од примерокот од базичното сценарио, кои ќе добијат ваков грант (тие се т.н. третирана група), а другите ќе служат како контролна група. По одреден период по доделувањето на грантот и отворањето на фирмата од страна на корисниците на грантот, се спроведува ново собирање податоци: примарни (преку анкета) или секундарни (доколку националниот систем ги мери посакуваните индикатори за контролната и третираната група). Ефектот од мерката ќе биде разликата во индикаторите меѓу третираната и контролната група по спроведувањето на мерката. Сепак, во поголемиот број импактни евалуации, националната статистика не ги врши посакуваните мерења за конкретните групи, третирана и контролна, па анализата повторно се сведува на собирање примарни, место секундарни податоци. Користењето секундарни податоци може да има повеќе предности. Првенствено, собирањето на секундарните податоци често бара многу помал напор (и интелектуален и финансиски), во споредба со собирањето примарни податоци (Vartanian, 2011). Потоа, секундарните податоци во голем број случаи се достапни во временска димензија: такви се националните анкетни истражувања во сферата на пазарот на трудот и на животниот стандард. Тоа овозможува да се анализираат врските меѓу променливите во единица време, но и низ времето, што со примарни податоци може да претставува особено ограничување. Анализираните секундарни податоци се достапни и за други истражувачи, што е особено важно за спроведување тестови за валидација на наодите или, пак, за нивно натамошно анализирање. Од друга страна, секундарните податоци имаат и свои недостатоци. Често, аспектот што сакаме да го анализираме не е опфатен, или не е опфатен доволно за да претставува солидна основа за длабинска анализа. Второ, секундарните податоци не се секогаш лесно достапни. На пример, националните анкети се често достапни само во заштитените соби на статистичките агенции. Дополнително, може да се достапни во агрегатна форма, која не одговара на нашата потреба, а подеталната дезагрегација да не е овозможена во рамки на договорот за користење на таквите секундарни податоци. Од особена важност при користењето секундарни податоци е јасното наведување на изворот, односно обезбедување недвосмислена референција. Сите анализи и заклучоци изведени од користените податоци треба да бидат совршено повторливи, односно кој било истражувач што има пристап до секундарните податоци, користејќи го истиот метод на анализа, треба да дојде до истите резултати.

22


Со секундарните податоци може да се креираат мноштво анализи и излезни информации, всушност, како и кај примарните податоци. Излезните информации се најчесто од визуелен и нумерички тип. Визуелните излезни информации имаат форми на графикони и на мапи, додека нумеричките се наречени со нивното генеричко име статистика и се однесуваат на описна статистика на централна тенденција и варијабилност, интервал на доверба и на статистички хипотези, како и форма на статистичка регресија.

Статистичка анализа Статистичката анализа е статистички метод за испитување на врските меѓу различни сетови податоци. Генерално, статистичката анализа е релативно сложен процес и за општата јавност нешто во кое не сака да навлегува. Но, статистичката анализа е (треба да биде) основна алатка за секој истражувач во кое било научно поле. Овој дел од овој прирачник ќе се обиде да ја претстави статистичката анализа на интуитивен начин, без длабински да навлегува во математичката заднина на претставените концепти. Статистиката се дели на два дела: описна статистика и статистика на заклучување (инференцијална статистика). Описната статистика цели да ги опише податоците преку визуализации (графикони) и нумерички пресметки изведени од примероците, додека статистиката на заклучување се однесува на изведувањето заклучоци за целата популација врз основа на примерокот. Општата корисност на статистиката се состои во информациите што ги произведува за донесување одлуки, врз основа на собирање податоци, нивна анализа и интерпретација. Вообичаено, во многу од случаите описната статистика ќе биде доволна за да се опишат податоците и од нив да се извлече заклучок за општите трендови. Но, доколку целта е да се анализираат врски меѓу податоците, тогаш се неопходни алатките на статистиката на заклучување. Статистичката анализа не треба да се користи слепо. Со појавата и леснотијата во користењето на статистичките софтвери, не значи дека и користењето статистички алатки е лесно. Тие ќе произведат точна и корисна информација само ако се знае како да се употребат, кога да се употребат и како да се интерпретира информацијата што ја даваат.

Описна статистика Описната статистика овозможува опишување и споредување на променливите. Општо гледано, описната статистика вклучува графичко / визуелно опишување

23


и нумеричко опишување. Визуелното опишување на податоците го оставаме за делот четири од овој прирачник, а овде ќе се задржиме на нумеричкиот опис. Променлива претставува некоја измерена карактеристика, која е различна за различни единици (и оттука се нарекува променлива). Описната статистика ја опишува променливата од два аспекта: нејзината централна тенденција и нејзиното растурање или варијабилност. Мерки за централна тенденција. Централната или средна вредност (или тенденција) на една променлива може да се измери на три начини: просечна, медијална и модална вредност. Најчесто користената мерка за централна тенденција е просекот. Тој ги вклучува сите податочни вредности на една променлива и има смисла само за нумерички податоци. Просекот се пресметува на следниов начин: 𝑛

𝑥̅ = ∑ 𝑥𝑖 𝑖=1

Каде што 𝑥̅ е вообичаената ознака за просек (се чита икс-бар), 𝑥𝑖 е секоја индивидуална опсервација од 1 до n. Вака дефиниран, просекот ги зема предвид сите вредности на една променлива, што значи и вредностите што имаат компаративно значително поголеми вредности од сите други опсервации. Таквите вредности се нарекуваат екстремни вредности. Екстремните вредности влијаат врз просекот и го прават помалку репрезентативна мерка за централна тенденција. Во случај на големо влијание на екстремните вредности, се препорачува да се користи медијаната. Медијаната е централната вредност на една променлива, кога нејзините вредности се подредени по растечки или опаѓачки редослед. За променливи со парен број опсервации, медијаната е просечната вредност од двете вредности во средината на променливата. Постои и трета мерка за централна тенденција – модалната вредност. Тоа е вредноста што се појавува (повторува) најчесто. На пример, колкава е зачестеноста еден студент да добие оценка А на испитот по статистика. Доколку ист број студенти добиле оценка А и Б (на пример, по пет), тогаш таквата променлива се нарекува бимодална. Но, модалната вредност може да биде од помала корист за повеќето нумерички променливи што ја добиваат која било вредност. Мерки за варијабилност. Една променлива за две различни групи може да има иста средна вредност (на пример, променливата возраст за две групи деца во градинка), но, сепак, нејзините вредности да бидат различно распоредени или различно растурени околу просечната / медијалната вредност во двете групи. Затоа, мерките за централна тенденција треба секогаш да се 24


гледаат комплементарно на мерките за варијабилност. Вообичаени мерки за варијабилност се: опсегот, меѓуквартилниот опсег, стандардната девијација и z вредноста. Опсегот на податоците е разликата меѓу максималната и минималната вредност на една променлива. Тој се користи само за да се добие првичен впечаток за растурањето на променливата, но не може да обезбеди некој подлабински заклучок. Во ситуации кога променливата има екстремни вредности, добро е нивното влијание врз опсегот да се отстрани, преку пресметка на меѓуквартилен опсег. Квартилите ги делат вредностите на една променлива на четвртини. Оттука, постојат четири квартили: прв квартил е тој кога една четвртина од вредностите на променливата е под таа вредност, а три четвртини се над неа. Вториот квартил ги дели вредностите 50:50 и се нарекува медијана. Третиот квартил е тој кога три четвртини од вредностите на променливата се под таа вредност, а една четвртина над неа. Четвртиот квартил е максималната вредност на променливата. Меѓуквартилниот опсег е разликата меѓу првиот квартил (25 проценти) и третиот квартил (75 проценти). Со оглед на тоа дека екстремните вредности се концентрирани на краевите од распоредот на променливата, не ги вклучува. Сепак, најкорисна статистика на растурање е стандардната девијација. Концепциски и статистички е важно да знаеме како индивидуалните вредности на една променлива се растурени околу нејзината просечна вредност. Ако се тесно распоредени околу просекот, тогаш се вели дека растурањето е мало, и обратно. Стандардната девијација овозможува ова да се измери. Формулата е следнава: 𝑛

𝜎 = √∑ 𝑖=1

(𝑥𝑖 − 𝑥̅ )2 𝑛−1

Каде што 𝜎 се користи како ознака за стандардна девијација (иако, со оглед на тоа дека се работи за примерок, често се укажува да се користи ѕ место 𝜎), која го зема квадратниот корен од сумата на секое индивидуално отстапување од просечната вредност на квадрат, поделена со бројот на набљудувања минус 1. Вредноста добиена од оваа формула е секогаш позитивен број, кој сам по себе не мора да значи ништо, освен ако не се стави во споредба. Споредбата може да се врши меѓу два сета податоци (споредба на растурањето на возраста кај двете групи деца во градинка) или стандардната девијација да се спореди со просечната вредност, што претставува дефиниција за коефициентот на варијација: 𝐶𝑜𝑉 =

𝜎 ∗ 100% 𝑥̅

25


Концепциски, коефициентот на варијација ја дава големината на стандардната девијација во однос на просечната вредност (изразен во проценти). Доколку стандардната девијација е мала во однос на просекот, тогаш растурањето на таа променлива е мало, односно, во просек, индивидуалните опсервации се тесно распоредени околу средната вредност. И обратно. Нема строго правило за тоа кога коефициентот на варијација означува ниска, а кога висока варијабилност на една променлива, но постои некое непишано правило дека кога тој е понизок од 30 проценти, променливата може да се смета за нисковаријабилна, кога е меѓу 30 проценти и 70 проценти таа е средноваријабилна, и кога е повисок од 70 проценти, таа е високоваријабилна. Секако, коефициентот може да надмине и 100 проценти бидејќи вредност на стандардната девијација не е ограничена со просечната вредност. z вредноста е мерка за варијабилност без единица мерка. Всушност, таа го изразува отстапувањето на секоја вредност од просекот, во стандардни девијации: 𝑧=

𝑥̅ − 𝑥𝑖 𝜎

Оттука, z вредноста (или z скор) се нарекува и стандардизирано отстапување. z вредноста наоѓа широка примена во статистиката, како што ќе видиме подолу во текстот. На ова место, важно е да се запомни дека таа се користи и за утврдување дали една вредност е екстремна или не. Оттука, ако z вредноста е поголема од 3 или помала од -3, тогаш таа вредност на променливата (𝑥𝑖 ) се смета за екстремна. Мерки за поврзаност на две променливи. Во опфатот на описната статистика спаѓаат и две мерки што мерат поврзаност меѓу две променливи: коваријанса и корелација. Коваријансата се пресметува на следниов начин: 𝐶𝑜𝑣𝑥,𝑦 =

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) 𝑛−1

При што со х е означена едната променлива, а со у другата. По конструкција, коваријансата прво го зема производот од отстапувањата на секоја опсервација од средната вредност за двете променливи, а потоа вкупниот збир од тие производи го дели со бројот на опсервации минус 1. На ваков начин, коваријансата е позитивен или негативен број, кој сам по себе нема позначајна употребна вредност, освен што укажува на насоката на врската меѓу двете променливи. Интензитетот на врска може да се одреди само доколку се пресмета коефициентот на корелација: 𝜌=

26

𝐶𝑜𝑣𝑥,𝑦 ∗ 100% 𝜎𝑥 𝜎𝑦


Кој е однос меѓу коваријансата и производот од стандардните девијации на двете променливи, изразен во проценти. Корелацијата може да се движи од 1, кога врската меѓу двете променливи е совршено негативна; до +1, кога врската меѓу двете променливи е совршено позитивна. Кога коефициентот се приближува кон нула, врската слабее и исчезнува. Пример за негативна корелација е состојбата во која порастот на производството е поврзан со намалување на невработеноста, додека пример за позитивна корелација е состојбата во која зголемените инвестиции се поврзани со поголемо производство.

Описна статистика со статистички софтвер. Целта на изнесените формули е да се разбере суштината на статистичките концепти. Во денешно време, овие пресметки никој не ги прави рачно. Основниот софтвер за изведба на овие пресметки денес е Microsoft Excel. „Ексел“ е дизајниран така за да располага со мноштво функции со чиешто внесување во ќелиите се добива 27


посакуваната статистика. Во овој прирачник нема да ги анализираме поединечните функции бидејќи „Ексел“ овозможува уште една корисна алатка, која се нарекува Data analysis и може да се најде во менито Data.

За илустрација, користиме пример со плати на 307 работници во една фабрика. Освен податокот за платите (wage), дадени ни се и информации за полот, возраста, годините искуство, образованието, видот на склучен договор и занимањето.

28


Со неговото притискање, се појавува дијалог-бокс со повеќе статистички опции, од кои во моментов ни е потребна Descriptive statistics:

По што се отвора дијалог-бокс, кој изгледа вака:

Во овој активен дијалог-бокс, потребно е да се внесат информации за тоа која променлива сакаме да ја анализираме. На пример, тоа е променливата за плата, за која сакаме да ја утврдиме просечната вредност, медијаната и стандардната девијација. Во вториот дел од боксот, потребно е да го означиме полето Summary statistics. Потоа, се добива следнава излезна информација: 29


wage

Mean

1,189.73

Standard Error

28.74

Median

1,053.20

Mode

652.69

Standard Deviation

503.59

Sample Variance

253,603.48

Kurtosis

2.36

Skewness

1.45

Range

2,588.52

Minimum

528.37

Maximum

3,116.89

Sum

365,245.98

Count

307

Просечната плата во оваа фабрика изнесува 1.190 евра, додека медијалната плата 1.053 евра. Со оглед на тоа дека разликата меѓу двете е мала, влијанието на екстремните вредности е мало. Модалната плата изнесува 653 евра, што покажува дека во фабриката се најзастапени работниците што ја примаат оваа плата. Стандардната девијација изнесува 504 и нема особено значање, освен ако не се стави во однос на просечната вредност и не се добие коефициентот на варијација. Во нашиот случај, тој изнесува 42 процента, вбројувајќи ја променливата за плата во средноваријабилни променливи.

Во дијалог-боксот Data analysis ќе ги избереме и опциите Covariance и Correlation, со цел да ја пресметаме оваа статистика за поврзаност меѓу променливите. За илустрација, ја набљудуваме поврзаноста меѓу платата и искуството, при што се претпоставува дека поголемото искуство (изразено низ број на години во работен ангажман) е поврзано со повисока плата. 30


Во дијалог-боксот за пресметка е потребно да ги внесеме двете колони заедно:

Двата коефициента се забележуваат во ќелијата каде што се вкрстуваат платата и искуството: коваријансата е 1.308,6 и само укажува дека меѓу платата и искуството постои потенцијално позитивна врска. Нејзиниот интензитет е определен со коефициентот на корелација, кој изнесува 39 проценти, укажувајќи дека врската постои, но, сепак, е средно силна.

31


Covariance wage wage experience

experience

252,777.41 1,308.61

44.35

wage

experience

Correlation wage experience

1 39.09%

1

За да може да извршиме поригорозни статистички тестирања подоцна во овој прирачник, потребна ни е софтверска надградба. Во овој прирачник ќе се послужиме со XLSTAT, што претставува надградба на „Ексел“, која може да се преземе бесплатно за период од 30 дена. По нејзиното преземање, XLSTAT ќе се појави како посебно мени:

XLSTAT има мени за описна статистика:

32


Во кое, во табот Output, може да се направи избор од проширен сет описна статистика, која софтверот ќе ја пресмета.

За тестирање на поврзаноста меѓу две нумерички променливи, користиме уште два теста: Pearson и Spearman, тестови за корелација. Предноста на овие тестови во споредба со стандардниот коефициент на корелација, за кој дискутиравме погоре, е што оценуваат дали интензитетот на врската е статистички значаен. Тие може да се најдат во менито Correlation/Association tests, Correlation tests:

33


По што се добива дијалог-бокс во кој се избираат променливите за кои се пресметува коефициент на корелација, како и видот на тестот што сакаме да го користиме.

Ние ги избираме двата теста едноподруго, по што ја добиваме следнава излезна информација: Correlation matrix (Pearson): Variables experience wage Values in bold are different

experience wage 1 0.391 39.1% 1 from 0 with a significance level alpha=0.05

p-values (Pearson): Variables experience wage

experience 0 < 0.0001

wage < 0.0001 0

Coefficients of determination (Pearson): Variables experience wage 34

experience 1 15.3%

wage 0.153 1


Correlation matrix (Spearman): Variables experience wage Values in bold are different

experience 1 51.8% from 0 with a significance

wage 0.518 1 level alpha=0.05

p-values (Spearman): Variables experience wage

experience 0 < 0.0001

wage < 0.0001 0

Coefficients of determination (Spearman): Variables experience wage

experience 1 26.8%

wage 0.268 1

Во нашиот случај, Pearson тестот укажува на корелација меѓу платата и искуството од 39,1 проценти, додека Spearman на корелација од 51,8 проценти. Во двата случаја, корелацискиот коефициент е статистички значаен.

35


Да забележиме дека во нашиот сет од податоци за платите имаме и неколку бинарни променливи, односно тие што земаат вредности нула и еден. За таквите променливи, погорните стандардни тестови за корелација би биле невообичаени (иако често се применуваат). За вакви ситуации се применува посебен тест, наречен Biserial correlation. Тој може да се најде во истото мени како и претходните тестови, а дијалог-боксот изгледа вака:

36


По што се добива следнава излезна информација: Summary statistics:

Variable

Observations

Minimum

Maximum

Mean

Std. deviation

wage

307

528.366

3116.887

1189.726

503.591

Variable gender

Categories 0 1

Frequencies 116 191

% 37.785 62.215

Biserial correlation (wage / gender) / Two-tailed test: r 0.185 p-value (Twotailed) 0.001 alpha 0.05 The p-value has been computed using 10000 Monte Carlo simulations. Time elapsed: 1s. 99% confidence interval on the p-value: ] 0.000, 0.001 [

Test interpretation: H0: The quantitative variable wage and the qualitative variable gender are not associated Ha: The quantitative variable wage and the qualitative variable gender are associated. Забележуваме дека бисерискиот коефициент за корелацијата меѓу платата и полот е позитивен и изнесува 18,5 проценти. Тоа имплицира дека мажите (категоријата што има вредност 1) се поврзани со повисока плата. p вредноста потврдува дека овој коефициент е статистички различен од нула, односно статистички значаен.

37


Нормален распоред Во основата на статистичкото заклучување лежи претпоставката за нормален распоред на вредностите од една променлива. Една променлива е нормално распоредена кога нејзините вредности се распоредени околу средната вредност на симетричен начин и следат распоред во форма на ѕвоно. Следната слика дава визуелен приказ на нормален распоред. Кај него, просекот, медијаната и модалната вредност се еднакви, а стандардната девијација на променливата одредува колку кривата во форма на ѕвоно ќе биде плоската.

38


Нормалниот распоред на една променлива може да се тестира и на поригорозен начин, преку формални тестови. Тие испитуваат во која мера распоредот на една променлива е различен од совршен нормален распоред. Два такви теста се Колмогоров-Смирнов тест и Шапиро-Вилков тест. Кај нив се пресметува тест-статистика и вредноста на веројатноста дека податоците на променливата по случајност се разликуваат од тие на нормален распоред. Така, вредноста на веројатноста од 0,05 значи дека постои само пет проценти веројатност дека вистинскиот распоред се разликува од нормален распоред. Оттука, веројатност пониска од 0,05 значи дека тие податоци не се нормално распоредени. Ако вредноста е повисока од 0,05, тогаш податоците се сметаат за нормално распоредени. Нормален распоред во статистички софтвер. Пред да се премине на квантитативно испитување на нормалниот распоред на која било променлива, добро е таа да се претстави визуелно и така да се здобие интуиција за нејзиниот нормален распоред. „Ексел“ тоа го нуди преку опцијата Histogram во Data analysis. Со избор на оваа опција се добива следниов дијалог-бокс:

Во кој треба да се внесе променливата за која сакаме да нацртаме хистограм (input range). Но, дијалог-боксот бара уште една влезна информација, а тоа се т.н. класи (bins). Имено, со оглед на тоа дека станува збор за непрекината нумеричка променлива, на „Ексел“ треба да му се даде насока за начинот на класификување на податоците. Бројот на класи го одредува истражувачот: тој број не треба да биде многу мал за да може да се добие разумен графикон, но не треба да биде ниту многу голем, за податоците да не се разводнат низ многу класи. Вообичаено, број до 10 класи е разумен. Нивната ширина треба да биде воедначена, а почетокот и крајот се одредени од минималната и од максималната вредност на променливата. Да се потсетиме дека платата имаше 39


вредности од 528 евра до 3.117 евра, што имплицира дека за 10 класи ширината на интервалот би била (3.117-528)/10 = 258 евра. Оттука, може арбитрарно да ја поставиме на 250 евра, почнувајќи од 500 евра нагоре (првата класа ќе биде „500-750“, втората „751-1.000“ итн.).

Врз основа на ова дефинирање, ја добиваме следнава излезна информација:

40


Според ова визуелно испитување, распоредот на нашата променлива плата не е нормален. Имено, постои концентрација на платите околу просекот (1.189 евра), но на десната страна постојат плати што значително отстапуваат од просекот (се значително повисоки), и го нарушуваат нормалниот распоред. Кај платите, ваквиот распоред е вообичаен бидејќи менаџерските плати се вообичаено значително повисоки од просекот во компанијата. За статистичките тестови, го користиме XLSTAT. Опцијата за тестирање на нормалниот распоред на една променлива се наоѓа во менито Modelling data – Distribution fitting:

Со нејзино избирање, се појавува дијалог-бокс со повеќе табови: во првиот ќе ја специфицираме променливата, чијшто нормален распоред сакаме да го тестираме:

41


Додека во вториот таб го избираме Колмогоров-Смирновиот тест:

По што добиваме екстензивна излезна информација. Овде, ја претставуваме само излезната информација за Колмогоров-Смирновиот тест:

Вредноста на веројатноста (p-value) е многу ниска (0,000), што укажува на тоа дека променливата не следи нормален распоред, што е потврда на заклучокот од визуелното испитување погоре.

42


Сет од други тестови за проверка на нормалниот распоред на една променлива може да се најде во менито Describing data – Normality tests:

Во ова мени, на располагање се уште четири тестови за нормален распоред:

Ги избираме сите и ја добиваме следнава излезна информација:

Variable\Test

ShapiroWilk

AndersonDarling

Lilliefors

JarqueBera

Wages < 0.0001 < 0.0001 < 0.0001 < 0.0001 Забележуваме дека кај сите четири теста, веројатноста е под 0,0001, што значи дека сите тие потврдуваат дека испитуваната променлива не следи нормален распоред.

43


ะ˜ะฝั‚ะตั€ะฒะฐะป ะฝะฐ ะดะพะฒะตั€ะฑะฐ ะŸั€ะธ ั€ะฐะฑะพั‚ะตัšะต ัะพ ะฟั€ะธะผะตั€ะพั†ะธ โ€“ ัˆั‚ะพ ะต ะฝะฐั˜ั‡ะตัั‚ ัะปัƒั‡ะฐั˜ ะฒะพ ะฟั€ะธะผะตะฝะตั‚ะฐั‚ะฐ ั€ะฐะฑะพั‚ะฐ โ€“ ัะฐะบะฐะผะต ะดะฐ ะธะทะฒะปะตั‡ะตะผะต ะทะฐะบะปัƒั‡ะพะบ ะทะฐ ั†ะตะปะฐั‚ะฐ ะฟะพะฟัƒะปะฐั†ะธั˜ะฐ ะฒั€ะท ะพัะฝะพะฒะฐ ะฝะฐ ะฝะฐะพะดะธั‚ะต ะพะด ะฟั€ะธะผะตั€ะพะบะพั‚. ะะพ, ะพะฒะฐ ะฝะต ะผะพะถะต ะดะฐ ัะต ะฝะฐะฟั€ะฐะฒะธ ัะพ 100 ะฟั€ะพั†ะตะฝั‚ะธ ัะธะณัƒั€ะฝะพัั‚. ะ—ะฐั‚ะพะฐ, ะฒะพ ัั‚ะฐั‚ะธัั‚ะธั‡ะบะฐั‚ะฐ ะฐะฝะฐะปะธะทะฐ ะดะตั„ะธะฝะธั€ะฐะผะต ะฝะธะฒะพ ะฝะฐ ะดะพะฒะตั€ะฑะฐ, ะบะพะต ะต ะฝะฐั˜ั‡ะตัั‚ะพ 95 ะฟั€ะพั†ะตะฝั‚ะธ. ะขะพะฐ ะทะฝะฐั‡ะธ ะดะตะบะฐ ัะธั‚ะต ัั‚ะฐั‚ะธัั‚ะธั‡ะบะธ ะทะฐะบะปัƒั‡ะพั†ะธ ะธะทะฒะปะตั‡ะตะฝะธ ะทะฐ ะฟะพะฟัƒะปะฐั†ะธั˜ะฐั‚ะฐ ะฒั€ะท ะฑะฐะทะฐ ะฝะฐ ะฟั€ะธะผะตั€ะพะบะพั‚ ะธะผะฐะฐั‚ ะฒะตั€ะพั˜ะฐั‚ะฝะพัั‚ ะดะฐ ะฑะธะดะฐั‚ ะฟะพะณั€ะตัˆะฝะธ ะฝะฐั˜ะผะฝะพะณัƒ ะฟะตั‚ ะฟั€ะพั†ะตะฝั‚ะธ. ะ”ะฐ ะฟั€ะตั‚ะฟะพัั‚ะฐะฒะธะผะต ะดะตะบะฐ ะพะด ะผะฝะพะณัƒ ะณะพะปะตะผะฐ ะฟะพะฟัƒะปะฐั†ะธั˜ะฐ ะปัƒั“ะต, ั„ะพั€ะผะธั€ะฐะผะต 100 ะฟั€ะธะผะตั€ะพั†ะธ ะธ ั˜ะฐ ะทะฐะฑะตะปะตะถัƒะฒะฐะผะต ะฟั€ะพัะตั‡ะฝะฐั‚ะฐ ะฒะพะทั€ะฐัั‚. ะขะฐะฐ ัœะต ะฑะธะดะต ั€ะฐะทะปะธั‡ะฝะฐ ะฒะพ ัะตะบะพั˜ ะฟั€ะธะผะตั€ะพะบ, ะฝะพ ัœะต ะณั€ะฐะฒะธั‚ะธั€ะฐ ะพะบะพะปัƒ ะฒะธัั‚ะธะฝัะบะฐั‚ะฐ ะฟั€ะพัะตั‡ะฝะฐ ะฒั€ะตะดะฝะพัั‚ ะฝะฐ ั†ะตะปะฐั‚ะฐ ะฟะพะฟัƒะปะฐั†ะธั˜ะฐ. ะกะพ ะดั€ัƒะณะธ ะทะฑะพั€ะพะฒะธ, ะพะด ะฟั€ะธะผะตั€ะพะบ ะดะพ ะฟั€ะธะผะตั€ะพะบ, ัœะต ัะต ะฟะพั˜ะฐะฒะธ ะฒะฐั€ะธั˜ะฐั†ะธั˜ะฐ ะฒะพ ะดะพะฑะธะตะฝะฐั‚ะฐ ะฟั€ะพัะตั‡ะฝะฐ ะฒะพะทั€ะฐัั‚. ะขะฐะฐ ะฒะฐั€ะธั˜ะฐั†ะธั˜ะฐ ัะต ะฝะฐั€ะตะบัƒะฒะฐ ัั‚ะฐั‚ะธัั‚ะธั‡ะบะฐ ะณั€ะตัˆะบะฐ ะธ ัะต ะฟั€ะตัะผะตั‚ัƒะฒะฐ ะบะฐะบะพ ัะพะพะดะฝะพั ะพะด ัั‚ะฐะฝะดะฐั€ะดะฝะฐั‚ะฐ ะดะตะฒะธั˜ะฐั†ะธั˜ะฐ ะธ ะบะฒะฐะดั€ะฐั‚ะฝะธะพั‚ ะบะพั€ะตะฝ ะพะด ะณะพะปะตะผะธะฝะฐั‚ะฐ ะฝะฐ ะฟั€ะธะผะตั€ะพะบะพั‚: ๐œŽ๐‘ฅฬ… =

๐œŽ โˆš๐‘›

ะกะพ ะพะณะปะตะด ะฝะฐ ั‚ะพะฐ ะดะตะบะฐ ัั‚ะฐะฝะดะฐั€ะดะฝะฐั‚ะฐ ะณั€ะตัˆะบะฐ ัะฐะบะฐะผะต ะดะฐ ะฑะธะดะต ะบะพะปะบัƒ ัˆั‚ะพ ะต ะผะพะถะฝะพ ะฟะพะผะฐะปะฐ (ะบะฐะบะพ ะธ ะทะฐ ัะตะบะพั˜ะฐ ะดั€ัƒะณะฐ ะณั€ะตัˆะบะฐ), ะผะพะถะต ะดะฐ ั˜ะฐ ะฝะฐะผะฐะปะธะผะต ะฐะบะพ ะณะพ ะทะณะพะปะตะผัƒะฒะฐะผะต n, ะพะดะฝะพัะฝะพ ะฐะบะพ ะธะทะฑะตั€ะตะผะต ะบะพะปะบัƒ ัˆั‚ะพ ะต ะผะพะถะฝะพ ะฟะพะณะพะปะตะผ ะฟั€ะธะผะตั€ะพะบ (ะฟะพั‚ัะตั‚ะตั‚ะต ัะต ะฝะฐ ะ—ะฐะบะพะฝะพั‚ ะทะฐ ะณะพะปะตะผะธั‚ะต ะฑั€ะพะตะฒะธ). ะœะพะถะต ะดะฐ ะบั€ะตะธั€ะฐะผะต ะธะฝั‚ะตั€ะฒะฐะป ะฒะพ ะบะพั˜ ะฑะธ ัะฟะฐะดะฝะฐะปะต ัะธั‚ะต ะฟั€ะพัะตั‡ะฝะธ ะฒั€ะตะดะฝะพัั‚ะธ ะฝะฐ ะฟั€ะธะผะตั€ะพั†ะธั‚ะต, ะฟะพั‚ะพั‡ะฝะพ 95 ะฟั€ะพั†ะตะฝั‚ะธ ะพะด ะฝะธะฒ, ัะพ ะพะณะปะตะด ะฝะฐ ั‚ะพะฐ ะดะตะบะฐ ะฟั€ะธ ั€ะฐะฑะพั‚ะฐั‚ะฐ ัะพ ะฟั€ะธะผะตั€ะพะบ ะฝะต ะผะพะถะตะผะต ะดะฐ ะฟะพัั‚ะธะณะฝะตะผะต ั‚ะพั‡ะฝะพัั‚ ะพะด 100 ะฟั€ะพั†ะตะฝั‚ะธ. ะžะฒะฐ ัะต ะฝะฐั€ะตะบัƒะฒะฐ ะธะฝั‚ะตั€ะฒะฐะป ะฝะฐ ะดะพะฒะตั€ะฑะฐ ะธ ัะต ะฟั€ะตัะผะตั‚ัƒะฒะฐ ะฝะฐ ัะปะตะดะฝะธะพะฒ ะฝะฐั‡ะธะฝ: ๐‘ฅฬ… ยฑ ๐‘๐›ผ/2

๐œŽ โˆš๐‘›

ะšะฐะดะต ัˆั‚ะพ ๐‘๐›ผ/2 ะต ะฒั€ะตะดะฝะพัั‚ะฐ ัˆั‚ะพ ัะพะพะดะฒะตั‚ัั‚ะฒัƒะฒะฐ ะฝะฐ ะฒะตั€ะพั˜ะฐั‚ะฝะพัั‚ะฐ ะพะด ๐›ผ/2, ะบะพั˜ะฐ ะต ะดะตัะฝะพ ะฒะพ ะฝะพั€ะผะฐะปะฝะธะพั‚ ั€ะฐัะฟะพั€ะตะด. ะ˜ะผะตะฝะพ, ๐‘๐›ผ/2 ัะต ะฝะฐั€ะตะบัƒะฒะฐ ะบั€ะธั‚ะธั‡ะฝะฐ ะฒั€ะตะดะฝะพัั‚ ะฝะฐ ั€ะฐัะฟะพั€ะตะดะพั‚. ะ—ะฐ ะดะพะฒะตั€ะฑะฐ ะพะด 95 ะฟั€ะพั†ะตะฝั‚ะธ, ๐›ผ ะธะทะฝะตััƒะฒะฐ 0,05, ั‚ะฐะบะฐ ัˆั‚ะพ ะบั€ะธั‚ะธั‡ะฝะฐั‚ะฐ ๐‘๐›ผ/2 ะฒั€ะตะดะฝะพัั‚ ัˆั‚ะพ ะบะพั€ะตัะฟะพะฝะดะธั€ะฐ ัะพ ะฒั€ะตะดะฝะพัั‚ ะฝะฐ ะดะตัะฝะฐั‚ะฐ ัั‚ั€ะฐะฝะฐ ะพะด ะฝะพั€ะผะฐะปะฝะธะพั‚ ั€ะฐัะฟะพั€ะตะด ะพะด 0,025 ะธะทะฝะตััƒะฒะฐ 1,96. ะ’ะพ ัะปัƒั‡ะฐั˜ ะบะพะณะฐ ัั‚ะฐะฝะดะฐั€ะดะฝะฐั‚ะฐ ะดะตะฒะธั˜ะฐั†ะธั˜ะฐ ะฝะฐ ะฟะพะฟัƒะปะฐั†ะธั˜ะฐั‚ะฐ ะต ะฝะตะฟะพะทะฝะฐั‚ะฐ โ€“ ัˆั‚ะพ ะต ะฟะพั‡ะตัั‚ ัะปัƒั‡ะฐั˜ โ€“ ัะต ะบะพั€ะธัั‚ะธ ัั‚ะฐะฝะดะฐั€ะดะฝะฐั‚ะฐ ะดะตะฒะธั˜ะฐั†ะธั˜ะฐ ะฝะฐ ะฟั€ะธะผะตั€ะพะบะพั‚, ะฟั€ะธ ัˆั‚ะพ ะผะตัั‚ะพ ัั‚ะฐะฝะดะฐั€ะดะฝะธะพั‚ ะฝะพั€ะผะฐะปะตะฝ ั€ะฐัะฟะพั€ะตะด, ัะต ะบะพั€ะธัั‚ะธ ะกั‚ัƒะดะตะฝั‚ะพะฒ t ั€ะฐัะฟะพั€ะตะด. ะŸั€ะฐะบั‚ะธั‡ะฝะพ ะณะปะตะดะฐะฝะพ, ะธะฝั‚ะตั€ะฒะฐะปะพั‚ ะฝะฐ ะดะพะฒะตั€ะฑะฐ ะต ะฟะปัƒั / ะผะธะฝัƒั ะฑั€ะพั˜ะบะฐ ัˆั‚ะพ ัะต ะฟั€ะธะบะฐะถัƒะฒะฐ ะบะพะณะฐ ัะต ะธะทั€ะฐะทัƒะฒะฐ ะฝะตัะธะณัƒั€ะฝะพัั‚ ะทะฐ ัั€ะตะดะฝะฐั‚ะฐ ะฒั€ะตะดะฝะพัั‚. ะขะฐะบะฒะธ ะฟั€ะธะผะตั€ะธ ัั€ะตัœะฐะฒะฐะผะต ะฒะพ ััƒะฟะตั€ะผะฐั€ะบะตั‚ะธั‚ะต ะบะพะณะฐ ะฝะฐะฑะฐะฒัƒะฒะฐะผะต, ะฝะฐ ะฟั€ะธะผะตั€, ัˆะตัœะตั€, ะฟั€ะธ ัˆั‚ะพ 44


неговата тежина е означена како 900 гр +/- 20 гр. Ова значи дека во 95 од секои 100 пакувања шеќер вистинската вредност на тоа пакување ќе се движи од 880 до 920 грама. Или, при известувањето на резултатите од анкетите при изборни циклуси. На пример, со користење на интервал на доверба од ±3 проценти, а кога 60 проценти од испитаниците во примерокот одговориле дека ќе гласаат за одредена партија, тогаш може да бидеме сигурни дека ако прашањето било поставено на целата популација, 57 проценти до 63 проценти од неа ќе се изјаснеле позитивно за таа партија. Интервал на доверба во статистички софтвер. Во „Ексел“, интервалот на доверба се пресметува на едноставен начин. Во Data analysis – Descriptive statistics, треба да се избере полето Confidence level for the mean, кое по автоматизам е поставено на 95 проценти (при тоа, може да се специфицира и друго ниво).

Потоа, излезната информација е во следнава форма: wage Confidence Level (95.0%)

56.55586

45


И означува една половина од интервалот на доверба распореден лево и десно околу просечната вредност; во овој случај 1.190 ± 57 евра. Оттука, со 95 проценти сигурност, просечната плата за целата популација ќе се движи во интервалот од 1.133 до 1.247 евра.

Тестирање статистички хипотези Во применетата работа, често сакаме да тестираме некоја хипотеза. Хипотезата може да се однесува на една променлива: на пример, дека просечната тежина на пакување шеќер изнесува 900 грама; или на врската меѓу две променливи. Тестирањето на веројатноста за одреден образец на однесување, или хипотеза за врската меѓу променливите, се нарекува тестирање на значајноста (Berman Brown and Saunders, 2008). Хипотезата доаѓа во два облика: нулта и алтернативна хипотеза. Нултата хипотеза е таа што се однесува на статус кво (на пример, просечната тежина на пакување шеќер изнесува 900 грама), додека со алтернативната хипотеза го предизвикуваме статус квото. При тестирањето, ја пресметуваме t статистиката и целта е да оцениме колку е далеку од вредноста во хипотезата. На пример, од нашиот примерок сме заклучиле дека просечната вредност на пакување шеќер е 890 грама. Ова не значи веднаш дека пакувањата се помалку полни од тоа што е декларирано на пакувањето. Напротив, потребно е да се оцени колку 890 грама е далеку или блиску до 900 грама. За таа цел, тој износ ќе го претвориме во стандардизирана t вредност, според следнава формула: 𝑡=

𝑥𝑖 − 𝑥̅ 𝜎 √𝑛

И добиениот износ ќе го споредиме со критична вредност. Критичната вредност зависи од избраното ниво на доверба (најчесто 95 проценти), како и од степените на слобода, кои во поголемиот број од тестовите се еднакви на бројот на набљудувања, намален за 1. За големи примероци, критичната t вредност се приближува до z вредноста од 1,96, така што во применетата работа, оцената на хипотезите може да се врши со споредба на добиената т вредност со вредноста 2. Притоа, ако добиената t вредност е поголема од 2 или помала од -2, тогаш добиената статистика за примерокот е значително далеку од вредноста во хипотезата за целата популација, што имплицира дека нултата хипотеза се отфрла. Слично, со оглед на тоа дека оценетата статистика на примерокот во ваков случај се наоѓа во „опашките“ од нормалниот распоред, веројатноста е многу мала и, во секој случај, помала од прифатеното ниво на статистичка грешка од пет проценти. Оттука, ако веројатноста на тестстатистиката е многу ниска (p<0,05 или пониско), тогаш имаме статистички значајна врска.

46


Во статистиката, ова се нарекува отфрлање на нултата хипотеза и прифаќање на алтернативната хипотеза. Оттука, отфрлањето на нултата хипотеза значи отфрлање на исказот што го тестираме „нема разлика меѓу...“, и прифаќање на исказот „има разлика меѓу...“. Спротивно, ако веројатноста да се добие тестстатистика е повисока од 5 проценти, тогаш заклучуваме дека врската не е статистички значајна. Ова се нарекува неуспех да се отфрли нултата хипотеза. Имено, врската, сепак, може да постои, но тоа не можеме да го утврдиме со одредена сигурност. Статистичката значајност на една врска е во голема мера одредена од големината на примерокот, што може да се види во погорната формула. Имено, големината на примерокот се јавува во именителот на формулата: помал примерок значи поголема стандардна грешка, а поголема стандардна грешка имплицира помала т вредност. Помалата t вредност ја зголемува веројатноста дека врската ќе биде оценета како незначајна. Оттука, со многу големи примероци, секоја врска (или разлика) ќе биде значајна (Anderson, 2003). Поради тоа, особено ако се тестираат мали разлики, примерокот треба да биде што поголем за да се зголеми веројатноста дека разликата ќе биде оценета како значајна.

Тестирање на просечната вредност на една променлива. Наједноставното тестирање хипотези во статистичката анализа е кога сакаме да утврдиме дали просечната вредност на една променлива се разликува од одредена вредност. За таа цел го користиме t тестот на еден примерок. Тој тест ќе го најдеме во менито Parametric tests:

47


По што, ќе ја специфицираме платата како променлива, чијашто средна вредност сакаме да ја тестираме:

48


Наспроти претпоставена (теоретска) вредност од 1.000 евра:

Ова ја дава следнава излезна информација:

One-sample t-test / Two-tailed test: 95% confidence interval on the difference between the means: ] 1134.142, 1247.540 [ Difference t (Observed value) |t| (Critical value) DF p-value (Two-tailed) alpha

190.841 6.623 1.968 305 < 0.0001 0.05

Test interpretation: H0: The difference between the means is equal to 0. Ha: The difference between the means is different from 0.

Р вредноста е пониска од критичната вредност од 0,05, што овозможува нултата хипотеза масивно да се одбие, односно да се потврди дека просечната плата е значително различна од претпоставената плата. Тестирање независност на две променливи. Независноста или поврзаноста на две променливи е анализа што често сакаме да ја направиме. За таа цел ни служи тестот хи-квадрат (Chi-square). Нултата хипотеза на тестот 49


е дека нема зависност меѓу променливите. Слично како и кај t тестот, одбивањето или неодбивањето на нултата хипотеза се спроведува со помош на споредба со критичката хи-квадрат вредност. За да ја покажеме употребната вредност на овој тест, прво ќе креираме т.н. контингентна табела од две категориски променливи од нашиот примерок со вработени и со нивната плата:

Образование

Средно

Високо

Постдипломско

Вкупно

Жени

7

102

7

116

Мажи

22

145

24

191

Вкупно

29

247

31

307

Пол

Нултата хипотеза во овој случај ќе биде дека полот и образованието се независни, односно дека застапеноста на мажите и на жените во различните категории образование е иста. Во XLSTAT ја избираме опцијата Tests on contingency tables во менито Correlation-Association tests:

50


По што го добиваме следниов дијалог-бокс:

Додека во табот Options, ја избираме опцијата Chi-square test, а во табот Outputs, опциите Theoretical frequencies и Proportions/Column:

Резултатите се дадени во следнава слика. Вредноста на веројатноста (pvalue=0.036) е пониска од нивото на значајност од 0,05. Оттука, може да се одбие нултата хипотеза дека полот и образованието се независни. Со други зборови, ако хипотезата се одбие, ризикот од грешка е помал од прифатливото ниво, и во овој случај изнесува 3,6 проценти. Test of independence between the rows and the columns (Chi-square):

Chi-square (Observed value)

6.641

Chi-square (Critical value)

5.991

DF

2

p-value

0.036

alpha

0.05

51


Test interpretation: H0: The rows and the columns of the table are independent. Ha: There is a link between the rows and the columns of the table.

Потоа, табелата со теоретските фреквенции ги претставува фреквенциите што ќе се добиеја ако нултата хипотеза беше точна. Додека табелата за пропорции / колони ги покажува пропорциите на образование на мажите и на жените, во трите образовни варијанти. Според резултатите, може да кажеме дека барем една од трите пропорции (0,587) е значително различна од другите две. Theoretical frequencies:

Secondary

Tertiary

Postgraduate

Total

Female

10.958

93.329

11.713

116.000

Male

18.042

153.671

19.287

191.000

Total

29

247

31

307

Proportions / Column: Secondary

Tertiary

Postgraduate

Total

Female

0.241

0.413

0.226

0.378

Male

0.759

0.587

0.774

0.622

Total

1

1

1

1

Вообичаено, статистичките софтвери пресметуваат и сет од тестови за поврзаност (асоцијација) меѓу променливите од контингентната табела. Тие вообичаено ја известуваат поврзаноста на скала од 0 до 1, при што нула значи отсуство на врска, додека 1 значи совршена врска. Во продолжените, ги претставуваме тестовите што XLSTAT ги нуди заедно со хи-квадрат:

52


Association coefficients (1):

Coefficient

Value

Pearson's Phi

14.7%

Contingency coefficient

14.6%

Cramer's V

14.7%

Tschuprow's T

12.4%

Goodman and Kruskal tau (R/C)

2.2%

Goodman and Kruskal tau (C/R)

1.5%

Во конкретниот случај, сите тестови укажуваат на тоа дека, иако постои зависност меѓу полот и образованието, сепак интензитетот на таа врска е слаб. Тестирање дали две групи се различни. Со овој тест – наречен и t тест на независни групи - може да утврдиме дали две групи од една иста променлива се различни една од друга. Тестот ја споредува средната вредност на двете групи користејќи мера за растојанието меѓу статистиката. Ако веројатноста за постоењето на оваа разлика (растојание) по случајност е мала, тогаш t вредноста ќе биде голема, а p вредноста помала од 0,05. Тоа значи дека разликата е статистички значајна. Со цел да го примениме тестот во XLSTAT, ќе направиме реорганизација на сетот од податоци, така што една променлива ќе биде платата на мажите, а другата на жените. Потоа, од менито Parametric tests, ја избираме опцијата Two-sample t-test and z-test:

53


По што, го добиваме следниов дијалог-бокс: во табот General ги избираме двата потпримерока (мажи и жени) и опцијата One column per sample, која се користи за да специфицира дека се работи за два одвоени потпримерока, додека во табот Options ја поставуваме нултата хипотеза, според која разликата меѓу просекот од двете групи не постои (односно е еднаква на нула).

54


Потоа, се добива следнава излезна информација:

Од првата табела за збирна статистика забележуваме дека мажите имаат повисока просечна плата од жените (1.309 евра, наспроти 1.117 евра). Од втората табела, забележуваме дека p вредноста е пониска од критичната вредност 0,05, што значи дека нултата хипотеза е одбиена, односно дека се потврдува постоењето на разликата во платите меѓу мажите и жените во оваа компанија. Алтернативно, може да имаме две мерења едноподруго на една иста група испитаници. Тоа значи дека имаме по две податочни информации за секој испитаник. Тоа овозможува да се оцени веројатноста за разликата меѓу двете информации, дали се секоја по случајност, со помош на т.н. двоен t тест. Да претпоставиме дека во нашиот пример платите на жените од оваа компанија се следени во два периода. Оттука, за секоја вработена жена имаме по два податока: платата во време t, и платата во време t+1. Со оглед на тоа дека станува збор за двојни податоци, ќе го примениме двојниот t тест. Исто како и претходно, од менито Parametric tests, ја избираме опцијата Two-sample t-test and z-test, и во табот General, ја избираме опцијата Paired samples:

55


По што ја добиваме следнава излезна информација:

56


Забележуваме дека во подоцнежниот период платата на жените пораснала на 1.309 евра, од 1.078 евра во претходниот период. Р вредноста е пониска од 0,05, што значи дека нултата хипотеза може масивно да се одбие, односно разликата меѓу платата на жените во двата периода е статистички значајна, односно набљудуваниот пораст не е случаен.

Иако овие t тестови претпоставуваат дека податоците се нормално распоредени, игнорирањето на распоредот не претставува голем проблем дури и кога примерокот е мал. Дополнително, ако двата потпримерока се од иста или слична големина, дури и разликата во варијансите може да се игнорира (Hays, 1994). Но, доколку податоците се закосени или примерокот е мал, тогаш постои посоодветен статистички тест, кој се нарекува Mann-Whitney U test. Тестот е непараметарска варијанта на тестот за независни групи. Оттука, ако веројатноста за постоењето на разлика меѓу двете групи по случајност е мала, тогаш U вредноста ќе биде голема, а p вредноста помала од 0,05. Тоа значи дека разликата е статистички значајна. Во менито Non-parametric tests, ја избираме опцијата Comparison of two samples:

57


Додека во следниот дијалог-бокс ги внесуваме сите влезни информации како и претходно, избирајќи ја опцијата Mann-Whitney test:

Што ја нуди следнава излезна информација:

Забележуваме дека U вредност е многу голема, што резултира со р вредност пониска од 0,05, имплицирајќи дека нултата хипотеза – дека разликата меѓу двете групи е незначајна – се одбива.

58


Тестирање дали три и повеќе групи се различни. За да тестираме различност меѓу сатистиката на три или повеќе групи, на располагање имаме два теста: Kruskal-Wallis test и Friedman’s test. Првиот претпоставува независни групи, додека вториот двојни групи. За да го примениме првиот тест, ги делиме платите на вработените според нивото на завршено образование: средно, високо и постдипломско. Во менито Non-parametric tests, ја избираме опцијата Comparison of k samples:

А, во дијалог-боксот, го специфицираме соодветниот тест Kruskal-Wallis:

59


По што ја добиваме следнава излезна информација:

Р вредноста е поголема од 0,05 укажувајќи дека нултата хипотеза, според која статистиката меѓу трите потпримероци е иста, не може да биде отфрлена на конвенционалните нивоа на статистичка значајност. Ако претпоставиме дека ова беа платите на една група (на пример, на тие со средно образование) во три временски моменти едноподруго, тогаш може да го примениме Friedman’s test за двојни k примероци:

60


Со следнава излезна информација:

Според која, разликата меѓу просечните плати набљудувани во трите временски моменти е еднаква на нула (р вредност поголема од 0,05).

61


Преглед на различните тестови. Следната табела дава сумарен преглед на тестовите што се на располагање, кои може да се искористат во различни ситуации. Табелата предлага уште неколку дополнителни тестови, згора на тие што ги образложивме на претходните страници. Нивната примена следи ист образец како и тестовите што ги опишавме погоре, па затоа читателот се охрабрува овие тестови да ги примени сам.

62


63

Споредба на две варијанси

Споредба на серии од бинарни податоци

Споредба на варијанси

Споредба на вистински со теоретски просек

Прашање

Споредба на просек во две независни групи Споредба на просек во неколку независни групи Споредба на просек во две зависни групи Споредба на просек во неколку зависни групи Споредба на серии од бинарни податоци (зависни мерења)

Семејство тестови Споредба на просек

е

Двете варијанси се еднакви

Статистиката иста

Просекот е ист

Просекот е исти

Просекот е ист

Нулта хипотеза Вистински просек = теоретски просек Просекот е ист Споредба на платите меѓу неколку нивоа на образование Споредба на платите во два периода едноподруго Споредба на платите во неколку периоди едноподруго Оценувачите забележуваат присуство или отсуство на одредена карактеристика кај група производи Споредба на растурањето (варијансата) на платите меѓу мажите и жените

Споредба на платите меѓу мажите и жените

Споредба на набљудуваните ПМ10 во воздухот, со стандардот

Пример

Fisher тест

Повторени мерки ANOVA

т-тест на удвоени примероци

т-тест на независни примероци ANOVA

Параметарски тест т-тест со еден примерок

McNemar's тест (за 2 серии); Cochran's Q тест (за повеќе од 2 серии)

Friedman тест

Wilcoxon тест

Kruskal-Wallis тест

Mann-Whitney тест

Непараметарски тест


Семејство тестови

Прашање

Споредба на учества (пропорции)

Споредба на вистинското учество со теоретско учество Споредба на неколку учества

Споредба на повеќе варијанси

Тестови за поврзаност

Тест за поврзаност меѓу две квалитативни променливи Тест за поврзаност меѓу две квалитативни променливи низ повеќе стратуми Тест за поврзаност меѓу две квантитативни променливи Тест за поврзаност меѓу бинарна и квантитативна променлива

Нулта хипотеза Повеќето варијанси еднакви се

Вистинско учество = теоретско учество Учествата се еднакви меѓу себе Двете променливи се независни

Пример Споредба на растурањето (варијансата) на платите меѓу неколку нивоа на образование Споредба на учеството на жените во политика, со теоретско учество од 50 проценти Споредба на учеството на жените во политика, во неколку земји Дали високото образование е поврзано со полот?

Параметарски тест Levene тест

Pearson коефициент корелација

на

на

Хи-квадрат тест за учество со еден примерок

Хи-квадрат

Дали платата и искуството се поврзани:

Бисериска корелација

Хи-квадрат контингентна табела

се

се

се

Дали платите поврзани со полот?

Дали високото образование е поврзано со полот? Оценка за повеќе градови Двете променливи независни

се

Двете променливи независни

Двете променливи независни

Непараметарски тест

Серија тестови

Cochran-MantelHaenszel (CMH) тест

Spearman тест на корелација

64


65

Тестови на распореди

Семејство тестови

Тест нормалноста

на

Споредба на вистински распоред со теоретски распоред Споредба на два распореда

Тест за поврзаност меѓу две табели од квантитативни променливи

Прашање

Дали распоредот на платите е значително различен од нормален?

Дали платите следат ист распоред за мажи и за жени?

Двата примерока следат ист распоред Примерокот следи нормален распоред

Вистинскиот и теоретскиот распоред се исти

Дали оценката на серии од работници на серии од нивни карактеристики се менува од панел во панел? Дали платите следат нормален распоред?

Пример се

Нулта хипотеза Табелите независни

Shapiro-Wilk и други тестови за нормалност

Параметарски тест RV коефициент тест

KolmogorovSmirnov тест

KolmogorovSmirnov тест

Непараметарски тест


Регресија Тестовите што ги обработивме во претходните секции се добро загревање за т.н. регресивна анализа. Имено, суштината на статистичката анализа е утврдување на поврзаност и / или причинско-последична врска меѓу две променливи, како и одредување на статистичката значајност на таа врска. Тоа го овозможува регресијата. Таа функционира врз истите статистички принципи како и тестирањето на хипотезите. Всушност, во регресијата ја тестираме нултата хипотеза дали регресивните коефициенти се статистички значајни или не. Визуелно испитување. За да може да ја претставиме регресијата на интуитивен начин, добро е да почнеме со визуелен приказ на врската меѓу платите и искуството (повеќе за визуелниот пристап во делот четири). За очекување е дека поголемото искуство е поврзано со повисока плата, или дека поголемото искуство води кон повисока плата. Тука треба да направиме јасна разлика меѓу корелацијата и каузалноста. Корелацијата се однесува на интензитетот на врската меѓу две променливи, додека каузалноста се однесува на причинско-последичната поставеност. На пример, производството и инвестициите може да се позитивно поврзани: поголемо производство е поврзано со повисоки инвестиции во машини, опрема и во вештини на работната сила. Повисокото производство може да биде резултат на зголемените инвестиции, но можно е и зголеменото производство да донесе повеќе пари во фирмата, која потоа ќе реши да ги инвестира во нови машини и опрема. Значи, корелацијата може да е јасна и силна, но насоката на каузалноста да е нејасна. Каузалност, всушност, може и да не постои, ако корелацијата меѓу производството и инвестициите е поради некој трет фактор: на пример, некој пронајдок (патент) на фирмата, кој значително го подигнал нејзиното учество на пазарот, а истовремено бил проследен со зголемени инвестиции за негова комерцијализација. Регресијата што ќе ја претставиме во овој прирачник се сведува само на утврдување статистичка корелација, освен кога, според конструкцијата, каузалноста е јасна (на пример, кога е јасно дека мажите добиваат поголема плата, односно кога обратната конструкција, поголемата плата, влијае врз полот, не прави никаква смисла). Да се вратиме на нашата врска меѓу платите и искуството. Неа ќе ја прикажеме преку едноставен дијаграм на растурање (скатер), на следниов начин:

66


Врската помеѓу платите и искуството 3,500.0 3,000.0

Плати, евра

2,500.0 2,000.0 1,500.0 1,000.0

500.0 0

5

10

15

20

25

30

35

40

Искуство, години На дијаграмот, на х оската е претставено искуството во години, а на у оската платата во евра. Секоја точка претставува комбинација од платата и од искуството за секој вработен. Ако дијаграмот го набљудуваме како целина, тогаш може да идентификуваме одреден тек. Во овој случај, тој тек се чини растечки, како што и очекувавме: поголемата плата е поврзана со поголемо искуство.

Нашата цел е да идентификуваме една линија, која ќе биде најдобар претставник на сите точки. Таа линија, всушност, треба да ги намали на минимум растојанијата меѓу неа и секоја опсервација:

67


Врската помеѓу платите и искуството 3,500.0 3,000.0

Плати, евра

2,500.0 2,000.0 1,500.0 1,000.0

500.0 0

5

10

15

20

25

30

35

40

Искуство, години Но, како да знаеме која е најдобрата линија? Испрекинатата линија на сликата е нацртана така што збирот од квадратите од отстапувањата меѓу линијата и секоја опсервација е сведен на минимум преку техники на линеарно програмирање. Која било друга линија ќе резултира со повисока вредност на оваа бројка и оттука нема да биде линијата што се вклопува најдобро во податоците. Регресивна линија. Сега, да ѝ зададеме математичка форма на нацртаната линија: 𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 Каде што 𝑦𝑖 и 𝑥𝑖 се вредностите што ги читаме на соодветните оски; 𝛼 се нарекува слободен член и, математички, тоа е вредноста каде што линијата би ја пресекла у оската, додека 𝛽 се нарекува накосување и оттука означува дали накосувањето на кривата е негативно или позитивно / благо или стрмно. Проста регресија. Горната форма е математичка или детерминистичка. Со задавање вредности за х, добиваме вредности за у: сите тие ќе лежат

68


на самата права. Но, нашиот феномен плата - искуство не е детерминистички: за 10-годишно искуство, правата предвидува плата од 1.200 евра, но некои вработени имаат значително над таа вредност, а други значително под таа вредност. Оттука, во нашата статистичка форма, имаме и стохастичка компонента. Статистичката форма е следнава: 𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜀𝑖 Според која х е набљудувана променлива, која ја детерминира у, но врз у влијаат и други фактори, кои или се познати, но не се ставени во регресијата, или, пак, се непознати. Оттука, у се нарекува зависна променлива, а х независна променлива. Оваа равенка, генерално, се нарекува регресија. Проста регресија во статистички софтвер. Платите се одличен пример за ова. Во нашиот случај, дозволуваме платите да ги објаснува искуството. Но, знаеме дека најзначајна детерминанта на платите (барем според теоријата на Гари Бекер, 1964 година) е човековиот капитал, кој наједноставно се апроксимира преку образованието. Ако образованието не го вклучиме како посебна променлива, тогаш тоа ќе потпадне во 𝜀𝑖 и може да објасни дел од разликите од регресивната линија до секоја опсервација. Други вакви објаснувачки фактори би биле возраста, секторот, занимањето и видот на договорот. 𝜀𝑖 , секако, ќе содржи и некои ненабљудувани (невидливи) променливи за кои знаеме дека имаат веројатна поврзаност со платата: мотивацијата, амбицијата, интелигенцијата, снаодливоста, вештините за преговарање и комуникација и сл. Регресивната анализа во „Ексел“ се изведува мошне едноставно. Во Data analysis ја избираме опцијата Regression:

69


По што, го добиваме следниов дијалог-бокс:

Во кој ја специфицираме зависната променлива у и независната променлива х. Сега работиме само со една независна променлива, а тоа е искуството, додека нашата зависна променлива се платите. Потоа, ја добиваме следнава излезна информација: Coefficient s

Standard Error

t Stat

Pvalue

Lower 95%

Upper 95%

Слободе н член

880.96

49.35

17.8 5

0.000 0

783.84

978.07

Искуство

29.51

3.98

7.42

0.000 0

21.68

37.34

Во првата колона ги читаме коефициентите 𝛼 и 𝛽. Оценетата регресивна линија може да се напише на следниов начин:

𝑤𝑎𝑔𝑒 ̂ 𝑖 = 880,96 + 29,51 ∗ 𝑒𝑥𝑝𝑒𝑟𝑖𝑒𝑛𝑐𝑒𝑖 Забележуваме дека врз зависната промелива имаме ознака „капа“, која означува дека ја претставуваме оценетата регресивна линија. Коефициентот на накосувањето покажува дека со секоја дополнителна

70


година искуство, во просек, платата расте за речиси 30 евра. Додека, слободниот член означува дека за лице без искуство (нововработен), платата изнесува 881 евро. Следната важна информација содржана во горната табела е статистичката значајност. Како што споменавме и погоре, концептот на статистичко тестирање на хипотезите е широко применет во регресивната анализа. Овде, заинтересирани сме да ја отфрлиме нултата хипотеза, која тврди дека коефициентите се еднакви на нула, односно дека не се статистички значајни. Тоа го правиме преку пресметка на t статистиката, која е однос од разликата меѓу оценетиот и хипотетичкиот коефициент и стандардната грешка. Целата пресметка за нас ја прави статистичкиот софтвер. Всушност, софтверот директно ни нуди информација за р вредноста, која покажува дека коефициентот е статистички значаен ако таа е пониска од 0,05. Тоа значи дека оценетиот коефициент се наоѓа во опашките на нормалниот распоред и е оценет како доволно оддалечен од средната вредност на распоредот, која е хипотетичката вредност од нула. Оттука, можеме излезната информација да ја претставиме во следниов облик:

𝑤𝑎𝑔𝑒 ̂ 𝑖 = 880,96 + 29,51 ∗ 𝑒𝑥𝑝𝑒𝑟𝑖𝑒𝑛𝑐𝑒𝑖 [0.000]

[0.000]

Р вредноста ја задаваме под секој коефициент за да може веднаш да се увиди дали коефициентот е статистички значаен или не. Во нашиот случај, двата коефициента се статистички значајни. Особено е важна информацијата дека оценетиот коефициент пред искуството е статистички значаен, што значи дека искуството има објаснувачка моќ врз платите. Користење логаритам. Ако уште еднаш се навратиме врз дијаграмот на растурање, може да забележиме дека врската меѓу платите и искуството не следи константен тек. Платите се мошне концентрирани кога искуството е мало, што е логично бидејќи на почетокот на кариерата моќта за преговарање е многу мала и компаниите ја нудат платата во форма „земи или остави“. Но, како што се зголемува искуството, така „раштрканоста“ на платите се зголемува, што се должи на засиленото влијание на повеќе други набљудувани и ненабљудувани фактори. Статистички, платите во однос на искуството имаат потенцијално засилена и различна варијанса, што се нарекува хетероскедастичност. Со примената на статистички софтвер, хетероскедастичноста престана да биде голем проблем бидејќи софтверот најчесто содржи алгоритам за т.н. избелување на стандардната грешка, со чијашто помош се прочистува од

71


нееднаквата варијанса. Но, сè уште е валидна една релативно стара статистичка препорака дека за монетарните променливи (односно тие што се изразени во валута) е добро да се користи логаритам, со оглед на тоа дека логаритамската скала е многу потесна и овозможува „зауздување“ на оваа различна варијабилност. Користењето логаритам има уште една предност. Имено, во интерпретацијата на коефициентите забележавме дека требаше да реферираме кон единиците во кои се мерени. Со користењето логаритам, ова веќе не е потребно: логаритамот овозможува коефициентите да апроксимираат еластичности и нивната интерпретација да се сведе во проценти. Можно е следново користење логаритам: Регресија Линеарна

Зависна променлива Ниво

Независна променлива Ниво

Лог-линеарна

Логаритам

Ниво

Лог-линеарна

Ниво

Логаритам

Логаритамска

Логаритам

Логаритам

Интерпретација на коефициентот Во оригиналните единици Зависна во %, независна во оригинал. Множење со 100 Зависна во оригинал, независна во %. Делење со 100 Во %

Оваа процедура за пресметка на регресијата ја повторуваме со тоа што ја трансформираме платата во логаритамска вредност. Ја добиваме следнава излезна информација:

72

Coefficient s

Standard Error

t Stat

Pvalue

Lower 95%

Upper 95%

Слободе н член

2.94

0.02

183.1 6

0.000 0

2.90

2.97

Искуств о

0.01

0.00

7.94

0.000 0

0.01

0.01


Забележуваме дека коефициентите значително се сменија. Првенствено, стандардните грешки во однос на пресметаните коефициенти се помали, што резултира со поголема t вредност, а што е резултат на процесот на користење логаритам. Пресметаната регресивна линија е следнава: ̂ 𝑖 = 2.94 + 0.01 ∗ 𝑒𝑥𝑝𝑒𝑟𝑖𝑒𝑛𝑐𝑒𝑖 𝑙𝑤𝑎𝑔𝑒 [0.000]

[0.000]

Секоја дополнителна година искуство е поврзана со повисока плата, во просек, за еден процент. Двата коефициента остануваат статистички значајни. Коефициент на детерминација. Нашата цел во регресивната анализа е да објасниме што поголем дел од (варијацијата на) зависната променлива. Вкупната варијација во податоците може да се подели на варијација што се должи на регресивната линија и таа е објаснета со вклучените променливи, и варијација што се должи на ненабљудуваните фактори, односно на грешката. Нашата цел е учеството на објаснетиот дел од варијацијата во вкупната варијација да биде што поголемо. Ова учество се нарекува коефициент на детерминација или Р квадрат. За нашата претходна проста регресија, Р квадратот може да се види заедно со излезната информација за регресивните коефициенти: Regression Statistics Multiple R

41.38%

R Square

17.12%

Adjusted R Square

16.85%

Standard Error

15.07%

Observations

307

Може да забележиме дека со искуството објаснуваме 17,1 проценти од варијацијата во платите. Секако, овој коефициент се чини низок, со оглед на тоа дека сакаме да биде објаснет поголем дел од варијацијата во платите (а идеално во целост). Тоа е и логично во овој пример, со оглед на тоа дека станува збор за проста регресија, односно ја објаснуваме платата само со една променлива, а притоа знаеме дека врз неа влијае уште мноштво променливи, како образованието, секторот, занимањето и сл.

73


Со излезната информација за р квадратот, доаѓа уште една информација, а тоа е статистичката значајност на коефициентот на детерминација, што истовремено ја потврдува статистичката значајност на сите независни променливи заедно врз зависната променлива. Овој тест се нарекува F тест, и е пандан на t тестот, но се однесува за варијацијата во целата регресија, а не за варијацијата поврзана со одреден регресивен коефициент. df

SS

MS

F

Significance F

Regression

1

1.4321

1.4321

63.0162

0.0000

Residual

305

6.9312

0.0227

Total

306

8.3632

Оценетата F вредност треба да се спореди со критична вредност. Но, постои поедноставниот начин – со поглед врз р вредноста на F статистиката. Таа е пониска од 0,05, што значи дека нултата хипотеза – дека сите променливи заеднички немаат објаснувачка моќ врз платата, може да се одбие на конвенционалните нивоа на статистичка значајност. Повеќекратна регресија. Со оглед на тоа дека нашата цел е да објасниме еден феномен во колку што е можно поголема мера, во регресијата ќе ги вклучиме сите променливи што имаат потенцијална објаснувачка моќ врз зависната променлива. Така добиваме повеќекратна регресија, која ја има следнава форма:

𝑦𝑖 = 𝛼 + 𝛽1 𝑥1𝑖 + 𝛽2 𝑥2𝑖 +. … . . +𝛽𝑛 𝑥𝑛𝑖 + 𝜀𝑖 Каде што ознаките се исти како претходно, со таа разлика што сега имаме повеќе независни променливи, од 𝑥1𝑖 до 𝑥𝑛𝑖 . Оцената и толкувањето на повеќекратната регресија се врши на ист начин како и кај простата регресија, со таа разлика што секој коефициент се интерпретира според принципот „ceteris paribus“, односно дека сè друго останува константно. Повеќекратна регресија во статистички софтвер. Во нашата регресија за плата сега ги додаваме сите променливи што се на располагање, и тоа: полот (0 = мажи, 1 = жени), образованието (1=средно, 2 = високо и 3 = постдипломско), возраста изразена во години, видот договор (0 = определено време, 1 = неопределено време) и занимањето, распоредено во три бинарни променливи: за менаџери,

74


професионалци и за технички персонал. Прво ќе ги внесеме сите променливи, освен занимањето, на следниов начин. Во Data analysis ја избираме опцијата Regression:

И во полето за зависна променлива ја избираме колоната со логаритмот од платата, додека во полето за независни променливи, ги избираме сите колони со споменатите променливи. Потоа, ја добиваме следнава излезна информација: Regression Statistics Multiple R

61.0%

R Square

37.2%

Adjusted Square

R 36.1%

Standard Error

13.2%

Observations

307

df

SS

MS

F

Significance F

Regression

5

3.110

0.622

35.638

0.000

Residual

301

5.253

0.017

75


Total

306

8.363

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Intercept

2.655

0.093

28.525

0.000

2.472

2.839

Experience

0.013

0.003

3.942

0.000

0.007

0.020

Gender

-0.077

0.016

-4.886

0.000

-0.107

-0.046

Education

0.118

0.019

6.094

0.000

0.080

0.156

Age

-0.001

0.003

-0.421

0.674

-0.008

0.005

Contract

0.117

0.026

4.578

0.000

0.067

0.167

Прво, забележуваме дека коефициентот на детерминација се зголеми од претходните 17,1 проценти на 37,2 проценти. Ова ниво на објаснување на варијацијата во платата сè уште може да е незадоволително, но во однос на претходното, неговото зголемување е повеќе од двојно. F статистиката го потврдува овој коефициент на детерминација. Потоа, преминуваме на интерпретација на економската и на статистичката значајност на добиените коефициенти. Веднаш забележуваме дека возраста нема објаснувачка моќ врз платата бидејќи р вредноста е повисока од 0,05. Оттука, добиениот коефициент не е статистички различен од нула и понатаму не го интерпретираме. Другите променливи се статистички значајни. Дополнително искуство од една година е поврзано со повисока плата за, во просек, 1,3 проценти, ceteris paribus. Дополнителен степен образование, во просек, резултира со 11,8 проценти поголема плата, ceteris paribus. Променливите за полот и за договорот се бинарни променливи. Нив ги објаснуваме во продолжение. Бинарни променливи. Бинарните променливи се квалитативни променливи. Тие земаат вредност од нула и од еден, така означувајќи некој квалитативен белег. Притоа, нумерирањето не игра улога, но е важно да се знае која карактеристика добила еден, а која нула затоа што карактеристика што добила нула служи за референтна категорија. Во случајот на повеќекратната регресија, жените имаат пониска плата од мажите, во просек за 7,7 проценти, ceteris paribus. Имено, жените беа означени со вредност 1, додека мажите со вредност 0, и тие служат за

76


референтна категорија. Слично, вработените со договор на неопределено време имаат, во просек, повисока плата од вработените на определено време за 11,7 проценти, ceteris paribus. Regression Statistics Multiple R

71.1%

R Square

50.6%

Adjusted Square

R 49.5%

Standard Error

11.8%

Observations

307

df

SS

Significance F

MS

F

43.785

0.000

Regression

7

4.233

0.605

Residual

299

4.130

0.014

Total

306

8.363

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Intercept

2.649

0.083

31.912

0.000

2.486

2.813

Experience

0.010

0.003

3.290

0.001

0.004

0.016

Gender

-0.052

0.014

-3.617

0.000

-0.080

-0.023

Education

0.095

0.018

5.406

0.000

0.061

0.130

Age

0.000

0.003

0.155

0.877

-0.005

0.006

Contract

0.091

0.023

3.964

0.000

0.046

0.136

Managers

0.164

0.039

4.261

0.000

0.088

0.240

Professionals

0.153

0.018

8.349

0.000

0.117

0.190

77


Да забележиме дека, иницијално, нашата променлива за занимањето се состоеше од три карактеристики: професионалци (вредност 1), технички персонал (вредност 2) и менаџери (вредност 3). Доколку оваа променлива ја внесеме во регресијата на ваков начин, тогаш добиениот коефициент нема да има економска смисла, со оглед на тоа дека одењето од 1 кон 3 не означува подреден редослед на одредена карактеристика. Во овој случај, занимањата може да се подредат бидејќи е за очекување дека менаџерите ќе имаат повисока плата од професионалците, а овие повисока од техничкиот персонал. Но, може да имаме ситуација во која некој феномен е објаснет преку три бои, кај кои воопшто не може да се воспостави ваква подреденост. Оттука, ваквиот тип променливи треба да се поделат на бинарни променливи. Секоја карактеристика ќе биде претставена преку една бинарна променлива: на пример, бинарната променлива менаџери ќе добие вредност 1 секогаш кога вработениот има менаџерска позиција, а 0 во спротивен случај. Проблемот што се јавува при ваквото дефинирање на овој тип променливи е што збирот на сите карактеристики (во случајов, збирот на сите три вектори) е еднаков на единица, за секој вработен. Таквиот вектор се поистоветува со константата и тие заедно не може да коегзистираат во една регресија. Проблемот се надминува на тој начин што една од повеќето (во случајов, трите) карактеристики ќе се испушти и ќе служи за споредбена категорија. Ние ќе ја испуштиме категоријата технички лица и другите две бинарни дефинирања на променливата занимање ќе ги додадеме на регресијата. Ја добиваме следнава излезна информација: Прво забележуваме дека р квадратот се зголеми на 50,6 проценти, што веќе е задоволително ниво на објаснување на варијацијата на платите. Со додавање објаснувачки променливи, р квадратот може само да расте; колку ќе расте, зависи од објаснувачката моќ на додадената независна променлива, но во никој случај не може да опаѓа. F статистиката го потврдува овој р квадрат. Следно ги интерпретираме коефициентите. Забележуваме дека возраста останува статистички незначајна, додека коефициентите пред другите променливи се променија, но нивната големина останува споредлива со таа што ја добивме во претходната регресија. Занимањата се статистички значајни. Менаџерите, во просек, имаат повисока плата од техничкиот персонал за 16,4 проценти, ceteris paribus, додека професионалците, за 15,3 проценти, ceteris paribus. Да не заборавиме дека испуштената категорија, техничкиот персонал, служи за споредбена категорија. Разликата во платите меѓу менаџерите и

78


професионалците е многу мала, само 1,1 процент, а нејзината статистичка значајност не може директно да се утврди од горната табела. Анализа на оценетиот модел. На крајот од регресивната анализа, треба да оцениме / анализираме дали оценетиот модел е соодветен на податоците што ги имаме. Тоа го правиме преку анализа на претпоставките на регресијата, и тоа:    

Линеарност Независност на грешките Нормалност на грешките Еднаква варијанса (хомоскедастичност).

Во целата анализа претпоставувавме дека врската меѓу платата и искуството (а потоа и со другите независни променливи) е линеарна. Ако оваа претпоставка е нарушена, тогаш оценетите коефициенти се неточни. Втората претпоставка претпочита дека грешките 𝜀𝑖 се независни една од друга. Во контекстот на нашата регресија, ова значи дека фактот дека вработениот А има значително повисока плата од тоа што предвидува регресивната линија, не е поврзан со фактот дека лицето Б има значително пониска плата од тоа што го предвидува регресивната линија. Оваа претпоставка има особена значајност кога се работи за податоци собрани низ времето, при што е вообичаено вредноста од сегашниот период да е поврзана со таа од претходниот период. Зависноста може да е присутна и при работа со податоци како нашите – за повеќе единици во една точка од времето – но ако начинот на нивното подредување има смисла (на пример, ако станува збор за цената на куќи, при што е важно колку тие куќи се оддалечени од депонијата, нивното просторно подредување е важно). Третата претпоставка подразбира дека грешките 𝜀𝑖 се нормално распоредени за секоја од независните променливи. Сè додека распоредот на грешките за секое ниво на независните променливи не е значително различен од нормален распоред, заклучоците за регресивните коефициенти не се сериозно загрозени. Четвртата претпоставка бара варијансата на грешките 𝜀𝑖 да биде константна за сите вредности на независната променлива. Да се потсетиме на графиконот на растурање меѓу платата и искуството: таму забележавме дека платите се многу концентрирани на почетокот на кариерата, а потоа нивната растуреност се зголемува. Во вакви случаи, податоците треба да претрпат некаква трансформација, како што направивме со користењето логаритамска вредност од платата, или да се

79


користи понапреден метод за излегување на крај со хетероскедастичнoста. Со напредувањето на статистичките софтвери, хетероскедастичноста се решава преку вградените алгоритми за т.н. избелување на грешките, односно нивно прочистување од различната варијанса. Анализа на оценетиот модел во статистички софтвер. Со оглед на тоа дека валидноста на претпоставките ја проверуваме преку анализа на грешките, процесот се нарекува и анализа на грешките, или анализа на остатоците. Во дијалог-боксот за регресија во Data analysis ги избираме опцитие за грешките (residuals), нивните прикази (residual plots), линијата на вклопување (line fit plots) и приказите на нормалниот распоред (normal probability plots):

Линеарноста може да ја оцениме така што ќе ги нацртаме на графикон грешките на вертикалната оска и соодветните вредности на независната променлива на хоризонталната оска. Ако линеарниот модел е соодветен, тогаш нема да забележиме никаков особен тек (шема) кај грешките. Да го погледнеме ваквиот приказ за грешките и искуството. Тој не укажува на постоење некоја позначајна шема. Грешките, се чини, се еднакво распоредени над и под нулата за различни вредности на искуството. Оттука, линеарниот модел се чини соодветен кога станува збор за простата регресија меѓу платата и искуството. Ваква анализа се прави за сите вклучени променливи.

80


Тек на грешките за искуството 0.5 0.4

0.3

Residuals

0.2

0.1 0 -0.1

0

5

10

15

20

25

30

35

40

-0.2 -0.3

-0.4

exper

Претпоставката за независност на грешките нема особено значење во нашиот случај бидејќи нашите податоци немаат ниту временска ниту просторна подреденост. Претпоставката за нормален распоред на грешките може да се оцени преку т.н. приказ за нормален распоред. Тој приказ ги става грешките на вертикалната оска и перцентилот во кој се наоѓаат набљудуваните вредности на хоризонталната оска. Ако податоците се нормално распоредени, вредностите ќе се прикажат по приближно права линија. Во нашата анализа, тоа е случај, поради што може да заклучиме дека моделот не отстапува значително од претпоставката за нормален распоред.

81


Normal Probability Plot 4 3.5 3

lwage

2.5

2 1.5 1

0.5 0 0

20

40

60

80

100

120

Sample Percentile Последната претпоставка, исто така, се оценува низ визуелна призма, односно преку набљудување на текот на грешките. Во случај да е нарушена оваа претпоставка на еднаква варијанса, тогаш грешките ќе следат одредена шема во која ќе бидат тесно распоредени околу нулата лево на хоризонталната оска, и таа растуреност ќе се зголемува со движење десно по оската. Од нашиот графикон не може да се забележи таков тек, поради што може со голема доза на сигурност да заклучиме дека нашиот модел не страда од хетероскедастичност. Треба да се забележи дека врз грешките може и е препорачливо да се применат и некои поригорозни тестови за задоволување на моделските претпоставки, од кои дел ги елабориравме во погорните секции, а понапредните се надвор од опфатот на овој прирачник и читателот го упатуваме на некое понапредно статистичко четиво. Чести грешки при оцена на регресијата. При анализата на регресија се прават чести грешки. Најголемата грешка што истражувачите често ја прават е т.н. слепа примена на статистички софтвер, без темелно разбирање на значењето на таквите пресметки. Во овој прирачник строго препорачуваме да се избегнува слепа примена на статистичка анализа. Други чести грешки при анализата на регресија вклучуваат:

82


Недоволно познавање на теоретската рамка на хипотезите на регресијата што може да доведе до исклучување соодветни променливи или вклучување несоодветни променливи во регресијата Недостиг од свесност за претпоставките на регресијата Незнаење како да се оценат претпоставките на регресијата Незнаење за алтернативите на регресијата базирана на методот на најмали квадрати, кога некоја претпоставка е нарушена Користење регресивен модел, без да се разбере феноменот што се анализира Заклучување дека оценетата значајна врска меѓу две променливи е каузална (причинско-последична врска). Препорачуваме неколку лесни чекори, кои може да се следат, со цел да се намали инциденцијата на грешките при статистичката (регресивната) анализа: Почнете со дијаграм на растурање за да здобиете интуитивно разбирање за можната врска меѓу променливите. Искористете сет од тестовите за поврзаност меѓу две и повеќе променливи, зависно дали се квалитативни или квантитативни. Ваквата анализа ќе го зголеми вашето разбирање на податоците. Пресметајте ја вообичаената описна статистика и осигурете се дека во целост го разбирате нејзиното значење. Проверете ги претпоставките на регресијата: а. Прикажете ги грешките наспроти независните променливи за да одредите дали линеарниот модел е соодветен и за да проверите за еднаквост на варијансата б. Конструирајте хистограм или приказ на нормалниот распоред на грешките за да го проверите нормалниот распоред в. Прикажете ги грешките наспроти времето (ако станува збор за временски податоци) за да проверите независност. Ако има нарушувања на претпоставките, користете алтернативни методи на методот на најмали квадрати.

83


Ако нема нарушувања на претпоставките, оценете ги регресивните коефициенти, нивната големина и статистичка значајност, како и интервалите на доверба. Не заборавајте дека идентификуваните врски не значат неопходно причинско-последична поврзаност. Каузалноста значи корелираност, но корелираноста не значи каузалност.

84


85


КВАЛИТАТИВНИ МЕТОДИ ВО ЕКОНОМИЈАТА


3. Квалитативни методи во економијата Квалитативните методи се занимаваат со оцена на општествените феномени. Тие овозможуваат резултати што се, обично, описни, богати и детални, нудат идеи и концепти за истражувачката работа. Преку квалитативните методи се осознава контекстот, што мислат и чувствуваат луѓето. Тие немаат цел да обезбедат информација за тоа колкав дел од целната популација мисли на еден или друг начин, што е цел на квантитативните методи.

Квалитативна анкета Квалитативната анкета, исто како и квантитативната анкета, цели да обезбеди информации за истражувачот, кои се, главно, од квалитативна природа. Оттука, повеќето од аспектите што ги елабориравме кај квантитативната анкета се валидни и за квалитативната. Клучната разлика е што квалитативната анкета се фокусира на прашањето „зошто“, место на прашањето „колку“. Оттука, таа прашува за контекст, мислења, ставови и за чувства. Поголем дел од нив може да се опфатат преку описни и, често, отворени прашања. Отворените прашања најчесто почнуваат со „што“, „зошто“, „како“, или „опишете“ за да здобијат богата квалитативна информација. MacDonald и Headlam (2009) даваат преглед отворените прашања кај квалитативната анкета: Користење Како прашање што следува по затворени квалитативни прашања за да се добие подетален одговор Да се дознае повеќе за личноста, нејзините размислувања, потреби, проблеми и сл. Да ги натера луѓето да ја сфатат големината / важноста на нивните проблеми Да ги натера луѓето да се изјаснат за влијанието на нешто или на некоја промена Извор: MacDonald и Headlam(2009),

на

користењето

на

Пример Ако одговоривте „да“ на прашањето 7, ве молиме објаснете ги причините за ова Зошто е важно за вас? Каков ефект има ова врз вашиот фамилијарен живот? Како ова направи разлика за вас? стр. 36.

87


Квалитативната анкета е често значително помалку ригорозна, како во делот на статистичка анализа на добиените одговори, така и во делот на создавањето на примерокот. Оттука, целта на квалитативната анкета не е секогаш генерализација на резултатите за целата популација. Но, квалитативната анкета не исклучува дефинирање репрезентативен примерок, кој е избран на случаен или стратифицирано случаен начин. Сепак, примерокот што се дефинира при квалитативна анкета е најчесто од т.н. намерен / целен или пригоден тип. Тоа значи дека за анкетата се избираат тие испитаници за кои е најверојатно да дадат квалификуван и суштински одговор, или тие испитаници што се најлесно достапни. Во вакви случаи, првите контакти ќе овозможат дополнителни контакти на испитаници што се слични на нив. Ваквиот метод на избор на примерокот се нарекува снежна топка. Слично како и кај квантитативната анкета, квалитативната анкета може да се спроведе лично, по телефон, по пошта или електронски. Сепак, кога станува збор за детални и особено за лични квалитативни прашања, најефективниот метод е лице в лице, со оглед на тоа дека истражувачот ќе може да постави и потпрашања, зависно од одговорите и од изразите што ги прави испитаникот. Сепак, ова може да внесе пристрасност, па затоа, обично, истражувачот поставува потпрашања само од веќе дефиниран сет. Со други зборови, испитаниците не треба да се форсираат да даваат одговори што не ги мислат или за кои не се сигурни, а кои би биле испровоцирани од инсистирањето на истражувачот, што значително ја нарушува објективноста на собирање на одговорите. Анализата на одговорите кај квалитативната анкета може да бара повеќе време и напор, во споредба со квантитативната анкета, особено ако застапеноста на описни одговори и, особено, такви на отворени прашања, е поголема. Кај ваквите прашања, секој одговор може да е појавно и / или суштински различен од претходниот.

Интервју Интервјуто е една од најкористените квалитативни истражувачки алатки. Спроведувањето интервју е интерперсонален процес, кој мора да води сметка за однесувањето на истражувачот, како и за претпоставките во целиот процес. Интервјуата не се неутрален општествен простор и мора да почитуваат одредени граници. Интервјуто, како и квалитативната анкета, цели да ги здобие перцепциите и ставовите на испитаниците за одредено прашање. Кај интервјуто е

88


важно да се одредат кои се клучните лица со кои ќе се прави интервју и каков тип интервју ќе се примени. Видови интервју. Интервјуата се најчесто од три типа: структуирани, полуструктурирани и неструктурирани. Кај структурираните интервјуа, видот и опсегот на прашањата се фиксирани од почеток. Со ваков тип интервју, се постигнува поголема споредливост на добиените информации. Но, почесто се користи полуструктурираното интервју. Во него се дефинирани темите за разговор, а не и конкретни прашања. Тоа овозможува флексибилност на истражувачот да може да го води разговорот на начин како што се појавуваат прашањата во неговиот тек. Неструктурираното интервју нема никаков тек и се почнува со обичен разговор, кој добива тек и динамика во зависност од тоа како се отвораат темите и како што и истражувачот и испитаникот мислат дека се важни. Цел на интервјуто. Интервјуата може да се спроведат со неколку цели. Доколку се сака да се добие конкретна информација од лицето со кое се прави интервју – најчесто преку структурирано интервју – тогаш станува збор за интервју што наоѓа факти. На пример, откако е спроведена квантитативна анкета за износот што едно лице го прима како дознаки од свои роднини во странство, може да следи ваков тип интервју со кој би се добиле дополнителни квалитативни информации поврзани со оваа појава, а кои не можат да се откријат низ бројки. Спротивно на ова, доколку не постои никаква претходна информација за одреден феномен, може да се спроведе интервју за генерирање идеи. Нему повеќе му прилега полуструктурирана или неструктурирана форма и се спроведува на почетокот од одредена анализа, со цел да ја зададе нејзината натамошна структура и тек. Најчесто користеното интервју е истражувачкото интервју. Тоа се спроведува со испитаници што се најсоодветни за одредено прашање. Со кого да направиме интервју? Примерокот кај интервјуата е секогаш целен / намерен. Интервјуа се спроведуваат со испитаници што за конкретното прашање може да обезбедат најбогат сет од квалитативни информации во форма на факти, перцепции, ставови, чувства и контекст. Оттука, целта на интервјуата не е во никој случај да се постигне репрезентативност. Администрирање. Најдобро е ако интервјуто се спроведе лице в лице, со оглед на тоа дека само тогаш, освен кажаното, може да се забележи и говорот на телото и гестикулациите, кои за одредени теми може да бидат особено значајни. На лицето со кое се прави интервју треба однапред да му се укаже на анонимноста, како и на времето што ќе треба да го одвои за интервјуто, со цел да биде фокусирано за време на

89


интервјуто. Друг начин за спроведување на интервјуто, секако, е телефонски.

Фокусна група Фокусната група се состои од неколку индивидуи што се поканети да дискутираат за нивните видувања за одредено прашање, на отворен форум. Вообичаено, фокусната група се состои од шест до 10 лица и треба да биде конструирана на тој начин што ќе биде одраз на демографската структура на популацијата што е предмет на испитување или која, во најмала рака, ќе биде доволно хетерогена по неколку избрани демографски карактеристики. Фокусната група има слична цел како интервјуто – да здобие длабински поглед во прашањето што се анализира. Предноста на фокусната група во однос на интервјуто е што покрај личните ставови и перцепции, таа овозможува извлекување заклучоци и од групната интеракција и динамика. Дополнително, кога едно лице е дел од група може да се чувствува порелаксирано, во споредба кога се разговара еден на еден. Фокусната група е и временски ефективна, со оглед на тоа дека се добива вредна информација од повеќе лица истовремено. Главна мана на фокусната група – во споредба со интервјуто – е што просторот за дебата на посензитивни прашања е поограничен бидејќи испитаниците често не сакаат да дискутираат за вакви прашања пред други луѓе. Времетраењето на дискусијата во фокусната група е околу еден час. Регрутирањето на лицата во фокусната група може да следи различни методи, но во практика тоа е најчесто неструктурирано. На пример, истражувачите објавуваат повик за самопријавување учесници во фокусната група на својата страница на интернет или преку социјалните мрежи. Ваков пристап може да биде особено корисен кога се работи за популација што е „тешко достапна“. Ваквата регрутација често вклучува и одредена мотивација за учество, најчесто во форма на паричен надомест и покривање на патните трошоци. Сепак, во специфични случаи, регрутирањето треба да следи специфичен и структуриран тек. На пример, кога се истражува ефектот од одреден проект врз животниот стандард на целното население, тогаш фокусната групата ќе се спроведе со лицата што биле вклучени во проектот. Значи, избирањето ќе се врши врз основа на листи за учество. Слично, при особено деликатни теми – како на пример, зависност од дрога или семејно насилство – избирањето мора да биде лично, најчесто со претходно добиени листи од страна на институциите што имаат соодветни регистри.

90


Прашањата што се поставуваат за време на дискусија во фокусната група се исти или слични на тие при интервју. Истражувачот потоа има улога на олеснувач на дискусијата во фокусната група, што е специфична вештина. Имено, дискусијата може да отиде во непосакуван правец, може да се создаде непосакувана „бучава“, па дури и да дојде до засилена вербална аргументација меѓу учесниците. Истражувачот мора да биде во позиција да го контролира тоа и соодветно да го канализира. Во такви ситуации, дел од учесниците може и да се повлечат од натамошна дискусија, што е ситуација што, исто така, бара соодветно однесување од истражувачот. Оттука, истражувачот е пожелно да има листа од прашања, кои ќе ги наметнува во дискусијата, ќе охрабрува интеракција место само прашање - одговор, ќе ја потиснува дискусијата кога оди во неважна насока и ќе ги „фаќа“ прашањата што (срамежливо) произлегуваат од дискусијата, а кои се особено важни.

91


*** Квалитативно истражување во статистички софтвер. NVIVO е софтвер што овозможува анализа на квалитативни информации. Тој овозможува внесување информации, нивно организирање, анализа, визуализација и објавување во форма по избор на истражувачот, кои по природа се неструктурирани или квалитативни. Обично, ваквиот тип софтверска анализа се базира на идентификување и на извлекување материја врз основа на клучни зборови или фрази и потоа поделба на податоците во поспецифични области за анализа. Оттука, софтверот е соодветен за анализа на квалитативни информации собрани преку квалитативна анкета, интервју и фокусни групи. NVIVO функционира на таков начин што прво се креира нов проект:

Со внесување на квалитативните информации што сме ги собрале со помош на квалитативната анкета во новоотворениот проект, може да почнеме со анализата. Прво е важно да знаеме што бараме: акции, чувства, идеи, реакции, решенија, искуства. Во долниот дел од дијалогбоксот на NVIVO веќе се содржат кодови што може да се искористат за оваа намена. Но, генерално, кодовите ги дефинира истражувачот, врз основа на литературата, или врз основа на фрази што најчесто се повторуваат во текстот:

92


Со клик на зелената стрелка, ознаката ќе биде доделена на текстот. Потоа почнува процесот на анализа на собраните квалитативни податоци. Може да се почне со едноставно пребарување на зборови и на фрази за да се провери зачестеноста на нивната употреба. Резултатите од ваквото пребарување може да се зачуваат како нови кодови.

Потоа, се добива т.н. извештај на кодови, односно сите места во текстот каде што се појавува дефинираниот код:

93


Потоа, истражувачот треба да провери дали, навистина, сите извадоци од текстот се однесуваат на истиот концепт дефиниран според кодот. Доколку некој пасус не се вклопува во дефинираниот код, тогаш може да се откодира и да се прекодира. Во случај кога истражувачот дефинирал многу кодови и добил многу извадоци од текстот, неопходен е следниот чекор на нивно организирање и кратење. Во NVIVO овој процес се нарекува хиерархија. Saldana (2016) го нарекува кодирање од втор ред. Во софтверот тоа се изведува така што се креира нов код и тој се повлекува под кодот во кој се вклопува. Така се креираат кодови мајка и ќерка, односно главни кодови и поткодови. Потоа, може да се креираат извештаи во нодот мајка што ги вклучува и нодовите ќерки, преку опцијата „aggregate coding from child nodes”. NVIVO, секако, вклучува и понапредни опции за квалитативна анализа, кои се надвор од опсегот на овој прирачник и читателите се охрабруваат да ги истражат самите.

94


Прашалник „Делфи“ Методот „Делфи“ датира уште од во 50-тите години, од серијата студии што ги спровела корпорацијата RAND со цел да развие техника за здобивање консензус во група стручњаци (Dalkey and Helmer, 1963). Методот ја структурира групната комуникација дозволувајќи им на групата стручњаци да излезат на крај со комплексен проблем, со постигнување консензус преку неколку кругови повратни информации и последователна ревизија (Linstone и Turoff, 1975). Како што укажуваат Rowe et al. (1991), обично, методот се користи во случаи кога информациите за заклучувањето се неопходни, преку серија прашалници проследени со контролирани повратни информации. Дизајнот на прашалникот „Делфи“ следи сличен модел како и кај анкетата – квантитативна или квалитативна. Вообичаено, тој се состои од неколку прашања, кои бараат или квантификација на одреден феномен или разграничување на неколку опции во контекст со повеќе (квалитативни) одговори. Можностите во вториот случај можат да бидат поставени од страна на истражувачот или да произлегуваат од претходна анкета меѓу поголема група стручњаци. Потоа, се избира соодветна група испитаници; тие се, обично, теренски стручњаци, доволно квалификувани да одговорат на прашањата. Откако ќе се спроведе првиот круг анкетирање, вториот круг прашалник се поставува исто како и тој од првиот круг, но вклучува и агрегатни одговори (резултати) од првиот круг. Прашалникот е дизајниран на сличен начин во секој следен круг нудејќи го агрегираниот резултат од претходниот круг. Во секој следен круг, испитаниците имаат можност да го ревидираат својот одговор врз основа на новиот сет информации (главно, агрегатниот резултат од претходниот круг, кој им се дава на увид). Процесот се повторува сè додека не се постигне задоволителен степен на консензус. Испитаниците се чуваат анонимни еден од друг (иако не се анонимни за истражувачот) низ целиот процес. Конечниот резултат се формира со агрегирање на сите индивидуални мислења. Подетално техничко извршување на методот „Делфи“ е претставено во Okoli and Pawlowski (2004), додека преглед на литературата за обновениот интерес за примената на методот „Делфи“ може да се најде во Landeta (2006). Дефиниран на овој начин, методот „Делфи“ го мери консензусот како негова клучна компонента. Сепак, Dajani et al. (1979) тврдат дека стабилноста на групата треба да се постигне однапред, односно дека консензусот може да биде безначаен без стабилност на групата. Тие ја дефинираат групната стабилност како „конзистентност на одговорите меѓу последователни кругови од студијата“ (стр. 84).

95


Finance Think – Институтот за економски истражувања и политика применуваше прашалник „Делфи“ во неколку ситуации. На пример, за целите на прогнозирањето на идните текови на иселување и за дознаки во четири земји од Западниот Балкан (Petreski et al. 2017) методот беше спроведен на следниов начин. Во секоја од четирите земји беа конструирани две групи испитаници: i) околу десет стручњаци од областа на емиграциите и на развојната економија; и ii) околу 20 примачи на дознаки по земја. Стручњаците се избираа со следење на нивната стручна експертиза, односно лица што истражуваат и / или професионално ја истражуваат динамиката на миграцијата и дознаките во секоја земја. Тоа вклучи истражувачи на универзитети / институти, професионалци / истражувачи во централните банки и министерствата за финансии; професионалци во рамките на агенциите за миграција / дијаспора, банкари на девизни плаќања и слично. Оваа група е во суштината на дизајнот на „Делфи“. Другата група беше составена од околу 20 примачи на дознаки. Оваа група не беше составена од стручњаци сама по себе и постоеше убедување меѓу истражувачите дека оваа група, исто така, може да обезбеди доволно сигурна процена за насоката, големината и ефектите на миграцијата и на дознаките. Секоја група помина низ два круга анкетирање. Постоеше и трет, заеднички круг. Имено, вториот круг обезбеди резултат од претходниот круг што се спроведе врз истата група и беше побарана потенцијална ревизија на мислењата. Третиот круг обезбеди агрегатен резултат од вториот круг од другата група; стручњаците добија збирни резултати од групата приматели, и обратно, и беа побарани потенцијални ревизии. Оттука, го следевме степенот на консензус во рамките на групите, но, исто така, и меѓу групите. Во литературата има голема разновидност за методите што се користат за мерење на консензусот и на групната стабилност; за преглед видете кај Von der Gracht (2012). Покрај тоа, стандардите за мерење на консензусот никогаш не биле строго поставени, што предизвика неконтролиран пораст на начините за мерење на консензусот (Meyrick, 2003). Сепак, стандардна мера за мерење на консензусот остана коефициентот на варијација. Buck et al. (1993) тврдат дека стабилното намалување на овој коефициент меѓу круговите би значело зголемување на консензусот, додека Zinn et al. (2001) и English and Keran (1976) тврдат дека коефициентот на варијација од или под 50 проценти значи дека е постигнат разумно добар внатрешен консензус. За да се измери стабилноста на групите, се користат три мерки. Првата е стандарден t тест, кој го елабориравме во делот за статистичката анализа.

96


Дизајнот „Делфи“ во погорниот пример овозможува да се користат две варијанти од тестот: за двојни примероци меѓу круговите еден и два бидејќи ја следевме еволуцијата на одговорите на истиот примерок; и за независни примероци меѓу круговите два и три, бидејќи ги споредуваме стручњаците со примачите. Вториот тест е Wilcoxon signed-rank (исто така специфициран во табелата во секцијата за статистичка анализа), чијашто нулта хипотеза е дека двата примерока следат ист распоред. Техничкото спроведување на прашалникот „Делфи“ може да биде лице в лице, телефонски или електронски. Денес е најчесто електронското спроведување, преку достапните платформи како Monkey Survey (накратко елаборирана во делот за квантитативна анкета). Важно е платформата да има опција за следење на секој учесник во анкетата „Делфи“ бидејќи е важно неговиот одговор да може да се следи од круг во круг и да се набљудува еволуцијата на накосување (или одбивањето за накосување) кон просечното или најзастапеното мислење.

Набљудување Набљудувањето се нарекува и „набљудување на учесник“ и може да има разни форми, како неформални интервјуа, дискусија во група, директно набљудување на однесувањето и на ставовите, учество во животот на некоја група, анализа на лични дневници, документи, животна историја, забелешки, самоанализа и сл. Сите овие вообичаено ќе произведат доволно обемен пишан материјал, кој потоа е предмет на анализа и на синтеза. Процесот на набљудување е долготраен и се протега од неколку месеци до неколку години, во зависност од предметот на испитување. Тоа е неопходно со цел да се добие детална и точна информација. Според MacDonald и Headlam (2009), набљудувањето како истражувачки метод е соодветно во случаи кога се бара детална прецизност, кога се сака да се погледне групната динамика и кога се сака да се откријат скриени детали. На пример, националните анкети вклучуваат анкета за користење на времето, во која секој испитаник дава информација за активностите на кои го распоредува своето време. Меѓутоа, очекувано, ваквата ex-post информација може да содржи многу непрецизности, односно испитаникот да дава груби и заокружени одговори. Наспроти тоа, набљудувањето на трошењето на времето ќе овозможи прецизна и детална информација. Во вториот случај, набљудувањето треба да ги открие интерперсоналните врски, а истражувачот да даде рефлексија на социјалната блискост, да ги набљудува врските и говорот на телото. Набљудувањето се користи и за истражување тајни, табуа, предрасуди и сл., односно ситуации за кои

97


учесникот би се изјаснил поинаку од тоа што е реално однесување или став. Сепак, набљудувањето како метод содржи една голема мана, а тоа е што се потпира на субјективното расудување на набљудувачот. Затоа, методот не може да се повтори во иста форма и со исти заклучоци бидејќи самото негово присуство може да влијае врз заклучоците на поволен или на неповолен начин. Од друга страна, валидноста на добиените погледи во феноменот што се истражува е на високо ниво, со оглед на тоа дека набљудувањето не суди за прашањата, ставовите и за настаните. За истражувањата во бизнисот и во економијата набљудувањето се користи поретко, но може да се употребува во менаџмент и за маркетингстудии. Податоците добиени преку набљудување се анализираат и се користат како и тие што се добиени преку квалитативна анкета, интервју и фокусна група.

98


99


ПРЕТОЧУВАЊЕ РЕЗУЛТАТИ И НАОДИ ВО ИНФОРМАЦИЈА РАЗБИРЛИВА ЗА ЈАВНОСТА


4. Преточување резултати и наоди информација разбирлива за јавноста

во

Економската наука е квантитативна по природа. Производството, цените, доходот – сите се квантитативни променливи. Тоа овозможува и задачата за визуелно претставување на економските феномени, како и резултатите и наодите од економските истражувања, да биде релативно лесна, односно барем полесна од други дисциплини и области (како на пример, областа на демократијата или човековите права). Оттука, овој дел од прирачникот претставува некои од алатките што се користат најчесто за визуелно претставување економски податоци.

Графикони и инфографикони Основни графикони Графиконите овозможуваат визуелни патокази, иако бараат категоризирање и квалитативни и квантитативни променливи. Генерирањето графикони е алатка што се користи нашироко за визуализација и може да се изведе во кој било статистички софтвер. Овде даваме примери од користењето „Ексел“. За категориски податоци, најсоодветни се графиконите со столпчиња и со пита. Кај графиконот со столпчиња, висината или должината на секое столпче ја претставува фреквенцијата на случување. Вообичаено, кај овој тип графикон, меѓу столпчињата има растојание. Следната слика дава приказ на графикон со столпчиња за образовните квалификации на вработените во нашиот пример со платите. Највисокиот столб се однесува на работниците со високо образование, укажувајќи дека тие се најзастапени во нашиот примерок. За овој, како и за секој графикон во „Ексел“, може да се искористи мноштвото опции за додавање информации (на пример, додавање точни проценти), како и опции за визуализацијата (на пример, менување бои, форми, димензионалност итн.).

101


Образование на работниците 300 250 200 150 100 50 0 Средно

Високо

Постдипломско

Доколку сакаме да направиме графикон со столпчиња за променливата плата, тогаш прво ќе мора да дефинираме категории, во кои ќе го вброиме секој вработен, а потоа фреквенциите од секоја категорија ќе ги нанесеме на графикон. Карактеристично е што кај непрекината променлива меѓу столпчињата нема растојание, што укажува на нејзината континуираност. Во таков случај, станува збор за посебна форма на графиконот со столпчиња, која се нарекува хистограм. За оваа цел ја користиме опцијата Histogram во Data analysis:

102


Забележуваме дека таа бара две влезни информации: променливата за која ќе цртаме хистограм, како и класите или категориите. Оттука, потребно е да ги дефинираме. Категориите се дефинираат од страна на истражувачот. Добро е да има доволно категории за да добиеме разумен хистограм, но истовремено не и премногу за да не се случи некои категории да останат празни или со многу малку опсервации. Во нашиот пример, со оглед на тоа дека минималната плата изнесува 528 евра, додека максималната 3.116 евра, имплицирајќи распон од нешто повеќе од 2.500 евра, ќе го дефинираме распонот на секоја класа да биде 300, почнувајќи од 500, па сè до 3.200. Така добиваме класи (или во „Ексел“, тоа се bins). Потоа, може да ја примениме опцијата за хистограм:

По што го добиваме следниов графикон:

Histogram Frequency

100 80 60 40 20 0 500

800 1100 1400 1700 2000 2300 2600 2900 3200 More bins

103


Притоа, класите означуваат: до 500, 501-800, 801-1100 итн. Хистограмот ни покажува дека платите следат распоред што е закривен надесно, односно имаме концентрација на платите околу 1.100 евра, а највисоките плати се многу малку.

Друга форма на користење на графиконите со столпчиња е кога истражувачот сака да прикаже учество. Притоа, графиконот со столпчиња се црта според две карактеристики. На следниот графикон ова е прикажано со образованието и со полот. За секој степен на образование, претставено е учеството на мажите и на жените. Притоа, забележуваме дека мажите се позастапени кај степенот за средно и за постдипломско образование. Сепак, ваквиот графикон не дава информација за фреквенцијата на набљудувањата по категории.

Образованието и полот 100%

90% 80% 70% 60% 50%

Мажи

40%

Жени

30% 20% 10%

0% Средно

Високо

Постдипломско

Доколку сакаме да ги претставиме двете информации заедно, тогаш ќе избереме т.н. повеќекратен графикон на столпчиња, кој изгледа вака:

104


Образованието и полот 160 140 120 100 80 60 40 20 0

Жени Мажи

Средно

Високо

Постдипломско

На ваквиот тип графикони може да се забележат двете информации: која група е најзастапена според образовниот степен, и застапеноста на половите во рамки на секој образовен степен. За учеството на набљудувањата во вкупниот примерок, според одредена карактеристика, често се користи и графиконот пита. Тој изгледа вака:

Средно

Постдипло мско

Високо

105


За непрекинатите променливи, може да внесеме и дополнителни информации на единствен графикон, како што се минималната и максималната вредност, квартилите и медијалната вредност. Во тој случај зборуваме да приказ на кутија (box plot).

3500 3000 2500 2000 1500 1000 500

0 Wages

Приказот на кутија ја има улогата да алудира на распоредот на една непрекината променлива. На пример, во случајот на платите, забележуваме дека медијалната вредност (централната линија меѓу двата обоени бокса) не е во теоретската средина, што укажува на тоа дека платите се закосени надесно, односно нивната концентрација е околу 1.100 евра, а максималната плата се протега над 3.100 евра. На крајот, важно е и визуелно да претставиме дали меѓу две карактеристики (две променливи) постои некаква поврзаност. За таа цел користиме дијаграм на растурање (или популарно наречен скатер). На х оската претставуваме една променлива, а на у оската друга променлива. Скатерот е најинформативен ако претставува непрекинати променливи, иако понекогаш може да се искористи и за променливи по категорија,

106


особено ако станува збор за повеќе категории. На следната слика ја претставуваме врската меѓу платите и годините искуство:

Платите и искуството 3,500

Плата (евра)

3,000

2,500 2,000 1,500 1,000 500 -

5

10

15

20

25

30

35

40

Искуство (години) Графиконот укажува на тоа дека како што се зголемува искуството, така се зголемува и платата. Но, платата е мошне концентрирана на почетокот од работната кариера (нововработените немаат моќ да преговараат за својата плата), а потоа варијансата се зголемува со секоја дополнителна година искуство. Тоа укажува на тоа дека со текот на времето и други фактори, освен искуството, почнуваат значајно да влијаат врз платата, а кои не се претставени на дијаграмот на растурање. „Ексел“ нуди и некои дополнителни опции за графикони, кои истражувачите се повикуваат да ги истражат самите. Натамошни детали за визуализацијата на економски податоци преку графикони може да се најдат кај Schwabish (2014).

Комбинирани графикони и информации Освен што може да пренесуваат едноставна информација (учество, распоред, поврзаност), графиконите може да се користат на малку посложен начин, така што истовремено пренесуваат повеќе информации комбинирани на визуелно привлечен начин. Денес сè почесто се користи

107


терминот инфографикон. Генерално, инфографиконот комбинира повеќе информации, претставени на повеќе начини, кои може да бидат неколку визуелно различни начини, или комбинација на слика и на текст. Наједноставното комбинирање на економски информации на графикон е кога тој содржи повеќе од две информации комбинирани на ист графикон. Ова се постигнува на тој начин што левата скала од графиконот се однесува на една променлива (или група променливи што имаат иста единица мера), а другата скала на друга променлива (или група променливи со иста единица мера).

108


Таков пример е следниов графикон, кој ги претставува трошоците за транспорт на просечното домаќинството според децилната група на која припаѓа и учеството на тие трошоци во вкупниот домашен буџет.

Сепак, дури и кога две променливи се мерат на иста скала, истражувачот може, за визуелни цели, да процени дека ќе ги претстави на два одвоени графикона, како што е случај на следниов графикон:

109


Елементарна информација може да биде комбинирана и со мапа за да произведе визуелно привлечна информација:

110


Понатаму, инфографиконите ги комбинираат сите карактеристики на визуелното претставување на економските информации. На пример, следниот инфографикон комбинира неколку базични графикони во една интегрирана слика:

111


Додека, пак, следните три инфографикони вршат натамошно пософистицирано комбинирање на посложени економски информации на начин на кој ќе бидат разбирливи и привлечни за пошироката публика:

112


113


Воопшто земено, при користењето на графиконите и на инфографиконите, мора да се внимава на следниве пет аспекти: 1. Која е пораката што сакам да ја пренесам? Или, кое е прашањето на кое сакам да одговорам преку визуелно прикажување на моите податоци? 2. Запознајте ги податоците и почнете со наједноставните графикони. Изведување особено сложени графикони (инфографикони) нема секогаш да помогне во пренесувањето сложена информација на едноставен начин. 3. Направете раздвојување меѓу клучните индикатори што сакате да ги претставите, од тие што се помалку важни. 4. Изберете го најсоодветниот вид графикон, или најсоодветната комбинација од графикони, слики и зборови. 5. Користете соодветна боја, големина, обем, форми и ознаки за да го насочите вниманието кон клучните пораки.

114


Други форми на визуализација на економски податоци Покрај графиконите и инфографиконите, денес постои палета од решенија за поинаква или натамошна визуализација на економските податоци. Тие најчесто вклучуваат: Интерактивни (инфо)графикони. Наједноставно кажано, ова се графикони што се движат. Тие се мошне привлечен начин за претставување економски податоци (особено ако сакаме да прикажеме одредена променлива во текот на времето). Мана е што може да се ефективни само на електронски уред, но, секако, не и на хартија. Графичка комбинација од слики што се движат. Ова се т.н. гифови, односно комбинација од пет до 10 слики, кои се движат без да притискате какво било копче за движење. Може да вклучат графикони, слики и зборови. Видео. Видеото е стар, но ефективен начин за пренесување пораки. Мана е што, доколку е долго, и особено ако пораката што се пренесува е на крајот од видеото, ефективноста може да биде намалена, со оглед на опаѓачкото внимание со должината на видеото.

Комуникација Визуализациите претставени на претходните страници, всушност, имаат една единствена цел: да претстават (релативно) сложена информација на начин што ќе биде разбирлив за широка читателска публика. Граѓаните и општата јавност не се економисти; особено во земјите во развој, економското познавање на општата читателска публика е на незадоволително ниво. Оттука, целта на визуализациите може да биде и едукација на публиката за важни економски теми. Економските теми се такви што граѓаните ги гледаат во своето секојдневие. Секој ја знае својата заработка и сака да стигне на повисоко ниво. Кога одиме во супермаркет, ги набљудуваме цените. Кога се појавуваме на пазарот на труд, ги нудиме своите вештини за да најдеме добро платена и соодветна работа. Сите плаќаме даноци. И така натаму. Оттука, да се зборува за економски теми, вклучително преку визуализации, и не е толку тешко: кога граѓаните се директно засегнати од нешто, тогаш таа тема станува поинтересна за нив. Визуализациите се еден од начините таа тема да се доближи до граѓаните уште повеќе, да се

115


актуализира уште повеќе, и, секако, да се разјаснат сите вистини и заблуди поврзани со неа. Тинк тенковите ја имаат таа задача во општеството, а визуализациите се една од алатките што им овозможуваат своите сложени наоди и откритија да ги направат достапни за широката јавност. Генерално земено, активностите на тинк тенковите врзани со преточување сложени информации во едноставни пораки разбирливи за широка читателска публика, може да се сведат на следниве неколку: Визуализации. Нив детално ги елабориравме. Нивната целна група се граѓаните и општата јавност со цел одреден проблем да се актуализира, повеќе да се зборува за него, и на таков начин да се изврши притисок врз носителите на политиката да преземат дејства за негово решавање. Визуализациите имаат и образовна улога, особено за разбирање предрасуди и за пристрасни перцепции. Блогови. Блоговите се вербален исказ на став и на мислење. Може да содржат лична, често субјективна перцепција. Но, нивната цел, исто така, е актуализирање одредено прашање со цел носителите на политиката да пристапат кон него на сериозен начин. Блоговите го врамуваат и јавното мислење. Сепак, помалку се ефективни во однос на визуализациите, особено во средини каде што склоноста кон читање е пониска. Учество во медиумите. Тинк тенковите имаат и општествена одговорност да учествуваат во медиумите, односно своите наоди, резултати и пораки да ги пренесуваат до општата јавност преку изнесување експертски изјави, учества во дебатни емисии, интервјуа и сл. На таков начин се загрева јавната дебата, се информира општата јавност и се мобилизира општото граѓанство за решавање на жешките економски прашања. Експертски статии, анализи, брифови и студии. Опсегот на нивно влијание е повеќе ограничен на стручната јавност, особено што содржат стручен жаргон и се често подолги. Затоа, многу е важно тие да бидат проследени со некоја од наведените алатки, со цел главната порака да се пренесе на доволно едноставен и разбирлив начин. Тркалезни маси, форуми, работилници. Слично како и кај анализите и брифовите, влијанието на овие алатки се сведува на стручната заедница, иако, доколку се проследени со изјави и со учество во медиумите, како и со други визуализациски алатки, тогаш нивното влијание се протега и до пошироката публика.

116


Сите наведени алатки за комуникација денес тинк тенковите ги користат во јавниот простор, кој сè повеќе се преселува од традиционалните медиуми (телевизии, радија и сл.) на современите медиуми (интернетстраниците и, особено, социјалните медиуми, пред сè на тие што се строго фокусирани врз споделување визуелна содржина). Затоа, особено визуализациите се од особена важност да се споделуваат преку социјалните медиуми, на кои и досегот може да биде значително висок.

117


БИБЛИОГРАФИЈА


5. Библиографија Anderson, D., Sweeney, D. and Williams, T. (1999) Statistics for Business and Economics, 7th edition, South-Western College Publishing (or more recent edition of this book). Anderson, T.W. (2003) An Introduction to Multivariate Statistical Analysis. New York: John Wiley. Bazeley, P. (2013) Qualitative data analysis with NVivo. 2nd ed. London: SAGE Publications. Berman Brown, R. and Saunders, M. (2008) Dealing with statistics: What You Need to Know. Maidenhead: McGraw-Hill Open University Press. Blaxter, L., Hughes, C. and Tight, M. (2001) How to research. 2nd edition. Buckingham, Open University Press. Buck, A.J., Gross, M., Hakim, S. and Weinblatt, J. (1993). Using the Delphi process to analyze social policy implementation: A post-hoc case from vocational rehabilitation. Policy science, 26, p.271-288. Dajani, J.S., Sincoff, M.Z., and Talley, W.K. (1979). Stability and agreement criteria for termination of Delphi studies. Technological Forecasting and Social Change, 13, p.83-90. Dalkey, N. and O. Helmer, (1963) An experimental application of the Delphi method to the use of experts. Management Science, 9(3), pp. 458-467. Edwards, T., Tregaskis, O., Edwards, P., Ferner, A., Marginson, A. with Arrowsmith, J., Adam, D., Meyer, M. and Budjanovcanin, A. (2007) Charting the contours of multinationals in Britain: Methodological challenges arising in survey-based research. Warwick papers in Industrial Relations No. 86. Available at: https://www.cbs.dk/files/cbs.dk/charting_the_contours_of_multinationals_in _britain.pdf [Accessed 10 February 2018.] English, G.M. and Keran, G.L. (1976). The prediction of air travel and aircraft technology to the year 2000 using the delphi method. Transport Research, 10, p.1-8. Hays, W.L. (1994) Statistics. 4th ed. London: Holt-Saunders. Kar, S. and Ramalingam, A. (2013) Is 30 the magic number? Issues of sample size estimation. Natl. J. Community Med., 4 (2013), pp. 175-179.

119


Landeta, J. (2006). Current validity of the Delphi method in social sciences. Technological Forecasting and Societal Change, 73, p.467-482. Levine, D.M., Stephan, D.F., Timothy, K.C. and Berenson, M.L. (2011) Statistics for managers using Microsoft excel. Sixth ed. Pearson. Linstone, H.A. and M. Turoff, (1975). The Delphi Method: Techniques and Applications. Addison Wesley Publishing Company, London. MacDonald, S. и Headlam, N. (2009) Research Methods Handbook. Introductory guide to research methods for social research. Manchester: Centre for Local Economic Strategies. McClave, J.T., Benson, P.G. and Sincich, T. (2007) Statistics for Business & Economics (10th Edition), Prentice Hall Meyrick, J. (2003) The Delphi method and health research. Health Education, 103, p.7-16. Neuman, W.L. (2014) Social Research Methods: Qualitative and Quantitative Approaches. 7th ed. Essex: Pearson. Okoli, C. & Pawlowski, S. D. (2004). The Delphi method as a research tool: an example, design considerations and applications. Information & Management, 42(1), 15-29. Petreski, M., Petreski, B., Tumanoska, D., Narazani, E., Kazazi, F., Ognjanov, G., Jankovic, I., Mustafa, A. and Kochovska, T. (2017) The size and effects of emigration and remittances in the Western-Balkans: Forecasting based on a Delphi process. Südosteuropa: Journal of Politics and Society, 65(4), p. 679695. QSR (2015) NVivo10 help. QSR [online]. Available from: http://helpnv11.qsrinternational.com/desktop/welcome/welcome.htm [Accessed 8 February 2018]. Rowe, G., G. Wright, F. Bolger, (1991). Delphi: A re-evaluation of research and theory. Technological Forecasting and Social Change, 39, p.235-251. Saldana, J. (2016) The Coding Manual for Qualitative Researchers. Los Angeles: SAGE. Saunders, M., Lewis, P. and Thornhill, A. (2016) Research methods for business students. 7th edition. Essex, Prentice Hall. Schwabish, Ј.А. (2014) An Economist’s Guide to Visualizing Data. Journal of Economic Perspectives, 28(1), p.209–234.

120


Vartanian, T. (2011) Secondary Data Analysis. Oxford University Press. Zinn, J., Zalokowski, A. and Hunter, L. (2001). Identfying indicators of laboratory management performance: A multiple constituency approach. Health Care Management Review, 26, p.40-53.

121


Поддржано од:

Profile for Finance Think

Истражувачки алатки во економијата  

Перспектива на тинк-тенк

Истражувачки алатки во економијата  

Перспектива на тинк-тенк

Advertisement