__MAIN_TEXT__

Page 1


МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ Державний вищий навчальний заклад «КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ ЕКОНОМІЧНИЙ УНІВЕРСИТЕТ імені ВАДИМА ГЕТЬМАНА»

Журнал є науковим фаховим виданням України, в якому можуть публікуватися результати дисертаційних робіт на здобуття наукових ступенів доктора і кандидата наук в галузі економіки (наказ МОН України від 26.05.2014 № 642 — оголошення в спецвипуску газети «Освіта України», червень 2014 р.).

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ Науково-аналітичний журнал Заснований у 2011 р. Виходить двічі на рік

№6

Київ 2017


УДК 519.86 Редакційна колегія

Почесний Головний редактор Лотфі А. Заде, доктор наук, професор (США). Головний редактор А. В. Матвійчук, доктор економічних наук, професор. Відповідальний секретар Г. І. Великоіваненко, канд. фіз.-мат. наук, професор; І. З. Батиршин, доктор фіз.-мат. наук, професор (Мексика); А. М. Борисов, доктор техн. наук, професор (Латвія); В. В. Вітлінський, доктор екон. наук, професор; В. К. Галіцин, доктор екон. наук, професор; К. Д. Іманов, чл.-кор. НАН Азербайджану, доктор екон. наук, професор (Азербайджан); А. Б. Камінський, доктор екон. наук, професор; Т. С. Клебанова, доктор екон. наук, професор; К. Ф. Ковальчук, доктор екон. наук, професор; Ю. Г. Лисенко, чл.кор. НАН України, доктор екон. наук, професор; І. Г. Лук’яненко, доктор екон. наук, професор; Т. В. Меркулова, доктор екон. наук, професор; Лешек Рутковський, член Польської академії наук, доктор наук, професор (Польща); В. М. Соловйов, доктор фіз.-мат. наук, професор; С. В. Устенко, доктор екон. наук, професор; О. І. Черняк, доктор екон. наук, професор; С. Д. Штовба, доктор техн. наук, професор; О. В. Язенін, доктор фіз.-мат. наук, професор (Росія).

Адреса редакційної колегії: 03680, м. Київ, просп. Перемоги, 54/1, кімн. 220 ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана» Тел./факс: 044 371 61 09 E-mail: editor@nfmte.com Веб-сайт журналу: http://nfmte.com/ Засновник та видавець Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана»

Свідоцтво про державну реєстрацію КВ № 18370-7170Р, видане Державною реєстраційною службою України 27.10.2011 Рекомендовано до друку Вченою радою КНЕУ Протокол № 14 від 22.06.2017 Загальна та наукова редакція А. Матвійчука

Журнал індексується в міжнародних реферативних базах даних: Index Copernicus, CiteFactor, Ulrichsweb, Global Serials Directory, EBSCO, OAJI, ResearchBible, Google Scholar.

ISSN 2306-3289

 КНЕУ, 2017


УДК 330.4: 336.774

АНАЛІЗ ВАГОМОСТІ КРИТЕРІЇВ В ОЦІНЮВАННІ КРЕДИТОСПРОМОЖНОСТІ ФІЗИЧНИХ ОСІБ

Г.В. Гаврилюк Кандидат економічних наук, Заступник начальника Представництво ПАТ «Українська залізниця» в Російській Федерації та Республіці Білорусь провулок Вознесенський, 17, м. Москва, 125009, Росія amagicveeva@gmail.com

Стаття присвячена вирішенню завдання аналізу вагомості характеристик потенційних позичальників – фізичних осіб в оцінюванні їх кредитоспроможності. Обґрунтовано доцільність застосування з цією метою методу нечіткого багатокритеріального аналізу, за яким вибір найбільш кредитоспроможних позичальників за рядом критеріїв здійснюється на основі парних порівнянь альтернатив. Особливістю запропонованого методу є застосування принципу Беллмана-Заде, згідно якого компенсація недоліку одних показників надлишком інших є неприпустимою. Як розв’язок, найпривабливішим для кредитування визначається потенційний позичальник, який одночасно задовольняє усім критеріям найбільшою мірою. В ході проведеного аналізу сформовано множину критеріїв оцінювання кредитоспроможності фізичних осіб і виявлено вплив критеріїв на можливість підвищення ефективності такої оцінки. Практичною цінністю проведеного дослідження є отримані нові знання щодо впливу критеріїв відбору фізичних осіб на оцінювання ризику дефолту, що в подальшому слугуватиме одним із інструментів для попередження втрат від невиконання кредитних зобов’язань. Ключові слова: кредитоспроможність фізичної особи, кредитний ризик, багатокритеріальний аналіз, нечіткі множини, парні порівняння.

© Г. В. Гаврилюк, 2017

3


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

АНАЛИЗ ВЕСОМОСТИ КРИТЕРИЕВ В ОЦЕНИВАНИИ КРЕДИТОСПОСОБНОСТИ ФИЗИЧЕСКИХ ЛИЦ

А.В. Гаврилюк Кандидат экономических наук, Заместитель начальника Представительство ПАО «Украинская железная дорога» в Российской Федерации и Республике Беларусь переулок Вознесенский, 17, г. Москва, 125009, Россия amagicveeva@gmail.com

Статья посвящена решению задач анализа весомости характеристик потенциальных заёмщиков – физических лиц при оценке их кредитоспособности. Обоснована целесообразность применения с этой целью метода нечеткого многокритериального анализа, согласно которому выбор наиболее кредитоспособных заёмщиков по ряду критериев осуществляется на основе парных сравнений альтернатив. Особенностью предложенного метода является применение принципа БеллманаЗаде, когда компенсация недостатка одних показателей переизбытком других является недопустимой. При таком подходе наиболее привлекательным для кредитования определяется тот потенциальный заемщик, который одновременно удовлетворяет всем критериям в наибольшей степени. В ходе проведенного анализа сформировано множество критериев оценивания кредитоспособности физических лиц и показано влияние критериев на возможность повышения эффективности такой оценки. Практичной ценностью выполненного исследования являются полученные новые знания о влиянии критериев отбора физических лиц на оценку риск дефолта, что в дальнейшем будет служить одним из инструментов предупреждения потерь от невыполнения кредитных обязательств. Ключевые слова: кредитоспособность физического лица, кредитный риск, многокритериальный анализ, нечеткие множества, парные сравнения.

4


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

ANALYSIS OF THE CRITERIA SIGNIFICANCE IN ASSESSING THE CREDITWORTHINESS OF INDIVIDUALS

Ganna Gavrilyuk PhD in Economics, Deputy Head Representative of the Public Joint Stock Company «Ukrainian Railways» in the Russian Federation and the Republic of Belarus 17 Voznesensky lane, Moscow, 125009, Russia amagicveeva@gmail.com The article is devoted to solving the problems of analyzing the weight of the characteristics of potential borrowers — individuals in assessing their creditworthiness. The expediency of applying for this purpose the method of fuzzy multi-criteria analysis is substantiated, according to which the selection of the most creditworthy borrowers for a number of criteria is carried out on the basis of paired comparisons of alternatives. A feature of the proposed method is the application of the Bellman-Zadeh principle, according to which compensation for the lack of certain indicators by an overabundance of others is unacceptable. As a solution, the most attractive for lending is the potential borrower, which meets all the criteria to the greatest extent. In the course of the analysis a number of criteria for assessing the creditworthiness of individuals were formed and the influence of the criteria on the possibility of improving the efficiency of such an assessment was shown. The practical value of the research is the new knowledge gained on the impact of the selection criteria of individuals on the credit risk assessment, which in the future will serve as one of the tools to prevent costs from defaulting on loan commitments. Key words: creditworthiness of an individual, credit risk, multicriteria analysis, fuzzy sets, pair comparisons. JEL Classіfіcatіon: C13, D70, D81, E51

Постановка проблеми Сукупність складних економічних, соціальних і політичних умов української сучасності призвели до зростання частки проблемних кредитів у банківських установах. За даними НБУ до 2014 року обсяг проблемної заборгованості змінювався незначними темпами: у 2012 році спостерігалось зменшення на 8,3 % порівняно з 2011 роком, у 2013 році зменшення склало ще 3,0 % у порівнянні з попереднім роком [1]. Однак у 2014 році обсяг 5


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

проблемної заборгованості зріс на 93,6 % відносно попереднього року, у 2015 році ще на 56,9 %. У жовтні 2016 році в порівнянні з жовтнем 2015 року зростання склало 31,6 % [2]. Зростання частки проблемної заборгованості в кредитному портфелі банку, згідно банківської нормативно-правової бази [3], зумовлює значні відрахування в резерви на покриття втрат за кредитними операціями. Так, частка резервів за активними операціями банків у 2008–2015 роках повторює тенденцію за часткою простроченої заборгованості за кредитами. Зокрема, у 2012 році частка резервів за активними операціями зменшилась на 1,8 %, порівняно з 2011 роком, у 2013 році зменшилась на 2,9 %, у 2014 році відбулось зростання на 6,0 %, а у 2015 році зростання склало 12,9 % при порівнянні з попереднім роком [2]. Це свідчить про низьку якість активів банку та призводить до зменшення розміру потенційного прибутку. У зв’язку з такою ситуацією ряд банків зменшив обсяг кредитування населення, що у свою чергу здійснило додатковий негативний вплив на прибутковість банків, обумовило певні труднощі для кредиторів і позичальників, знизило довіру до банківської системи та ускладнило відновлення кредитування реального сектора економіки України. З огляду на необхідність збільшення обсягів кредитування та виведення цього процесу на ефективніший рівень, розробка адекватного інструментарію оцінювання кредитоспроможності фізичних осіб є вкрай актуальним завданням. Проблеми оцінювання кредитоспроможності фізичних осіб традиційно перебувають в центрі уваги вчених і є одним із найбільш досліджених розділів банківської справи. Дослідження в цьому напрямі представлені як зарубіжними, так і вітчизняними дослідниками, серед яких варто відзначити: Д. Дюрана [4], В. Вітлінського [5], А. Камінського [6], Н. Сіддікі [7]. Представлені в науковій літературі підходи свідчать про те, що в зарубіжній і вітчизняній банківській практиці кредитоспроможність потенційного позичальника завжди була і залишається одним з основних критеріїв визначення доцільності встановлення кредитних відносин з клієнтом. Тому проведення оцінювання кредитоспроможності фізичної особи на стадії прийняття рішення про доцільність видачі кредиту є необхідним інструментом для ефективного управління кредитним ризиком банку. Оцінюючи кредитоспроможність позичальника, банк фактично визначає рівень кредитного ризику, який він приймає на себе, 6


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

надавши кредит. Таким чином, рівень ризику потенційного позичальника трансформується у ризик самого банку за умови встановлення кредитних відносин. Отже, оцінювання кредитного ризику фізичних осіб є важливою складовою в забезпеченні беззбиткового функціонування банку. Також важливим є формування множини критеріїв оцінювання позичальника та подальший аналіз їх впливу на кредитоспроможність фізичної особи.

Виклад основного матеріалу дослідження Розробка власної рейтингової системи оцінювання кредитоспроможності позичальника надає можливість формування критеріїв та вимог до клієнта відповідно до положень кредитної політики банку. Критерії оцінювання кредитоспроможності позичальника можуть визначатись кожним банком самостійно і мають бути документально закріплені в окремому положенні, яке входить до стандартів кредитної політики банку. Залежно від того, яким чином будуть сформовані критерії для оцінювання кредитоспроможності позичальника, буде залежати величина ризику для банку. Національним банком України в Положенні «Про порядок формування та використання резерву для відшкодування можливих втрат за кредитними операціями банків» [8] встановлено систему кількісних та якісних показників для оцінювання кредитоспроможності позичальника, врахування яких обов’язкове для банків. Затверджені Положенням вимоги є мінімально необхідними і кожен банк може самостійно визначати додаткові критерії, що підвищують вимоги до позичальників, з метою адекватного оцінювання рівня кредитного ризику і належного контролю за ним. При виборі системи показників оцінювання кредитоспроможності позичальника потрібно враховувати специфіку того сегмента ринку, який обслуговує банк, спеціалізацію банку (іпотечний, інвестиційний, ощадний), форми (іпотечні, споживчі, лізингові тощо), строки кредитів (коротко-, довгострокові), кредитні стратегії та політику банку (обережна, помірна чи агресивна), рівень кваліфікації працівників кредитного відділу, рівень організації і технічного забезпечення аналітичної роботи в банку. Відбір кредитоспроможних позичальників необхідно забезпечити з урахуванням умов слабоформалізованості та невизначено7


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

сті початкових даних, беручи до уваги одночасно якісні та кількісні характеристики позичальника. Для цього вважаємо відомими: Р = {р1, р2, ..., рm} – множина потенційних позичальників (тих фізичних осіб, які претендують на отримання кредиту); К ={k1, k2,..., kп} – множина кількісних та якісних критеріїв відбору для оцінювання кредитоспроможності потенційних позичальників. Задача багатокритеріального оцінювання полягає у впорядкуванні елементів множини Р за критеріями з множини К. На сьогодні не існує стандартного набору характеристик, за якими можна класифікувати фізичних осіб за рівнем кредитоспроможності. Аналіз робіт [7–9] дає підстави виділити такі показники для оцінювання кредитоспроможності потенційних позичальників: k1 – вік; k2 – сімейний стан; k3 – кількість утриманців; k4 – освіта позичальника; k5 – заробітна плата; k6 – кількість телефонів позичальника (вибір даного критерію обумовлений тим, що відсутність такого роду інформації або часта зміна телефонів підвищують імовірність вчинення позичальником шахрайських дій); k7 – стать. Враховуючи той факт, що критерії оцінювання позичальників представлені як кількісними, так і якісними показниками, застосуємо метод нечіткого багатокритеріального аналізу варіантів [10–13] для ранжування потенційних позичальників за їх кредитоспроможністю. За подібного підходу критерії будемо розглядати як нечіткі множини, що задані на універсальній множині варіантів за допомогою функцій належності. Нехай  ki ( р j ) – рівень кредитоспроможності потенційного позичальника pj  P за критерієм відбору ki  K : ki ( p j ) приймає значення в діапазоні [0, 1] – чим більше число ki ( p j ) , тим вища оцінка 8


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

позичальника за критерієм ki  K , j  1, m; i  1, n . У такому випадку критерій відбору ki  K можна представити у вигляді нечіткої ~ множини k і , яку задано на універсальній множині P таким чином: k ( pm )  ~  k ( p1 ) ki ( p2 ) kі   i , ,..., i , p2 pm   p1

(1)

де ki ( p j ) – ступінь належності елемента pj до нечіткої множи~ ни k і . Ступені належності нечіткої множини (1) знайдемо за методом побудови функцій належності на основі парних порівнянь. При такому підході формуються матриці за кожним із критеріїв, а загальна кількість таких матриць співпадає із кількістю критеріїв відбору і дорівнює n. Для критерію ki  K матриця парних порівнянь приймає вигляд: ki ki  a11 a12  k ki a i a22 Aki   21  ... ...  k i am1 amki2

... a1kmi   ... a2kmi  , ... ...   ki  ... amm

(2)

де aljk i — рівень переваги за критерієм ki позичальника pl над позичальником p j , l , j  1, m , який визначається за дев’ятибальною шкалою Сааті [14]: 1 – якщо відсутня перевага pl над pj; 3 – якщо перевага pl над pj є слабкою; 5 – якщо перевага pl над pj є помірною; 7 – якщо перевага pl над pj є сильною; 9 – якщо перевага pl над pj є абсолютною; 2, 4, 6, 8 – проміжні оцінки: 2 – ледь слабка перевага; 4 – помітна перевага; 6 – майже сильна перевага; 8 – майже абсолютна перевага. Слід зазначити, що матриця (2) є діагональною ( aljki 1 l  j ) та обернено симетричною (елементи матриці парних порівнянь пов’язані математичним виразом alj  9

1 , l, j  1,k ). a jl


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Ступенями належності нечіткої множини (1) будуть виступати коефіцієнти відносної важливості, обчислення яких проводимо із використанням середнього геометричного елементів кожного із рядків матриці А [14; 15, с. 46]:

l 

al1  ...  alm

m m

m

l 1

, l  1, m .

(3)

al1  ...  alm

Згідно підходу Беллмана–Заде найкращим буде результат, який найбільшою мірою одночасно задовольняє усім критеріям відбору. При цьому нечіткий розв’язок задачі розрахунку відповідності позичальника всім критеріям знаходиться як перетин їх нечітких множин [16]: ~ ~ ~ ~ (4) D  k1  k2  ...  k n . Ступені належності  D ( pm )  ~   D ( p1 )  D ( p2 )

D 

p1

,

p2

,...,

pm

нечіткого

розв’язку

 знаходимо через операцію пере

тину Заде  D  p j i min ki p j , j  1, m . 1, n

Найбільш кредитоспроможним є потенційний позичальник з максимальним ступенем належності: p  arg max D  p1 ,  D  p2 ,...,  D  pm  . pi

За різної важливості критеріїв формула (4) набуває вигляду: α

D = k1 1

α

k2 2

α

kn n =

min i=1,n

μαk i p1 i

p1

,

min i=1,n

μαk i p2 i

p2

,…,

min i=1,n

μαk i pm i

pm

,

(5)

де αi – коефіцієнти відносної важливості критеріїв ki, i = 1, n , такі, що α1 +···+ αn =1. 10


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

Степінь αi у формулі (5) концентрує функції належності нечіт~ ких множин kl , l  1, n , згідно важливості критерію ki, відповідно до підходу, описаного у [14]. Коефіцієнти відносної важливості критеріїв визначаються за формулою (3). Проведемо аналіз вагомості впливу критеріїв відбору на результуючу оцінку та здійснимо оцінювання кредитоспроможності чотирьох потенційних позичальників, інформацію щодо яких наведено у табл. 1. Таблиця 1 ХАРАКТЕРИСТИКИ ПОЗИЧАЛЬНИКІВ Потенційний позичальник

Критерії k1

k2

k3

k4

k5

k6

k7

1

43

одружений

середня

437,8

2

чоловік

2

49

розлучений

незакінчена вища

500

2

чоловік

3

60

заміжня

2

вища

2

жінка

4

83

478,8

3

чоловік

в громадянському незакінчена — шлюбі вища

При формуванні матриць парних порівнянь (2) експерту потрібно розуміти, наскільки відповідально позичальники з різних вікових груп виконують власні зобов’язання по кредитам. З цією метою виникає доцільність у формуванні еталону, який міститиме характеристики найкращого позичальника за усіма відібраними критеріями одночасно. Отримати еталон можна в результаті проведення аналізу розширеної вибірки даних за багатьма позичальниками. Такий аналіз дозволив виявити закономірності у кредитній поведінці за всіма критеріями оцінювання позичальників. Ступінь відповідальності у поведінці позичальників можна оцінити через так званий коефіцієнт повернення кредиту (КПК), під яким розумітимемо співвідношення кількості стандартно завершених угод до кількості невиконаних кредитних угод. Виходячи з аналізу статистичних даних за цим показником пропонуємо наступну шкалу для оцінювання КПК: від 0 до 5 – поганий рівень повернення кре11


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

10

35

9

Кількість позичальників, чол

Коефіцієнт повернення кредиту

дитів; (5; 7] – низький рівень повернення кре8 дитів; (7; 10] – середній 30 7 рівень повернення кре25 6 дитів; більше 10 – ви20 5 сокий рівень повер4 15 нення кредитів. Так, 3 10 наприклад, рис. 1 вка2 5 зує на найвищий сту1 0 0 пінь відповідальності в 38 39 40 41 42 43 44 45 кредитній поведінці Роки позичальників у віці 43 Коефіцієнт Кількість позичальників та 44 роки, для яких КПК знаходиться на ріРис. 1. Динаміка КПК у віковій групі вні близько 30 (кільвід 38 до 44 років кість стандартно завершених угод у 30 разів більша, ніж дефолтів за кредитними зобов’язаннями) і свідчить про високий рівень повернення кредитів. На рис. 2 спостерігаємо значення КПК для вікової групи від 45 до 53 років, яке коливається в інтервалі від 8 до 15. Однак для вікової категорії 46 років коефіцієнт повернення кредитів стрибає до рівня 32. Подібні сплески носять випадковий характер і не мають узагальнюючих властивостей, адже, наприклад, вже через рік у цю категорію перейдуть сьогоднішні сорокап’ятирічні і значення КПК для неї опуститься у чотири рази. Враховуючи це, доцільним стає подання вихідних результатів з групуванням за більш тривалими періодами. Результати аналізу залежності коефіцієнта повернення кредитів позичальниками від їх Рис. 2. Динаміка КПК у віковій групі віку при об’єднанні за від 45 до 53 років 40

12


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

Кпк

п’ятирічними діапазонами наочно представлені на рис. 3. Рис. 4 – 8 ілюструють результати розрахунку КПК за іншими критеріями. 14

30,00

12

25,00

10 8

КПК

20,00

6

15,00

4 2

10,00 0

5,00

0,00 37-42

43-47

48-52

53-57

58-62

63-67

68-72

73-77

78-82

83-87

88-92

Сімейний стан

Роки

Рис. 4. Динаміка КПК залежно від сімейного стану позичальника

Рис. 3. Динаміка КПК від 37 до 98 років 12

16

14 10

12 10

КПК

КПК

8

8

6 6

4 2

4

0 2

0 немає

1

2

3

4

5

не надали дані

Кількість утриманців

Освіта

Рис. 5. Динаміка КПК залежно від кількості утриманців

Рис. 6. Динаміка КПК залежно від рівня освіти

14

16

12

14

10

12 10

КПК

КПК

8

6

8 6

4 4

2 2

0 0

1

2

3

4

5

6

7

8

9

10

Кількість телефонів позичальника

Заробітня плата

Рис. 8. Динаміка КПК залежно від кількості телефонів позичальника

Рис. 7. Динаміка КПК залежно від рівня заробітної плати

13

Немає даних


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Проведений аналіз також дозволив виявити, що жінки є надійнішими позичальниками, порівняно з чоловіками. Так, коефіцієнт повернення кредитів жінками дорівнює 9,99, тоді як для чоловіків КПК = 8,12. Як уже зазначалось, у результаті проведених обчислень має бути сформований еталон, з яким далі здійснюватиметься порівняння кожного потенційного позичальника. Еталону має відповідати найбільш кредитоспроможний позичальник по запропонованих критеріях. З урахуванням отриманих значень КПК сформуємо матриці парних порівнянь (2) за кожним із критеріїв. Об’єктами оцінювання виступають чотири потенційні позичальники (див. табл. 1).

3 5  1 1 / 3 1 3  А  1/ 5 1/ 3 1 1 / 7 1 / 5 1 / 5 k1

А

k3

1  1 1 1   1/ 5 1/ 3  1 1

7 5 5 1

5 1  3 1  1 1 / 2 2 1 

А

k2

 1  1 / 3 1  3

А

k4

1 1 / 3 1 1 / 3  3 1 1 / 3 3  1 3 1 1/ 3 3 1 / 3 3 1 

3 1 1 / 3 1 1 / 3 1 / 5 3 1 1 / 3 5 3 1 

(6) А

k5

 1 1/ 7 1   7 1/ 7 1/ 7  4 1 / 5

7 1 / 4 7 5  1 1 / 7 7 1 

А

k7

1 3  1 1 1 3   1/ 3 1/ 3 1  1 1 1/ 2

А

k6

1  1 1 2

1 1 1 3

1 1 / 2 1 1 / 3 1 1 / 3 3 1 

1 1 2 1 

Відповідно до сформованої дев’ятибальної шкали Сааті перша матриця за критерієм k1 інтерпретується такими висловлюваннями: слабка перевага позичальника р1 над р2, помірна пере14


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

вага позичальника р1 над р3, сильна перевага позичальника р1 над р4, слабка перевага позичальника р2 над р3, помірна перевага позичальника р2 над р4, помірна перевага позичальника р3 над р4. Перший позичальник попадає у вікову групу від 43 до 47 із КПК 22,63 (див. рис. 3). Дана вікова група характеризується високим рівнем повернення кредитів. Це свідчить про його перевагу над усіма іншими претендентами, що і відображено у матриці Аk1 . Аналогічно побудовано й інші матриці парних порівнянь. Знаходимо по кожній із матриць парних порівнянь (6) за допомогою формули (3) коефіцієнти відносної важливості критеріїв, які будуть виступати ступенями належності нечіткої множини (1). У результаті отримаємо нечіткі множини:  ~  0,56 0,26 0,13 0,05 , , , k1   ;  p1 p2 p3 p4    k~   0,20 , 0,08 , 0,20 , 0,52 ;  2  p1 p2 p3 p4    ~  0,34 0,30 0,10 0,27  , , , ; k3    p1 p2 p3 p4     ~  0,12 0,48 0,12 0,28 , , , k 4   ; (7)  p1 p2 p3 p4    k~   0,11, 0,61, 0,04 , 0,24 ;  5  p1 p2 p3 p4    ~  0,19 0,17 0,17 0,47  , , , ; k 6   p p p p 1 2 3 4       k~7   0,32 , 0,32 , 0,17 , 0,20 .   p1 p2 p3 p4  Щоб оцінити, наскільки потенційні позичальники р1÷р4 задовольняють критеріям, представимо нечіткі множини (7) у вигляді: 15


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

𝑝1 =

0,56 0,20 0,34 0,12 0,11 0,19 0,32 , , , , , , ; 𝑘1 𝑘2 𝑘 3 𝑘4 𝑘5 𝑘6 𝑘7

𝑝2 =

0,26 0,08 0,30 0,48 0,61 0,17 0,32 , , , , , , ; 𝑘1 𝑘2 𝑘 3 𝑘4 𝑘5 𝑘6 𝑘7

𝑝3 =

0,13 0,20 0,10 0,12 0,04 0,17 0,17 , , , , , , ; 𝑘1 𝑘2 𝑘3 𝑘4 𝑘5 𝑘6 𝑘7

𝑝4 =

0,05 0,52 0,27 0,28 0,24 0,47 0,20 , , , , , , . 𝑘1 𝑘2 𝑘3 𝑘4 𝑘5 𝑘6 𝑘7

(8)

p1  ~ p4 , відображені на Функції належності нечітких множин ~ рис. 9, свідчать, що різні потенційні позичальники мають певні переваги за тим чи іншим критерієм. Так, позичальник р1 є кращим за критеріями k1, k3 та k7, позичальник р2 – за критеріями k4, k5 і k7, а позичальник р4 – за критеріями k2 та k6. Позичальник р3 не має переваг перед іншими за обраними критеріями. 0,70 0,60

0,50 0,40 0,30 0,20 0,10 0,00 k1

k2

k3 p1

k4 p2

k5 p3

k6

k7

p4

Рис. 9. Порівняння потенційних позичальників за критеріями

Вибір потенційного позичальника доцільно проводити з урахуванням важливості критеріїв. Експертні парні порівняння важливості критеріїв виявились такими: відсутня перевага k1 над k2; помірна перевага k1 над k4, k5 і k6; відсутня перевага k2 над k4; сла16


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

бка перевага k2 над k6 і k7; слабка перевага k3 над k1, k4 і k7; помірна перевага k3 над k2 і т.д. Цим висловлюванням відповідає матриця парних порівнянь: 1 1 3 𝐴 = 1/5 3 1/5 1/5

1 1 5 1 5 1/3 1/3

1/3 1/5 1 1/3 3 1 1/3

5 1 3 1 5 1 3

1/3 1/5 1/3 1/5 1 1/3 1/5

5 5 3 3 1 3 1 1/3 . 3 5 1 1 1 1

(9)

Знаходимо коефіцієнти важливості критеріїв для даної матриці за формулою (3): 1  0,17; 2  0,10; 3  0,21; 4  0,05; 5  0,34;  6  0,07; 7  0,06. Розраховані коефіцієнти свідчать, що найбільше впливають на прийняття рішень щодо кредитоспроможності позичальника його вік, кількість утриманців і заробітна плата. ~ Для застосування формули (5) знайдемо kii , i  1, n на основі (8) і матриці (9). У результаті отримуємо нечіткі множини критеріїв із урахуванням їх важливості:  0,560,17 0,260,17 0,130,17 0,050,17   0,91 0,80 0,71 0,60 ~ k11   , , , , , ,  ; p2 p3 p4   p1 p2 p3 p4   p1  0,200,10 0,080,10 0,200,10 0,520,10   0,85 0,77 0,85 0,94 ~ k2 2   , , , , , ,  ; p2 p3 p4   p1 p2 p3 p4   p1  0,340, 21 0,300,21 0,100, 21 0,270, 21   0,79 0,77 0,61 0,76 ~ k3 3   , , , , , ,  ; p2 p3 p4   p1 p2 p3 p4   p1  0,120,05 0,480,05 0,120,05 0,280,05   0,90 0,96 0,90 0,94 ~ k4 4   , , , , , ,  ; p2 p3 p4   p1 p2 p3 p4   p1

 0,110,34 0,610,34 0,040,34 0,240,34   0,48 0,85 0,33 0,62 ~ k5 5   , , , , , ,  ; p2 p3 p4   p1 p2 p3 p4   p1  0,190,07 0,170,07 0,170,07 0,470,07   0,89 0,88 0,88 0,95 ~ k6 6   , , , , , ,  ; p2 p3 p4   p1 p2 p3 p4   p1

17


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

 0,320,06 0,320,06 0,170,06 0,200,06   0,93 0,93 0,90 0,91 ~ k7 7   , , , , , ,  . p2 p3 p4   p1 p2 p3 p4   p1

Функції належності потенційних позичальників до відібраних критеріїв з урахуванням їх важливості наведено на рис. 10. 1,20 1,00 0,80 0,60 0,40 0,20 0,00 k1

k2

k3 p1

k4 p2

k5 p3

k6

k7

p4

Рис. 10. Порівняння позичальників з урахуванням важливості критеріїв

Порівнюючи рис. 9 і 10 видно, що із урахуванням важливості критеріїв відстань між оцінками позичальників зменшилась. Перетин нечітких множин усіх критеріїв за формулою (5) ~ ~α ~α ~ k1 1  k 2 2 ... k nαn дає такі ступені належності вихідного рішення D :  D  p1   min0,90; 0,85; 0,79; 0,90; 0,48; 0,89; 0,93  0,48;  D  p2   min0,82; 0,77; 0,77; 0,96; 0,85; 0,88; 0,93  0,77;  D  p3   min0,72; 0,85; 0,61; 0,90; 0,33; 0,88; 0,90  0,33;  D  p4   min0,60; 0,94; 0,76; 0,94; 0,62; 0,95; 0,91  0,60. Результат розрахунку подаємо у вигляді нечіткої множини: ~  0,48 0,77 0,33 0,60 D ; ; ; , p2 p3 p4   p1

яка свідчить про перевагу позичальника p2 над іншими(тобто, позичальник p2 задовольняє встановленим критеріям із урахуванням їх важливості більшою мірою за решту позичальників). Ви18


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

хідне рішення щодо видачі кредитів формується в результаті порівняння потенційних позичальників. Потенційний позичальник із найбільшою мірою належності більше за інших відповідає вимогам, що визначені критеріями відбору. Дослідження впливу вагомості критеріїв відбору на результуючий показник дозволили сформувати таку шкалу для прийняття управлінських рішень щодо видачі кредиту: (0; 0,33] – відмовити у видачі кредиту; (0,33; 0,70] – видача кредиту із більш «жорсткими» умовами; (0,70; 1] – доцільно надати кредит. Відповідно до цієї шкали позичальнику p2 доцільно надати кредит, позичальникам p1 та p4 можна надати кредит, але з більш «жорсткими» умовами, позичальнику p3 – відмовити. Проведемо аналіз впливу критеріїв на результат оцінювання кредитоспроможності позичальників із застосуванням методики дослідження чутливості прийнятого рішення на основі «що, якщо» аналізу. Такий підхід дозволяє встановити, як зміниться оцінка позичальника, якщо змінити значення одного з парних порівнянь. Застосуємо запропонований у роботах [17, 18] підхід до аналізу чутливості з метою виявлення впливу критеріїв відбору на оцінку кредитоспроможності потенційного позичальника. Скористаємось отриманими вище результатами багатокритеріального аналізу позичальників. З’ясуємо, наприклад, яким чином можна скорегувати переваги критеріїв, щоб позичальник р1 став найбільш кредитоспроможним з-поміж інших за оцінкою банку. Наразі позичальник p1має третій ранг після p2 та p4. Будемо вважати, що є можливість покращити парні порівняння цього позичальника за критерієм k5 (тобто, є потенційна можливість змінити роботу і, відповідно, збільшити рівень заробітної плати). З’ясуємо, як впливає на оцінку кредитоспроможності поступова зміна рівня переваги потенційного позичальника p2 над p1 з поточного значення «сильна перевага p2 над p1» на всі можливі варіанти до оцінки «відсутня перевага p2 над p1». Для цього послідовно змінимо значення елемента а12 матриці парних порівнянь Ak5 з 1/7 на 1/6, 1/5, 1/4, 1/3, 1/2, 1 та проведемо розрахунки за викладеною у [10] методикою, результати яких зведемо до табл. 2. При цьому необхідно враховувати ту обставину, що зміна переваги за критерієм k5 у потенційного позичальника p1 відносно p2 може привести до зміни переваг і з іншими позичальниками. Тобто, якщо зарплата першого потенційного позичальника була макси19


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

мально нижчою, ніж у другого (оцінка переваги 1/7), але при цьому максимально вищою порівняно з третім (оцінка 7), то з ростом зарплати першого його перевага до третього залишиться максимальною – рівною 7, але перевага до четвертого потенційного позичальника буде зростати. В таких випадках відбувається зміна попарних порівнянь у матриці і, відповідно, результуючих показників, що можна бачити у табл. 2. Таблиця 2 ВПЛИВ КРИТЕРІЮ k5 НА РЕЗУЛЬТУЮЧУ ОЦІНКУ КРЕДИТОСПРОМОЖНОСТІ ПОЗИЧАЛЬНИКА р1 ПРИ ЗМІНІ ПАРНОЇ ПЕРЕВАГИ а12

̃ 𝑘

𝐴

а12 1/7 [

]

[

]

[

]

[

]

[

]

[

]

[

]

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

1/6

1/5

1/4

1/3

1/2

1

20


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

м

На рис. 11 відображено динаміку оцінок кредитоспроможності усіх потенційних позичальників за даними з табл. 2, де видно, що позичальник p1 стане другим за рангом (зрівняється з p4), коли за критерієм k5 перевага p4 над p1 буде відсутньою (а14 = 1). 0,9

0,8 0,7 0,6 0,5

D(P1)

0,4

D(P2)

0,3

D(P3)

0,2

D(P4)

0,1 0 1/7

1/6

1/5

1/4

1/3

1/2

1

а12

Рис. 11. Динаміка оцінок кредитоспроможності потенційних позичальників при зміні переваг за критерієм k5

З рис. 11 бачимо, що в результаті підвищення рівня заробітної плати позичальника p1 із відповідним збільшенням його переваги за цим критерієм відносно інших позичальників, його інтегральна оцінка зросла з 0,48 до 0,72. Хоча він і не став кращим за потенційного позичальника p2, проте, враховуючи встановлені діапазони результуючої шкали для прийняття рішень, потенційний позичальник p1 за таких умов зможе одержати кредит.

Висновки з проведеного дослідження Поява проблемної заборгованості може призвести до негативних наслідків у роботі банку, погіршувати його здатність генерувати прибуток і динамічно розвиватись в умовах мінливого зовнішнього середовища. Тому зменшення кредитних ризиків, пошук і формування нових і вдосконалення існуючих методів регулювання проблемних кредитів є одними з головних завдань, що стоять перед банківськими установами. У статті проведено дослідження особливості оцінювання кредитоспроможності потенційних позичальників. У результаті було виділено такі критерії оцінювання як вік, сімейний стан позичальника, кількість утриманців, освіта, заробітна плата, кількість 21


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

телефонів і стать позичальника. Процедуру відбору кредитоспроможних позичальників реалізовано на основі методу нечіткого багатокритеріального аналізу, згідно якого оцінювання здійснюється на основі парних порівнянь варіантів. Показано, що застосування не абсолютних значень критеріїв, а парних порівнянь їх переваг є зручнішим для експертів. Особливістю метода багатокритеріального аналізу є використання принципу Беллмана-Заде, за яким найкращим визначається позичальник, що одночасно задовольняє усім критеріям найбільшою мірою. В ході аналізу вагомості критеріїв на основі нечітких парних порівнянь сформульовані рекомендації, яким чином необхідно змінювати характеристики потенційному позичальнику, щоб підняти рівень його кредитоспроможності за оцінкою банку.

Література 1. Основні показники діяльності банків України [Електронний ресурс] // Національний банк України. – 2014–2016. – Режим доступу: https://bank.gov.ua/control/uk/publish/article?art_id=34661442. 2. Аналітичний огляд банківської системи України за 9 місяців 2016 року [Електронний ресурс] // Національне рейтингове агенство Рюрік. – 2016. – Режим доступу: http://rurik.com.ua/documents/research/bank_ system_3_kv_2016.pdf. 3. Положення «Про порядок формування та використання банками України резервів для відшкодування можливих втрат за активними банківськими операціями» [Електронний ресурс] / Затверджено Постановою Правління Національного банку України від 25.01.2012 № 23. – Режим доступу: http://zakon2.rada.gov.ua/laws/show/z0231-12. 4. Durand D. Risk Elementsin Consumer Instalment Financing / David Durand. – New York: National Bureau of Economic Research, 1941. – 128 p. 5. Вітлінський В. В. Кредитний ризик комерційного банку: навч. посіб. / В. В. Вітлінський, О. В. Пернарівський, Я. С. Наконечний, Г. І. Великоіваненко. – К. : Знання, 2000. – 251 с. 6. Камінський А. Б. Нейромережеві технології в управлінні портфелем простроченої заборгованості / А. Б. Камінський, В. О. Сікач // Моделювання та інформаційні системи в економіці. – 2011. – Вип. 84. – С. 5–19. 7. Сиддики Н. Скоринговые карты для оценки кредитных рисков. Разработка и внедрение интеллектуальных методов кредитного скоринга / Наим Сиддики. – М.: Изд-во МИФ, 2014. – 268 с. 8. Положення «Про порядок формування та використання резерву для відшкодування можливих втрат за кредитними операціями банків» [Електронний ресурс] / Затверджено Постановою Правління Націона22


Аналіз вагомості критеріїв в оцінюванні…

А. В. Гаврилюк

льного банку України від 6 липня 2000 р. № 279. – Режим доступу: http://zakon4.rada.gov.ua/laws/show/z0474-00. 9. Гаврилюк Г.В. Ієрархічна модель оцінювання кредитоспроможності позичальників. Актуальні проблеми прогнозування поведінки складних економічних систем: колективна наукова монографія / за ред. О.І. Черняка, П.В. Захарченка. – Бердянськ: Видавець Ткачук О.В, 2016. – 512 с. 10. Ротштейн А. П. Интеллектуальные технологии идентификации [Електронний ресурс]. – Режим доступу: http://matlab.exponenta.ru/ fuzzylogic/book5/7_4.php. 11. Rotshtein A. Fuzzy multicriteria analysis of variants with the use of paired comparisons / A. Rotshtein, S. Shtovba // Journal of Computer and Systems Sciences International. – 2001. – Vol. 40. – № 3. – P. 499–503. 12. Борисов А. Н. Принятие решений на основе нечетких моделей: примеры использования / А. Н. Борисов, О. А. Крумберг, И. П. Федоров. — Рига: Зинатне, 1990. – 184 с. 13. Ротштейн А. П. Интеллектуальные технологи идентификации: нечеткая логика, генетические алгоритмы, нейронные сети / А. П. Ротштейн. – Винница: УНІВЕРСУМ-Вінниця, 1999. – 295 с. 14. Саати Т. Принятие решений. Метод анализа иерархий / Т. Саати. – М.: Радио и связь, 1993. – 279 с. 15. Кігель В.Р. Математичні методи ринкової економіки / В.Р. Кігель. – К.: Кондор, 2003. – 158 с. 16. Bellman R. Decision-making in a fuzzy environment / R. Bellman, L. Zadeh // Management Science. – 1970. – Vol. 17. – № 4. – P. 141–164. 17. Штовба С.Д. Проектирование нечетких систем средствами MATLAB / С. Д. Штовба. – М.: Горячая линия – Телеком, 2007. – 288 с. 18. Ротштейн А.П. Многокритериальный выбор бренд-проекта с помощью нечетких парных сравнений альтернатив / А. П. Ротштейн, С. Д. Штовба, Е. В. Штовба // Управление проектами и программами. – 2006. – № 2. – C. 138–146.

References 1. National Bank of Ukraine. (2014–2016). Osnovni pokazately diyal’nosti bankiv Ukrayiny. Retrieved from https://bank.gov.ua/control/ uk/publish/article?art_id=34661442 [in Ukrainian]. 2. National rating agency Rurik. (2016). Analitychnyy ohlyad bankivs’koyi systemy Ukrayiny za 9 misyatsiv 2016 roku. Retrieved from http://rurik. com.ua/documents/research/bank_system_3_kv_2016.pdf [in Ukrainian]. 3. National Bank of Ukraine. (2012). Polozhennya Pro poryadok formuvannya ta vykorystannya bankamy Ukrayiny rezerviv dlya vidshkoduvannya mozhlyvykh vtrat za aktyvnymy bankivs’kymy operatsiyamy. Retrieved from http://zakon2.rada.gov.ua/laws/show/z0231-12 [in Ukrainian]. 23


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

4. Durand D. (1941). Risk Elementsin Consumer Instalment Financing. New York: National Bureau of Economic Research. 5. Vitlins’kyj, V. V., Pernarivs’kyj, O. V., Nakonechnyj, Ya. S., & Velykoivanenko, H. I. (2000). Kredytnyj ryzyk komertsijnoho banku. Kyiv, Ukraine: Znannia [in Ukrainian]. 6. Kamins’kyy, A. B., & Sikach, V. O. (2011). Neyromerezhevi tekhnolohiyi v upravlinni portfelem prostrochenoyi zaborhovanosti. Modelyuvannya ta informatsiyni systemy v ekonomitsi (Modelling and information systems in economy), 84, 5–19 [in Ukrainian]. 7. Siddiqi, N. (2006). Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring. New Jersey: John Wiley and Sons. 8. National Bank of Ukraine. (2000). Polozhennya Pro poryadok formuvannya ta vykorystannya rezervu dlya vidshkoduvannya mozhlyvykh vtrat za kredytnymy operatsiyamy bankiv. Retrieved from http://zakon4. rada.gov.ua/laws/show/z0474-00. 9. Gavrilyuk, G. V. (2016). Iyerarkhichna model’ otsinyuvannya kredytospromozhnosti pozychal’nykiv. In Aktual’ni problemy prohnozuvannya povedinky skladnykh ekonomichnykh system: kolektyvna naukova monohrafiya. (pp. 258–268). Berdyans’k, Ukraine: Vydavets’ Tkachuk O.V. [in Ukrainian]. 10. Rotshtein, A. P. Intellektual’nyye tekhnologii identifikatsii. Retrieved from http://matlab.exponenta.ru/fuzzylogic/book5/7_4.php. 11. Rotshtein, A., & Shtovba, S. (2001). Fuzzy multicriteria analysis of variants with the use of paired comparisons. Journal of Computer and Systems Sciences International, 40(3), 499—503. 12. Borisov, A. N., Krumberg, O. A., & Fedorov I. P. (1990). Prinyatiye resheniy na osnove nechetkikh modeley: primery ispol’zovaniya. Riga, Latvia: Zinatne [in Russian]. 13. Rotshteyn, A. P. (1999). Intellektual’nyye tekhnologi identifikatsii: nechetkaya logika, geneticheskiye algoritmy, neyronnyye seti. Vinnitsa, Ukraine: UNÍVERSUM-Vínnitsya [in Russian]. 14. Saati, T., & Joyce, A. (1989). Conflict Resolution: The Analytic Hierarchy Process. New York: Praeger. 15. Kigel, V. R. (2003). Matematychni metody rynkovoyi ekonomiky. Kyiv, Ukraine: Kondor [in Ukrainian]. 16. Bellman, R., & Zadeh, L. (1970). Decision-making in a fuzzy environment. Management Science, 17(4), 141—164. 17. Shtovba, S. D. (2007). Proyektirovaniye nechetkikh sistem sredstvami MATLAB. Moscow, Russia: Goryachaya liniya — Telekom [in Russian]. 18. Rotshtein, A.P., Shtovba, S.D., & Shtovba, E. V. (2006). Mnohokryteryal'nyi vybor brend-proekta s pomoshchyu nechetkykh parnykh sravneniy al'ternatyv. Upravleniye proektami i prohrammami (Project and Program Management), 2, 138–146 [in Russian]. Стаття надійшла до редакції 29.03.2017

24


УДК 332.12

ОЦІНЮВАННЯ ВНУТРІШНЬОРЕГІОНАЛЬНОЇ ДИФЕРЕНЦІАЦІЇ НА ЗАСАДАХ НЕЙРО-НЕЧІТКОГО МОДЕЛЮВАННЯ

Т. І. Єфанова Магістр з економічної кібернетики, здобувач кафедри економічної кібернетики Дніпровський національний університет імені Олеся Гончара проспект Гагаріна, 72, м. Дніпро, 49010, Україна efanovati@gmail.com

Дана стаття містить результати дослідження у сфері регіонального розвитку, зокрема огляд існуючих принципів і розробку ефективного підходу до аналізу регіонального простору задля покращення соціального та економічного середовища в регіонах. Аналіз результатів проведених експериментів виявив невідповідність традиційних підходів реальним умовам розвитку регіонів. Запропонований підхід, який базується на принципах нейронечіткого моделювання та експертних методах, поєднує сценарні розрахунки з урахуванням якісних і кількісних показників, експертних знань у предметній області. Це дозволяє досягти топологічної впорядкованості об’єктів, провести групування та проаналізувати динаміку розвитку районів обраного регіону. Апробація запропонованого методологічного підходу була проведена із застосуванням реальних даних щодо діяльності районів Дніпропетровської області за 2006–2015 рр., яка підтвердила ефективність розробленого математичного інструментарію при виявленні загальних закономірностей у розвитку районів за їх фінансово-соціальними показниками. Ключові слова: регіональний розвиток, карти самоорганізації Кохонена, нечітка логіка,експертні методи.

© Т. І. Єфанова, 2017

25


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

ОЦЕНИВАНИЕ ВНУТРИРЕГИОНАЛЬНОЙ ДИФЕРЕНЦИАЦИИ НА ОСНОВЕ НЕЙРО-НЕЧЕТКОГО МОДЕЛИРОВАНИЯ

Т. И. Ефанова Магистр по экономической кибернетике, соискатель кафедры экономической кибернетики Днепровский национальный университет имени Олеся Гончара проспект Гагарина, 72, г. Днепр, 49010, Украина efanovati@gmail.com

Данная статья содержит результаты исследования в области регионального развития, в частности обзор существующих принципов и разработку эффективного подхода к анализу регионального пространства для улучшения социальной и экономической среды в регионах. Анализ результатов проведенных экспериментов обнаружил несоответствие традиционных подходов реальным условиям развития регионов. Предложенный подход, основанный на принципах нейро-нечеткого моделирования и экспертных методах, сочетает сценарные расчеты с учетом качественных и количественных показателей, экспертных знаний в предметной области. Это позволяет достичь топологической упорядоченности объектов, разделить по группам и проанализировать динамику развития районов выбранного региона. Апробация предложенного методологического подхода была проведена с применением реальных данных о деятельности районов Днепропетровской области за 2006–2015 гг., которая подтвердила эффективность разработанного математического инструментария при выявлении общих закономерностей в развитии районов согласно их финансово-социальных показателей. Ключевые слова: региональное развитие, карты самоорганизации Кохонена, нечеткая логика, экспертные методы.

26


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

EVALUATION OF INTRA-REGIONAL DIFFERENTIATION BASED ON NEURO-FUZZY SIMULATION

Tetiana Efanova Master’s Degree in Economic Cybernetics, PhD student, Department of Economic Cybernetics Oles Honchar Dnipro National University 72 Gagarin Avenue, Dnipro, 49010, Ukraine efanovati@gmail.com This article contains the results of a study on regional development, in particular a review of existing principles and the development of an effective approach to the analysis of the regional space for improving the social and economic environment in the regions. An analysis of the results of carried out experiments revealed a discrepancy between the traditional approaches to the real conditions of the regions development. The suggested approach, based on the principles of neuro-fuzzy modeling and expert methods, combines scenario calculations with qualitative and quantitative indicators, experts knowledge in the subject area. It allows reaching a topological ordering of objects, dividing into groups and analyzing the dynamics of development of districts of the chosen region. The approbation of the proposed methodological approach was carried out using real data on the activities of districts of Dnipropetrovsk region in 2006-2015, which confirmed the effectiveness of the developed mathematical tools in identifying common patterns in the development of areas according to their financial and social indicators. Keywords: regional development, Kohonen self-organization map, fuzzy logic, expert method. JEL Classification: C61, R11

Постановка проблеми Регіональна економічна система України сьогодні перебуває у стані кардинальних змін, які потребують реального оцінювання поточного стану та однозначного формулювання завдань розвитку. Традиційні підходи та способи формування перспективних стратегій розвитку регіону в умовах сучасних реалій, які характеризуються відсутністю яких-небудь достовірних кількісних прогнозів у масштабі всієї країни, значно ускладнюють вирішення завдання розробки ефективної соціально-економічної стратегії на рівні регіону. Через це існує нагальна потреба у неперервному, 27


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

своєчасному, достовірному моніторингу соціально-економічної ситуації, тактичному та стратегічному плануванні регіональних процесів і розробки інструментарію формування стратегій. Активний перехід до децентралізації став передумовою зміщення акценту з державної стратегії до регіональної. Стратегія розвитку окремого регіону має розроблятися відповідно до Державної стратегії регіонального розвитку, в якій визначаються пріоритетні напрямки для кожного регіону. У регіонах прийнята значна кількість цільових програм, але не всі вони розроблені відповідно до регіональних стратегій. Це призводить до розпорошення та неефективного використання бюджетних ресурсів і, відповідно, недосягнення цілей і завдань соціальноекономічного розвитку регіону, суттєвого ускладнення контролю за результативністю виконання програм, неможливості ефективної концентрації бюджетних ресурсів і продуктивнішого їх використання. Тому, необхідно чітко окреслити коло показників, які адекватно відображають загальноекономічну та соціальну ситуацію в регіоні, та обрати методики, які дозволять одержати обґрунтовані пропозиції з формування стратегії регіонального розвитку.

Аналіз останніх джерел і публікацій Питання соціально-економічного розвитку територій і формування їх соціальної політики неодноразово порушувались у працях зарубіжних і вітчизняних науковців, зокрема, С. І. Богуславської [1], З. С. Варналія [2], М. А. Захарової [3], В. Є. Реутової [4] та ін. Більшість учених розглядали підходи до визначення складових регіональної соціальної політики, не приділяючи увагу методології для визначення кількісного показника рівня її ефективності. Спроби кількісно оцінити подібний показник закінчувалися невдало, адже складно врахувати якісні складові формування соціальної політики. Для оцінки якісних показників рівня розвитку соціальної політики застосовуються експертні методи та методологія нечіткого моделювання, які дають можливість кількісно оцінювати різноманітні якісні характеристики. Розробкою, дослідженням і порівнянням різноманітних методів експертних оцінок займалися С. Д. Бешелев [5], О. Г. Гофман [6], Б. Г. Литвак [7], а також багато інших вітчизняних та іноземних науковців. Основні положення теорії нечітких моделей було закладено американським математиком Лотфі Заде [8]. В Україні питаннями нечіткого мо28


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

делювання в економіці займались В. В. Вітлінський [9], К. Ф. Ковальчук [10], А. В. Матвійчук [11] та ін. Утім, низка питань, пов’язаних з поєднанням кількісних і якісних, суб’єктивних та об’єктивних характеристик із застосуванням експертних методів і нечіткої логіки до оцінювання рівня життя населення в регіонах, залишаються нерозв’язаними. Незважаючи на велику кількість робіт, присвячених класифікації регіонів, досі не було розроблено підходу, який би включав комплексний аналіз фінансово-економічної складової розвитку районів, рівня життя населення, як основного індикатора ефективності соціальної політики, та виявлення можливих траєкторій і тенденцій розвитку. Мета і завдання дослідження Метою роботи є обґрунтування теоретико-методологічних положень і практичних рекомендацій щодо визначення тенденцій формування регіонального простору на засадах економіко-математичного моделювання. Основним завданням статті є: побудова моделі оцінювання внутрішньорегіональної диференціації в динаміці у контексті економічного розвитку регіону на підґрунті поєднання інструментарію теорії нечіткої логіки та технологій штучних нейронних мереж. Виклад основного матеріалу Соціально-економічна ситуація в регіоні у кожен момент часу t t=1,T характеризується певними комбінаціями параметрів розвитку усіх районів, які входять до його складу. На зростання рівня розвитку районів впливають як фінансово-економічні Н, так і соціальні ~ ~ показники H , які утворюють матрицю Eˆ ={eˆhtr }; t=1,T ; h=1,H  H; r=1,R , де eˆhtr – значення h-го показника розвитку r-го району в

момент часу t. Звертаємо увагу, що самі соціальні показники міс~ тяться у векторі-стовпці Y  ( y1 , y2 ,...,yH~ ), h=1,H . Необхідно: - визначити кількісні характеристики якісних показників розвитку. При цьому основним індикаторним параметром пропонується розглядати рівень ефективності проведення соціальної політики в районах області як одної із якісних складових рівня життя населення кожного району; 29


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

- згрупувати райони в однорідні групи, тобто провести топологічне упорядкування районів з метою оцінювання ефективності державної регіональної політики, в контексті фінансових і соціальних показників розвитку. Для розв’язання сформульованої задачі пропонується застосувати методологічний підхід, за яким слід: - сформувати тривимірну матрицю лінгвістичних оцінок ~ ~ tr ~ tr E = {e }; t = 1,T ; h = 1,H ; r = 1,R , де елемент e~ – це лінгвістична h

h

оцінка r-го району за h-им якісним показником соціального розвитку протягом t-го періоду часу; - здійснити перехід від оцінок якісних показників тривимір~ ної матриці E={e~htr } у кількісні значення G={ghtr }; t=1,T ; ~ h=1,H ;r=1,R , які нададуть можливість визначити рівень ефективності соціальної політики в розрізі районів, тобто сформувати двомірну матрицю U  { tr }; t=1,T ;r=1,R ; - сформувати тривимірну матрицю E ={ehtr }; t=1,T ; h=1,Hˆ ; r=1,R;Hˆ  H  1 , інформативних показників, які поєднують кількісні та якісні оцінки районів, де Hˆ – кількість показників, що мають кількісний характер ( ehtr  eˆhtr , t=1,T; h=1,H ). У кожен t-ий tr tr період часу елемент eH 1 буде приймати значення  , t=1,T ; r=1,R , для інтегральної кількісної оцінки якісних соціальних показників. Таким чином, елементи матриці утворюють вектори ε tr  eˆ1tr , ..., eˆHtr , δ tr , t=1,T ;r=1,R . Тоді сама матриця може бути

 

записана у вигляді E   tr , t=1,T ;r=1,R ; - провести кластеризацію районів за фінансово-соціальними показниками, тобто визначити місце кожного з R районів серед інших у момент часу t, t=1,T . Загальну схему реалізації підходу до оцінювання внутрішньорегіональної диференціації в динаміці у контексті розвитку регіонального простору, яка включає усі зазначені етапи, зображено на рис. 1.

30


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

Матриця фінансово-економічних та соціальних показників , де

– значення

h-го показника розвитку r-го району в момент часу t Матриця кількісних показників розвитку

Матриця якісних показників розвитку , де елемент

— це лінгвістична оцінка

Отримати попередні числові оцінки експертними методами

Застосувати методи нечіткого моделювання для обробки оцінок якісних характеристик Знайти інтегральний показник рівня ефективності соціальної політики

Сформувати набір інформативних показників кількісного характеру,

тобто матрицю:

,

ЗАДАЧА ГРУПУВАННЯ РАЙОНІВ Визначити місце кожного з R районів та розподілити їх за кластерами в момент часу t,

Рис. 1. Схема оцінювання внутрішньорегіональної диференціації в динаміці у контексті розвитку регіонального простору [авторська розробка]

Задачу визначення кількісних оцінок якісних показників розвитку розглянемо детальніше.

~

~

На основі матриці E={e~htr }; t=1,T ; h=1,H ; r=1,R , формуємо матрицю кількісних експертних оцінок за соціальними показниками 31


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

~ G={g htr }; t=1,T ;h=1,H ;r=1,R . Для того, щоб представити лінгвістичні оцінки в кількісній формі, необхідно провести попередню їх обробку із застосуванням експертних методів. У результаті отримуtr

ються елементи матриці G, де g h – кількісна оцінка h-го соціального показника розвитку у кожен t-ий період часу для r-го району. Етапи отримання експертної суб’єктивної оцінки рівня розвитку соціальної політики по районам для кожного року t, t= 1,T є такими:  визначення мінімально-необхідної кількості експертів κmax; ~  формування матриці  , яка складається з векторів ~ ~   ~ ,...,~ ,...,~ ,h 1,H , з елементами  , які є кіh

h1

hp

h max

hp

лькісними оцінками за h-показником і виставлені p-експертом, p 1, max . Дана матриця формується на основі тривимірної мат-

~

риці лінгвістичних оцінок E={e~htr }; t=1,T ; стосуванням шкали, що наведена в табл. 1.

~ h=1,H ; r=1,R , із заТаблиця 1

ШКАЛА ПЕРЕХОДУ ВІД ЛІНГВІСТИЧНИХ ОЦІНОК ДО КІЛЬКІСНИХ ОЦІНОК Якісний показник

у1

у2

у H~

~ tr

Лінгвістичне значення показника eh

низький допустимий високий низький середній високий … … … неефективний помірно ефективний високо ефективний 32

~

Шкала оцінювання  hp

0–3 3–7 7–10 0–4 4–7 7–10 … … … 0–2 2–6 6–10


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

 оцінка рівня компетентності експертів αр, p  1,  max ; ~  оцінка альтернатив і визначення їх корисності ~h , h  1,H (в якості оцінюваних альтернатив виступають соціальні показники діяльності районів області, для яких має бути визначена індивідуальна суб’єктивна оцінка, яка дає можливість визначати важливість кожної із альтернатив при оцінюванні рівня ефективності соціальної політики);  визначення ступеня узгодженості оцінок об’єктів експертизи

~ K ht , h  1,H ;

 аналіз отриманих результатів експертизи. Зазначимо, що на розмір експертної групи впливає велика кількість факторів та обставин, зокрема ступінь актуальності, складність і багатогранність проблеми, яку необхідно вирішити. Мінімально-необхідна кількість експертів розраховується за формулою [5]:

 max=0,5*3/+5,

(1)

де   (0;1) – можлива помилка результатів експертизи, що задається особою, яка проводить експертизу. Виходячи із значення κmax особа, яка приймає рішення, має сформувати групу експертів, оцінити рівень їх компетентності αр та визначити корисність кожної із оцінюваних альтернатив ~ h . Для обробки експертних суджень використовуємо метод групового оцінювання, який дозволяє визначити коефіцієнт компетентності експертів αр та групові оцінки якісних характеристик

~ h . При цьому компетентність експертів визначається за ступенем узгодженості їх оцінок із груповою оцінкою. На підставі су~ джень експертів формується матриця  кількісних оцінок за кожною суб’єктивною характеристикою:

 

~ ~   ~hp , h  1, H , p  1,  max , 33

(2)


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

де ~hp – оцінка за h-показником p-експертом. Процес знаходження зазначених характеристик представляє собою ітераційну процедуру. Вагові коефіцієнти компетентності експертів αр містяться у відповідному векторі-рядку, рівність компонент якого означає, що експерти на початковому етапі мають однаковий ступінь компетентності:

 0  (10 , 20 ,... 0 )  ( 1 max

, 1 max

1

 max ,...  max )

.

(3)

На основі цього вектора визначається групова оцінка якісних 

характеристик діяльності районів ~h , що являє собою корисність альтернатив, значення яких містяться у векторі-стовпці ~  h , h 1,H :  max

~ ~h 1    p ~hp , h  1, H ,   1, Z . p 1

(4)

~ H

Зазначимо, що ~ h 1  1 . h 1

Отримані значення групової оцінки використовуються для коригування коефіцієнтів компетентності, які заносяться у вектор-

рядок    1 ,  2 ,...,  max ,  1, Z , елементи  p якого розраховуються за формулою: ~ H

 p1  1   ~hp *~h , p  1,  max ,   1,Z ,  h1 ~ H  max

(5)

де     ~hp *~h 1 , що є коефіцієнтом, який водиться для 

h 1 p 1

  max  нормування ваг компетентностей експертів    p  1 .  p 1  34


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

Для розрахунку рівня компетентності експертів αр та рівня корисності альтернатив ~h застосовуємо теорему Фробеніуса– Перона, згідно якої за умови, що τ→∞, вектор-стовпець з оцінками ~ ~ корисності альтернатив  h , h  1, H , та вектор-рядок з оцінками рівня компетентності експертів  p , p  1,  max , збігаються до ~ ~ ~ ~ власних векторів матриць   T і T   , відповідно [12]. На наступному етапі аналізу, який проводиться експертною групою, формується матриця кількісних експертних оцінок за ~ соціальними показниками G={g htr }; t=1,T ;h=1,H ;r=1,R . Кожен p-ий експерт у період часу t виставляє кожному r-му району за tr h-м показником деяке число  hp , яке відповідає кількісному значенню лінгвістичної оцінки, шкалу якої наведено в табл. 2. Таблиця 2 КІЛЬКІСНА ШКАЛА ЛІНГВІСТИЧНОЇ ОЦІНКИ Якісний показник

у1

у2

у H~

Лінгвістичне значення показника

низький допустимий високий низький середній високий … … … неефективний помірно ефективний високо ефективний

35

Шкала оцінювання

0–0,3 0,3–0,7 0,7–1 0–0,2 0,2–0,6 0,6–1 … … … 0–0,4 0,4–0,7 0,7–1

tr  hp


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Підсумкова кількісна оцінка соціальних показників розвитку у кожен t-ий період часу за h-м показником r-го району розраховується за формулою:  max ~ tr ~ g htr   ( hp *ψ h* p ), t  1,T , h  1,H , r  1,R , p 1

(6)

tr де  hp – оцінка r-го району p-м експертом за h-м показником у

t-ий період часу;

ψ~ h – оцінка корисності h-ої альтернативи; αр – оцінка компетентності р-го експерта. tr

Для того, щоб упевнитись у достовірності оцінок g h кількісно оцінимо ступінь узгодженості думок експертів, розрахувавши для кожного h-го показника значення коефіцієнта конкордації [5]: K ht 

12*d ht ~ ~ 3 ~ ;t  1,T ,h  1,H , 2  max* H  H

(7)

R R  max tr 2 ~ ~ де d ht   d htr   (  rhp  0,5 *  max * ( H  1)) 2 ;t  1,T , h  1, H ; r 1

r 1 p 2

κmax – кількість експертів; ~ H – кількість властивостей, які розглядаються; R – кількість районів регіону; T – кількість періодів часу, за які аналізується статистика за районами; tr – місце, яке зайняв r-ий район серед інших районів у ранrhp жуванні p-м експертом за h-м показником у період часу t;

d htr – відхилення суми рангів по r-ому району за h-м показни-

~ ком від середнього арифметичного сум рангів за H показниками у t-ий період. 36


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

Слід зазначити, що K ht  [0;1] . Якщо K ht  0 , то це свідчить про абсолютну протилежність оцінок експертів, а якщо K ht  1 – повне співпадіння ранжувань. Достовірність оцінювання вважається адекватною, якщо K ht  0,7 . Соціально-економічна ситуація, яка притаманна регіону, характеризується певними комбінаціями параметрів розвитку кожного району, які входять до складу області. На зростання рівня розвитку районів впливають як фінансово-економічні, так і соціальні показники. Більше того, соціальні характеристики вже давно виступають центральними індикаторами, які визначають збалансований розвиток будь-якого регіону. Однією з якісних складових рівня життя населення, яка є найскладнішою категорією у соціальній теорії, є показник ефективності проведення соціальної політики в районах області. Тож наступний етап запропонованого методологічного підходу до оцінювання внутрішньорегіональної диференціації полягає у знаходженні інтегрального показника рівня ефективності проведення соціальної політики  tr , t=1,T ;r=1,R , на засадах інструментарію нечіткого моделювання. Необхідно сформувати двовимірну матрицю U  { tr }; t=1,T ; r=1,R , яка отримується шляхом обробки тривимірної матриці ~ G={g htr }; t=1,T ;h=1,H ;r=1,R , що містить кількісні оцінки тих

якісних показників соціального розвитку, за якими було оцінено окремий район для кожного t-го періоду часу. Процес нечіткого моделювання для знаходження інтегрального показника рівня ефективності проведення соціальної політики  tr , t=1,T ;r=1,R , можна представити такими етапами [13]: — формування вхідних факторів Y  ( y1 , y2 ,..., y H~ ) і вибір якісної результуючої змінної ESCtr, t=1,T ;r=1,R , що відповідає кількісному показнику  tr ; — процес фаззифікації (введення нечіткості) – встановлення відповідності між конкретним значенням вхідної змінної системи 37


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

нечіткого висловлювання і значенням її функції належності до кожної нечіткої множини, що описується відповідним лінгвістичним термом; — формування нечіткої бази знань – правил, на основі яких формується нечіткий логічний висновок стосовно ефективності рівня соціальної політики за районами; — проведення модельних експериментів та уточнення параметрів моделі; — формулювання висновків і рекомендацій. Як зазначалося, вхідними даними для отримання інтегральної оцінки розвитку соціальної політики районів  tr , t=1,T ;r=1,R , визначеної для Т періодів часу, є матриця G  {g htr } , яка складається з елементів g htr , t=1,T;h=1,H~;r=1,R , що визначають підсумкову експертну оцінку r-го району за h-м показником. Прийняття рішення щодо визначення рівня ефективності соціальної політики здійснюється відповідно до алгоритму Мамдані [14]. Крок 1. Вектор фіксованих значень вхідних змінних визначається вектором Y  ( y1 , y2 ,..., yH~ ) , який містить у собі якісні показники для оцінки рівня ефективності соціальної політики. Крок 2. Скласти нечітку базу знань у вигляді сукупності не чітких правил типу “ЯКЩО — ТОДІ”, що визначають взаємозв’язок між вхідними змінними Y  ( y1 , y2 ,..., yH~ ) та результуючою змінною ESCtr, t=1,T ;r=1,R , моделі. На основі цієї бази виводиться система нечітких логічних рівнянь типу Мамдані для всіх варіантів вихідної змінної, що враховувала б усі терми з ~ множини Wh  {w1h , wh2 ,...,whfh }, h  1, H , де f h  кількість термів у ~

множині Wh вхідної змінної yh , h  1, H . Вигляд вирішальних правил для оцінки рівня ефективності проведення соціальної політики у загальному вигляді представлено у табл. 3, в якій whdfd – значення лінгвістичного терму вхід38


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

~

ної змінної yh, h  1, H , за fd правилом, що відповідає d-му терму результуючої змінної, а  df – вага правила прийняття рішення. d Таблиця 3 ЗАГАЛЬНИЙ ВИГЛЯД НЕЧІТКОЇ БАЗИ ЗНАНЬ Вага правила

Вхідні змінні

№ вхідної комбінації

y H~

~ w11 H

11

wh 1

1f

w1H~f1

 1f1

w2D1

whD1

wHD~ 1

1D

w1Df D

w2Df D

whDf D

wHDf ~ D

 DfD

у1

у2

11

w111

w11 2

w11 h

1 f1

w11 f1

w12 f1

D1

w1D1

Df D

yh

Вихідна змінна

ESC

v1

vD

Нечітка база знань, яка побудована, спираючись на знання експертів, ставить у відповідність вектору вхідних змінних одне з можливих значень vd, d  1, D , за принципом “ЯКЩО — ТОДІ”, тобто: ЯКЩО

y

1

(з вагою 11 ) АБО

y

1

~  w11  w111 ТА y 2  w11 ~ 2 ТА… ТА y H H

~  w12  w112 ТА y 2  w12 ~ 2 ТА … ТА y H H

(з вагою 12 ) 39


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

АБО АБО

y

1 f1 1  w1

 ТА y

2

2017, № 6

 w12 f1 ТА … ТА y H~  w1~f1 H

(з вагою 1f1 ), ТОДІ ESC  v1 .

y

ЯКЩО

1

 w1D1 ТА y 2  w2D1 ТА… ТА y H~  wHD~1

(з вагою 1D ) АБО … Df АБО y1  w1Df D ТА y2  w2Df D ТА … ТА y H~  wH~ D

(з вагою  ), ТОДІ ESC  vD .

D fD

(8)

Базу правил прийняття рішень і систему нечітких логічних рівнянь у компактній формі можна записати як:

 vd

~

fd 

dl H  y1 , y 2 ,..., y H~   l1ld h1  wh  y h  , d  1, D.    

(9)

Після проведення операції дефаззифікації (перетворення нечіткої множини у чітке число) знаходиться кількісна оцінка результуючої змінної ESCtr*, яка відповідає заданому вхідному вектору Y [11]. У результаті обробки отриманих експертних оцінок якісних показників за допомогою побудованої нечіткої моделі, для кожного r-го району в період часу t визначається числове значення інтегрального показника рівня ефективності соціальної політики

 tr , утворюючи таким чином загальну для регіону матрицю U  { tr }; t=1,T;r=1,R .

Крок 3. Відповідно до вектора вхідних змінних tr Y  y1 , y2 ,..., yH~ і результуючого показника ESC , t=1,T ; r=1,R ,

40


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

задається вигляд функції належності  vd ( y1 , y 2 ,..., y ~ ) нечітких H

термів V  {vd },d  1, D . Для опису всіх лінгвістичних термів як вхідних, так і результуючої змінних пропонується застосовувати квазідзвоноподібні функції належності. Зокрема, аналітичний вигляд функції належності результуючої змінної ESCtr, t=1,T ;r=1,R , задається співвідношенням:  vd (Y ) 

1  Y  bvd 1   cv d 

   

2

,

(10 )

де  vd (Y ) – належність змінної Y до відповідного терму

V  {vd },d  1, D ;

c vd – коефіцієнт концентрації-розтягування квазідзвоноподібної функції належності; bvd – координата максимуму функції належності. Для конкретизації виду цієї функції необхідно задати орієнтовні межі змін усіх нечітких множин кожного з показників yh, ~ h  1, H , відповідно до їх нормативних значень. Таким чином встановлюються рівні показників, які будуть відповідати своїм лінгвістичним термам. Параметри квазідзвоноподібних функцій належності для вхідних змінних, які були застосовані в дослідженні, представлено в табл. 4. Зауважимо, що чим більше значення коефіцієнту концентрації-розтягування c vd , тим пологіший вигляд має функція належності. Низьке значення коефіцієнта концентрації-розтягування акцентує увагу на невеликому околі координати максимуму, що притаманне вхідним змінним з невеликим розмахом [15].

41


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Таблиця 4 ПАРАМЕТРИ КВАЗІДЗВОНОПОДІБНИХ ФУНКЦІЙ НАЛЕЖНОСТІ ВХІДНИХ ЗМІННИХ Вхідна змінна

Коефіцієнт концентрації-

Лінгвістичне значення показника

у1

у2

розтягування функції

c vd

Координата максимуму функції

низький

0,7

0

допустимий

0,7

1

високий

0,7

4

низький

0,4

0

середній

0,3

0,3

високий

0,3

0,6

кризовий

1

2

передкризовий

1

6

задовільний

4

9

… … …

… … …

… … …

неефективний

0,8

0

у H~

помірно ефективний

1

2

високо ефективний

1

4

у3

bvd

Крок 4. Застосовуючи логічні рівняння обчислюються значення функцій належності  vd ( y1 , y 2 ,..., y ~ ) вектора Y  ( y1 , y 2 ,..., y ~ ) для H H

всіх значень vd V,d  1, D , вихідної змінної ESCtr, t=1,T ;r=1,R . Крок 5. Значення функції належності  vd ( y1 , y 2 ,..., y ~ ) для H

кожного лінгвістичного терму v d , d  1, D , результуючої змінної ESCtr, t=1,T ;r=1,R , моделі у кожний t-ий період часу для кожного r-го району розраховується таким чином:

ESC tr 

arg

 



max  vd y1 , y 2 ,..., y ~ , t  1,T , r  1,R .

v1 ,v2 ,..., vd  d 1, D

H

42

(11)


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

Розглянемо процес формування бази знань, для визначення «ефективного рівня» проведення соціальної політики. Спочатку для оцінки всіх якісних показників вхідних yh, ~ tr h  1, H , і результуючої ESC , t=1,T ;r=1,R , змінних сформуємо власні множини можливих лінгвістичних змінних. Так для вхідної змінної у1, яка відповідає рівню екологічного забруднення, застосуємо шкалу якісних термів із терм-множини W1  w11 , w12 ,...,w1f1  Н , Д , В: Н – кризовий рівень показника, Д – передкризовий і В – допустимий. Аналогічним чином формуються терм-множини для інших якісних показників. Для оцінки результуючої змінної ESCtr, t=1,T ;r=1,R , будемо використовувати терми із множини vd V  ЕФ, ПЕ, НЕ: ЕФ – ефективний рівень, ПЕ – помірно ефективний рівень, НЕ – неефективний рівень. Після визначення лінгвістичних змінних будуємо функції належності вхідних і результуючої змінної, які мають квазідзвоноподібний вигляд. Експертна система на базі нечітких правил для результуючої змінної ESCtr, яка ставить у відповідність їй терм ЕФ (ефективний рівень), наведена у табл. 5.

Таблиця 5 НЕЧІТКА БАЗА ЗНАНЬ ДЛЯ ВИЗНАЧЕННЯ «ЕФЕКТИВНОГО РІВНЯ» СОЦІАЛЬНОЇ ПОЛІТИКИ

№ вхідної комбінації

Вхідні змінні

Вага правила

Вихідна змінна

ESC

у1

у2

y H~

11

В

Д

Д

1ЕФ

12

Д

Д

В

 2ЕФ

1 f1

В

Н

В

 ЕФ f1

43

ЕФ


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Правила прийняття рішень для визначення «ефективного рівня» соціальної політики в аналітичній формі набувають вигляд:

 ЕФ ( y1 ,..., yH~ )  1ЕФ  В ( у1 )   Д ( у2 )  ...   Д ( у Н~ )

 

 ) ,

 2ЕФ  Д ( у1 )   Д ( у2 )  ...   В ( у Н~ )  ...    ЕФ f1

В

( у1 )   Н ( y2 )  ...   B ( y H~

(12)

де  vd ( y1 ,..., y H~ ) – функція належності вектора вхідних змінних ( y1 ,..., y H~ ) лінгвістичному терму v d V,d  1, D , результуючої змінної; vd – значення вихідної змінної ESCtr, t=1,T ;r=1,R , з терммножини {ЕФ, ПЕ, НЕ};  df – ваги правил (числа з діапазону [0,1], що характеризують d

ступінь упевненості експерта в істинності конкретного правила); fd – номер правила, що відповідає d-му терму результуючої змінної ESCtr, t=1,T ;r=1,R ; D – кількість лінгвістичних значень результуючої змінної ESCtr [16]. Згідно сформульованого методологічного підходу далі постає задача об’єднання районів за однорідними групами. Для адекватного аналізу та оцінки соціально-економічного потенціалу районів у контексті регіону необхідно, щоб фактори, які враховуються під час кластеризації, охоплювали різні групи показників, такі як фінансові, соціальні, демографічні, освітні та tr інші. Тому матрицю E  eˆ1tr , ..., eˆH ,  tr , t  1, T ; r  1, R , для групування районів було сформовано з урахуванням кількісних і якісних показників. Для вирішення цієї задачі пропонується застосовувати самоорганізуючі Карти Кохонена. На відміну від класичного кластерного аналізу, який дозволяє лише згрупувати однорідні об’єкти, карти Кохонена на додачу до цього також надають можливість візуалізувати результати. Також карти Кохонена не потребують

44


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

наявності апріорної інформації про параметри кластерів. Зокрема, формування «еталонів класів» у процесі навчання такої нейронної мережі відбувається на основі вхідної інформації. Топологія самоорганізуючих карт Кохонена представлена нейронною мережею, яка складається з нейронів вхідного шару, що виконують розподільчу функцію, і обчислювального шару, нейрони якого розташовуються на площині – шар Кохонена. Карта самоорганізації навчається «без учителя» – це такий вид оптимізаційної моделі, при якому значення вихідної змінної заздалегідь невідомі і нейромережа вчиться виявляти приховані закономірності у масиві вхідних даних. Мета функціонування мережі полягає у здійсненні топологічного упорядкування вхідних сигналів, за якого «сусіднім» вхідним образам знаходяться відповідні сусідні нейронні елементи з обчислювального шару. Для розв’язання цього завдання формується область тяжіння нейрона-переможця, у якій всі нейрони, які потрапляють у цю область, змінюють свої вагові коефіцієнти і тим самим стають більш подібними до поданого вектора даних і, відповідно, нейрона-переможця [17]. Перед проведенням навчання нейронної мережі здійснюється ініціалізація карти, тобто відбувається процедура привласнення невеликих випадкових чисел усім параметрам нейронів. На кожному кроці навчання відбувається порівняння векторавхідних значень з векторами усіх нейронів. У процесі цього відбувається «змагання» між нейронами з метою визначення нейрона-переможця, який має бути найближчим по значенню до вхідного вектора даних. У результаті такого ітеративного процесу на карті Кохонена формуються кластери із векторів з однорідними показниками. ~ Нехай ~s – номер ітерації, ~ s  0, S (на початковому етапі номер ітерації 0). У процесі самоорганізації карти Кохонена виконуються такі кроки: - вибираємо випадковий вектор  tr  eˆ1tr , ..., eˆHtr ,  tr , t  1, T ; r  1, R , із множини вхідних значень E  { tr } ; - знаходимо нейрон, який є найближчим за евклідовою відстанню до вхідного вектора ɛtr:

45


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

~~ (~ ~~ (~ ~~ (~  tr (~ s)n   tr (~ s)n s ) n s), z s) l l

2017, № 6

(13)

~ ~~ (~ де n – вектор ваг нейрона-переможця N ~z ; z s) ~ ~~ (~ n s ) – вектор ваг N ~l -го вузла на карті. l Якщо умові (13) задовольняють кілька нейронів, нейрон-переможець обирається з них випадковим чином; - корегуємо вектори ваг нейронів. З кожною ітерацією здійснюється коригування ваг нейрона-переможця та його сусідів за формулою:

~~ (~ ~~ (~ ~~ (~ n s  1)  n s )   (~ s ) * h~z ~l (~ s )( tr (~ s)n s )) , l l l

(14)

s  1 – навчальний співмножник, монотонно спадаючий де 0   ~ з кожною наступною ітерацією; h~z ~l ~ s  – міра сусідства, яка визначає «ступінь сусідства» вуз~ ~ лів N ~z і N ~l . На практиці для її реалізації зазвичай застосовують функцію Гауса:  r~  r~ 2   z  l (15) h~z ~l (~ s )  exp  , 2 ~  2 ( s )    ~ ~ де r~z , r~l – координати нейронів N на карті; ~ z і N~ l ~  (s ) – співмножник, який монотонно спадає по мірі навчання, зменшуючи кількість сусідів нейрона-переможця з кожною наступною ітерацією. s  і їх характер спадання задаютьПараметри функції  ~s  ,  ~ ся аналітиком. На «навчену» мережу подають новий вектор даних, що містить фінансово-соціальні показники певного району, визначають нейрон-переможець і виявляють кластер, відповідний цьому нейрону. Можемо зробити висновок, що новий вектор даних має властивості, які притаманні всім векторам (районам), що потра46


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

пили в даний кластер. Відповідність між об’єктами та нейронами більм-менш зберігають топологію простору вхідних даних. Класи, які отримуються після кластеризації, є топологічно впорядкованими та можуть бути легко перегрупованими у разі необхідності [18]. Апробація запропонованого підходу була проведена на даних щодо розвитку районів Дніпропетровської області протягом десяти років (2006–2015 рр.), тобто T = 10. Аналіз діяльності районів Дніпропетровського регіону проводився за кількісними та якісними показниками розвитку. Зокрема, було визначено п’ять ~ найбільш значущих якісних показників ( H =5): - рівень екологічного забруднення y1; - рівень розвитку системи охорони здоров’я y2; - рівень розвитку культури y3; - рівень соціальної безпеки y4; - рівень якості послуг у сфері соціального обслуговування y5. Далі формується група експертів, яка надає оцінку кожній із зазначених якісних характеристик. Розрахунок мінімальнонеобхідної кількості експертів за формулою (1), прийнявши ϕ = 0,15, дозволив отримати значення  max  12,5 . Тому було сформовано групу експертів з 15 осіб. Рівень компетентності кожного з них і корисність альтернатив було знайдено, застосовуючи метод групового оцінювання. За формулами (2)–(5) були розраховані коефіцієнти компетентності експертів αр, p  1,15 , та оцінки корисності кожного із якісних показників ~h , h  1, 5 , для періоду t = 10. Значення оцінок компетентності експертів зведено до табл. 6. Таблиця 6 ОЦІНКИ КОМПЕТЕНТНОСТІ ЕКСПЕРТІВ № експерта (р)

Оцінка компетентності (  p )

1 2 3 4

0,072366 0,072958 0,068298 0,068841

47


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Закінчення табл. 6 5 6 7 8 9 10 11 12 13 14 15

0,05872 0,062992 0,07635 0,084441 0,061062 0,072755 0,062415 0,065135 0,049205 0,067201 0,057261

~ Оцінки корисності якісних показників розвитку ~h , h  1, H , за формулою (4) наведено у табл. 7.

Таблиця 7 ОЦІНКИ ЯКІСНИХ ПОКАЗНИКІВ №

Назва якісного показника

~h

1.

Рівень екологічного забруднення

0,2127

2.

Рівень розвитку системи охорони здоров’я

0,2000

3.

Рівень розвитку культури

0,1958

4.

Рівень соціальної безпеки

0,2127

5.

Рівень якості послуг у сфері соціального обслуговування

0,1788

Наступний етап, який проводиться експертною групою, полягає у виставленні кожним експертом p у період часу t кожному tr району r за h-м показником у відповідність деякого числа  hp , яке знаходиться у проміжку від 0 до 1. У табл. 8 наведено матрицю, tr елементи якої  hp характеризують рівень екологічного забруднення (h = 1) у період часу t = 10. 48


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

Таблиця 8 ОЦІНКА ЕКСПЕРТІВ РІВНЯ ЕКОЛОГІЧНОГО ЗАБРУДНЕННЯ Номер експерта

1

2

3

4

5

6

13

Апостолівський

0,56

0,6

0,78

0,81

0,6

0,73

0,73

0,73 0,56

Васильківський

0,65

0,71

0,72

0,4

0,67

0,45

0,72

0,69 0,53

Верхньодніпровський

0,7

0,65

0,61

0,55

0,6

0,49

0,62

0,54 0,49

Дніпровський

0,78

0,75

0,71

0,69

0,68

0,72

0,61

0,55

Криворізький

0,88

0,81

0,8

0,76

0,83

0,65

0,86

0,67 0,72

Криничанський

0,86

0,8

0,54

0,67

0,62

0,72

0,73

0,8

0,57

Магдалинівський

0,67

0,62

0,72

0,88

0,81

0,8

0,55

0,6

0,49

Межівський

0,62

0,54

0,49

0,88

0,81

0,76

0,7

0,55

0,6

Нікопольський

0,61

0,55

0,6

0,88

0,81

0,7

0,6

0,49 0,88

Новомосковський

0,86

0,67

0,72

0,69

0,68

0,69

0,72

0,76 0,76

Павлоградський

0,73

0,8

0,57

0,64

0,46

0,78

0,56

0,78

Петриківський

0,55

0,6

0,49

0,6

0,49

0,82

0,8

0,57 0,69

Петропавлівський

0,88

0,81

0,7

0,62

0,54

0,49

0,64

0,46 0,78

Покровський

0,88

0,81

0,6

0,61

0,55

0,6

0,6

0,49 0,82

П’ятихатський

0,69

0,68

0,73

0,8

0,57

0,68

0,62

0,54 0,49

Синельниківський

0,7

0,55

0,6

0,7

0,72

0,76

0,61

0,55

Солонянський

0,6

0,49

0,88

0,69

0,56

0,78

0,86

0,67 0,72

Софіївський

0,6

0,7

0,72

0,73

0,8

0,57

0,73

0,8

0,57

Томаківський

0,88

0,69

0,56

0,71

0,64

0,46

0,55

0,6

0,49

Царичанський

0,88

0,81

0,8

0,55

0,6

0,49

0,88

0,81

0,8

Широківський

0,78

0,7

0,55

0,6

0,49

0,81

0,88

0,81

0,8

Юр’ївський

0,55

0,6

0,49

0,88

0,81

0,8

0,69

0,68 0,72

Назва району

14

15

0,6

0,7

0,6

За формулою (6) була визначена підсумкова кількісна оцінка якісних характеристик рівня розвитку соціальної політики по ра49


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

йонам Дніпропетровської області для кожного t-го періоду, значення яких для останнього періоду (t = 10) наведено у табл. 9. Таблиця 9 ЕКСПЕРТНІ ОЦІНКИ ЯКІСНИХ ХАРАКТЕРИСТИК РІВНЯ РОЗВИТКУ СОЦІАЛЬНОЇ ПОЛІТИКИ РАЙОНІВ ДНІПРОПЕТРОВСЬКОЇ ОБЛАСТІ ЗА 2015 РІК Назва альтернативи Назва району

Рівень Рівень розвитку Рівень екологічного системи охорони розвитку забруднення здоров’я культури

Рівень соціальної безпеки

Рівень якості послуг у соціальному обслуговуванні

Апостолівський

0,700

0,348

0,468

0,469

0,41

Васильківський

0,808

0,598

0,328

0,511

0,483

Верхньодніпровський

0,750

0,496

0,190

0,712

0,583

Дніпровський

0,180

0,489

0,870

0,237

0,402

Криворізький

0,190

0,418

0,760

0,217

0,387

Криничанський

0,664

0,354

0,467

0,593

0,492

Магдалинівський

0,650

0,320

0,547

0,643

0,524

Межівський

0,630

0,360

0,360

0,607

0,289

Нікопольський

0,178

0,398

0,409

0,189

0,501

Новомосковський

0,637

0,598

0,453

0,591

0,542

Павлоградський

0,200

0,461

0,796

0,26

0,71

Петриківський

0,864

0,465

0,493

0,805

0,672

Петропавлівський

0,769

0,567

0,234

0,589

0,591

Покровський

0,470

0,754

0,234

0,432

0,481

П’ятихатський

0,624

0,564

0,567

0,348

0,375

Синельниківський

0,150

0,414

0,568

0,391

0,59

Солонянський

0,789

0,440

0,330

0,363

0,491

Софіївський

0,876

0,567

0,345

0,543

0,631

Томаківський

0,416

0,278

0,354

0,389

0,23

Царичанський

0,670

0,654

0,458

0,723

0,681

Широківський

0,754

0,453

0,675

0,613

0,39

Юр’ївський

0,686

0,430

0,234

0,563

0,2

50


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

За формулою (7) було розраховано коефіцієнт конкордації, який визначає ступінь узгодженості оцінок експертів, значення якого K ht  0,82 свідчить про те, що достовірність оцінювання є адекватною. За допомогою fuzzyTECH 6.02, який спеціалізується на нечіткому моделюванні, була сформована єдина система нечіткого виводу. Для кожної вхідної змінної були визначені такі терммножини, які задаються відповідними функціями належності: • рівень екологічного забруднення: ecology={negative; zero; positive}; • рівень розвитку системи охорони здоров’я: social={small; medium; large}; • рівень розвитку культури: culture={low; medium; high}; • рівень соціальної безпеки: security={low; medium; high}; • рівень якості послуг у сфері соціального обслуговування: service={decrease; steady; increase}. Згідно з послідовністю етапів оцінки та аналізу (8) – (12) застосовуємо систему нечіткого виводу. Для отримання кількісного значення δtr вихідної змінної ESCtr, якій відповідає лінгвістично заданий терм з множини: ESCtr ={effective, medium-effective, noneffective}, що вказує на ефективність проведення соціальної політики, задаються конкретні значення вхідних показників (рівень екологічного забруднення, рівень розвитку системи охорони здоров’я, рівень розвитку культури, рівень соціальної безпеки та рівень якості послуг у сфері соціального обслуговування) і застосовується система нечіткого висновку. Кількісна шкала оцінювання ефективності соціальної політики δtr має вигляд: від 0 до 0,35 – соціальна політика неефективна, від 0,35 до 0,6 – помірно ефективна, від 0,6 до 1 – соціальна політика ефективна. На рис. 2 – 4 наведено функції належності та відкладені на них ~ реальні значення вхідних змінних y h , h  1, H , та результуючої змінної ESCtr для трьох районів Дніпропетровської області. Для наглядного прикладу було обрано райони, які входять до різних груп розвитку – це Петриківський, Синельниківський і Покровський. Отримане за допомогою правил нечіткого висновку значення ефективності проведення соціальної політики для Петриківського 51


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

району наведено на рис. 2 і дорівнює 0,7148, отже соціальну політику можна вважати ефективною. Хоча даний район не є лідером за економічними показниками, проте він займає одне з перших місць серед районів за рівнем життя населення. Перш за все це пов’язане з відсутністю промислових об’єктів на території району, що позитивно впливає на екологію та соціально-демографічні процеси. Кількість бібліотек, освітніх закладів і медичних установ створюють гарні передумови для розвитку культурної освіченості населення даного району і підвищення рівня якості послуг у сфері соціального обслуговування.

ecology = 0,864 social = 0,465 culture = 0,493 security = 0,493 service = 0,672

ESCtr = 0,7148

Рис. 2. Функції належності для якісних характеристик Петриківського району за 2015 рік

Отримане на основі правил нечіткого висновку значення ефективності проведення соціальної політики для Синельниківського району наведено на рис. 3 і дорівнює 0,2736, що вказує на неефективність соціальної політики. Дані результати свідчать про те, що незважаючи на лідерство Синельниківського району за економічними показниками, проблемам екології та ситуації у сфері охорони здоров’я тут приділяють недостатньо уваги. Запроваджені ініціативи або не виконуються, або не є ефективними. Стає зрозумілим, що такі значення за показниками рівня життя є загрозливими і тому потребують посиленого регулювання з боку органів державної влади. 52


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

ecology = 0,15 social = 0,414 culture = 0,568 ESCtr = 0,2736 security = 0,391 service = 0,55

Рис. 3. Функції належності для якісних характеристик Синельниківського району за 2015 рік

Процедуру розрахунку ефективності проведення соціальної політики для Покровського району графічно відображено на рис. 4, рівень якої складає 0,4899. Отже, соціальну політику можна вважати помірно ефективною. Даний район входить до класу середньо розвинених районів за доходними показниками та за рівнем соціальної політики. Це свідчить про стабільний і рівномірний розвиток району в обох напрямах.

ecology = 0,47 social = 0,71 culture = 0,234 security = 0,432 service = 0,481

ESCtr = 0,4899

Рис. 4. Функції належності для якісних характеристик Покровського району за 2015 рік 53


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Аналогічні розрахунки проведені за допомогою нечіткого моделювання для інших районів Дніпропетровської області з 2006 по 2015 роки, які дозволили порівняти райони між собою та зробити висновок про ефективність проведення соціальної політики у регіоні в цілому. Результати розрахунків для 2015 року наведено на рис. 5, за яким можна зробити висновок, що в більшості районів у цьому році рівень соціальної політики був помірноефективним.

Рис. 5. Інтегральний показник рівня ефективності соціальної політики в районах Дніпропетровської області за 2015 рік

Отриманий інтегральний показник рівня розвитку соціальної політики  tr , заноситься до матриці E ={ehtr } за правилом

tr E  eˆ1tr , ..., eˆH ,  tr , t  1, T ; r  1, R .

Таким чином, до матриці інформативних кількісних показників E ={ehtr }; t=1,T;h=1,Hˆ ;r=1,R;Hˆ  H  1 , де Hˆ = 22 – кількість показників (сумарно вхідних і вихідного), T = 10 – кількість пері54


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

одів, що оцінюються, R = 22 – кількість районів Дніпропетровської області, входять такі групи показників: демографічно-міграційні: e1tr – населення r-го району Дніпропетровської області; e 2tr – кількість народжених у r-му районі;

e3tr – кількість померлих у r-му районі;

e 4tr – зовнішня міграція в r-му районі; e5tr – внутрішня міграція в r-му районі;

e6tr – міське населення в r-му районі; e7tr – сільське населення в r-му районі;

економічні: e8tr – іноземні інвестиції в r-ий район; e9tr – експорт із r-го району;

e10tr – імпорт у r-ий район; e11tr – валовий районний продукт у r-му районі;

e12tr – доходи населення в r-му районі; e13tr – витрати населення в r-му районі;

e14tr – кількість безробітних у r-му районі; e15tr – кількість зайнятих у r-му районі;

промислові: e16tr – добувна промисловість в r-му районі; e17tr – переробна промисловість в r-му районі; e18tr – виробництво та розподіл електроенергії, газу та води в r-му

районі; аграрні: e19tr – рослинництво в r-му районі; tr – тваринництво в r-му районі; e 20

55


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

tr – харчова промисловість у r-му районі; e 21

соціальний: tr =  tr – інтегральний показник рівня ефективності соціальe 22

ної політики в r-му районі. Для проведення кластеризації районів за формулами (13) – (15) було застосовано програмний пакет ViscoverySOMine6, за допомогою якого для періоду часу Т = 10 років (з 2006 року по 2015 рік) з матриці вхідних даних сформовано карту, яку для кращої візуалізації та аналізу було розбито на Т карт. Проведемо спочатку кластерізацію районів для отримання однорідних груп за фінансово-економічними показниками (тобто tr без урахування e 22 – інтегрального показника рівня ефективності соціальної політики). З цією метою виділимо три класи районів: високо розвинені, середньо розвинені та нерозвинені. Розглянемо на рис. 6, як змінювалось на картах Кохонена положення районів протягом 2006–2015 рр.

а) 2006 рік

б) 2007 рік

в) 2008 рік

д) 2010 рік

е) 2011 рік

ж) 2012 рік

56

г) 2009 рік

з) 2013 рік


Оцінювання внутрішньорегіональної диференції на засадах…

к) 2014 рік

Т. І. Єфанова

л) 2015 рік

Рис. 6. Карти Кохонена за фінансово-економічними показниками районів Дніпропетровської області

На рис. 6 різними відтінками сірого кольору виділені відповідні класи районів: - клас S1 (нерозвинені райони); - клас S2 (середньо розвинені райони); - клас S3 (високо розвинені райони). На рис. 7 наведено процентне співвідношення представництва районів між класами S1, S2, S3.

Рис. 7. Процентне співвідношення між класами S1, S2, S3 57


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Результати візуального аналізу фінансово-економічних показників, які наведено на рис. 7, свідчать, що Дніпропетровський регіон відноситься до категорії областей, які вразливі до впливу глобальної кризи. Так, криза 2008 року в Дніпропетровській області набула обвального характеру і падіння економіки було глибоким, що чітко демонструє порівняння відсоткового співвідношення між найбільш розвиненими та нерозвиненими районами. Протягом 2008–2010 рр. процент нерозвинених районів становив 77,27 %, тоді як у докризовому 2007 році цей процент складав лише 54,55 %, а у 2006 році і того менше – 45,45 %. Це перш за все пов’язано з тим, що Дніпропетровський регіон має експортну орієнтацію і саме зростаючий попит світових ринків на продукцію, яка виробляється в області підтримував стійкість розвитку серед районів. Під час глобальної економічної кризи 2008 року найглибший спад спостерігався саме в експортних галузях української економіки, тому не дивно, що саме в цей період вразливість економіки Дніпропетровського краю була найбільшою. Починаючи з 2011 року процент нерозвинених районів скоротився до 59,09 %, порівнюючи з кризовим періодом, а у 2013 році досягнув свого мінімуму 36,36 %. Однак, політична ситуація, яка склалася в країні у 2014–2015 рр., стала підґрунтям до зниження економічного потенціалу регіону, що спричинило поетапне збільшення кількості нерозвинених районів. У 2015 році цей показник становив 45,45 %. Зауважимо, що у програмному пакеті ViscoverySOMine6 карти Кохонена будуються таким чином, що кожному району на карті відповідає певна сукупність точок (рис. 8 і 9), аналізуючи розміщення яких можна зробити висновки щодо розташування районів у динаміці, яка супроводжується зміною економічних показників. Розглянемо детальніше, як змінювалося положення Синельниківського (рис. 8) та Павлоградського (рис. 9) районів відносно інших за фінансово-економічними показниками.

58


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

Рис. 8. Карти Кохонена за фінансово-економічними показниками Синельниківського району за 2006–2015 рр.

У 2006 році Синельниківський район займав одне з центральних місць з-поміж середньо розвинених районів, але з 2007 року його позиції почали падати, так що в 2008–2009 рр. він займав останні позиції серед районів із класу S 2. Як видно з рис. 8, у ці роки район граничить з класом S 1, до якого входять нерозвинені райони (тобто, спостерігалися тенденції до зниження розвитку району за доходними показниками). Але завдяки вдало проведеним антикризовим заходам уже на початку 2011 року ситуація стабілізувалася, що стало передумовою для того, щоб район у 2012 році потрапив до класу S 3 – високо розвинених районів. У 2013 році район зайняв одне з центральних місць серед класу S2 – середньо розвинених районів, а у 2014 році знову повернувся до класу S3 – високо розвинених районів. Проте нестабільна економічна ситуація в країні стала передумовою того, що району не вдалося втримати лідируючі позиції та у 2015 році він знову опустився до класу S 2 – середньо розвинених районів.

59


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Рис. 9. Карти Кохонена за фінансово-економічними показниками Павлоградського району за 2006–2015 рр.

Павлоградський район є лідером серед хімічної галузі та спеціалізується на видобуванні коксового вугілля. Даний район робить основний внесок в український експорт серед зазначених галузей. На глибину падіння виробництва у хімічній промисловості вплинули погіршення кон’юнктури на зовнішніх ринках і різке зростання цін на імпортований газ, який є основною сировиною для галузі. Вугільна ж промисловість відноситься до традиційно збиткових галузей, які постійно підтримуються державою. Криза, яка мала наслідком зниження попиту на обидва види вугілля – коксівне й енергетичне, спричинила різке падіння обсягів виробництва у Павлоградському районі. Шахти призупиняли видобуток, склади були перевантажені вугільними запасами. Усі зазначені фактори вплинули на розташування району на карті Кохонена, що можна бачити на рис. 9 (район завжди займав центральні позиції серед усіх класів). Так, починаючи з 2006 року, він був серед лідерів у класі S2 – середньо розвинених районів, у 2007 році він посилив свої позиції і став наближатися до класу S3 – високо розвинених районів, а у 2008 році уже знаходився на границі з ним. 60


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

Але криза 2008 року віддалила район від попадання до класу S3. Для подолання кризової ситуації було запроваджено ряд заходів, які вивели б район на докризовий рівень. Серед них можна зазначити заходи зі стимулювання попиту на мінеральні добрива з боку українських сільгоспвиробників, масована закупівля добрив у державний резерв. Така масштабна підтримка забезпечила хімічній промисловості одні з найвищих серед промислових галузей темпів відновлення виробництва. Тому в 2012 році район стає лідером у класі S3 – високо розвинених районів. Аналізуючи місце району в 2013 році, можна зробити висновок, що відбулося падіння обсягів виробництва по основних галузях. Хоча у 2014 році район потрапив до класу S 3 – високо розвинених районів, але він зайняв місце, яке знаходиться на границі з класом S1 – нерозвинених районів. Це стало передумовою того, що у 2015 році він закріпився у класі S2 – середньо розвинених районів. Незважаючи на складну економічну кон’юнктуру, економіка Дніпропетровського регіону витримала і за обмеженої зовнішньої допомоги почала швидше за інші регіони самостійно виходити з кризи. Як видно з рис. 7, у 2013 році розподіл районів за класами ефективності став навіть кращим, ніж у докризовий час. Процент високо розвинених районів склав 22,73 %, а середньо розвинених – 40,91 %, тобто частка нерозвинених районів стала менше половини. Політичні та економічні негаразди 2013–2014 рр. мали негативний вплив на розподіл районів. У 2015 році процент високо розвинених районів становив лише 9,1 %, середньо розвинених – 45,45 %, нерозвинених – 45,45 %. Хоча відсоток нерозвинених районів не перевищує 50 %, однак така ситуація в регіоні свідчить про те, що в ньому відбувся спад у виробничій і фінансовій сфері. Розвиненіші райони втрачають свої позиції та наближаються до менш розвинених. Проаналізуємо, як зміниться розташування районів при враtr хуванні e 22 – інтегрального показника рівня ефективності соціальної політики. На рис. 10 наведено карти Кохонена за фінан61


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

сово-економічними та соціальними показниками розвитку з 2006 по 2015 рр.

а)2006 рік

б)2007 рік

в)2008 рік

г)2009 рік

д)2010 рік

е)2011 рік

ж)2012 рік

з)2013 рік

к)2014 рік

л)2015 рік

Рис. 10. Карти Кохонена за фінансово-соціальними показниками районів Дніпропетровської області

В результаті аналізу рис. 10 можемо прослідкувати, як змінили своє положення райони на карті Кохонена у порівнянні з розподілом за фінансово-економічними показниками (див. рис. 6). Так, ряд доходних районів, таких як Криворізький, Нікопольсь62


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

кий, Павлоградський і Синельниківський, перемістилися з верхніх класів до класу S1 – нерозвинутих районів. У свою чергу менш розвинені райони по доходним показникам, такі як Царичанський, Петриківський, Верхньодніпровський, перемістилися до класу S3 – високо розвинених районів. Це свідчить про важливість соціальної політики при формуванні стратегій розвитку регіону, врахування якої дозволить забезпечити регіону збалансоване зростання у всіх галузях. Порівняння карт Кохонена на рис. 6 і рис. 10 підтверджують факт, що соціальна політика у Дніпропетровській області перебуває у стані динамічного, але незбалансованого розвитку, що дозволяє задовольняти соціальні потреби мешканців регіону на мінімальному рівні. Так, обсяг соціальних видатків на одного жителя в регіоні є найнижчим серед великих промислових міст України, при тому, що показники економічного зростання, навпаки, займають найвищі рейтингові позиції. Усе це приводить до висновку, що першочерговим завданням для органів регіональної влади та місцевого самоврядування має бути реалізація заходів, які пов’язані з покращенням рівня та якості життя населення.

Висновки У статті розроблено методологічний підхід до оцінювання рівня ефективності соціальної політики в районах на основі як кількісних фінансово-економічних, так і якісних соціальних показників, а також проведення порівняльного аналізу районів у регіоні. Розроблений підхід базується на поєднанні різноманітних математичних інструментів аналізу характеристик діяльності регіону, зокрема карт Кохонена, теорії нечіткої логіки та експертних методів. Побудована в рамках запропонованого методологічного підходу комплексна економіко-математична модель дозволяє проаналізувати динаміку зміни регіонального простору.

63


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Апробація запропонованого методологічного підходу була проведена із застосуванням реальних даних щодо районів Дніпропетровської області з 2006–2015 рр. Отримані результати засвідчили високу адекватність запропонованого підходу та розроблених економіко-математичних моделей.

Література 1. Богуславська С. І. Соціальна політика в умовах ринкових відносин [Електронний ресурс] / С. І. Богуславська, Л. В. Потапенко // Фінансовий простір. – 2013. – № 2. – С. 106–110. – Режим доступу: http://nbuv.gov.ua/j-pdf/Fin_pr_2013_2_14.pdf. 2. Варналій З. С. Регіони України: проблеми та пріоритети соціально-економічного розвитку: монографія / З. С. Варналій, А. І. Мокій, О. Ф. Новікова, С. А. Романюк, В. І. Чужиков та ін.; за ред. З. С. Варналія. – К. : Знання України, 2005. – 498 с. 3. Захаров М. А. Региональная социальная политика в условиях административной реформы [Электронный ресурс] / М. А. Захаров // Известия ВУЗов. Поволжский регион. Общественные науки. – 2007. – № 3. – С. 24–29. – Режим доступу: https://cyberleninka.ru/article/n/ regionalnaya-sotsialnaya-politika-v-usloviyah-administrativnoy-reformy. 4. Реутов В. Є. Закономірності і парадигми регіонального розвитку [Електронний ресурс] / В. Є. Реутов // Ефективна економіка : електронне наукове фахове видання. – 2010. – № 9. – С. 118–123. – Режим доступу: http://www.economy.nayka.com.ua/?op=1&z=319. 5. Бешелев С. Д. Математико-статистические методы экспертных оценок / С. Д. Бешелев, Ф. Г. Гурвич. – М. : Статистика, 1980. – 263 с. 6. Гофман О. Г. Экспертное оценивание : учеб. пособие / О. Г. Гофман. – Воронеж : Воронеж. гос. ун-т, 1991. – 152 с. 7. Литвак Б. Г. Экспертные оценки и принятие решений / Б. Г. Литвак. – М.: Патент, 1996. – 298 с. 8. Zadeh L. Fuzzy Sets // Information and Control. – 1965. – № 8. – P. 338–353. 9. Вітлінський В. В. Математичні моделі та методи ринкової економіки: навч. посіб. / В. В. Вітлінський, О. В. Піскунова. – К.: КНЕУ, 2010.— 531 с. 10. Kovalchuk K. F. Intelligent Decision Support System // Proc. First Asian Fuzzy Systems Symposium (Singapore, November 23—26). – 1993. – P. 510–516. 64


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

11. Матвійчук А. В. Штучний інтелект в економіці: нейронні мережі нечітка логіка: монографія / А. В. Матвійчук. – К.: КНЕУ, 2011. — 439 с. 12. Тинякова В. И. Математичские методы обработки экспертной информации / В. И. Тинякова. – Воронеж : Изд-во Воронеж. гос. ун-т, 2006. — 68 c. 13. Ольховська О. Л. Економіко-математична модель діагностики банкрутства страхової компанії на основі нечіткої логіки / О. Л. Ольховська // Моделювання та інформаційні системи в економіці. — К.: КНЕУ, 2010. — № 81. — С. 59–74. 14. Mamdani E. H. Advances in the Linguistic Synthesis of Fuzzy Controller / E. H. Mamdani // International Journal Man-Machine Studies. — 1976. — Vol. 8. — P. 669—678. 15. Шарапов О. Д. Оцінювання можливого банкрутства на основі індикаторів фінансового стану кампаній з використанням нейронних мереж зустрічного розповсюдження / О. Д. Шарапов, Д. Б. Кайданович // Нейро-нечіткі технології моделювання в економіці. — 2012. — № 1. — С. 207–227. 16. Shtovba S. Prediction of Competitive Position of Brand Product by Fuzzy Knowledge Base / S. Shtovba, O. Shtovba // Journal of Automation and Information Sciences. — 2006. — № 8. — P. 69–80. 17. Максишко Н. К. Оцінювання системних характеристик економічної динаміки на базі результатів комплексного фрактального аналізу / Н. К. Максишко // Вісник Запорізького національного університету: зб. наук. праць. Економічні науки. — 2011. — № 2 (10). — С. 119–130. 18. Kohonen T. Self-organization and associative memory / T. Kohonen. — Springer–Verlag, 1989. — 312 p.

References 1. Boguslavska, S. I., & Potapenko, L. V. (2013). Sotsialna politika v umovah rinkovih vidnosin. Finansoviy prostir (Financial space), 2, 106– 110. Retrieved from: http://nbuv.gov.ua/j-pdf/Fin_pr_2013_2_14.pdf [in Ukrainian]. 2. Varnalyy, Z. S. (2005). Regioni Ukrayini: problemi ta prioriteti sotsialno-ekonomichnogo rozvitku. Kyiv, Ukraine: Znannya Ukrayiny [in Ukrainian]. 65


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

3. Zaharov, M. A. (2007). Regionalnaya sotsialnaya politika v usloviyah administrativnoy reformyi. Izvestiya VUZov. Povolzhskiy region. Obschestvennyie nauki (Proceedings of the universities. Volga region. Social sciences), 3, 24–29. Retrieved from: https://cyberleninka.ru/article/ n/regionalnaya-sotsialnaya-politika-v-usloviyah-administrativnoy-reformy [in Russian]. 4. Reutov, V. E. (2010). Zakonomirnosti i paradigmi regionalnogo rozvitku. Efektivna ekonomika: elektronne naukove fahove vidannya (Effective economy: electronic scientific professional edition), 9, 118–123. Retrieved from: http://www.economy.nayka.com.ua/?op=1&z=319 [in Ukrainian]. 5. Beshelev, S. D., & Gurvich, F. G. (1980). Matematiko-statisticheskie metodyi ekspertnyih otsenok. Moscow, Russia: Statistika [in Russian]. 6. Gofman, O. G. (1991). Ekspertnoe otsenivanie. Voronezh, Russia: Voronezh. gos. un-t [in Russian]. 7. Litvak, B. G. (1996). Ekspertnyie otsenki i prinyatie resheniy. Moscow, Russia: Patent [in Russian]. 8. Zadeh, L. (1965). Fuzzy Sets. Information and Control, 8, 338–353. 9. Vitlins’kyy, V. V., & Piskunova, O. V. (2010). Matematichni modeli ta metodi rinkovoyi ekonomiki. Kyiv, Ukraine: KNEU [in Ukrainian]. 10. Kovalchuk, K. F. (1993, November 23—26). Intelligent Decision Support System. Proc. First Asian Fuzzy Systems Symposium (Singapore), 510–516. 11. Matviychuk, A. V. (2011). Shtuchniy Intelekt v ekonomitsi: neyronni merezhi nechitka logika. Kyiv, Ukraine: KNEU [in Ukrainian]. 12. Tinyakova,V. I. (2006). Matematichskie metodyi obrabotki ekspertnoy informatsii. Voronezh : Izd-vo Voronezh. gos. un-t [in Russian]. 13. Olhovska, O. L. (2010). Ekonomiko–matematichna model diagnostiki bankrutstva strahovoyi kompaniyi na osnovi nechitkoyi logiki. Modelyuvannya ta informatsiyni sistemi v ekonomitsi (Modeling and Information Systems in Economics), 81, 59–74 [in Ukrainian]. 14. Mamdani, E. H. (1976). Advances in the Linguistic Synthesis of Fuzzy Controller. International Journal Man-Machine Studies, 8, 669—678. 15. Sharapov, O. D., & Kaidanovich, D. B. (2012). Otsinyuvannya mozhlivogo bankrutstva na osnovi indikatoriv fInansovogo stanu kampaniy z vikoristannyam neyronnih merezh zustrichnogo rozpovsyudzhennya. Neyro– nechitki tehnologіyi modelyuvannya v ekonomitsi (Neuro-fuzzy modeling techniques in economics), 1, 207–227 [in Ukrainian]. 66


Оцінювання внутрішньорегіональної диференції на засадах…

Т. І. Єфанова

16. Shtovba, S., & Shtovba, О. (2006). Prediction of Competitive Position of Brand Product by Fuzzy Knowledge Base. Journal of Automation and Information Sciences, 8, 69–80. 17. Maksishko, N. K. (2011). Otsinyuvannya sistemnih harakteristik ekonomichnoyi dinamiki na bazi rezultativ kompleksnogo fraktalnogo analizu. Visnik Zaporizkogo natsionalnogo universitetu. Ekonomichni nauki (Bulletin of the Zaporizhzhya National University. Economic Sciences), 2(10), 119–130 [in Ukrainian]. 18. Kohonen, T. (1989). Self-organization and associative memory. New-York: Springer–Verlag. Стаття надійшла до редакції 5.05.2017.

67


330.47:519

ОЦЕНКА ДОВЕРИЯ: ТЕОРЕТИЧЕСКИЕ МОДЕЛИ И РЕЗУЛЬТАТЫ ЭМПИРИЧЕСКОГО ИССЛЕДОВАНИЯ НА ПРИМЕРЕ СОЦИАЛЬНЫХ СЕТЕЙ

Е. Ю. Кононова Доктор экономических наук, доцент, доцент кафедры экономической кибернетики и прикладной экономики Харьковский национальный университет им. В.Н. Каразина площадь Свободы, 4, г. Харьков, 61022, Украина kateryna.kononova@gmail.com В условиях перехода к е-обществу количество ежедневно генерируемой информации растет стремительными темпами, при этом оценивать ее качество и достоверность становится все сложнее. Это ведет к формированию повышенного спроса на методы и модели оценки доверия как к источникам информации, так и к самой информации. К понятию доверия в последние годы обращались ученые из различных научных сфер – психологии, социологии, экономики, информатики. Однако, несмотря на растущее количество научных публикаций в данном направлении, исследования остаются фрагментарными и не дают целостного представления об особенностях формирования и распространения доверия в обществе. Новое междисциплинарное направление – анализ данных социальных медиа, в рамках которого исследуются профили и поведение пользователей онлайновых социальных сетей, – охватывает такие области как машинное обучение, искусственный интеллект, визуализация данных, алгоритмы поиска информации, лингвистика и масштабные вычисления. Принимая во внимание тот факт, что пользователями социальных сетей сегодня является более четверти населения планеты, социальные данные представляют собой репрезентативный срез общества и могут составить основу для построения и верификации моделей оценки доверия. Целью исследования является проверка теоретических предположений моделей оценки доверия на основе анализа поведения пользователей и структуры социальных сетей. В статье проанализировано распределение пользователей, их сообщений, друзей и групп, описаны нетипичные примеры. В результате кластеризации пользователей идентифицированы типы их поведения: выявлены кластера «писателей», «распространителей» информации и ее потребителей – «читателей», а также кластер «малоактивных» пользователей. Анализ кластеров показал, что зачастую генераторы контента не являются основным каналом распространения информации, что противоречит теоретическим предположениям модели оценки доверия. Однако исследование структуры неявных связей между агентами свидетельствует в пользу гипотезы о том, что наиболее активно пишущие пользователи имеют наибольшее число контактов и пользуются наибольшим доверием. Ключевые слова: онлайновые социальные сети (ОСС), модели оценки доверия, типы поведения пользователей, карты Кохонена, структура сети, графовые модели. © К. Ю. Кононова, 2017

68


Оценка доверия: теоретические модели…

Е. Ю. Кононова

ОЦІНКА ДОВІРИ: ТЕОРЕТИЧНІ МОДЕЛІ ТА РЕЗУЛЬТАТИ ЕМПІРИЧНОГО ДОСЛІДЖЕННЯ НА ПРИКЛАДІ СОЦІАЛЬНИХ МЕРЕЖ

К. Ю. Кононова Доктор економічних наук, доцент, доцент кафедри економічної кібернетики та прикладної економіки Харківський національний університет ім. В.Н. Каразіна площа Свободи, 4, м Харків, 61022, Україна kateryna.kononova@gmail.com В умовах переходу до е-суспільства кількість інформації, що генерується щодня, зростає швидкими темпами, при цьому оцінювати її якість і достовірність стає все складніше. Це веде до формування підвищеного попиту на методи та моделі оцінки довіри як до джерел інформації, так і до самої інформації. До поняття довіри останніми роками зверталися вчені з різних наукових сфер – психології, соціології, економіки, інформатики. Однак, незважаючи на зростаючу кількість наукових публікацій у даному напрямку, дослідження залишаються фрагментарними та не дають цілісного уявлення про особливості формування та поширення довіри в суспільстві. Новий міждисциплінарний напрямок – аналіз даних соціальних медіа, в рамках якого досліджуються профілі та поведінка користувачів онлайнових соціальних мереж, – охоплює такі області як машинне навчання, штучний інтелект, візуалізація даних, алгоритми пошуку інформації, лінгвістика та масштабні обчислення. Беручи до уваги той факт, що користувачами соціальних мереж сьогодні є понад чверть населення планети, соціальні дані представляють собою репрезентативний зріз суспільства та можуть скласти основу для побудови та верифікації моделей оцінки довіри. Метою дослідження є перевірка теоретичних гіпотез моделей оцінки довіри на основі аналізу поведінки користувачів і структури соціальних мереж. У статті проаналізовано розподіл користувачів, їх повідомлень, друзів і груп, описані нетипові приклади. В результаті кластеризації користувачів ідентифіковані типи їх поведінки: виявлено кластери «письменників», «розповсюджувачів» інформації та її споживачів – «читачів», а також кластер «малоактивних» користувачів. Аналіз кластерів показав, що найчастіше генератори контенту не є основним каналом поширення інформації, що суперечить теоретичним припущенням моделі оцінки довіри. Однак дослідження структури неявних зв’язків між агентами свідчить на користь гіпотези про те, що ті користувачі, які найбільш активно пишуть, мають найбільше число контактів і користуються найбільшою довірою. Ключові слова: онлайнові соціальні мережі (ОСМ), моделі оцінки довіри, типи поведінки користувачів, карти Кохонена, структура мережі, графові моделі.

69


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

TRUST EVALUATION: THEORETICAL MODELS AND RESULTS OF EMPIRICAL RESEARCH ON SOCIAL NETWORKS

Kateryna Kononova Doctor of Economics, Docent, Associate Professor of Department of Economic Cybernetics and Applied Economics V.N. Karazin Kharkiv National University 4 Svobody Sq., Kharkiv, 61022, Ukraine kateryna.kononova@gmail.com The amount of daily generated information is growing at a catastrophic rate while assessing its quality and reliability becomes more and more difficult. This leads to an increase in demand for methods and models of trust evaluation both to sources of information and to information itself. Scientists from various fields – psychology, sociology, economics, and computer science – dealt with the concept of trust in recent years. However, despite the growing number of scientific publications in this field, the relevant studies are fragmented and there is not yet a holistic understanding of the topic. A new interdisciplinary area – Social Media Mining, which studies social networks structures, users’ profiles and their behavior, spans areas such as machine learning, graph mining, information retrieval, knowledge-based systems, linguistics, common-sense reasoning, natural language processing and big data computing. Taking into account the fact that more than a quarter of the world population are users of several online social networks, social data are fully representative cross-section of society and can be the basis for the design and verification of trust models. The purpose of the study is to examine the theoretical assumptions of trust models based on an analysis of users behavior and the structure of social networks. The article examines the distribution of users, their messages, friends and groups, describes atypical examples. Users clustering allowed identifying the types of their posting behavior: identified the clusters of “writers”, “distributors” of information and its consumers – “readers”, as well as a cluster of “low-active” users. Analysis of clusters showed that content generators are not the main channel for diffusion of information, which contradicts the theoretical assumptions of trust model. However, a study of the implicit relationships structure confirms the hypothesis that “writers” have the largest number of contacts and are most trusted. Key words: online social network (OSN), trust evaluation model, users posting behavior, Kohonen map, network structure, graph model. JEL Classification: C45, С81, D85

70


Оценка доверия: теоретические модели…

Е. Ю. Кононова

Введение В результате развития информационных технологий сегодня более 80 % населения развитых стран имеют доступ в интернет. Сеть стала новой площадкой для делового и дружеского общения, основным источником политических, культурных и научных новостей, средством осуществления коммерческих сделок и взаимодействия с органами государственной власти. В основе успешного взаимодействия между агентами сети лежит доверие между сторонами. Однако, если раньше оно базировалось на легко проверяемой информации (в условиях, когда информационные потоки были относительно скудными, выводы можно было сделать на основе физического контакта, перепроверить информацию через третьих лиц), сегодня верификация входящей информации становится все более и более сложной задачей, все труднее становится принимать решения о том, каким источникам доверять, а каким – нет. Таким образом, в последние 10–15 лет сформировался новый спрос на методы анализа информации и механизмы формирования доверия. Он породил предложение со стороны научного сообщества, понятие доверия исследовалось в психологии, социологии, экономике, информатике. Анализ данных социальных медиа, в рамках которого исследуются профили и поведение пользователей социальных сетей, также вырос из этой новой потребности. Он сочетает в себе такие дисциплины, как структурный анализ сетей, управление мультимедиа, аналитика социальных медиа, анализ трендов и мнений, машинное обучение, искусственный интеллект, визуализация данных, алгоритмы поиска информации, теория систем, основанных на знаниях, лингвистика и масштабные вычисления. Учитывая, что более четверти населения планеты являются пользователями онлайновых социальных сетей (число агентов Facebook превысило два миллиарда), можно утверждать, что накопленные (и регулярно обновляемые) социальные данные о предпочтениях и поведении пользователей могут выступать основой для построения и верификации моделей оценки доверия, анализа процессов его формирования и распространения.

Понятие, свойства и типы доверия Понятие доверия исследовалось в различных науках. В психологии под доверием понимается состояние агента, когда доверя71


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

ющий принимает риск на основании позитивных ожиданий относительно намерений доверителя [4, 28, 29, 31]. В социологии и экономике доверие определяется как субъективное ожидание доверяющего относительно будущего поведения доверителя [9, 23, 24]. В информатике доверие рассматривается с точки зрения «пользователя» и «системы» [22]. Во всех дисциплинах отношение доверия имеет два важных аспекта: риск и взаимозависимость [8, 28, 37]. Источником риска является неопределенность в отношении намерений другой стороны. Взаимозависимость обусловлена тем, что интересы обеих сторон связаны и не могут быть достигнуты без полагания друг на друга. Кроме того, доверие имеет следующие свойства:  зависимость от контекста,  динамичность – доверие может увеличиться или уменьшаться с новым опытом (основанном на результатах взаимодействий или наблюдений) [32],  распространяемость – аналогично феномену распространения информации «из уст в уста» [1],  нетранзитивность – потеря достоверности заключений вследствие увеличения их информативности [39],  комбинаторность – возможность формирования доверия на основе мнений различных агентов, зачастую напрямую не связанных с данным,  субъективность,  асимметричность – один агент может доверять другому больше, чем второй доверяет первому,  самоусиление (положительная обратная связь) – агенты склонны к усилению взаимодействия с теми, кому они уже доверяют,  чувствительность – доверие требует много времени для формирования, но достаточно одного негативного события, чтобы его полностью уничтожить [24]. Шерхан [21] рассматривает следующие типы доверия:  расчетное доверие (на основе дилеммы заключенного) определяется исходя из предположения о максимизации выгоды доверителя [36];  реляционное доверие формируется в результате повторных взаимодействий между доверителем и доверяющим;  эмоциональное доверие возникает в результате ощущения безопасности и комфорта в отношении доверителя [15]; 72


Оценка доверия: теоретические модели…

Е. Ю. Кононова

 когнитивное доверие основывается на рациональном поведении агентов [15],  институциональное доверие обеспечивает среду, которая поощряет сотрудничество между членами и наказывает «безбилетников» [17],  диспозициональное доверие основано на предположении, что в течение жизни человек развивает обобщенные ожидания относительно достоверности поведения других людей [28].

Опыт моделирования доверия Для моделирования доверия используются статистические и эвристические методы, методы машинного обучения и анализа поведения агентов. С использованием статистических методов для оценивания доверия разработаны модели на основе байесовских систем [14, 23], в рамках машинного обучения – модели искусственных нейронных сетей и сетей Маркова [21, 31]. Эвристические модели использовались для оценки репутации агентов [13]. В поведенческих моделях рассмотрены характер взаимодействия и способы распространения информации [1]. Для исследования доверия в социальных сетях разработаны модели на основе: 1) структуры сети (графовые модели), 2) поведения агентов, 3) гибридные модели. Графовые модели, как правило, основаны на концепции «сети доверия» или FOAF (friend-of-a-friend) [10]. Также на основе структуры сети разрабатывались гравитационные модели доверия [20]. В графовой модели доверия Баскенса [7] рассматривалась гипотеза, что создатели контента имеют более высокий уровень доверия. Для прогнозирования доверия Лиу предложил использовать шаблоны поведения пользователей [18]. Непал [25] разработал модель, в которой оценка доверия проводится на основе популярности (числа друзей) и участия (как часто агент посещает сайты, сколько сообщений он читает и комментирует). Адали [1] оценивал доверие на основе следующих факторов: общение (насколько долго и/или как часто два агента взаимодействуют друг с другом) и распространение (передается ли информация, полученная от одного агента, к другим). Кроме того, в рамках этого направления исследовались вопросы создания и распространения информации. Ранние работы бы73


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

ли сфокусированы на поведении пользователей в блогах и изучали информационные эпидемии с использованием классической модели диффузии инноваций. Кумар [16] исследовал «взрывной характер» блогов, анализируя эволюционирующую структуру ссылок. Грюль [11] изучал проблему распространения тем из блога в блог, основываясь на анализе текстов, а не гиперссылок. Гуо [12] выявил ежедневные и еженедельные шаблоны поведения, исследуя две группы пользователей – активных и пассивных. Бамсук [6] также исследовал временные характеристики поведения агентов, сравнивая блогосферу и Twitter, коммерческие и некоммерческие блоги. Папагелис [17] анализировал связь между индивидуальным поведением и социальным влиянием. Лю [13] прогнозировал поведение пользователя на основе анализа кликов, Сюй [21] – на основе «горячих» новостей, репостов друзей и интересов пользователя, указанных в профиле. Роман [27] предложил стохастическую модель, основанную на психологии принятия решений. В гибридных моделях доверия рассматриваются оба аспекта – и структура графа, и взаимодействия внутри сети. В таких моделях оценка явного доверия делается на основе сетевой структуры, тогда как оценка неявного доверия – на основе взаимодействий пользователя в сети. В рамках данного подхода Трифуновичем [34] предложена модель оппортунистической сети.

Цель и задачи исследования В данной работе использован гибридный подход. Однако при разработке моделей мы будем исходить, в первую очередь, не из теоретических предположений, а из структуры и содержания данных. Целью исследования является проверка теоретических предположений моделей доверия на основе анализа поведения пользователей и структуры онлайновой социальной сети. Для ее достижения в работе были поставлены и решены следующие задачи:  проанализировать профили пользователей социальной сети, проживающих в целевом регионе, а также контент, ими генерируемый; 74


Оценка доверия: теоретические модели…

Е. Ю. Кононова

 выявить пользователей, проявляющих активность в рамках определенной тематики;  определить типы поведения этих пользователей;  исследовать связи между пользователями;  оценить уровень доверия к тематическому контенту и группам пользователей, его формирующим.

Сбор и подготовка данных Исследование построено на основе анализа 248 тыс. профилей пользователей одной из самых популярных (до недавнего времени) в отечественном сегменте социальных сетей «ВКонтакте», а также контенте – сообщениях и комментариях – этих пользователей. Собранная база данных включает следующие записи:  идентификатор пользователя;  список друзей пользователя;  список групп, в которых состоит пользователь;  открытые сообщения пользователя (посты и комментарии). На первом этапе исследования набор данных был очищен от неинформативных сообщений:  которые не содержали текстовой информации (а лишь ссылки, изображения, аудио и т. п.);  язык которых не соответствовал анализируемому (для идентификации постов на русском языке использовалась библиотека poliglot языка python). Затем, используя модуль tokenizer библиотеки nltk python, в сообщениях пользователей были выделены отдельные слова и удалены посторонние символы (знаки препинания, смайлики и т.п.). На основе библиотеки pymorphy2 слова были лемматизированы, все буквы в словах переведены в нижний регистр.

Частотные характеристики выборки После предварительной подготовки для каждого пользователя были рассчитаны его характеристики и число постов на заданную тему. В результате была сформирована таблица следующего вида (табл. 1).

75


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Таблица 1 ФРАГМЕНТ ДАННЫХ БАЗЫ ВК Идентификатор

Число друзей

Число групп

Число постов

Число постов друзей

Число постов, тема 1

195269137

49

3

992

1439

138

61

187704426

53

10

949

62

109

39

17241807

193

1

925

593

95

20

35833523

332

1

789

726

82

13

906761

300

3

773

291

356

48

23419701

273

4

754

55

104

31

51258489

536

10

735

754

158

31

Число постов, тема 5

Распределение числа друзей пользователей сети описывается, как и большинство распределений в Интернет [1], степенным законом, как показано на рис. 1. При этом более чем у четверти пользователей друзей нет, около трети имеет от пятидесяти до ста друзей, почти 7 % – тысячники.

Рис. 1. Распределение числа друзей пользователя 76


Оценка доверия: теоретические модели…

Е. Ю. Кононова

Анализ показал, что две трети пользователей подписаны не более чем на пять групп, из них более 40 % вообще не состоят в тематических группах.

Рис. 2. Распределение числа групп, в которых состоит пользователь

Распределение общего числа постов имеет очень длинный хвост, для анализа которого пользователи, написавшие более 50 000 постов, были сгруппированы в один бин. На рис. 3 видим, что около одного процента пользователей не написали ни одного поста за исследуемый период, примерно столько же написало более 50 тысяч. Оба числа свидетельствуют о нетипичном поведении пользователей.

Рис. 3. Распределение общего числа постов пользователя 77


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

При этом на заданную тему в течение исследуемого периода почти половина пользователей написали от 500 до 1000 постов, в то же время лишь чуть меньше 4 % не написали вообще ничего (рис. 4).

Рис. 4. Распределение числа тематических постов пользователя

Это распределение также имеет длинный хвост, анализ которого показал, что примерно 5 % пользователей написали более двух тысяч тематических постов за исследуемый период, что вызывает подозрение об их ангажированности. Принимая во внимание, что некоторые пользователи размещали посты 5–10 раз в день, можно предположить, что эта деятельность являлась для них своеобразной работой. Как показало предварительное исследование, часть пользователей имеет колоссальное количество друзей, некоторые состоят в большом числе групп, некоторые размещают большое число собственных постов или сообщений друзей. В связи с этим, а также опираясь на теоретические предположения моделей оценки доверия, может быть поставлен ряд вопросов для достижения целей нашего исследования:  состоят ли в группах те пользователи, у кого много друзей;  много ли друзей у тех, кто много пишет; 78


Оценка доверия: теоретические модели…

Е. Ю. Кононова

 все ли темы создаются идентичным образом (например, за счет написания постов или ре-постов от друзей / из групп). Для ответа на эти вопросы была проведена идентификация типов поведения пользователей ОСС.

Анализ типов поведения пользователей Для выявления и описания типов поведения были использованы методы кластеризации (в частности карты Кохонена, позволяющие выявлять скрытые закономерности в данных). В качестве параметров кластеризации были выбраны следующие:  количество друзей;  количество тематических постов;  количество тематических групп, в которых состоит пользователь;  количество тематических постов на стенах друзей пользователя. После серии экспериментов с фрагментом базы данных сети ВКонтакте был получен набор карт, представленный на рис. 5.

Рис. 5. Набор карт Кохонена, описывающих поведение пользователей 79


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Анализ профилей представленных на рис. 5 кластеров (табл. 2) позволил описать следующие типы контент-поведения пользователей: «писатели», «распространители», «читатели» и «малоактивные». Таблица 2 ТИПЫ ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ, % Число друзей

Число групп

Число постов

Число постов друзей

Писатели (7,2 %)

31

31

71

33

Распространители (8,3 %)

13

50

12

12

Читатели (13,4 %)

48

13

10

49

Малоактивные (71,1 %)

7

6

8

6

Кластер

Рассмотрим особенности кластеров. Чуть более семи процентов пользователей составили кластер «писателей». Хотя этот кластер самый маленький, его участники генерируют основной контент по заданной тематике. Кроме того, они чаще других оставляют комментарии. Следующим по численности является кластер «распространителей» (около 8 %) – это пользователи с наибольшим количеством ре-постов из тематических групп. В отличие от других пользователей, у них мало друзей, они сосредоточены на сборе информации из тематических групп и ее дальнейшем распространении. Среди людей, которые активно интересуются данной темой, наиболее многочисленным является кластер «читателей» (13 %), новостные ленты которых состоят из сообщений друзей. В отличие от «распространителей», они ориентированы скорее на потребление информации, чем на ее распространение. Хотя большинство пользователей ВКонтакте (более 70 %) оказались слабо заинтересованы в исследуемой тематике (они и писали, и читали, и ре-постили относительно редко), однако некоторую активность в рамках тематики они все же продемонстрировали, отчего и попали в общий список. А значит, их можно рассматривать как потенциальную аудиторию. Идентифицированные типы поведения графически представлены на рис. 6. 80


Оценка доверия: теоретические модели…

Е. Ю. Кононова

Рис. 6. Характеристики ядер кластеров

Анализ поведения пользователей показал, что у основных генераторов контента, составивших кластер «писателей», не самое большое число друзей, что противоречит предположениям моделей оценки доверия. Поэтому для дальнейшего исследования было решено проанализировать граф связей пользователей.

Анализ структуры сети Для построения графа связей между пользователями были протестированы следующие гипотезы:  связь между пользователями есть, если они дружат между собой в соцсетях (прямая связь), при этом сила связи определяется количеством общих друзей;  связь между пользователями есть, если они имеют ненулевое количество общих друзей, но дружить друг с другом не обязаны (связь через друзей). После ряда экспериментов с разными видами связей установлено, что соединение типа «связь через друзей» является более информативной с точки зрения формирования групп: выделились неявные группы пользователей, соответствующие исследуемым темам. На рис. 7 представлены графы связей пользователей в разрезе тем (рис. 7а) и кластеров (рис. 7б). Здесь размер маркера соответствует числу связей. 81


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

а)

б) Рис. 7. Графы связей пользователей в разрезе: а) тем, б) кластеров 82


Оценка доверия: теоретические модели…

Е. Ю. Кононова

Анализ структуры сети, в которой реализовано соединение «связь через друзей», показал, что в этом случае мы снимаем выявленное выше противоречие с моделью оценки доверия Баскенса: действительно, при таком подходе вершины, соответствующие пользователям, составившим кластер «писателей», являются самыми значительными. Приведенная графовая модель позволяет выявить пользователей, пользующихся наибольшим доверием (пять центральных вершин графа). Кроме того, на рис. 7 мы видим, что темы по кластерам распределены неравномерно. Детальный анализ показал, что лишь малоактивные пользователи интересуются темой 2, что можно видеть на рис. 8. В целом, интерес к этой и пятой теме одинаково низок как со стороны «писателей», так и среди «читателей» и «распространителей».

Рис. 8. Тематический срез кластеров

Выводы В работе предложен комплекс моделей оценки доверия на основе анализа поведения пользователей и структуры онлайновых социальных сетей. В результате кластеризации агентов с использованием сетей Кохонена идентифицированы и описаны типы их поведения: выявлены кластера «писателей», «распространителей» информации и ее потребителей – «читателей», а также 83


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

кластер «малоактивных» пользователей. Анализ показал, что хотя кластер «писателей» является самым малочисленным, именно эти пользователи генерируют основную часть контента. Однако, вопреки теоретическим предположениям модели оценки доверия, друзей у пользователей этого кластера не так много, как можно было бы ожидать. При этом, исследование структуры неявных контактов между агентами на основе графовой модели, в которой реализована «связь через друзей», свидетельствует в пользу гипотезы о том, что «писатели» имеют наибольшее число контактов и пользуются наибольшим доверием. Анализ кластеров в разрезе тем свидетельствует о неравномерном распределении активности пользователей и наводит на размышления об искусственно создаваемом интересе к некоторым из них. Этот вопрос нуждается в дальнейшем исследовании.

Литература 1. Abdul-Rahman A., Hailes S. Supporting trust in virtual communities // Proceedings of the 33rd Annual Hawaii International Conference on System Sciences. – Maui, Hawaii: IEEE Computer Society, 2000. – P. 1769–1777. 2. Adali S., Escriva R., Goldberg M. K., Hayvanovych M., MagdonIsmail M., Szymanski B. K., Wallace W.A., Williams G. Measuring behavioral trust in social networks // Proceedings of the IEEE International Conference on Intelligence and Security Informatics. – 2010. – P. 150–152. 3. Adamiс L.A., Huberman B.A. Power-law distribution of the World Wide Web // Science. – 2000. – Vol. 287. – P. 2115–2115. 4. Beatty P., Reay I., Dick S., Miller J. Consumer trust in e-commerce web sites: A meta-study // ACM Computing Surveys. – 2011. – № 43. – Vol. 3. – P. 1–14. 5. Benevenuto F., Magno G., Rodrigues T., Almeida V. Detecting Spammers on Twitter [Електронний ресурс]. – Режим доступу : http://www.decom.ufop.br/fabricio/download/ceas10.pdf. 6. Bumsuk L. A temporal analysis of posting behavior in social media streams [Електронний ресурс]. – Режим доступу : http://www.aaai.org/ ocs/index.php/ICWSM/ICWSM12/paper/viewFile/4741/5094. 7. Buskens V. The social structure of trust // Social Networks. – 1998. – № 20. – Vol. 3. – P. 265–289. 8. Coleman J. S. Foundations of Social Theory. – Cambridge, MA: Belnap Press of Harvard University Press, 1990. – 993 p. 9. Dumouchel P. Trust as an action // European Journal of Sociology. – 2005. – № 46. – P. 417–428. 84


Оценка доверия: теоретические модели…

Е. Ю. Кононова

10. Golbeck J., Parsia B., Hendler J. Trust networks on the semantic web // Proceedings of the 7th International Workshop on Cooperative Intelligent Agents. – Helsinki, Finland, 2003. – P. 238–249. 11. Gruhl D., Guha R., Liben-Nowell D., Tomkins A. Information diffusion through blogspace [Електронний ресурс]. – Режим доступу : http://people.csail.mit.edu/dln/papers/ blogs/idib.pdf. 12. Guo L., Tan E., Chen S., Zhang X., Zhao Y. Analyzing patterns of user content generation in online social networks [Електронний ресурс]. – Режим доступу : https://cs.gmu.edu/~sqchen/publications/kdd09.pdf. 13. Huynh T.D., Jennings N.R., Shadbolt N.R. Certified reputation: How an agent can trust a stranger // Proceedings of the 5th International Joint Conference on Autonomous Agents and Multiagent Systems. – NY: ACM Press, 2006. – P. 1217–1224. 14. Josang A., Ismail R. The beta reputation system // Proceedings of the 15th Bled Electronic Commerce Conference. – Bled, Slovenia, 2002. – P. 891–900. 15. Kuan H., Bock G. The collective reality of trust: An investigation of social relations and networks on trust in multi-channel retailers // Proceedings of the 13th European Conference on Information Systems. – Regensburg, Germany, 2005. – P. 1–8. 16. Kumar R., Novak J., Raghavan P., Tomkins A. On the bursty evolution of blogspace [Електронний ресурс]. – Режим доступу : http://www.disco.ethz.ch/lectures/fs12/ seminar/paper/Barbara/32.pdf. 17. Lewis J.D., Weigert A. Trust as a social reality // Social Forces. – 1985. – №63. – Vol. 4. – P. 967–985. 18. Liu H., Lim E.-P., Lauw H.W., Le M.-T., Sun A., Srivastava J., Kim Y.A. Predicting trusts among users of online communities: An epinions case study // Proceedings of the 9th ACM Conference on Electronic Commerce. – New York: ACM Press, 2008. – P. 310–319. 19. Liu J., Dolan P., Pedersen E.R. Personalized news recommendation based on click behavior [Електронний ресурс]. – Режим доступу : http://cs.northwestern.edu/~jli156/IUI224-liu.pdf. 20. Maheswaran M., Tang H.C., Ghunaim A. Towards a gravity-based trust model for social networking systems // Proceedings of the 27th international conference on distributed computing systems workshops. – Washington, DC: IEEE Computer Society, 2007. – P. 24. 21. Malik Z., Akbar I., Bouguettaya A. Web services reputation assessment using a hidden markov model // Proceedings of the 7th International Joint Conference on Service-Oriented Computing. – 2009. – P. 576–591. 22. Marsh S.P. Formalising trust as a computational concept: PhD Thesis. – Stirling, UK: University of Stirling. – 1994. 23. Mui L. Computational models of trust and reputation: Agents, evolutionary games, and social networks [Електронний ресурс].– Режим доступу: http://groups.csail.mit.edu/medg/people/lmui/docs/phddissertation.pdf. 85


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

24. Nepal S., Sherchan W., Bouguettaya A. A behavior based trust model for service web // IEEE Conference on Service-Oriented Computing and Applications. – 2010. – P. 1–4. 25. Nepal S., Sherchan W., Paris C. STrust: A trust model for social networks // Proceedings of the 10th IEEE International Conference on Trust, Security and Privacy in Computing and Communications. – 2011. – P. 841–846. 26. Papagelis M., Murdock V., van Zwol R. Individual behavior and social influence in online social systems [Електронний ресурс]. – Режим доступу : http://www.cs.toronto.edu/~papaggel/docs/papers/all/HT11Individual-Behavior-and-Social-Influence-in-Online-Social-Systems.pdf. 27. Roman P. E., Gutierrez M.E., Rios S.A. A model for content generation in On-line social network [Електронний ресурс]. – Режим доступу : https://www.researchgate.net/publication/233897861. 28. Rotter J. B. A new scale for the measurement of interpersonal trust // Journal Personality. – 1967. – № 35. – Vol. 4. – P. 651–665. 29. Rousseau D. M., Sitkin S. B., Burt R. S., Camerer C. Not so different after all: A cross-discipline view of trust // Academy Management Review. – 1998. – Vol. 23. – No. 3. – P. 393–404. 30. Sherchan W., Nepal S., Paris C. A Survey of trust in social networks [Електронний ресурс] // ACM Computing Surveys. – 2013. – Vol. 45. – No. 4. – P. 47:1–47:33. – Режим доступу : http://people.cs.vt.edu/~irchen/ 5984/pdf/Sherchan-acm-CSUR13.pdf. 31. Song W., Phoha V. V., Xu X. The hmm-based model for evaluating recommender’s reputation // Proceedings of the IEEE International Conference on E-Commerce Technology for Dynamic E-Business. – 2004. – P. 209–215. 32. Staab S., Bhargava B., Lilien L., Rosenthal A., Winslett M., Sloman M., Dillon T. S., Chang E., Hussain F. K., Nejdl W., Olmedilla D., Kashyap V. The pudding of trust: Managing the dynamic nature of trust // IEEE Intelligent Systems. – 2004. – Vol. 19. – Is. 5. – P. 74–88. 33. Sztompka P. Trust: A Sociological Theory. – Cambridge: Cambridge University Press, 1999. – 214 p. 34. Trifunovic S., Legendre F., Anastasiades C. Social trust in opportunistic networks // Proceedings of the INFOCOM IEEE Conference on Computer Communications Workshops. – 2010. – P. 1–6. 35. Tyler T. R. Why People Obey the Law. – New Haven, CT: Yale University Press, 1990. – 256 p. 36. Tyler T. R., Degoey P. Trust in organizational authorities: The influence of motive attributions on willingness to accept decisions // Trust in Organizations: Frontiers of Theory and Research / R. M. Kramer and T. R. Tyler, Eds. – Thousand Oaks, CA: Sage Publications, 1996. – P. 331–356. 37. Williamson O. E. Calculativeness, trust and economic organization // Journal of Law and Economics. – 1993. – № 30. – Is. 1. – P. 131–145. 86


Оценка доверия: теоретические модели…

Е. Ю. Кононова

38. Xu Z., Zhang Y., Wu Y., Yang Q. Modeling User Posting Behavior on Social Media [Електронний ресурс]. – Режим доступу : http://yaowu.co/docs/sigir12.pdf. 39. Yu B., Singh M. P. A social mechanism for reputation management in electronic communities // Proceedings of the 4th International Workshop on Cooperative Information Agents. – 2000. – P. 154–165.

References 1. Abdul-Rahman, A., & Hailes, S. (2000, January 7). Supporting trust in virtual communities. Proceedings of the 33rd Annual Hawaii International Conference on System Sciences (Maui, Hawaii: IEEE Computer Society), 1769–1777. DOI: 10.1109/HICSS.2000.926814 2. Adali, S., Escriva, R., Goldberg, M. K., Hayvanovych, M., MagdonIsmail, M., Szymanski, B. K., Wallace, W.A., & Williams, G. (2010). Measuring behavioral trust in social networks. Proceedings of the IEEE International Conference on Intelligence and Security Informatics, 150–152. 3. Adamiс, L.A., & Huberman, B.A. (2000). Power-law distribution of the World Wide Web. Science, 287, 2115–2115. 4. Beatty, P., Reay, I., Dick, S., & Miller, J. (2011). Consumer trust in e-commerce web sites: A meta-study. ACM Computing Surveys, 43(3), 1–14. 5. Benevenuto, F., Magno, G., Rodrigues, T., & Almeida, V. (2010). Detecting Spammers on Twitter. Retrieved from http://www.decom.ufop.br/ fabricio/download/ceas10.pdf. 6. Bumsuk, L. (2012). A temporal analysis of posting behavior in social media streams. Retrieved from http://www.aaai.org/ocs/index.php/ICWSM/ ICWSM12/paper/viewFile/4741/5094. 7. Buskens, V. (1998). The social structure of trust. Social Networks, 20(3), 265–289. 8. Coleman, J. S. (1990). Foundations of Social Theory. Cambridge, MA: Belknap Press of Harvard University Press. 9. Dumouchel, P. (2005). Trust as an action. European Journal of Sociology, 46, 417–428. 10. Golbeck, J., Parsia, B., & Hendler, J. (2003, August 27–29). Trust networks on the semantic web. Proceedings of the 7th International Workshop on Cooperative Intelligent Agents (Helsinki, Finland), 238–249. 11. Gruhl, D., Guha, R., Liben-Nowell, D., & Tomkins, A. (2004). Information diffusion through blogspace. Retrieved from http://people.csail. mit.edu/dln/papers/ blogs/idib.pdf. 12. Guo, L., Tan, E., Chen, S., Zhang, X., & Zhao, Y. (2009). Analyzing patterns of user content generation in online social networks. Retrieved from https://cs.gmu.edu/~sqchen/publications/kdd09.pdf. 13. Huynh, T.D., Jennings, N.R., & Shadbolt, N.R. (2006). Certified reputation: How an agent can trust a stranger. Proceedings of the 5th 87


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

International Joint Conference on Autonomous Agents and Multiagent Systems (New York), 1217–1224. 14. Josang, A., & Ismail, R. (2002, June 17–19). The beta reputation system. Proceedings of the 15th Bled Electronic Commerce Conference (Bled, Slovenia), 891–900. 15. Kuan, H., & Bock, G. (2005, May 26–28). The collective reality of trust: An investigation of social relations and networks on trust in multichannel retailers. Proceedings of the 13th European Conference on Information Systems (Regensburg; Germany), 1–8. 16. Kumar, R., Novak, J., Raghavan, P., & Tomkins, A. (2003). On the bursty evolution of blogspace. Retrieved from http://www.disco.ethz.ch/ lectures/fs12/ seminar/paper/Barbara/32.pdf. 17. Lewis, J. D., & Weigert, A. (1985). Trust as a social reality. Social Forces, 63(4), 967–985. 18. Liu, H., Lim, E.-P., Lauw, H.W., Le, M.-T., Sun, A., Srivastava, J., & Kim, Y.A. (2008). Predicting trusts among users of online communities: An epinions case study. Proceedings of the 9th ACM Conference on Electronic Commerce (New York), 310–319. 19. Liu, J., Dolan, P., & Pedersen, E. R. (2010). Personalized news recommendation based on click behavior. Retrieved from http://cs.northwestern.edu/~jli156/IUI224-liu.pdf. 20. Maheswaran, M., Tang, H.C., & Ghunaim, A. (2007). Towards a gravity-based trust model for social networking systems. Proceedings of the 27th international conference on distributed computing systems workshops (Washington, DC), 24. 21. Malik, Z., Akbar, I., & Bouguettaya, A. (2009). Web services reputation assessment using a hidden markov model. Proceedings of the 7th International Joint Conference on Service-Oriented Computing, 576–591. 22. Marsh, S.P. (1994). Formalising trust as a computational concept. PhD thesis. Stirling, UK: University of Stirling. 23. Mui, L. (2003). Computational models of trust and reputation: Agents, evolutionary games, and social networks. Retrieved from http://groups.csail.mit.edu/medg/people/lmui/docs/phddissertation.pdf. 24. Nepal, S., Sherchan, W., & Bouguettaya, A. (2010, December 13– 15). A behavior based trust model for service web. IEEE Conference on Service-Oriented Computing and Applications, 1–4. 25. Nepal, S., Sherchan, W., & Paris, C. (2011). STrust: A trust model for social networks. Proceedings of the 10th IEEE International Conference on Trust, Security and Privacy in Computing and Communications, 841–846. 26. Papagelis, M., Murdock, V., & van Zwol, R. (2011). Individual behavior and social influence in online social systems. Retrieved from http://www.cs.toronto.edu/~papaggel/docs/papers/all/HT11-IndividualBehavior-and-Social-Influence-in-Online-Social-Systems.pdf. 88


Оценка доверия: теоретические модели…

Е. Ю. Кононова

27. Roman, P. E., Gutierrez, M. E., & Rios, S. A. (2012). A model for content generation in On-line social network. Retrieved from https://www.researchgate.net/publication/233897861. 28. Rotter, J.B. (1967). A new scale for the measurement of interpersonal trust. Journal Personality, 35(4), 651–665. 29. Rousseau, D. M., Sitkin, S. B., Burt, R. S., & Camerer, C. (1998). Not so different after all: A cross-discipline view of trust. Academy Management Review, 23(3), 393–404. 30. Sherchan, W., Nepal, S., & Paris, C. (2013, August). A Survey of trust in social networks. ACM Computing Surveys, 45(4). DOI: http://dx.doi.org/10.1145/2501654.2501661 31. Song, W., Phoha, V.V., & Xu, X. (2004). The hmm-based model for evaluating recommender’s reputation. Proceedings of the IEEE International Conference on E-Commerce Technology for Dynamic E-Business, 209–215. 32. Staab, S., Bhargava, B., Lilien, L., Rosenthal, A., Winslett, M., Sloman, M., Dillon, T. S., Chang, E., Hussain, F. K., Nejdl, W., Olmedilla, D., & Kashyap, V. (2004). The pudding of trust: Managing the dynamic nature of trust. IEEE Intelligent Systems, 19(5), 74–88. 33. Sztompka, P. (1999). Trust: A Sociological Theory. Cambridge, UK: Cambridge University Press. 34. Trifunovic, S., Legendre, F., & Anastasiades, C. (2010). Social trust in opportunistic networks. Proceedings of the INFOCOM IEEE Conference on Computer Communications Workshops, 1–6. 35. Tyler, T. R. (1990). Why People Obey the Law. New Haven, CT: Yale University Press. 36. Tyler, T. R., & Degoey, P. (1996). Trust in organizational authorities: The influence of motive attributions on willingness to accept decisions. In Trust in Organizations: Frontiers of Theory and Research. (pp. 331–356). Thousand Oaks, CA: Sage Publications. 37. Williamson, O.E. (1993). Calculativeness, trust and economic organization. Journal of Law and Economics, 30(1), 131–145. 38. Xu, Z., Zhang, Y., Wu, Y., & Yang, Q. (2012). Modeling User Posting Behavior on Social Media. Retrieved from http://yaowu.co/docs/ sigir12.pdf. 39. Yu, B., & Singh, M. P. (2000). A social mechanism for reputation management in electronic communities. Proceedings of the 4th International Workshop on Cooperative Information Agents, 154–165. Стаття надійшла до редакції 12.04.2017

89


УДК: 004.89:519.816

МОДЕЛЮВАННЯ ІННОВАЦІЙНИХ ІНТЕЛЕКТУАЛЬНИХ СИСТЕМ ПРИЙНЯТТЯ РІШЕНЬ В ЕКОНОМІЦІ

Ю. Г. Лисенко Доктор економічних наук, професор, член-кореспондент НАНУ, директор Навчально-наукового інституту «Інноваційні технології управління» Вищий навчальний заклад Укоопспілки «Полтавський університет економіки і торгівлі» вул. Коваля, 3, м. Полтава, 36014, Україна yuriy.lysenko.1945@gmail.com

О. Ю. Мінц Кандидат економічних наук, доцент, докторант кафедри фінансів і банківської справи Державний вищий навчальний заклад «Приазовський державний технічний університет» вул. Університетська, 7, м. Маріуполь, 87500, Україна mints_a_y@pstu.edu У статті систематизовано та розширено теоретико-методологічні засади процесів синтезу інноваційних інтелектуальних систем прийняття рішень. Визначено концептуальні підходи до застосування методів інтелектуальних обчислень для моделювання систем прийняття рішень. Запропоновано класифікацію методів інтелектуальних обчислень і класифікацію задач з аналізу та обробки даних. Розглянуто методологічні підходи до реалізації процесів спостереження, моделювання, ідентифікації та оцінки ефективності результатів моделювання інноваційних інтелектуальних систем прийняття рішень в економіці. Предметом дослідження є методологія моделювання інноваційних інтелектуальних систем прийняття рішень в економіці. Метою дослідження є формалізація процесів синтезу інноваційних інтелектуальних систем прийняття рішень для підвищення ефективності функціонування суб’єктів економічної діяльності. Результати дослідження дозволяють підвищити ефективність роботи із слабко структурованою інформацією, а також якість прийняття управлінських рішень в умовах невизначеності. Ключові слова: інтелектуальні обчислення, інтелектуальні системи, прийняття рішень, нейронні мережі, аналіз даних, обробка даних, ідентифікація, моделювання, оцінка ефективності. © Ю. Г. Лисенко, О. Ю. Мінц, 2017

90


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

МОДЕЛИРОВАНИЕ ИННОВАЦИОННЫХ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ ПРИНЯТИЯ РЕШЕНИЙ В ЭКОНОМИКЕ

Ю.Г. Лысенко Доктор экономических наук, профессор, член-корреспондент НАНУ, директор Учебно-научного института «Инновационные технологии управления» Высшее учебное заведение Укоопсоюза «Полтавский университет экономики и торговли» ул. Коваля, 3, г. Полтава, 36014, Украина yuriy.lysenko.1945@gmail.com

А.Ю. Минц Кандидат экономических наук, доцент, докторант кафедры финансов и банковского дела Государственное высшее учебное заведение «Приазовский государственный технический университет» ул. Университетская, 7, г. Мариуполь, 87500, Украина mints_a_y@pstu.edu В статье систематизированы и расширены теоретикометодологические основы процессов синтеза инновационных интеллектуальных систем принятия решений. Определены концептуальные подходы к применению методов интеллектуальных вычислений для моделирования систем принятия решений. Предложена классификация методов интеллектуальных вычислений и классификация задач анализа и обработки данных. Рассмотрены методологические подходы к реализации процессов наблюдения, моделирования, идентификации и оценки эффективности результатов моделирования инновационных интеллектуальных систем принятия решений в экономике. Предметом исследования является методология моделирования инновационных интеллектуальных систем принятия решений в экономике. Целью исследования является формализация процессов синтеза инновационных интеллектуальных систем принятия решений для повышения эффективности функционирования субъектов экономической деятельности. Результаты исследования позволяют повысить эффективность обработки слабоструктурированной информации, а также качество принятия управленческих решений в условиях неопределенности. Ключевые слова: интеллектуальные вычисления, интеллектуальные системы принятия решений, нейронные сети, анализ данных, обработка данных, идентификация, моделирование, оценка эффективности.

91


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

MODELING OF INNOVATIVE INTELLECTUAL DECISION-MAKING SYSTEMS IN THE ECONOMY

Yuriy Lysenko Doctor of Economics, Professor, Corresponding Member of NASU, Director of the Educational and Scientific Institute "Innovative Management Technologies" Higher Educational Establishment "Poltava University of Economics and Trade" 3 Kovalya str., Poltava, 36014, Ukraine yuriy.lysenko.1945@gmail.com

Oleksii Mints PhD in Economics, Docent, Doctoral Candidate of the Department of Finance and Banking State Higher Educational Establishment "Priazovsky State Technical University" 7 Universitetskaya str., Mariupol, 87500, Ukraine mints_a_y@pstu.edu The article systematizes and extends the theoretical and methodological foundations of the synthesis processes of innovative intellectual decision-making systems. Conceptual approaches to application of methods of intellectual calculations for modeling of systems of decision-making are defined. Classification of methods of soft computing, and classification of tasks of data analysis and data processing are offered. Methodological approaches to implementation of the processes of observation, modeling, identification and evaluation of effectiveness of the results of innovative intellectual decision-making systems modeling in the economy are considered. The subject of study is the modeling of innovative intellectual decision-making systems in the economy. The research objective is to formalize the synthesis processes of innovative intellectual decision-making systems to improve the efficiency of the functioning of economic systems. The results of the research make it possible to improve the efficiency of poorly structured data processing and the quality of decisionmaking under uncertainty. Keywords: intellectual calculations, decision making, neural networks, data analysis, data processing, identification, modeling, assessment of efficiency. JEL Classification: C45, C51, C52, C81, D81

Вступ Однією з глобальних сучасних тенденцій розвитку економіки є різке зростання кількості інформації, обсяги якої, за оцінками 92


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

експертів, підвищуються на 30 % щорічно [1]. Лавиноподібне наростання маси різноманітної інформації в сучасному суспільстві отримало назву «інформаційного вибуху», в результаті якого можливості засобів обробки інформації перестали встигати за темпами росту її обсягів. У зв’язку з цим успіх в інформаційному суспільстві досягається за рахунок найбільш ефективних технологій здобуття, обробки та аналізу інформації. Внаслідок цього на конкурентоспроможність економічних суб’єктів і соціальних груп істотно впливає як нерівність доступу до засобів інформаційних технологій, яка отримала назву «перший цифровий розрив», так і нерівність в знаннях щодо використання таких технологій – «другий цифровий розрив». Тому проблема усунення цифрових розривів в Україні, де відставання в інноваційних технологіях обробки інформації рівнозначно відставанню в розвитку національної економіки, у даний час набуває особливої актуальності. Важливою ознакою сучасних тенденцій розвитку інформаційних технологій є поступове розширення функцій систем на основі інтелектуальних обчислень зі здійснення інформаційної підтримки прийняття рішень людиною до появи повноцінних інтелектуальних систем, здатних до прийняття рішень навіть в умовах мінливого середовища та часткової невизначеності. Інноваційні інтелектуальні системи прийняття рішень мають самостійне значення для вирішення багатьох економічних задач, зокрема фінансової діагностики, торгівлі на фінансових ринках, створення систем інформаційної безпеки. Але навіть більш значущим слід вважати той факт, що вони здатні стати потужним синергетичним фактором зростання ефективності та життєздатності існуючих економічних систем. У моделі життєздатної системи С. Біра [2] застосування інтелектуальних систем прийняття рішень можливе у всіх підсистемах організаційної структури, що підвищує її адаптаційні здібності та життєздатність. Різноманітні аспекти моделювання інтелектуальних систем прийняття рішень досліджуються в роботах вітчизняних і закордонних учених, серед яких варто згадати В. Вітлінського [3], В. Анфілатова [4], А. Матвійчука [5], С. Хайкіна [6], Г. Сетлак [7]. Разом із тим слід зазначити, що теоретичну базу та практичний інструментарій моделювання інноваційних інтелектуальних систем прийняття рішень розроблено недостатньо. У більшості 93


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

публікацій з даної тематики зосереджено увагу на використанні окремих методів, без намірів об’єднати їх у єдину систему. Тому комплексне дослідження питань моделювання інноваційних інтелектуальних систем прийняття рішень в економіці є актуальним науковим завданням.

Загальні визначення Інтелектуальними обчисленнями будемо називати методи та системи штучного інтелекту, які спрямовані на підтримку прийняття рішень, зокрема на вирішення задач інтелектуального аналізу даних, обробки даних, оптимізації. Можна виділити два класичних підходи до класифікації та розробки методів інтелектуальних обчислень – «нисхідний» і «висхідний» [8]. Нисхідний, або семіотичний підхід (англ. Top-Down AI), має за мету створення систем штучного інтелекту на основі імітації високорівневих психічних процесів, таких як мислення, міркування. Результатом застосування цього підходу є, наприклад, експертні системи, бази знань, системи логічного висновку (включаючи нечітку логіку). Висхідний, або біологічний підхід (англ. Bottom-Up AI), полягає у створенні систем штучного інтелекту на основі моделювання базових біологічних і фізичних процесів. Результатом реалізації цього підходу є такі інструменти інтелектуальних обчислень, як штучні нейронні мережі. Подальший розвиток методів аналізу даних змусив розширити цю класифікацію. Різні школи пропонують різноманітні її варіанти, але в рамках даного дослідження будемо виділяти в якості самостійних агентно-еволюційний та імітаційний підходи до проектування інтелектуальних систем. Агентно-еволюційний підхід полягає у використанні для розв’язання задачі деякого набору самостійних програм – агентів. Агенти діють в програмно-створеному середовищі, характеристики якого залежать від умов розв’язуваної задачі. Кожен агент наділений деякими можливостями щодо сприйняття умов середовища і вибору варіантів дій, виходячи з цих умов. Для даного підходу характерна не тільки часова, а й просторова неоднорідність створюваної моделі. В рамках агентно-еволюційного підхо94


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

ду можна виділити генетичні алгоритми та інші непереборні методи вирішення NP-повних задач (імітація відпалювання, метод мурашиних колоній тощо). Імітаційний підхід дозволяє створювати і досліджувати моделі систем, для яких відомі лише деякі закономірності поведінки (так звана «чорна скринька»). Переваги імітаційного підходу виявляються тоді, коли необхідно отримати знання про поведінку системи, яка складається з безлічі «чорних скриньок», що звичайними методами зробити неможливо. Класифікацію методів інтелектуальних обчислень за розглянутими підходами показано на рис. 1.

Дискретно - подійне моделювання

Моделювання системної динаміки

Імітаційний

Агентне моделювання

Генетичні алгоритми

Імітація відпалювання

Метод мурашиних колоній

Агентноеволюційний

Висхідний

Штучні нейронні мережі (більше 20 типів)

Дерева прийняття рішень

Нечітка логіка

Нисхідний

Експертні системи

Методи

Підходи

Системи інтелектуальних обчислень

Рис. 1. Класифікація методів інтелектуальних обчислень

Як видно з класифікації, наведеної на рис. 1, деякі методи інтелектуальних обчислень можуть бути розглянуті в рамках кількох підходів. Але це не є наслідком недосконалості класифікації, а показує багатогранність інтелектуальних обчислень.

Концептуальні підходи до моделювання інноваційної інтелектуальної системи прийняття рішень У загальному вигляді задача вибору рішення формулюється так [4]:   C () , (1) де  – множина можливих варіантів рішень; ω – обране рішення; C – правила вибору найкращої альтернативи (задаються у вигляді функції вибору). 95


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Вибір відповідних методів пошуку рішень залежить від рівня визначеності множини варіантів  і ступеня формалізації функції вибору C, що можна бачити з табл. 1. Таблиця 1 МЕТОДИ ВИРІШЕННЯ ЕКОНОМІЧНИХ ЗАДАЧ №

Однозначно 1. визначена

Тип задачі

C

Методи вирішення

Аналітичні методи; Строго фор- Задача оптима- Дослідження операцій; малізовано льного вибору Спеціальні методи оптимального вибору

Визначена, але перевищує обчис- Строго фор- Задача пошуку 2. оптимальних лювальні можли- малізовано рішень вості системи

Генетичні алгоритми; Рекурентні нейронні мережі; Методи фізикобіологічної оптимізації

Однозначно 3. визначена

Не формаліЗадача вибору зовано

Методи скорочення невизначеності: - Імітаційне моделювання; - Методи експертних оцінок

4. Може доповнюватися

Нечітка логіка; Загальна задача Нейронні мережі; Не формалі- прийняття Методи логікозовано рішень лінгвістичного моделювання

З табл. 1 легко помітити, що традиційні методи пошуку рішень дозволяють адекватно вирішувати тільки задачі оптимального вибору, які є добре структурованими. В цьому випадку отримане рішення буде об’єктивним і найкращим в наявних умовах. Однак ускладнення економічних процесів, що спостерігається в останні десятиліття, суттєво обмежує застосування таких підходів. Якщо в задачі існує формальний критерій оптимальності, але характеристики простору рішень виключають можливість застосування аналітичних і переборних методів (наприклад, задача є NP-повною), то її можна віднести до типу задач пошуку оптимальних рішень. Універсальним методом їх вирішення є генетичні алгоритми, однак застосовується і ряд інших інструментів 96


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

інтелектуальних обчислень, серед яких штучні нейронні мережі Хопфілда, мережі з нейронами Поттса, зростаючі нейронні мережі, метод імітації відпалювання, метод мурашиних колоній та інші [9]. Якщо простір вибору визначено, але неможливо об’єктивно сформулювати правило відбору кращої альтернативи, задача відноситься до категорії задач вибору. У цьому випадку критерій вибору і його результат суб’єктивно залежить від особи, що приймає рішення (ОПР). Для розв’язання задач вибору використовуються імітаційне моделювання, методи експертних оцінок, теорія корисності та інші підходи, які дозволяють зменшити невизначеність при виборі критеріїв. Найхарактернішою задачею в управлінні складними системами є загальна задача прийняття рішень (ЗЗПР) [10]. Для неї характерна відсутність можливості визначення не тільки критеріїв оптимальності, але і те, що сам простір вибору постійно видозмінюється, що веде до необхідності безперервного моніторингу стану системи і вироблення коригувальних рішень. Підтримка прийняття рішень в ЗЗПР реалізується шляхом формування проміжної множини альтернатив, з яких здійснює вибір ОПР, тобто ЗЗПР зводиться до класу задач вибору. Формування проміжної множини альтернатив може здійснюватись за допомогою нейромережевих інструментів, методів нечіткої логіки, а також методів логіко-лінгвістичного моделювання. Для задачі пошуку оптимальних рішень, задачі вибору та загальної задачі прийняття рішень визначення гарантовано-кращого рішення за припустимий час неможливе внаслідок великої кількості можливих варіантів чи недостатньої формалізації правил вибору найкращої альтернативи. Такі економічні задачі будемо називати складними. Розглядаючи прийняття рішень як процес, що відбувається в часі, слід зазначити, що в міру його розвитку необроблений масив інформації, який характеризує досліджувану систему, проходить через ряд послідовних трансформацій, що приводять в остаточному підсумку до вибору рішення, яке визначає подальший розвиток системи. У цій послідовності можна виділити процеси, пов’язані із спостереженням та моделюванням дослі-

97


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

джуваної системи, ідентифікацією її стану, оцінкою та вибором альтернатив. Процес спостереження включає відбір із простору станів аналізованої системи Z множини характеристик системи Y, які спостерігаються, відстеження їх значень і збереження отриманої інформації в базі даних. У термінах системного аналізу рішення цієї задачі зводиться до відшукання такого відображення g 1 :

Y Z ,

яке для кожної реалізації характеристик Y, що спостерігаються, ставить в однозначну відповідність внутрішній стан об’єкта управління. Процес моделювання з формальної точки зору може розглядатися як побудова абстрактної множини E, ізоморфної предметної області: :

Y E.

Основним призначенням моделі Е у задачі прийняття рішень є вивчення та прогнозування реакції об’єкта на керуючі впливи. Процес ідентифікації (ψ) пов’язаний із вирішенням задачі розпізнавання образів, тобто відшукання відповідності між характеристиками системи, які спостерігаються в даний момент (вектор S), і станами системи, які спостерігалися раніше. Процес оцінки та вибору альтернатив для складних економічних задач пов’язаний із необхідністю згортки багатовимірного простору критеріїв [11]. При цьому кожній моделі поведінки економічної системи відповідає свій набір коефіцієнтів важливості критеріїв. Задача оцінювання альтернатив, таким чином, зводиться до відшукування відображення :

M ,

тобто такого набору функцій μj, які б забезпечували однозначну відповідність між альтернативою    та її оцінкою M відповідно до заданого критерію j. Зазначені процеси можна звести у схему концепції моделювання інноваційної інтелектуальної системи прийняття рішень (ІІСПР), представлену на рис. 2. 98


Моделювання інноваційних інтелектуальних… Вектор поточного стану (Si ) g

zi Простір станів системи (Z)

Ю. Г. Лисенко, О. Ю. Мінц

δ Правила вибору (C)

ψ

ωi g

База спостережуваних даних (Y)

φ

Модель системи (E)

Множина оцінок (M)

μ

Рішення (Ω)

База моделей

Рис. 2. Концепція моделювання інноваційної інтелектуальної системи прийняття рішень

Розглянемо процедуру формування рішення в ІІСПР, схематично зображену на рис. 2. Поточна ситуація zi спостерігається та відображається у вигляді вектора Si. Його структура повторює структуру елемента множини Y у частині вхідної інформації. Далі в процесі функціонування ІІСПР поточна ситуація ідентифікується за допомогою моделей Е (процес ψ). Ідентифікація дозволяє відібрати з множини Ω деяку підмножину рішень (пред’явлення) для подальшого вибору найкращої альтернативи. Вибір альтернативи ωi здійснюється на підставі результатів моделювання та їх оцінки. Вибір методів оцінювання регламентується актуальними в поточній ситуації правилами прийняття рішень (елемент множини С). Таким чином, у розглянутій концепції ІІСПР процес пошуку рішення зводиться до послідовності процесів спостереження, моделювання, ідентифікації, оцінювання та вибору. Розглянемо деякі аспекти, пов’язані з реалізацією цих процесів у ІІСПР, які потребують ретельного вивчення та удосконалення.

Реалізація процесу спостереження Будь-яка складна економічна система характеризується великою кількістю параметрів. У той же час кількість станів системи 99


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Ефективність ідентифікації стану системи (% від максимуму)

(прикладів), які можуть бути відстежені за даними передісторії, звичайно обмежена. Тому в рамках процесу спостереження, як одного з етапів моделювання інноваційної інтелектуальної системи прийняття рішень, одними з головних є задачі, пов’язані з визначенням характеристик вхідної вибірки даних, зокрема її розмірності (кількості параметрів), необхідного обсягу (кількості прикладів) та значущості параметрів. Проілюструємо зв’язок між цими характеристиками та ефективністю ідентифікації стану системи за допомогою графіка, наведеного на рис. 3 (дані умовні). Критерієм ефективності ідентифікації стану системи покладемо частку правильно розпізнаних прикладів на тестовій вибірці даних. 100 90 80 70 60 50 40 30 20 10 0 10

20

30

40

50

60

70

80

90

100

Розмірність вектору вхідних даних (% від загальної кількості параметрів)

1. Велика вибірка, параметри відсортовані

2. Мала вибірка, параметри невідсортовані

3. Мала вибірка, параметри відсортовані

Рис. 3. Ілюстрація задачі пошуку оптимальних характеристик вхідних даних

Крива 1 на рис. 3 описує зміну ефективності ідентифікації тестових прикладів при фіксованій і гарантовано достатній кількості прикладів у навчальній вибірці, в залежності від частки параметрів вхідної множини даних, які включені в цю вибірку. При цьому параметри відсортовані за зниженням значущості. Графік цієї кривої при збільшенні кількості параметрів у загальному випадку є неспадним. 100


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

Крива 2 відображає зміну ефективності ідентифікації тестових прикладів при фіксованій і гарантовано недостатній кількості прикладів у навчальній вибірці, а також за умов рівної значущості всіх її параметрів. Починаючи з певного моменту, ефективність ідентифікації при малій вибірці даних буде зменшуватися за рахунок ефекту перенавчання. Крива 3 відображає ефективність ідентифікації тестових прикладів при фіксованій і гарантовано недостатній кількості прикладів у навчальній вибірці, але якщо параметри відсортовані за значущістю. Таким чином, на етапі спостереження перед дослідником можуть виникати різні проблеми, залежно від розмірності та обсягу вхідних даних. Так при вибірці великого обсягу, але низької розмірності, виникає проблема підвищення різноманітності даних, а при вибірці великої розмірності, але малого обсягу – проблема оцінки значущості параметрів. Тісно пов’язані з ними також проблеми визначення достатнього обсягу даних і синтезу оптимальної структури моделі, які повинні вирішуватися комплексно. Хоча зазначені проблеми різною мірою стосуються багатьох методів інтелектуальних обчислень, найбільшу актуальність вони мають при використанні для аналізу даних штучних нейронних мереж (ШНМ), тому будуть розглянуті саме на їх прикладі. Нехай Т – навчальна вибірка, яка являє собою множину даних, що складається з векторів Xi та очікуваного відклику мережі Yi = f ( X i ) : T  X i , Yi iI1 ,

(2)

де I – кількість прикладів у вибірці, а Xi – вектор, що має вигляд:

X i  ( xi ,1 , xi , 2 ,...,xi ,M ) ,

(3)

де M – кількість параметрів, що складають один приклад. Нехай NS – структура нейронної мережі, яка в загальному вигляді може бути описана таким чином: NS  N , L, , (4)

101


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

де N – множина нейронів, що складають ШНМ; L – множина зв’язків між нейронами; ψ – відношення інцидентності, що ставить у відповідність кожному зв’язку з множини L два нейрона з множини N. Для повнозв’язаних багатошарових нейронних мереж прямого поширення при описі структури можна обмежитися зазначенням кількості нейронів в кожному шарі. У цьому випадку структуру (точніше – архітектуру) мережі можна записати формулою виду N1 – N2 – …– Nlay,

(5)

де lay – кількість шарів нейронної мережі; N1 – кількість нейронів у вхідному шарі, що збігається з М – кількістю параметрів у навчальному прикладі; N2 … Nlay-1 – кількість нейронів у кожному з прихованих шарів; Nlay – кількість нейронів у вихідному шарі, які і є виходами ШНМ. Так, наприклад, формулою 5-6-3-1 описується архітектура ШНМ, що має 5 входів, 6 нейронів у першому прихованому шарі, 3 нейрона в другому прихованому шарі та 1 вихід. У загальному вигляді проблема відбору вхідних даних зводиться до знаходження такої вибірки T  T , щоб при заданому параметрі обсягу вибірки I забезпечувалась достатньо точна апроксимація функції f ( X i ) і, відповідно, рішення досліджуваної задачі. При цьому на вибірку T можуть накладатись обмеження залежно від умов задачі. Існування проблеми відбору вхідних даних обумовлено залежністю між складністю структури нейронної мережі та кількістю прикладів, які необхідні для її навчання. Теоретично достатню кількість прикладів у навчальній вибірці можна визначити, відштовхуючись від концепції виміру Вапніка–Червоненкіса (VCвиміру) [12], що відображає «обчислювальну потужність сімейства функцій класифікації, реалізованих машинами, здатними до навчання» [6]. VC-вимір також може бути інтерпретований як «максимальне число образів, на яких штучна нейронна мережа може бути навчена без помилок для всіх можливих бінарних маркувань функцій класифікації» [6, с. 148]. Хоча точне аналітичне 102


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

визначення цього параметра для конкретної архітектури ШНМ у більшості випадків неможливе, оцінки, зроблені в [13], показують, що для найпоширенішого типу нейронної мережі (тобто мережі прямого поширення, яка складається з нейронів із сигмоїдальною активаційною функцією) верхня межа VC-виміру пропорційна W2, де W – кількість вільних параметрів ШНМ, до яких відносяться вагові коефіцієнти зв’язків і параметри функцій активації нейронів: W=|L|+|N|. (6) При цьому: L

lay1

 N i  N i1 , i 1

(7)

lay

N   Ni . i 2

(8)

Розглянемо вимоги до кількості прикладів у вхідній вибірці на прикладі порівняно невеликої повнозв’язаної нейронної мережі прямого поширення з сигмоїдальною активаційною функцією та архітектурою 5-5-1. У такій мережі lay = 3, отже з (6)–(8) |L|=25+5=30, |N|=6  W=36. Таким чином VC вимір має той же порядок що 362 = 1296. Це означає, що для найякіснішого налаштування параметрів даної нейронної мережі для ідентифікації стану складної системи достатньо вибірки, яка містить близько 1000 незалежних прикладів. Якщо кількість незалежних параметрів буде перевищувати VC-вимір, це вже не поліпшить ефективність ідентифікації. Інші методи оцінки (наприклад, метод, запропонований у [14]) дозволяють задавати допустимий рівень помилки мережі, що дає можливість отримати оптимістичніші значення розмірів навчальної вибірки при прийнятному рівні ефективність ідентифікації, однак вимоги до її обсягу все одно залишаються досить високими. Слід наголосити на тому, що вираз W2 обмежує лише теоретичну верхню межу VC-виміру нейронної мережі [6]. Тому на 103


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

практиці може бути достатньо вибірки значно меншого розміру. Але вирази (6)–(8) дозволяють порівнювати різні варіанти архітектури нейронних мереж з погляду потреб до обсягу даних для навчання. З (7) випливає, що в повнозв’язаних нейронних мережах кількість вільних параметрів безпосередньо залежить від кількості нейронів у вхідному і вихідному шарах, а отже від розмірності вектора вхідних даних і його представлення в ШНМ. При цьому нерідко зустрічається ситуація, коли цей параметр великий, а кількість прикладів у навчальній вибірці навпаки – замала. Так, наприклад, задача передбачення банкрутств у банківській системі України пов’язана з аналізом більш ніж 30 параметрів, що характеризують активи, пасиви і фінансові результати банків, що обумовлює достатній обсяг вибірки на рівні приблизно 25000 прикладів (розрахунки зроблені для нейронної мережі з архітектурою 30-5-1). У той же час вибірка, що зроблена на основі банківської статистики України, має обсяг на порядок менше необхідного. Аналогічна ситуація виникає і в багатьох інших випадках, коли зібрати базу даних, обсяг якої був би достатнім для ефективного навчання нейронної мережі, не представляється можливим. Проблема відбору вхідних даних тісно пов’язана з задачею знаходження такої структури мережі NS, яка б забезпечувала мінімум помилки моделювання. У сукупності ці дві задачі не мають і швидше за все не можуть мати аналітичних методів рішення. Не існує також і надійних емпіричних методів їх розв’язання, тому поширеним способом є простий перебір можливих варіантів. Однак, якщо при відносно невеликих обсягах вхідних даних використання переборних алгоритмів цілком допустимо, то із збільшенням обсягу вибірки і розмірності вхідного вектора даних витрати часу на навчання ШНМ істотно зростають, що робить використання переборних алгоритмів недоцільним [15]. Розглянемо методи зниження розмірності даних, що ґрунтуються на: – логічному аналізі даних; – оптимізації представлення даних; – кореляційному аналізі; – непрямих методах аналізу значущості даних. 104


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

Очевидно, що основною метою застосування цих методів є видалення пояснюючих змінних, які слабо впливають або взагалі не впливають на результуючий показник. Отже, в ряді випадків насамперед доцільно провести логічний аналіз даних з метою відсікання параметрів, які не несуть інформаційного навантаження за умов задачі. Так, наприклад, при аналізі стандартних анкетних даних банківського позичальника з вибірки можна виключити поля «Порядковий номер», «№ паспорта», «ПІБ» і тому подібні. Наступним методом зниження розмірності є оптимізація представлення даних. Цей метод може бути використаний для подання на вхід нейронної мережі нечислових даних. Варіанти представлення таких даних наведено на рис. 4. Обласний центр

біт 1

Місто

j

біт 2

Сільська місцевість

а)

б)

в)

Рис. 4. Варіанти представлення нечислових даних, на прикладі параметра «Місце проживання клієнта»: а) представлення через позицію біта; б) представлення через бітову маску; в) представлення через ранг значення

Розглянемо переваги і недоліки кожного варіанта. Варіант представлення даних через визначення позиції біта (рис. 4-а) для кожного значення параметра є найточнішим, але разом з тим і найбільш ресурсномістким (потребує найбільше параметрів ШНМ для його представлення). 105


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Позначимо через vj кількість можливих варіантів значення нечислового параметра j. При поданні параметра через позицію біта, відповідно до (6) – (8), буде потрібно J  v j  N2

(9)

параметрів мережі для кодування цього показника, де N2 – кількість нейронів у другому шарі ШНМ. Для прикладу, який показано на рис. 4-а, |J| = 3*4 = 12. При кодуванні бітовою маскою порядковий номер кожного з варіантів представляється у вигляді двійкового числа і його біти, що мають значення «1», активують відповідні входи ШНМ (рис. 4-б). Кількість параметрів мережі для подібного кодування нечислового показника, можна розрахувати за формулою

J   log2 v j  N 2 ,

(10)

де знак  позначає операцію округлення в сторону більшого числа. Для варіанту представлення даних з рис. 4-б вхідний показник може бути закодований двома бітами. При цьому значенню «Обласний центр» може відповідати маска «11», значенням «Місто» та «Село» – маски «10» та «01», відповідно. Кількість необхідних параметрів |J| = 2 * 4 = 8. Недоліком цього способу кодування є деяке погіршення адекватності представлення вхідних показників, а також складність аналізу структури ШНМ для виявлення знайдених мережею залежностей. Представлення нечислових параметрів у вигляді рангів значень (рис. 4-в) може використовуватись тоді, коли для цих параметрів існує критерій розподілу на шкалі «краще» – «гірше», але якщо такий критерій може бути синтезовано, виходячи з умов задачі. Якщо критерію розподілу немає, або він не є явним, даний спосіб кодування можна застосовувати тільки у виняткових випадках, що є основним недоліком даного способу. Перевагою його є мінімальні вимоги до ресурсів ШНМ. Дійсно, у цьому випадку

J  N2 ,

(11)

що очевидно менше, ніж значення, отримані за формулами (9) або (10). 106


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

У розглянутому прикладі вхідні значення можна закодувати, наприклад, виходячи з питомої ваги проблемних кредитів в різних регіонах. Так, якщо найнадійнішими є кредити, що видані мешканцям обласних центрів, а найменш надійними – кредити мешканцям міст, то значенням «Обласний центр» відповідає код 1, значенням «Село» – код 0,33, а значенням «Місто» – код 0,66. При цьому кількість вільних параметрів складатиме всього |J| = 4. Кодування нечислових даних можна розглядати як компроміс між точністю відображення вхідної інформації та використовуваними ресурсами ШНМ. При великому обсязі вхідної вибірки або при малій кількості можливих значень параметра (наприклад, характеристика «стать» може приймати всього два значення) доцільно використовувати кодування позицією біта. За великої кількості можливих значень параметра або при невеликому обсязі навчальної вибірки доцільно використовувати кодування бітовою маскою. У окремих випадках може бути виправдане кодування шляхом ранжирування значень. Крім того, доцільно вивчити статистичні характеристики показників навчальної вибірки і розглянути можливість видалення з неї рідко використовуваних значень. Кореляційний аналіз є найбільш відомим і поширеним методом формального аналізу, на підставі якого з вхідних даних можна виключити як параметри, які занадто слабо пов’язані з результуючим показником, так і параметри, які занадто сильно пов’язані з іншими вхідними факторами. Недоліком кореляційного аналізу є можливість виявляти залежності між зміною тільки тих параметрів, які мають числове вираження. Нечислові параметри можуть бути проаналізовані лише в тому випадку, якщо вони можуть бути розташовані за принципом «краще» – «гірше», що не завжди можливо. Недоліком класичного метода визначення коефіцієнта кореляції є те, що він достовірно дозволяє знаходити тільки лінійні залежності, тоді як реальні економічні процеси можуть розвиватися за законами, далекими від лінійних. Проведені дослідження показали, що при аналізі даних, заданих у вигляді аналітичної функції, коефіцієнт кореляції Пірсона сягає 1 тільки для лінійної залежності. Для кубічної та експоненційної залежності його 107


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

значення знаходиться в межах від 0,6 до 0,7, а для періодичних функцій, які зустрічаються в аналізі економічних систем досить часто, значення коефіцієнту кореляції близьке до 0 [16]. Значно кращих результатів із виявлення функціональних закономірностей дозволяє домогтися використання сучасних методів аналізу взаємозалежностей в даних. За результатами дослідження [16] найефективнішим виявився метод, заснований на обчисленні коефіцієнта максимуму взаємної інформації (maximal information coefficient, MIC). Значення MIC для всіх аналітичнозаданих залежностей дорівнювало 1, що відповідає максимальному ступеню зв’язку. Хоча коефіцієнт MIC було запропоновано порівняно недавно, у 2011 році він швидко набув поширення для аналізу слабоструктурованих даних. Вже у 2012 році К. Мерфі в монографії, присвяченій перспективам розвитку машинного навчання, назвав MIC кореляцією XXI століття [17, с. 61]. Слід зазначити і недоліки MIC. Головний з них обумовлений вимогами до дискретності аналізованих показників. Це змушує використовувати для аналізу неперервних величин алгоритми дискретизації даних, що негативно позначається на точності виявлення слабких залежностей. Для підвищення точності рекомендується вибір методу дискретизації проводити ітеративно, що дозволяє трохи підвищити точність але, в свою чергу, збільшує трудомісткість і витрати часу. Таким чином, використання MIC вимагає високої кваліфікації аналітика. Крім того, застосування цього методу стримується його відсутністю у поширених програмних продуктах. Важливу роль при вирішенні задачі зниження розмірності вибірки можуть зіграти непрямі методи аналізу значимості даних. У роботі [18] показано, що в якості методу відбору значущих параметрів може бути використаний будь-який метод, що дозволяє виконати ранжирування набору даних за ступенем їх впливу на вихідний параметр, навіть якщо таке ранжирування не є його основною функцією. До таких методів, наприклад, можна віднести алгоритм автоматичної побудови дерев рішень C4.5 [19]. Використання цього алгоритму дозволяє провести ранжирування не тільки тих факторів, які мають числовий вираз, але і нечислових факторів, які не можуть бути приведені до числового 108


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

виду. Особливості роботи алгоритму дозволяють варіювати кількість параметрів, які відкидаються (тобто таких, яким присвоюється нульова значущість), що підвищує гнучкість методу. Ще однією перевагою алгоритму C4.5, порівняно з кореляційним аналізом, є автоматичне відкидання параметрів, що мають сильну взаємну кореляцію з іншими. За малої розмірності вектора вхідних даних, великої кількості прикладів у вибірці та наявності складної залежності між вхідними і вихідними параметрами постає проблема підвищення різноманітності вхідних даних. Прикладом таких даних може бути біржова інформація з валютних торгів. Базовий набір вхідних даних, що описує стан ринку, в загальному випадку містить лише інформацію про курсові відносини різних пар валют за часовими періодами. При цьому в кожному періоді виділяється курс на початок періоду oi, на кінець періоду ci, а також максимальні hi і мінімальні li значення курсу за період. Оскільки сам по собі такий вектор не несе ніякої інформації про тенденції змін цін на біржі, для урахування динаміки цього та інших часових рядів застосовують трансформацію вхідного набору даних за допомогою ковзного вікна, тобто замість вектора { oi , hi , li , ci } використовується вектор { oi k , hi k , lik , ci k , oik 1 ,...,oi1 , hi 1 , li 1 , ci1 , oi , hi , li , ci }. Однак і цей спосіб не дозволяє досягти високих результатів у прогнозуванні навіть із застосуванням персептронних і подібних до них нейронних мереж, що є наслідком з фундаментальних обмежень, які були сформульовані Розенблаттом і доповнені М. Минскім і С. Пейпертом [20]: – персептронні мережі не здатні до узагальнення своїх характеристик на нові стимули або нові ситуації, а також не здатні аналізувати складні ситуації в зовнішньому середовищі шляхом розчленування їх на простіші; – персептрони мають обмеження в задачах, пов’язаних з інваріантним представленням образів. Зменшити вплив цих обмежень можна шляхом надання персептронам додаткової інформації, що уточнює поточну ситуацію. Така інформація може бути отримана, наприклад, із використан109


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

ням емпіричних методів аналізу, які формулюються у вигляді «умова» – «наслідок». Фактично, такі методи можна розглядати як мікро-експертні системи (ЕС-1 … ЕС-n на рис. 5).

...

...

ЕС-n

...

Вхідні дані

...

ЕС-1

Рис. 5. Структура вхідної частини нейро-експертного модуля аналізу даних

Так, в якості ЕС-1…ЕС-n на рис. 5 на валютних і фондових ринках можуть виступати ринкові індикатори та осцилятори, які дозволяють отримувати вихідний сигнал у вигляді набору (-1/0/1), що відповідає прогнозуванню відповідно зниження курсу (-1), збереження нинішнього рівня (0) та підвищення курсу (1). Існують методи і для більш детального прогнозу [21]. 110


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

Реалізація процесу моделювання Серед методологічних проблем, які виникають на етапі моделювання ІІСПР, особливо слід виділити такі, що пов’язані із постановкою завдання і вибором ефективних інструментів його рішення. Хоча в [5, 22] надаються деякі рекомендації щодо застосування певних нейромережевих інструментів для вирішення різноманітних економічних задач, наприклад, побудови рейтингів, прогнозування, класифікації, проте не сформульовано єдиного комплексного підходу до конструювання штучних нейронних мереж з урахуванням специфіки задачі (вибору типу мережі, структури, обробки вхідних і вихідних даних тощо). Аналіз використання цього терміна в різних літературних джерелах показує, що найбільше уваги визначенню правильної постановки задачі надається в рамках теорії розв’язання винахідницьких завдань, запропонованої та розвиненої Г. С. Альтшуллером і його послідовниками [23, 24]. В рамках цієї теорії постановка відокремлюється як самостійний етап розв’язання задачі, який значною мірою визначає остаточний результат. За запропонованою концепцією моделювання інноваційних інтелектуальних систем прийняття рішень (див. рис. 2) постановка задачі є складовою частиною процесу моделювання φ. Результати проведеного дослідження показали, що при використанні інтелектуальних методів пошуку одна й та сама задача в деяких випадках може бути поставлена по-різному [25]. При цьому ефективність її рішення знаходиться у значній залежності від постановки задачі, а отже, від використаних методів та інструментів. Адже, відповідно даному вище визначенню складної економічної задачі, для неї неможливе знаходження гарантовано-кращого рішення за припустимий час. Тому всі методи розв’язання таких задач відшукують тільки приблизні варіанти рішень. Тому ефективність застосування різних інструментів у загальному випадку відрізнятиметься. Етап постановки задачі передбачає її віднесення до одного чи декількох класів. Тому слід розглянути класифікацію задач з аналізу та обробки даних. Аналізом даних будемо називати процес вилучення з необроблених даних відомостей, корисних для дослідника. 111


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Обробкою даних в широкому сенсі назвемо процеси, пов’язані зі збором, зберіганням, аналізом та трансформацією даних. Обробкою даних у вузькому сенсі назвемо процеси, в результаті яких з одного масиву даних виходить інший, із заданими властивостями. Щоб уникнути можливих різночитань, далі термін «обробка даних» буде використовуватися виключно у вузькому сенсі. Класифікацію задач з аналізу даних наведено на рис. 6. Задачі з аналізу даних

Прогностичні

Аналіз відхилень

Виділення значущих ознак

ф

Пошук аномалій

Гр а

Аналіз мережевих взаємодій

Матриця

д Ря

Виявлення причиннонаслідкових зв'язків

ф

Аналіз соціальних мереж

Пошук підпослідовностей

Прогнозування

Аналіз часових рядів

Регресія

Полінарна

ра

Матриця

д Ря

Бінарна

Аналіз зв’язків

Кластериз ація Г

Пошук асоціативних правил

Регресія

Групування об’єктів

Класифікація

Описові

Рис. 6. Класифікація задач інтелектуального аналізу даних

На відміну від запропонованих раніше [26–30], класифікація на рис. 6 містить чотири ранги за рахунок виділення і впорядкування таксономічних ознак. Це дозволяє краще зрозуміти взаємозв’язок між різними класами задач і методами їх вирішення, що надає можливість підвищення ефективності аналізу даних. Задачі аналізу даних за метою вирішення поділяються на дві великі групи – прогностичні та описові. 112


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

В рамках прогностичної групи на рис. 6 виділено такі класи: 1. Задачі класифікації. За кількістю класів, на які поділяється вхідна вибірка, слід виділяти задачі бінарної та полінарної класифікації. При бінарній класифікації вхідна вибірка ділиться тільки на два класи (наприклад – видавати кредит, або ні; надійний чи ненадійний контрагент). При полінарній класифікації вхідна вибірка ділиться на три або більше класів. Прикладами таких задач є: розпізнавання образів, сегментація клієнтів (якщо класи задані заздалегідь) тощо. Незважаючи на схожість постановок задач бінарної та полінарної класифікації, методи та інструменти їх вирішення суттєво різняться. 2. Задачі регресії потребують виявлення взаємозв’язку між вхідними та вихідними змінними. Прикладом задачі регресії може бути визначення суми кредиту, який може бути виданий клієнту. Існують також такі різновиди задач регресії, як прогнозування та аналіз часових рядів. Метою прогнозування є наближена оцінка значень деяких показників у майбутньому на підставі відомих значень у минулому і сьогоденні. Метою аналізу часових рядів є прогнозування майбутніх значень деякого набору даних, де значення вихідної змінної залежить не тільки від її минулих значень, але і від часу. У задачах описової групи на рис. 6 виділено такі класи: 1. Задачі кластеризації. При їх вирішенні потрібно знайти закономірності в масиві даних, виділити в ньому деяку кількість зон (кластерів) і розподілити по ним дані. До цього класу віднесено задачі з пошуку підпослідовностей у рядах даних, групування об’єктів та аналізу соціальних мереж, які відрізняються тільки представленням вхідних даних і розмірністю простору угруповання. Так, пошук підпослідовностей у динамічних рядах фактично являє собою задачу кластеризації в одновимірному просторі часу, де кожен елемент має тільки двох сусідів – попереднє значення ряду і наступне. В задачах угруповання масиву вхідних даних кожен елемент (крім крайніх і кутових) має фіксоване число сусідів. У двомірному ортогональному просторі їх чотири, в тривимірному – шість, і так далі. Вхідні дані у такому випадку представляються в матричному вигляді. Нарешті, аналіз соціальних мереж – це задача, де кожен елемент вхідних даних (вершина графа) може мати будь-яку кількість сусідів, яка в реальних соці113


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

альних мережах може сягати кількох тисяч (а для окремих людей і більше). 2. Задачі з аналізу зв’язків вирішуються за необхідності встановлення зв’язків і відносин між змінними у великих базах даних. Предметом виявлення причинно-наслідкових зв’язків є пошук статистично значущих закономірностей у часовій послідовності даних, який дозволяє відповісти на питання: «З якою ймовірністю настання події А тягне за собою настання події Б?». Пошук асоціативних правил дозволяє знаходити закономірності між пов’язаними подіями, тобто дає можливість відповісти на питання: «З якою ймовірністю пов’язані події А і Б?». При цьому послідовність настання подій значення не має. Аналіз мережевих взаємодій дозволяє вирішити задачу пошуку епіцентрів мережевої активності, тобто вузлів, що впливають на процеси, які відбуваються в мережі, або ініціюють такі процеси. Вхідні дані при цьому подаються у вигляді графа. У широкому сенсі ця задача зводиться до виявлення для кожного вузла мережі керуючих і керованих вузлів. 3. До задач аналізу відхилень відносяться задачі з пошуку аномалій і виділення значущих ознак. Пошук аномалій включає виявлення та ідентифікацію таких елементів даних, які не відповідають встановленим закономірностям. Причому такі аномалії можуть бути як новими закономірностями (наприклад, нові тренди в біржових даних), так і сигналами про ненормальну поведінку об’єкта спостереження. Об’єктом пошуку аномалій можуть бути результати вимірювань, часові ряди, текстова інформація, графи. Задача виділення значущих ознак набула особливої актуальності у зв’язку з розвитком Internet і різким зростанням обсягів інформаційних ресурсів. Суть її зводиться до створення на підставі вхідної інформації деякої вибірки, яка б при заданих обмеженнях на обсяг найповніше представляла її суть. Спочатку така задача вирішувалася виключно для текстових документів (автоматичне реферування), проте у даний час сфера її застосування охоплює всі основні види представлення інформації, у тому числі зображення, звук та відео. Серед актуальних прикладів її застосування – тематичний пошук контенту, контекстний пошук, виявлення матеріалів, що порушують інтереси правовласників чи законодавчі обмеження, тощо. 114


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

Класифікацію задач інтелектуальної обробки даних наведено на рис. 7. Обробка даних

Квантування Ря д

Матриця

Відновлення Ря д

Матриця

Ря д Матриця

Очищення

Фільтрація Ря д

ф

ф

Матриця

а Гр

а Гр

ф

Ряд

Ранжирування

Без зміни порядку елементів

а Гр

Ряд

Сортування

Зі зміною порядку елементів

Рис. 7. Класифікація задач інтелектуальної обробки даних

Як видно з аналізу рис. 7, основною класифікаційною ознакою задач інтелектуальної обробки даних пропонується ознака впливу на порядок елементів вхідної вибірки даних. Зміна порядку елементів відбувається при вирішенні задач ранжирування і сортування. Вхідні дані при цьому зазвичай представлені у вигляді рядів або зводяться до них. В інших задачах зміна порядку елементів вхідних даних не відбувається. Сортування – задача, пов’язана з розташуванням елементів даних у заданій послідовності або розподілом їх по групах. Задача ранжирування відрізняється від сортування тим, що для її вирішення необхідно визначити метод визначення рангу кожного елемента вхідної послідовності даних (тобто метод, 115


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

який дозволяє згорнути весь вектор значень елемента в єдиний параметр – ранг). Це дозволяє порівнювати між собою будь-яку кількість елементів із вхідного набору, не вдаючись до його повного сортування, що ефективно за наявності великих обсягів даних. Під фільтрацією при обробці економічних даних будемо мати на увазі відбір інформації, що задовольняє заданому критерію. Вхідні дані для фільтрації можуть бути представлені у вигляді ряду, масиву або графа. Задача очищення даних, по суті, є зворотною до задачі фільтрації та передбачає виключення з початкової вибірки «зайвих» даних. Очищення даних може стосуватись рядів, матриць і графів. Очищення рядів передбачає усунення «викидів», тобто даних, які явно виходять за межі основної тенденції. Причинами появи таких викидів можуть бути як помилки вимірювання, так і навмисні спотворення інформації. У будь-якому випадку, спотворені дані роблять сильний вплив на якість подальшого аналізу, особливо при використанні виключно формальних методів, в тому числі машинного навчання. Очищення даних, представлених у матричній формі, проводиться для усунення з вхідної вибірки факторів, що мало впливають на вихідні показники або зовсім не пов’язані з ними. Відносно графів очищення передбачає проріджування зв’язків і застосовується як по відношенню до вхідних даних, так і до деяких видів економіко-математичних моделей, структурою яких є граф, наприклад штучних нейронних мереж. При цьому усуваються слабкі зв’язки, які мало впливають на загальний результат але ускладнюють аналіз. Необхідність у відновленні даних виникає в тому випадку, якщо вхідна вибірка містить пропуски або якісь дані в ній відсутні, але є гіпотези про природу їх виникнення, що дозволяє оцінити найімовірніші значення. Відновлення даних дозволяє підвищити ефективність машинного навчання за рахунок розширення вхідної вибірки даних. Необхідність відновлення даних може виникати при їх поданні у будь-якій з розглянутих форм – у вигляді рядів, матриць або графів. В останньому випадку об’єктом відновлення виступають відсутні у вхідній вибірці зв’язки між вершинами графа. 116


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

Квантування використовується для динамічних рядів даних за необхідності зменшення кількості їх елементів, тобто при спрощенні рядів. Існують такі різновиди, як квантування за рівнем і квантування за часом. У першому випадку діапазон значень неперервної або дискретної величини розбивається на кінцеве число інтервалів. Якщо протягом деякого періоду часу значення величин динамічного ряду не виходило за межі одного інтервалу, то в результаті квантування всі ці величини будуть замінені одним значенням [31, с. 184]. У другому випадку розбиття динамічного ряду на інтервали відбувається за часом. Кожен інтервал замінюється одним усередненим значенням елементів ряду, або декількома, що відображають граничні значення показника за цей період. Останній спосіб використовується для представлення біржових даних. Існують також різновиди квантування за рівнем і за часом зі змінним кроком квантування [32]. Складність задач обробки даних зростає з ускладненням структури поля критеріїв і зменшенням їх визначеності. Таким чином, вирішення задач аналізу чи обробки даних у складі ІІСПР доцільно розпочинати з постановки завдання та віднесення задачі до одного чи кількох класів із наступним моделюванням кожної з постановок та оцінкою ефективності результатів. Наприклад, задача біржового спекулянта може бути вирішена щонайменш у трьох постановках – класифікації, регресії та кластеризації, а задача передбачення банкрутств комерційних банків може бути зведена до постановок класифікації, прогнозування та кластеризації.

Реалізація процесу ідентифікації Основна проблема ідентифікації полягає в тому, що внаслідок обмеження часу спостереження повний збіг значень вектора S характеристик системи, які спостерігаються в даний момент, з якимось елементом вхідної вибірки даних (множини Y) представляється неможливим (зрозуміло, якщо характеристики Y досить повно відображають стан системи, тобто за умови кваліфікованого рішення задачі спостереження). Отже, задача ідентифікації зводиться до відшукування найбільш схожої ситуації з-поміж тих, що спостерігалися раніше. Для цього використовуються ме117


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

тоди, засновані на визначенні відстані між вектором S і векторами, які описують попередні стани системи в n-вимірному просторі (моделлю системи), де n – розмірність вектора S. Найбільш схожій ситуації буде відповідати мінімальна відстань. На практиці, однак, необхідно мати на увазі різну значущість характеристик у кожному конкретному випадку. Точність ідентифікації значною мірою визначається адекватністю моделі і, як наслідок, залежить від результатів процесу моделювання. Разом з тим, достовірність ідентифікації може бути підвищена за рахунок зменшення невизначеності зовнішнього середовища шляхом оцінювання параметрів економічної системи, які на момент ідентифікації не є достовірно відомими. До них, зокрема, відносяться параметри, які формально визначаються за підсумками періоду, але можуть бути достатньо точно оцінені й раніше на підставі розрахункових чи імітаційних моделей. Останні розглянемо докладніше. Існує кілька різновидів імітаційного моделювання [34, 35]: – Моделювання системної динаміки. Виникнення цього напрямку пов’язане з ім’ям Дж. Форрестера, який у середині 1950х років розробив його основні засади. Системна динаміка передбачає найвищий рівень агрегування компонентів з усіх методів імітаційного моделювання. Завдяки ряду спрощень, прийнятих в моделях системної динаміки (абстрагування від індивідуальних характеристик об’єктів і фізичних характеристик навколишнього середовища, неперервність усіх змінних і процесів), вони дозволяють простими засобами отримати адекватний опис процесів у досить складних системах. Модель системної динаміки може служити для виявлення та аналізу причиннонаслідкових зв’язків між будь-якими компонентами системи, дозволяє порівняти варіанти рішень з її управління. Наприклад, імітаційна модель ціноутворення на ринку житлової нерухомості [36] може бути використана для аналізу взаємозв’язків між факторами ринку і для прогнозування ринкових цін, що є важливим для кредитних організацій та ріелторів. Імітаційна модель сімейного бюджету банківського позичальника [37] дозволяє комерційним банкам оцінити ймовірність повернення кредитів і розрахувати можливі сценарії реструктуризації простроченої кредитної заборгованості. 118


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

– Дискретно-подійне моделювання передбачає дослідження функціонування системи в часі та аналіз впливу на її стан зовнішніх подій, які подаються у вигляді «заявок». Найвідомим прикладом застосування цього різновиду імітаційного моделювання є аналіз систем масового обслуговування. Сферою застосування дискретно-подійного моделювання можуть служити будь-які системи, пов’язані з обслуговуванням потоку об’єктів – системи передачі інформації, логістичні, транспортні, виробничі системи тощо. – Агентне моделювання. Передбачає визначення поведінки одиничної простої структури – агента – у взаємодії з іншими такими ж агентами і навколишнім середовищем. Агент розглядається як деяка сутність, яка має активність, автономну поведінку, може приймати рішення відповідно до деякого набору правил, може взаємодіяти з оточенням та іншими агентами, а також може еволюціонувати. Вивчення поведінки сукупності агентів дозволяє отримати інформацію про властивості системи, що вивчається, на макрорівні. Агентний підхід доцільно застосовувати в тому випадку, коли індивідуальна поведінка об’єктів має великий вплив на поведінку системи в цілому. До таких завдань відносяться моделювання ринків, конкуренції, динаміки населення та ін. Крім того, агентний підхід може застосовуватись і спільно з іншими різновидами імітаційного моделювання, зокрема в рамках моделей системної динаміки. Таким чином, імітаційне моделювання відноситься до непрямих методів оцінки параметрів економічних систем і дозволяє розширити різноманітність вхідних даних для аналізу і, в результаті, підвищити обґрунтованість прийнятих рішень.

Реалізація процесу оцінки ефективності Слід виділити як мінімум два підходи до оцінки ефективності інтелектуальних обчислень – абсолютний і відносний. Визначення абсолютних оцінок дає можливість проаналізувати ефективність деякої моделі та відповісти на питання про її придатність або непридатність для вирішення поставленої задачі. Визначення відносних оцінок дає можливість порівняння кількох моделей і визначення кращої з них за діючих умов. 119


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Крім цього, задачу оцінки ефективності інтелектуальних систем прийняття рішень слід розглядати відносно різних об’єктів і процесів, серед яких відзначимо: – алгоритми і програмне забезпечення; – процес навчання; – моделі аналізу даних; – моделі обробки даних. Розглянемо зміст поняття «ефективність» по відношенню до цих об’єктів. Необхідність оцінки ефективності роботи програмного забезпечення обумовлена тим, що різні реалізації принципів інтелектуальних обчислень можуть сильно відрізнятись як за точністю, так і за швидкістю роботи. Аналогічна ситуація виникає при зіставленні ефективності роботи різних алгоритмів, що виконують функцію навчання моделі або налаштування параметрів інтелектуальних обчислень [38]. Таким чином, виникає потреба у надійному методі зіставлення різних програмних продуктів та алгоритмів за ефективністю їх реалізації. Оцінку ефективності машинного навчання необхідно розглядати в зв’язку з вирішенням задачі оптимальної настройки алгоритмів навчання, які чутливі до обсягу навчальної вибірки та до параметрів процесу навчання. Існуючі підходи до оптимізації цих параметрів носять емпіричний характер і потребують узагальнення. Ефективність моделей аналізу даних означає здатність розробленої моделі виконувати поставлені практичні завдання та має за мету визначення і порівняння економічної вигоди від їх застосування. Слід враховувати, що, принаймні, для різних класів економічних задач підходи до оцінки ефективності можуть відрізнятися. При оцінюванні ефективності моделей обробки даних необхідно знайти відповідь на питання про економічну вигоду, що отримується в результаті застосування різних методів обробки. Таким чином, задача дослідження ефективності виникає на таких етапах реалізації інтелектуальних методів вирішення економічних задач, як вибір програмного забезпечення, навчання інтелектуальних систем і оцінка результатів їх роботи для завдань аналізу і обробки даних. Розглянемо їх докладніше. 120


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

Оцінка ефективності роботи програмного забезпечення та алгоритмів навчання. Розвиток теорії інтелектуальних обчислень спричинив появу великої кількості модифікацій методів і алгоритмів машинного навчання. Так, кількість типів ШНМ на даний час перевищує 20. При цьому, наприклад, у математичному пакеті Matlab тільки для одного з цих типів – персептрона – передбачено більше ніж 10 варіантів навчання. Як правило, жодна з цих модифікацій не дозволяє отримати поліпшення ефективності на всьому діапазоні значущих параметрів і для всіх різновидів задач, але для окремих видів приріст ефективності може бути суттєвим (див., наприклад, [38]). Аналогічна ситуація спостерігається і стосовно програмного забезпечення, виробники якого часто використовують спрощені реалізації методів та алгоритмів, які не дозволяють отримати найефективніші рішення. Очевидно, що здійснення повного перебору всіх доступних варіантів для кожної задачі істотно збільшує трудомісткість реалізації ІІСПР. Тому на практиці до цього вдаються рідко, покладаючись на досвід та інтуїцію розробника. Однак такий підхід не завжди дозволяє одержати найкращий результат. Ефективнішою є така організація процесу вибору, за якої безліч варіантів зводиться до мінімуму за допомогою апріорного порівняння. Питання порівняння ефективності алгоритмів та їх реалізацій вперше було піднято Д. Кнутом [39]. Незважаючи на загальновизнану важливість таких досліджень, слід зазначити, що для оцінки ефективності роботи програмного забезпечення та алгоритмів інтелектуальних обчислень запропоновані в них ідеї повинні бути доповнені та розвинені з урахуванням новітніх розробок. Зокрема, основним критерієм ефективності алгоритмів у [39] приймається швидкість роботи. Однак, з огляду на те, що слабкоструктуровані задачі не завжди можуть сходитись до глобального оптимуму похибки моделювання, іншим важливим критерієм слід вважати точність одержуваних результатів. Оскільки критерії швидкості та точності є взаємно суперечливими, залежно від умов задачі один із них доцільно обмежувати. Тобто, можна шукати або найточніший алгоритм при заданих обмеженнях за часом роботи, або найшвидший алгоритм при заданих обмеженнях по точності. Для отримання порівнянних результатів необхідно забезпечити однакові умови тестування для різних методів. З технічного 121


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

боку це повинно проявлятись в однаковій апаратній платформі для перевірки різних алгоритмів. Не меншу важливість має забезпечення подібності задач для тестування. Для виконання останньої умови можна запропонувати підхід до реалізації та зіставлення алгоритмів машинного навчання, заснований на понятті типових задач. Типовою назвемо задачу, основні характеристики якої з погляду вхідних даних і результатів є досить близькими для деякого набору інших задач у схожій постановці. До задач, які можна використовувати за типові з економіки, висунемо такі вимоги (В.1 – В.6): В.1. Доступність вхідних даних, причому в різних варіантах, які, тим не менш, мали б схожі характеристики розподілу. Виконання цієї вимоги необхідно для забезпечення порівнянності результатів досліджень, проведених у різні часи і за різних умов. В.2. Прозорість економічної інтерпретації результатів. Необхідно для забезпечення можливості прямого зіставлення алгоритмів, які досліджуються, за основним критерієм, прийнятим в економіці – вигоді від використання. В.3. Можливість перевірки результату. Повинні існувати методи визначення абсолютно кращого варіанту розв’язання задачі. Це дозволить не тільки порівнювати алгоритми між собою, а й оцінювати їх абсолютну ефективність. В.4. Складність рішення. Типові задачі мають відноситися до задач пошуку оптимальних рішень, задач вибору чи загальних задач прийняття рішень (див. табл. 1). В.5. Можливість порівняння результатів. Постановка задачі повинна забезпечувати можливість визначення якості результатів різних її рішень. В.6. Репрезентативність. Чим більше різних економічних задач може бути зведено до тих самих постановок, що і типова, тим краще. Слід зазначити, що de facto у сфері інтелектуальних обчислень вже склався певний набір задач, які традиційно використовуються для перевірки роботи алгоритмів і демонстрації їх можливостей. Так, довгий час однією з них була задача класифікації, в якій потрібно віднести рослину ірис до одного з трьох видів (setosa, 122


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

versicolour або virginica) в залежності від довжини і ширини чашолистків і пелюсток. Аналіз відповідності вимогам В.1 – В.6 показує, що ця задача повністю відповідає лише вимогам В.3 і В.5, а також частково – В.6. Таким чином, підстав використовувати її в якості типової немає. Це розуміють і виробники програмного забезпечення, тому в демонстраційних прикладах сучасних систем нейромережевого моделювання вона майже не зустрічається. Для аналізу ефективності рішення NP-повних задач часто використовується задача комівояжера – одна з найвідоміших задач комбінаторної оптимізації [40, 41]. Суть її зводиться до відшукування найкоротшого шляху обходу заданих міст із подальшим поверненням на початок маршруту. Починаючи з 1950-х років ведеться систематичний пошук аналітичних рішень цієї задачі, що дозволило отримати методи і алгоритми розрахунку найкоротших шляхів для досить великої кількості вузлів. Недоліком цих методів є досить вузька спеціалізація, проте їх застосування дозволяє виконати вимогу В.3 до типових завдань. Інші вимоги також виконуються: дані легко можуть бути згенеровані (В.1); найкоротший маршрут є зазвичай і найвигіднішим економічно (В.2); знаходження найкоротшого шляху є дійсно складною задачею (В.4); відношення знайденого шляху до найкоротшого дозволяє однозначно порівнювати ефективність різних алгоритмів (В.5); до комбінаторної оптимізації в економіці можна звести велику кількість практичних задач (В.6). Ще однією задачею, яка має велике значення для порівняння алгоритмів реалізації інтелектуальних обчислень, є задача біржового спекулянта, яка також відповідає вимогам В.1 – В.6. Так, результати біржових торгів є відкритими і загальнодоступними, що забезпечує виконання вимоги В.1. Отримані результати прямо виражаються через прибуток, що забезпечує прозорість їх економічної інтерпретації (В.2). Абсолютно кращий варіант рішення відповідає точному прогнозу розвитку подій, який відомий з аналізу даних передісторії. Це забезпечує виконання вимог з перевірки результату (В.3). Досягнення абсолютно кращого результату на практиці неможливе, оскільки на розвиток подій впливає безліч факторів, які лише побічно проявляються у вхідних даних (В.4). Результати роботи різних алгоритмів можна зіставити за 123


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

розміром отриманого прибутку (В.5). Що стосується репрезентативності результатів (В.6), то вище вже зазначалось, що дана задача може розглядатись у різних постановках (регресії, класифікації, кластеризації), до яких можна звести велику кількість різних економічних задач з аналізу слабкозв’язаних даних. Використання системи типових задач у поєднанні з розробленими раніше методами забезпечення порівнянності результатів [39, 42, 43] дозволяє підвищити обґрунтованість вибору програмних засобів і алгоритмів навчання та знизити витрати на створення ІІСПР. При цьому система типових задач може формуватися поступово, на підставі узагальнення накопиченого досвіду в створенні ІІСПР. Ефективність машинного навчання. Термін «навчання» стосовно систем штучного інтелекту (комп’ютерних програм) визначено в класичній монографії Т. Мітчелла таким чином [44, с. 2]: Кажуть, що комп’ютерна програма навчається при вирішенні якоїсь задачі з класу T, якщо її продуктивність, згідно метрики P, поліпшується при накопиченні досвіду E. При цьому P, T і E можуть мати різні значення для різних задач. Отже, момент припинення росту продуктивності системи є очевидним маркером закінчення процесу навчання. Однак на практиці виявлення цього моменту часто є нетривіальною задачею, зважаючи на складність визначення продуктивності інтелектуальної системи для різних класів задач. Крім того, поняття «навчання», відповідно до визначення, даного вище, можна розглядати у вузькому і в широкому сенсах. У вузькому сенсі під навчанням будемо розуміти настройку параметрів інтелектуальної системи спеціалізованим навчальним алгоритмом (наприклад, Back Propagation для ШНМ, C4.5 для дерев рішень, оператори селекції генетичних алгоритмів). У широкому сенсі під навчанням будемо розуміти настройку самих навчальних алгоритмів, а також визначення структури системи інтелектуальних обчислень (наприклад – кількість нейронів у прихованих шарах ШНМ, кількість розгалужень у деревах рішень, розмір популяції в генетичних алгоритмах). Питання визначення оцінки продуктивності системи штучного інтелекту найприродніше вирішується для задач аналізу даних, що відносяться до прогностичної групи (класифікація і регресія). 124


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

Рівень помилки

Вхідна вибірка даних у цьому випадку ділиться на навчальну та тестову, а якість навчання визначається за такими критеріями [45, с. 96]: К.1. Мінімізація помилки у розпізнаванні навчальної множини; К.2. Мінімізація помилки у розпізнаванні тестової множини; К.3. Досягнення адекватної динаміки процесу навчання. Пояснимо критерій К.3. Аналіз динаміки навчання нейронної мережі дозволяє виявити момент перенавчання ШНМ, що є основною небезпекою роботи з малими вибірками даних, та уникнути його. На рис. 8 зображено класичний вид графіка зміни середньої помилки моделювання ШНМ на навчальній і тестовій множинах даних.

Тестова множина

Точка зупинення процесу навчання

Навчальна множина

Епохи

Рис. 8. Динаміка процесу навчання ШНМ

З аналізу рис. 8 видно, що якщо середня помилка на навчальній множині монотонно зменшується, то середня помилка ШНМ на тестовій множині проходить через екстремум, після чого починає збільшуватися. Проходження через екстремум і є моментом, коли процес навчання необхідно зупинити. У такому випадку ШНМ замість узагальнення залежностей між вхідними та вихідними даними починає підлаштовуватись і «запам’ятовувати» приклади з навчальної множини. 125


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

С. Хайкін вказує, що перехресна перевірка з використанням тестової множини і рання зупинка процесу навчання доцільні при виконанні такої умови [6, с. 293]: I < 30 W, (12) де I – кількість прикладів у навчальній вибірці; W – кількість вільних параметрів нейронної мережі. Тобто при малих обсягах навчальної вибірки перехресна перевірка необхідна. Графік, показаний на рис. 8, є лише схематичною ілюстрацією процесу контролю за навчанням, оскільки за явної суперечливості характеристик навчальної вибірки і архітектури ШНМ його вигляд буде істотно відрізнятись від наведеного. При аналізі ефективності навчання в задачах, де відсутня можливість розбиття вхідної вибірки на тестову і навчальну, застосування критерію К.2 неможливе. Якщо при цьому кількість ітерацій у процесі навчання не обмежена, може бути задіяний критерій К.3, відповідно до якого маркером закінчення процесу навчання слід вважати припинення поліпшення значень функції продуктивності. Наприклад, для генетичних алгоритмів такою буде функція пристосованості, а для самоорганізаційних ШНМ із шаром Кохонена – помилка кластеризації. Відзначимо, що оцінка продуктивності інтелектуальної системи у вузькому сенсі за критерієм К.3 не є можливою для алгоритмів навчання з кінцевою кількістю ітерацій, наприклад для алгоритмів синтезу дерев рішень. Взагалі, непряма оцінка ефективності навчання за критеріями К.1 – К.3 для таких випадків не має сенсу. Підбір параметрів навчання таких алгоритмів здійснюється в комплексі з оцінкою ефективності результатів методами комбінаторної оптимізації. Оцінка ефективності результатів аналізу даних. При оцінюванні результатів вирішення економічних задач головним критерієм ефективності є економічна вигода, тобто ефективність означає здатність розробленої моделі виконувати поставлені практичні завдання. Оцінка ефективності отриманої моделі може здійснюватись або в режимі реальної експлуатації, або на підставі даних про минулий стан системи. Режим реальної експлуатації дозволяє виявити справжню ефективність рішення, але ця перевірка обхо126


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

диться дорожче і займає багато часу. Перевірка на підставі минулих даних може бути проведена набагато швидше і коштує дешевше, але вона дозволяє знайти тільки очікувану ефективність і її достовірність падає в умовах мінливого зовнішнього середовища. Однак перевірка ефективності на історичних даних дозволяє порівняти між собою значну кількість моделей і обрати для практичного використання ту, що має найбільшу очікувану ефективність, у той час як режим реальної експлуатації передбачає аналіз зазвичай лише одної впровадженої системи. Тому обидва методи на практиці застосовуються спільно. Розглянемо класифікацію моделей аналізу даних з погляду на оцінку їх ефективності, яка ґрунтується на класифікації, даній у [42, с. 565]. Кількісними моделями першого типу будемо називати моделі, економічна ефективність яких однозначно визначається кількісними метриками, заснованими на різниці між результатами, передбаченими моделлю, і фактичними даними. До цього типу, наприклад, відносяться моделі, які вирішують задачу прогнозування. Кількісними моделями другого типу будемо називати моделі, економічна ефективність яких також залежить від достовірності передбачених подій, але абсолютна вартість правильних і помилкових прогнозів різниться. Серед моделей аналізу даних до цього типу відносяться, зокрема, ті, що вирішують задачі бінарної класифікації. До дескриптивного типу будемо відносити моделі, результат роботи яких носить характер опису і для яких застосування формальних методів оцінки точності неможливе. Такими є, наприклад, моделі, що відносяться до класу аналізу зв’язків. Ефективність кількісних моделей першого типу добре описується такою метрикою, як середньоквадратична помилка прогнозування на навчальній і тестовій вибірках даних. У складних випадках, коли вибірка даних недостатньо репрезентативна, а крива динаміки процесу навчання істотно відрізняється від виду, показаного на рис. 8, можуть бути використані додаткові засоби візуальної оцінки ефективності прогнозування, зокрема діаграми розсіювання, що дозволяють візуально оцінити рівень і розподіл помилок прогнозування [42]. Вважається, що чим ближче розрахункові значення до реальних, тим менша помилка прогнозуван127


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

ня. Однак така інтерпретація лише дублює показник середньоквадратичної помилки, тоді як діаграми розсіювання можуть використовуватись і для виявлення ефекту перенавчання. Розглянемо діаграми, представлені на рис. 9. Вони отримані при аналізі розрахунків ШНМ, навчених на вибірці даних, об’єм якої згідно (6) і (12) можна трактувати як недостатній. Це викликає ефект перенавчання, в результаті чого нейронна мережа «запам’ятовує» вхідну вибірку даних і демонструє на ній дуже точні результати прогнозування. На реальних же даних прогноз часто виявляється помилковим.

а)

б)

Рис. 9. Діаграми розсіювання моделей прогнозування а) коректно навчена модель б) перенавчена модель

Для подолання ефекту перенавчання необхідно зменшити кількість вільних параметрів нейронної мережі до мінімуму, що забезпечує припустиму ефективність рішення задачі. Використання традиційного способу – розбиття вхідної вибірки на навчальну і тестову, з подальшим контролем помилки за тестовою вибіркою (див. рис. 8), у даному випадку може виявитись недостатньо ефективним з огляду на занадто малий розмір вхідної вибірки. У той же час, аналіз діаграм розсіювання різних моделей дозволяє отримати непряму інформацію щодо їх узагальнюючих здібностей. 128


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

Так, діаграма на рис. 9-а відображає результати, отримані за допомогою ШНМ, що містить у прихованому шарі 2 нейрона. Діаграма, показана на рис. 9-б, відображає результати розрахунків ШНМ, що містить у прихованому шарі 3 нейрона. Незважаючи на те, що діаграма на рис. 9-б ілюструє практично ідеальне розпізнавання вхідних прикладів, вона свідчить про перенавчання ШНМ. Тому для подальшого використання доцільно вибрати мережу з меншою кількістю нейронів, діаграма розсіювання якої наведена на рис. 9-а. Ефективність кількісних моделей другого типу досліджується за допомогою інструментів, що дозволяють інтерпретувати результати інтелектуальних обчислень з погляду економічного ефекту та з урахуванням особливостей конкретної задачі. Суть цих інструментів зазвичай зводиться до розрахункових моделей, а також візуальних методів аналізу, серед яких можна виділити матриці спряженості, Lift-діаграми, ROC-криві тощо [42]. Розглянемо деякі з них. Для формальної оцінки точності бінарного класифікатора розроблено різноманітні метрики оцінювання. Однак, найчастіше використовуються такі з них, як точність і повнота [43]. Точність класифікатора показує, скільки з передбачених позитивних результатів виявились дійсно позитивними: Prec 

TP , TP  FP

(13)

де TP – кількість правильно розпізнаних позитивних результатів; FP – кількість негативних результатів, розпізнаних як позитивні. Повнота класифікатора показує, скільки із загальної кількості позитивних результатів було передбачено правильно: Rec 

TP , TP  FN

(14)

де FN – кількість позитивних результатів, розпізнаних як негативні. Тут позитивним результатом є важливіший з точки зору задачі клас досліджуваних об’єктів. Скажімо, в задачі класифікації потенційних позичальників для банків важливіше точніше передбачати дефолти за кредитами, ніж визначати надійних пози129


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

чальників, адже втрати за дефолтами критичніші, ніж недоотримання прибутку від невидачі кредиту. Отже, у даному контексті дефолт стає позитивним результатом, у той час як виконання позичальником кредитних зобов’язань – негативним. У різних практичних задачах одна з характеристик (Prec чи Rec) може виявитись важливішою за іншу. Наприклад, у задачах ранньої медичної діагностики важливіше повнота, а при класифікації потенційних банківських позичальників – точність. Існують й інші формули для формальної оцінки бінарних класифікаторів, але часто наочнішим і зручнішим є візуальний аналіз. Одним з його інструментів є матриця спряженості, приклад якої наведено у табл. 2. Таблиця 2 ПРИКЛАД МАТРИЦІ СПРЯЖЕНОСТІ ПРИ АНАЛІЗІ БАНКІВСЬКИХ ПОЗИЧАЛЬНИКІВ

Класифіковано Фактично

Позитивний

Негативний

Всього

Позитивний

34

1

35

Негативний

3

111

114

Всього

37

112

149

Матриця спряженості відображає кількість правильно і неправильно класифікованих зразків із вхідної вибірки та дозволяє контролювати результати навчання в разі асиметрії ціни помилок класифікації першого і другого роду. До помилок першого роду відноситься класифікація позитивних результатів як негативних, до помилок другого роду – класифікація негативних результатів як позитивних. Ціна помилок першого і другого роду може мати суттєві відмінності. Так при аналізі кредитоспроможності клієнта банк понесе істотно більші збитки, якщо поганого клієнта прийме за хорошого, ніж навпаки. Тобто в цьому випадку вартість помилок першого роду значно вище, ніж помилок другого роду. Найскладнішими для оцінки ефективності результатів аналізу даних є дескриптивні моделі. Застосування апріорних методів оцінки економічного ефекту для них у більшості випадків немо130


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

жливе, тому всі використовувані прийоми носять непрямий характер. До таких прийомів відносяться принципи «бритва Оккама» та «мінімальна довжина опису», засновані на доказі теореми про те, що з кількох моделей, які описують дані з однаковою точністю, кращою є більш коротка [44]. Хоча в оригінальному дослідженні Т. Мітчелл пише про дерева прийняття рішень, дані принципи можуть бути поширені і на інші інструменти інтелектуальних обчислень, які вирішують схожі задачі. Зокрема, рішення по діаграмах розсіювання, наведених вище на рис. 9, також відповідає ним. Оцінка ефективності результатів обробки даних. В рамках ІІСПР задачі обробки даних переважно носять забезпечувальний характер, тобто вирішуються для поліпшення результатів подальшого аналізу даних. У цьому випадку відносна ефективність застосування k-го методу обробки даних порівняно з h-м визначається як:

ek k/h edp  s , esh

(15)

де esk та e sh – ефективність усієї ІІСПР (або тої її частини, для якої вона може бути розрахована) за умови використання k-го та h-го методу обробки даних При цьому інші методи та складові ІІСПР залишаються незмінними (за винятком внутрішньої структури, створюваної в результаті навчання). Оцінки, отримані за допомогою виразу (15), є відносними, тоді як на практиці зручнішими є абсолютні. Для отримання можливості роботи з абсолютними оцінками (щоб було зрозуміло, чи обробка даних дає позитивний ефект) можна використовувати концепцію «наївного» методу обробки, застосування якого гарантовано не покращує структуру вихідних даних. Для задач обробки даних зі зміною порядку елементів таким є випадковий вибір даних із вхідного масиву. Для задач обробки даних без зміни порядку елементів дані на виході «наївного» методу будуть збігатися з даними на його вході, тобто фактично обробка буде відсутня. По відношенню до «наївного» будь-який метод, що за формулою (15) дає результат більше 1, може вважатися ефективним, а 131


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

при результаті менше 1 – неефективним. При цьому виконується правило транзитивності оцінок, яке можна сформулювати так: Якщо метод k1 краще «наївного» в x разів, а метод k2 краще «наївного» в y разів, то метод k1 краще k2 у x разів. y

Існують також економічні задачі, вирішення яких збігається саме до задачі обробки даних (у цьому випадку процедура оцінки ефективності передбачає визначення економічного результату від застосування методу). Серед них є задача ранжирування, до якої зводиться широке коло економічних задач. Існують як суто розрахункові, так і розрахунково-графічні методи оцінки ефективності вирішення задач ранжирування. Серед останніх слід виділити Lift-криві та їх різновиди (Profit-криві, Gain-діаграми та ін.) [42]. Lift-крива формується на основі ліфт-фактора, який був вперше запропонований при вирішенні задачі оптимізації масової розсилки як показник, що відображає збільшення числа відгуків відносно кількості дій (поштових відправлень). За горизонтальною віссю графіка відкладається розмір вибірки, впорядкованої за зменшенням показника rpi – імовірності настання позитивного результату, розрахованої аналізованою моделлю. За вертикаллю фіксується кумулятивне число позитивних результатів у кожній підвибірці (ліфт). Оскільки істинна рангова ознака trpx у даному випадку є бінарною величиною, яка приймає значення 1 у разі позитивного результату x та значення 0 у разі негативного, вираз для розрахунку ліфта можна записати у такий спосіб: i

lft i    trpx . x1

(16)

Як приклад використання Lift-кривої розглянемо задачу ранжирування прострочених кредитних справ у колекторському скорингу, в яких об’єкти необхідно розташувати за рівнем зменшення ймовірності відновлення позичальником платежів за кредитом. Припустимо, що для ранжирування застосовуються три моделі: Модель 1 є емпіричною і використовується в багатьох кредитних підрозділах для ранжирування даних про позичальників. Ранговими ознаками rpi в ній обрано кількість днів, які пройшли з моменту останнього платежу. 132


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

Модель 2 заснована на визначенні зв’язку між вхідними показниками та результуючим (імовірністю відновлення платежів) за допомогою логістичної регресійної моделі. Модель 3 передбачає відсутність ранжирування, тобто випадковий вибір позичальника. Таку модель назвемо «наївною». Вона служить візуальним орієнтиром для аналізу та зіставлення ефективності інших моделей і завжди присутня на діаграмі з Liftкривими. Графіки Lift-кривих зазначених моделей наведено на рис. 10. 100 90 80 70 60

Модель 2

Модель1

50 40

Модель 3

30 20 10 0 0

10

20

30

40

50

60

70

80

90

100

Рис. 10. Lift-криві різних моделей ранжирування позичальників у колекторському скорингу

Практичний сенс зіставлення ефективності за допомогою Liftкривих полягає у визначенні моделі, що дозволяє зробити найменшу кількість дій, необхідних для досягнення певного результату. Загальним критерієм оцінки моделі за її Lift-кривою є площа під кривою, що виражена у відсотках від загальної площини. Для «наївної» моделі цей показник завжди дорівнює 50 %. Для моделі логістичної регресії з рис.10 площа під кривою – 63,3 %. Для наведеної там же емпіричної моделі ранжирування – 55,1 %. Таким 133


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

чином, з розглянутих моделей за результатами зіставлення за площею під Lift-кривою ефективнішою для ранжирування позичальників виявилась модель логістичної регресії. Іншим критерієм оцінки ефективності вирішення задач ранжирування є частка відгуків, одержуваних при здійсненні певної кількості дій. Так, з аналізу графіків на рис. 10 можна побачити, що для отримання 50 % позитивних відгуків у «наївної» моделі необхідно обробити 50 % кредитних справ, з використанням моделі логістичної регресії – 31 % кредитних справ, а з використанням моделі оцінки ймовірності погашення боргу за періодом прострочення – 41 % справ. Очевидно, що в даному випадку також доцільніше вибрати саме модель логістичної регресії. При цьому слід зазначити, що емпірична модель демонструє прийнятні результати при обробці малої кількості заявок. Отже, можливість дослідження не тільки загальної ефективності моделей, але й ефективності їх на окремих ділянках діапазону ранжирування, є безумовною перевагою розрахунково-графічних методів оцінки ефективності вирішення задач ранжирування. Але недоліком класичних Lift-кривих є неможливість їх використання для аналізу ефективності моделей ранжирування в тому випадку, якщо елементи множини дійсних рангових ознак trpx мають не бінарну природу. Однак, даний метод може бути вдосконалений для аналізу ефективності при довільній природі дійсних рангових ознак. Вираз для розрахунку ліфта при цьому: i

lft i    r  trx , x1

(17)

де r  trx =1, якщо умова істинна, і 0 – якщо помилкова. Метод побудови кривої ефективності ранжирування, заснований на функції (17), дозволяє забезпечити пріоритетну значимість правильного ранжирування об’єктів на початку списку. Дійсно, якщо за основний критерій ефективності моделі ранжирування прийняти площу під кривою (у частках від загальної площі графіка): n

S lft 

 lf t(i) i 1

n2 134

,

(18)


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

то правильне розташування об’єкта на першому місці в ранзі збіn льшить загальну площу під кривою на величину S lft  2 , тоді як n правильне розташування об’єкта на останньому місці в ранзі – 1 тільки на величину S lft  2 . Таким чином, значимість місць n об’єктів у ранзі в запропонованому методі оцінки ефективності (17) убуває в арифметичній прогресії.

Висновки Проведене дослідження дозволило запропонувати концепцію моделювання інноваційної інтелектуальної системи прийняття рішень, як сукупності процесів спостереження, моделювання, ідентифікації, оцінювання та вибору рішення. Розглянуто реалізацію цих процесів, що базується на розробках вітчизняних і зарубіжних авторів у таких областях, як статистичний аналіз, спостереження і експеримент, технології баз даних, математичне моделювання, інтелектуальних аналіз і обробка даних, методи оптимізації. Вдосконалено та актуалізовано класифікацію економічних задач з аналізу й обробки даних та інтелектуальних методів їх вирішення. Розвинуто методологію моделювання штучних нейронних мереж для вирішення економічних задач в частині вибору інструментів моделювання, визначення архітектури штучних нейронних мереж, вдосконалення методів роботи із вхідними даними, дослідження ефективності вирішення економічних задач методами нейромережевого моделювання. Систематизовано та розширено підходи до оцінки результатів інтелектуальних обчислень, сформульовано та деталізовано концепцію типових задач, запропоновано розрахункові та розрахунково-графічні методи вирішення проблеми оцінки результатів обробки даних. Розроблена методологія моделювання інноваційних інтелектуальних систем прийняття рішень в економіці надає можливість вирішити нагальну для управління економікою України пробле135


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

му подолання цифрових розривів, що забезпечуватиме підґрунтя для підвищення ефективності функціонування економічних систем різного рівня, відкриваючи нові можливості для економічного росту.

Література 1. Hilbert M. The World’s Technological Capacity to Store, Communicate, and Compute Information / Martin Hilbert, Priscila López // Science. – 2011. – № 332 (6025). – P. 60–65. 2. Бир С. Мозг фирмы / С. Бир. – М.: Едиториал УРСС, 2005. – 416 с. 3. Вітлінський В.В. Штучний інтелект у системі прийняття управлінських рішень / В.В. Вітлінський // Нейро-нечіткі технології моделювання в економіці. – 2012. – № 1. – С. 97–118. 4. Анфилатов B. C. Системный анализ в управлении / B. C. Анфилатов, А. А. Емельянов, А. А. Кукушкин. – М.: Финансы и статистика, 2002. – 368 с. 5. Матвійчук А. В. Штучний інтелект в економіці: нейронні мережі, нечітка логіка: монографія / А. В. Матвійчук. – К.: КНЕУ, 2011. – 439 с. 6. Хайкин С. Нейронные сети: Полный курс / С. Хайкин – [2-е изд.]. – М.: Вильямс, 2006. – 1104 с. 7. Сетлак Г. Интеллектуальные системы поддержки принятия решений / Г. Сетлак. – К.: ЛОГОС, 2004. – 250 с. 8. Copeland J. Artificial Intelligence: A Philosophical Introduction / Jack Copeland. – NJ: Wiley-Blackwell. – 1993. – 328 p. 9. Неітеративні, еволюційні та мультиагентні методи синтезу нечіткологічних і нейромережних моделей: Монографія / Під заг. ред. С. О. Субботіна. – Запоріжжя: ЗНТУ, 2009. – 375 с. 10. Сараев А. Д. Системный анализ и современные информационные технологии / А. Д. Сараев, О. А. Щербина. – Симферополь: СОНАТ, 2006. – 342 с. 11. Макаров И. М. Теория выбора и принятия решений / И. М. Макаров, Т. М. Виноградская, А. А. Рубчинский, В. Б. Соколов. – М.: Наука, 1982. – 328 с. 12. Vapnik V. N. On the uniform convergence of relative frequencies of events to their probabilities / V. N. Vapnik, A. Ya. Chervonenkis // Theoretical Probability and Its Applications. – 1971. – № 17. – P. 264–280. 13. Koiran P. Neural networks with quadratic VC dimension / P. Koiran, E. D. Sontag // Advances in Neural Information Processing Systems. – 1996. – № 8. – P. 197–203. 14. Baum E. B. What sixe net gives valid generalization? / E. B. Baum, D. Haussler // Neural Computation. – 1989. – № 1. – P. 151–160. 136


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

15. Кравчук Е. В. Искусственные нейронные сети и генетические алгоритмы / Е. В. Кравчук, Э. Хантер. – Донецк: ДонГУ, 2000. – 200 с. 16. Reshef D. N. Detecting Novel Associations in Large Data Sets / D. N. Reshef, Y. A. Reshef, H K. Finucane and others // Science. – 2011. – № 334 (6062). – P. 1518–1524. 17. Murphy K. P. Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning series) – 1st Edition / Kevin P. Murphy. – Cambridge, MA: MIT Press, 2012. – 1067 p. 18. Минц А. Ю. Методы отбора данных для нейросетевого моделирования / А. Ю. Минц // Моделювання та інформаційні системи в економіці: зб.наук.пр. – Київ: КНЕУ, 2011. – Вип. 84. – С. 256–270. 19. Quinlan R. J. C4.5: Programs for Machine Learning / Ross J. Quinlan // Machine Learning. – 1994. – Vol. 16. – № 3. – P. 235–240. 20. Minsky M. L. Perceptrons / M. L. Minsky, S. A. Papert. – Cambridge, MA: MIT Press, 1969. – 263 p. 21. Эрлих А. Технический анализ товарных и фондовых рынков / А. Эрлих.– М.: Юнити, 1996. – 318 с. 22. Ежов А. А. Нейрокомпьютинг и его применения в экономике и бизнесе / А. А. Ежов, С. А. Шумский., под ред. проф. В. В. Харитонова. – М.: МИФИ, 1998. – 224 с. 23. Альтшуллер Г. С. Творчество как точная наука / Г. С. Альтшуллер. – М.: Сов. радио, 1979. – 175 с. 24. Альтшуллер Г. С. Найти идею: Введение в ТРИЗ – теорию решения изобретательских задач. – 4-е изд. / Г. С. Альтшуллер. – М.: Альпина Паблишерз, 2011. – 400 с. 25. Минц А. Ю. Общие вопросы постановки задач в нейросетевом моделировании / А. Ю. Минц // Нейро-нечіткі технології моделювання в економіці. – 2012. – № 1. – С. 189–206. 26. Neelamadhab P. The Survey of Data Mining Applications and Feature Scope / Padhy Neelamadhab, Mishra Pragnyaban, Rasmita Panigrahi // International Journal of Computer Science, Engineering and Information Technology. – 2012. – Vol. 2. – № 3. – P. 43–58. 27. Seddawy Ahmed Bahgat El. Enhanced K-mean Algorithm to Improve Decision Support System under Uncertain Situations / Ahmed Bahgat El Seddawy, Sultan Turky, Khedr Ayman // IJCSNS International Journal of Computer Science and Network Security. – 2013. – Vol. 13. – № 7. – P. 50–58. 28. Sangameshwari B. Survey on Data Mining Techniques In Business Intelligence / B. Sangameshwari, P. A. Uma // International Journal Of Engineering And Computer Science. – 2014. – Vol. 3. – № 10. – P. 8575–8582. 29. Larose D. T. Discovering Knowledge in Data: An Introduction to Data Mining / D. T. Larose. – NJ: Wiley & Sons, Inc, 2004. – 240 p. 30. Evolution of data mining, Gartner Group Advanced Technologies and Applications Research Note, 2/1/95 [Електронний ресурс]. – Режим доступу: http://www.thearling.com/text/dmwhite/dmwhite.htm. 137


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

31. Дьяконов В. Математические пакеты расширения Matlab. Специальный справочник / В. Дьяконов, В. Круглов.– СПб.: Питер, 2001.– 480 с. 32. Минц А. Ю. Метод упрощения динамических рядов с использованием генетических алгоритмов / А. Ю. Минц // Економічний вісник запорізької державної інженерної академії : зб. наук. праць. – Запорожье: ЗДІА, 2016. – Вип. 4 (04). – Ч. 2. – С. 120–124. 33. Минц А. Ю. Интеллектуальные методы анализа надежности участников рынков финансовых услуг / А. Ю. Минц // Вісник Донецького університету економіки та права : зб. наук. праць. – Артемівськ: ДонУЕП, 2015. – № 2/2015. – С. 85–90. 34. Карпов Ю. Имитационное моделирование систем. Введение в моделирование с AnyLogic 5 / Ю. Карпов.– СПб.: БХВ-Петербург, 2005. – 400 с. 35. Форрестер Дж. Основы кибернетики предприятия (Индустриальная динамика) / Дж. Форрестер. Пер. с англ. – М.: Прогресс, 1971. – 466 с. 36. Минц А. Ю. Моделирование ценообразования на рынке жилой недвижимости методами системной динамики / А. Ю. Минц // Технологический аудит и резервы производства. – 2016. – № 5/4(31). – С. 39–45. 37. Мінц О. Ю. Моделювання процесів реструктуризації кредитів // Вісник Університету банківської справи НБУ: Зб. наук. праць. – К.: УБС НБУ, 2012. – № 2(14). – С. 329–333. 38. Schauerhuber M. Benchmarking Open-Source Tree Learners in R/RWeka / M. Schauerhuber, A. Zeileis, D. Meyer In C. Preisach, H. Burkhardt, L. Schmidt-Thieme, R. Decker (eds.) // Data Analysis, Machine Learning and Applications (Proceedings of the 31st Annual Conference of the Gesellschaft für Klassifikation e.V., Albert-LudwigsUniversität Freiburg, 2007, March 7–9). – 2007. – P. 389–396. 39. Кнут Д. Искусство программирования. Том 1. Основные алгоритмы / Дональд Кнут. – М.: Вильямс, 2006. – 720 с. 40. Ватутин Э. И. Основы дискретной комбинаторной оптимизации / Э. И. Ватутин, В. С. Титов, С. Г. Емельянов. – М.: АРГАМАК-МЕДИА, 2016. – 270 с. 41. Карпенко А. П. Современные алгоритмы поисковой оптимизации. Алгоритмы, вдохновленные природой / А. П. Карпенко. – М.: Издательство МГТУ им. Н. Э. Баумана, 2014. – 446 с. 42. Паклин Н. Б. Бизнес-аналитика: от данных к знаниям / Н. Б. Паклин, В. И. Орешков. – СПб.: Питер, 2013. – 704 с. 43. Powers D. M. W. Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation / David M. W. Powers // Journal of Machine Learning Technologies. – 2011. – № 2 (1). – P. 37–63. 44. Mitchell Т. Machine learning / Т. Mitchell. – NY: McGraw-Hill, 1997. – 414 p.

138


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

45. Нечеткие модели и нейронные сети в анализе и управлении экономическими объектами: монография / под ред. Ю. Г. Лысенко. – Донецк: Юго-Восток, 2012. – 388 с.

References 1. Hilbert, M., & López P. (2011). The World’s Technological Capacity to Store, Communicate, and Compute Information. Science, 332(6025), 60–65. 2. Bir, S. (2005). Mozg firmy. Moskow, Russia: Yeditorial URSS [in Russian]. 3. Vitlinskiy, V.V. (2012). Shtuchnyi intelekt u systemi pryinyattya upravlinskykh rishen. Neiro-nechitki tekhnologii modelyuvannya v ekonomitsi (Neuro-fuzzy modeling techniques in economics), 1, 97–118 [in Ukrainian]. 4. Anfilatov, V. S., Yemel’yanov, A. A., & Kukushkin, A. A. (2002). Sistemnyi analiz v upravlenii. Moskow, Russia: Finansy i statistika [in Russian]. 5. Matviychuk, A. V. (2011). Shtuchniy intelekt v ekonomitsi: neironni merezhi, nechitka logika. Kyiv, Ukraine: KNEU [in Ukrainian]. 6. Haykin, S. (2006). Neyronnye seti: Polnyy kurs. Moskow, Russia: Williams [In Russian]. 7. Setlak, G. (2004). Intellektualnye sistemy podderzhki prinyatiya resheniy. Kyiv, Ukraine: LOGOS [in Ukrainian]. 8. Copeland, J. (1993). Artificial Intelligence: A Philosophical Introduction. Oxford: Wiley-Blackwell. 9. Subbotin, S. O. (2009) Neiteratyvni, evolyutsiyni ta multyagentni metody syntezu nechitkologichnykh i neyromerezhnykh modeley. Zaporizhzhya, Ukraine: ZNTU [in Ukrainian]. 10. Sarayev, A. D., & Shcherbina, O. A. (2006). Sistemnyy analiz i sovremennyye informatsionnyye tekhnologii. Simferopol, Ukraine: SONAT [in Russian]. 11. Makarov, I. M., Vinogradskaya, T. M., Rubchinskiy, A. A., & Sokolov, V. B. (1982). Teoriya vybora i prinyatiya resheniy. Moskow, Russia: Nauka [in Russian]. 12. Vapnik, V. N., & Chervonenkis, A. Ya. (1971). On the uniform convergence of relative frequencies of events to their probabilities. Theoretical Probability and Its Applications, 17, 264–280. 13. Koiran, P., & Sontag, E. D. (1996). Neural networks with quadratic VC dimension. Advances in Neural Information Processing Systems, 8, 197–203. 14. Baum, E. B., & Haussler, D. (1989). What sixe net gives valid generalization? Neural Computation, 1, 151–160. 15. Kravchuk, E. V., & Khanter, E. (2000). Iskusstvennyye neyronnyye seti i geneticheskiye algoritmy. Donetsk, Ukraine: DonGU [in Russian]. 16. Reshef, D. N., Reshef, Y. A., Finucane, H. K., & others. (2011). Detecting Novel Associations in Large Data Sets. Science, 334(6062), 1518–1524. 139


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

17. Murphy, K. P. (2012). Machine Learning: A Probabilistic Perspective. Cambridge, MA: MIT Press. 18. Mints, A. Yu. (2011). Metody otbora dannykh dlya neirosetevogo modelirovaniya. Modelyuvannya ta informatsiini systemy v ekonomitsi (Modelling and information systems in economy), 84, 256–270 [in Russian]. 19. Quinlan, R. J. (1994, September). C4.5: Programs for Machine Learning. Machine Learning, 3(16), 235–240. 20. Minsky, M. L., & Papert, S. A. (1969). Perceptrons. Cambridge, MA: MIT Press. 21. Erlikh, A. (1996). Tekhnicheskiy analiz tovarnykh i fondovykh rynkov. Moskow, Russia: Yuniti [in Russian]. 22. Yezhov, A. A., & Shumskiy, S. A. (1998). Neyrokompyuting i yego primeneniya v ekonomike i biznese. Moskow, Russia: MIFI [in Russian]. 23. Altshuller, G. S. (1979). Tvorchestvo kak tochnaya nauka. Moskow, Russia: Sovetskoye radio [In Russian]. 24. Altshuller, G. S. (2011). Nayti ideyu: Vvedeniye v TRIZ – teoriyu resheniya izobretatel’skikh zadach. Moskow, Russia: Alpina Pablisherz [in Russian]. 25. Mints, A. Yu. (2012). Obshchiye voprosy postanovki zadach v neirosetevom modelirovanii. Neiro-nechitki tekhnologii modelyuvannya v ekonomitsi (Neuro-fuzzy modeling techniques in economics), 1, 189–206 [in Russian]. 26. Neelamadhab, P., Pragnyaban, M., & Panigrahi, R. (2012). The Survey of Data Mining Applications and Feature Scope. International Journal of Computer Science, Engineering and Information Technology, 3(2), 43–58. 27. Seddawy, A. B. El, Turky, S., & Ayman, K. (2013). Enhanced K-mean Algorithm to Improve Decision Support System under Uncertain Situations. International Journal of Computer Science and Network Security, 7(13), 50–58. 28. Sangameshwari, B., & Uma, P. A. (2014). Survey on Data Mining Techniques in Business Intelligence. International Journal of Engineering and Computer Science, 10(3), 8575–8582. 29. Larose, D. T. (2004). Discovering Knowledge in Data: An Introduction to Data Mining. Hoboken, New Jersey: Wiley & Sons. 30. Gartner Group Advanced Technologies and Applications Research Note. (1995). Evolution of data mining. Retrieved from http://www. thearling.com/text/dmwhite/dmwhite.htm. 31. D’yakonov, V., & Kruglov, V. (2001). Matematicheskiye pakety rasshireniya Matlab. Spetsial’nyy spravochnik. St. Petersburg, Russia: Piter [in Russian]. 32. Mints, A. Yu. (2016). Metod uproshcheniya dinamicheskikh ryadov s ispolzovaniyem geneticheskikh algoritmov. Ekonomichnyi visnyk zaporizkoi 140


Моделювання інноваційних інтелектуальних…

Ю. Г. Лисенко, О. Ю. Мінц

derzhavnoi inzhenernoi akademii (Economic Bulletin of Zaporozhye State Engineering Academy), 4(2), 120–124 [in Russian]. 33. Mints, A. Yu. (2015). Intellektualnyye metody analiza nadezhnosti uchastnikov rynkov finansovykh uslug. Visnyk donetskogo universytetu ekonomiky ta prava (Bulletin of the Donetsk University of Economics and Law), 2, 85–90 [in Russian]. 34. Karpov, Yu. (2005). Imitatsionnoye modelirovaniye sistem. Vvedeniye v modelirovaniye s AnyLogic 5. St. Petersburg, Russia: BKHV-Peterburg [in Russian]. 35. Forrester, J. (1971). Osnovy kibernetiki predpriyatiya (Industrial’naya dinamika). Moskow, Russia: Progress [In Russian]. 36. Mints, A. Yu. (2016). Modelirovaniye tsenoobrazovaniya na rynke zhiloy nedvizhimosti metodami sistemnoy dinamiki. Tekhnologicheskiy audit i rezervy proizvodstva (Technology audit and production reserves), 5/4(31), 39–45 [in Russian]. 37. Mints, O. Yu. (2012). Modelyuvannya protsesiv restrukturyzatsii kredytiv Visnik Universytetu bankivskoi spravy NBU (Bulletin of the University of Banking of the NBU), 2(14), 329–333 [in Ukrainian]. 38. Schauerhuber, M., Zeileis, A., & Meyer, D. (2007, March 7–9). Benchmarking Open-Source Tree Learners in R/RWeka. Proceedings of the 31st Annual Conference of the Gesellschaft für Klassifikation e.v. (AlbertLudwigs-Universität: Freiburg), 389–396. 39. Knut, D. (2006). Iskusstvo programmirovaniya. Tom 1. Osnovnyye algoritmy. Moskow, Russia: Williams [In Russian]. 40. Vatutin, E. I., Titov, V. S., & Yemel’yanov, S. G. (2016). Osnovy diskretnoy kombinatornoy optimizatsii. Moskow, Russia: Argamak-Media [in Russian]. 41. Karpenko, A. P. (2014). Sovremennyye algoritmy poiskovoy optimizatsii. Algoritmy, vdokhnovlennyye prirodoy. Moskow, Russia: MGTU im. N. E. Baumana [in Russian]. 42. Paklin, N. B., & Oreshkov, V. I. (2013). Biznes-analitika: ot dannykh k znaniyam. St. Petersburg, Russia: Piter [in Russian]. 43. Powers, D. M. W. (2011). Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation. Journal of Machine Learning Technologies, 2(1), 37–63. 44. Mitchell, T. (1997) Machine learning. USA: McGraw-Hill. 45. Lysenko, Yu. G. (2012). Nechetkiye modeli i neyronnyye seti v analize i upravlenii ekonomicheskimi obyektami. Donetsk, Ukraine: YugoVostok [in Russian]. Стаття надійшла до редакції 31.05.2017

141


УДК 338.124.4, 519.865.7

ВИБІР ОПТИМАЛЬНОЇ ТОПОЛОГІЇ НЕЙРОННОЇ МЕРЕЖІ В ЗАДАЧАХ КЛАСИФІКАЦІЇ ДИНАМІЧНИХ ЕКОНОМІЧНИХ СИСТЕМ

І. І. Стрельченко Кандидат економічних наук, доцент, докторант кафедри економіко-математичного моделювання Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» проспект Перемоги, 54/1, м. Київ, 03680, Україна iistrelchenko@gmail.com

Стаття висвітлює головні ускладнення в процесі побудови та застосування нейронних мереж, які пов’язані, перш за все, з підбором оптимальної внутрішньої структури, а для мереж типу карти Кохонена – кількості нейронів у прихованому шарі. Показано, що процес оптимізації нейронних мереж полягає в ітераційному знаходженні деяких параметрів, що забезпечують екстремум функції якості, яка, як правило, не має властивості неперервності та гладкості. Тому істотним недоліком такого підходу є неможливість забезпечення гарантій оптимальності застосовуваних методів і алгоритмів. Відповідно, у статті розроблено покроковий алгоритм конструювання карт Кохонена, призначених для вирішення задачі класифікації динамічних економічних систем відповідно до обраного критерію. У роботі вперше запропоновано використання рангового коефіцієнта конкордації в якості критерію оптимальності для побудови нейронної мережі-класифікатора, який характеризує ступінь узгодженості у наборі вхідних змінних. Експериментально протестовано покроковий алгоритм побудови карти Кохонена, котра має оптимальну топологію за обраним критерієм і розбиває вихідну вибірку на шість груп. Відповідно до значень коефіцієнта конкордації реакція ключових макроекономічних індикаторів усередині отриманих кластерів характеризується високим рівнем подібності. Ключові слова. Динамічна економічна система, фінансова криза, макроекономічний індикатор, класифікація, ранговий коефіцієнт конкордації, нейронна мережа, карта Кохонена.

© І. І. Стрельченко, 2017

142


Вибір оптимальної топології нейронної мережі…

І. І. Стрельченко

ВЫБОР ОПТИМАЛЬНОЙ ТОПОЛОГИИ НЕЙРОННОЙ СЕТИ В ЗАДАЧАХ КЛАССИФИКАЦИИ ДИНАМИЧЕСКИХ ЭКОНОМИЧЕСКИХ СИСТЕМ

И. И. Стрельченко Кандидат экономических наук, доцент, докторант кафедры экономико-математического моделирования Государственное высшее учебное заведение «Киевский национальный экономический университет имени Вадима Гетьмана» проспект Победы, 54/1, г. Киев, 03680, Украина iistrelchenko@gmail.com Статья посвящена решению проблем, возникающих в процессе построения и применения нейронных сетей, которые связаны, прежде всего, с подбором их оптимальной внутренней структуры, а для сетей типа карты Кохонена – количества нейронов в скрытом слое. Показано, что процесс оптимизации нейронных сетей заключается в итерационном определении некоторых параметров, обеспечивающих экстремум функции качества, которая, как правило, не имеет свойства непрерывности и гладкости. Поэтому существенным недостатком такого подхода является невозможность обеспечения гарантий оптимальности применяемых методов и алгоритмов. Соответственно, в статье разработан пошаговый алгоритм конструирования карт Кохонена, предназначенных для решения задачи классификации динамических экономических систем в соответствии с выбранным критерием. В работе впервые предложено использование рангового коэффициента конкордации в качестве критерия оптимальности при построении нейронной сети-классификатора, который характеризует степень согласованности в наборе входных переменных. Экспериментально протестирован пошаговый алгоритм оптимизации топологии карты Кохонена согласно выбранному критерию, разбивающий в результате исходную выборку на шесть групп. В соответствии со значениями коэффициента конкордации реакция ключевых макроэкономических индикаторов внутри полученных кластеров характеризуется высоким уровнем сходства. Ключевые слова. Динамическая экономическая система, финансовый кризис, макроэкономический индикатор, классификация, ранговый коэффициент конкордации, нейронная сеть, карта Кохонена.

143


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

SELECTION OF A NEURAL NETWORK OPTIMUM TOPOLOGY IN PROBLEMS OF DYNAMIC ECONOMIC SYSTEMS CLASSIFICATION

Inna Strelchenko PhD in Economics, Docent, DSc Candidate, Department of Economic and Mathematical Modeling State Higher Educational Establishment «Kyiv National Economic University named after Vadym Hetman» 54/1 Peremogy Avenue, Kyiv, 03680, Ukraine iistrelchenko@gmail.com The article is dedicated to solve the main disadvantage, which arise in the process of constructing and applying neural networks and associated primarily with the selection of optimal internal structure, and for the Kohonen maps – with the number of neurons in the hidden layer. It is shown that the process of optimization of neural networks consists in iterative finding of some parameters that provide an extremum of the quality function, which, as a rule, does not have the property of continuity and smoothness. Therefore, a significant drawback of this approach is the inability to ensure the guarantees of the optimality of applied methods and algorithms. Accordingly, in the article a step-by-step algorithm for constructing Kohonen maps is developed, which intended to solve the problem of classifying dynamic economic systems in accordance with the chosen criterion. For the first time, it was proposed to use the rank coefficient of concordance as an optimality criterion for constructing a neural network-classifier that characterizes the degree of coherence in a set of input variables. It was experimentally tested step-by-step algorithm for constructing the Kohonen map, which has the optimal topology according to the chosen criterion and splits the original sample into six groups. In accordance with the values of the concordance coefficient, the reaction of key macroeconomic indicators within the obtained clusters is characterized by a high level of similarity. Keywords. Dynamic economic system, financial crisis, macroeconomic indicator, classification, ranking coefficient of concordance, neural network, Kohonen map. JEL Classification: C45, F36, G15, G17

Вступ На етапі первинного аналізу великих масивів неструктурованої економічної інформації актуальною є задача узагальнення, 144


Вибір оптимальної топології нейронної мережі…

І. І. Стрельченко

класифікації та візуалізації вихідних даних, яка надасть можливість виявити внутрішні закономірності для коректнішої побудови економіко-математичних моделей. У випадку, коли кожна точка простору вимірів описується двома або трьома показниками, побачити подібність між окремими елементами вибірки можна за допомогою графіків і діаграм. Набагато складніше виконати класифікацію масивів багатовимірних даних. Для вирішення такого класу задач найчастіше використовують проекційні методи, кластерний аналіз і методи, засновані на використанні карт Кохонена. Серед основних переваг карт, що самоорганізуються, відзначимо простоту реалізації, високу апроксимаційну здатність, можливість обробки нових даних у режимі реального часу. У загальному випадку процес моделювання на основі карти, що самоорганізується, включає в себе такі етапи: 1) збір даних для навчання; 2) підготовка даних (вибір єдиної шкали, нормалізація); 3) вибір топології майбутньої карти (кількість нейронів прихованого шару); 4) експериментальний підбір характеристик мережі; 5) навчання; 6) перевірка адекватності нейронної мережі та коригування параметрів; 7) вербалізація (словесний опис) отриманих результатів. Найбільш дискусійним і складним питанням у процесі побудови нейронних мереж типу карти Кохонена є вибір кількості нейронів у прихованому шарі. Адже ускладнення архітектури нейронної мережі дає покращення апроксимації лише до певної межі, потім відбувається процес, що отримав назву «деградації» [1]. Тому для вибору найраціональнішої структури мережі постає питання чисельної оцінки оптимальності отриманого розв’язку. В задачах кластеризації, у тому числі на основі карт Кохонена, коли об’єктом дослідження виступають економічні процеси, порівняти отримані результати групування з певним еталонним значенням неможливо в принципі. У випадку, якщо потрібно оцінити подібність динаміки множини макроекономічних індикаторів за певний проміжок часу для вибірки з кількох десятків країн, рецептів оцінки оптимальності отриманої класифікації не існує. 145


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Мета і завдання дослідження Враховуючи зазначене, постає актуальна задача розробки адекватного критерію оптимальності процесу кластеризації, який визначатиме відповідну топологію нейронної мережі типу карти Кохонена, що обумовлює мету дослідження. Досягнення мети передбачає необхідність розв’язання таких завдань: 1) обрати критерій оптимальності, котрий відповідає таким вимогам: - може бути виміряний чисельно та знаходиться в межах певного інтервалу; - має зрозумілу вербальну інтерпретацію; - дозволяє працювати з неоднорідними вихідними даними; - дає можливість визначити подібність реакції динамічних економічних систем всередині визначеного кластеру; 2) побудувати нейронну мережу типу карти Кохонена з топологією, оптимальною за обраним критерієм; 3) провести моделювання з отриманням відповідних висновків та рекомендацій.

Виклад основного матеріалу дослідження Дослідження впливу критерію оптимальності на результат кластеризації із застосуванням карт Кохонена здійснюватимемо на прикладі країн із різним рівнем розвитку економіки у період протікання світової фінансової кризи 2007–2009 рр. З цією метою сформовано вибірку з 65 країн, представлену макроекономічними індикаторами: валовий внутрішній продукт, зовнішні зобов’язання резидентів країни перед нерезидентами, валютний курс, обсяг золотовалютних резервів, вартість державних облігацій. Таким чином, масив вихідних даних складається з 65×5×12=3900 елементів. Якщо розглянути розмірність даних, то кожна країна характеризується п’ятьма координатами – значеннями макроекономічних індикаторів, які, у свою чергу, мають глибину в дванадцять щоквартальних замірів. Загалом така система характеристик вкладається у шість вимірів: час і п’ять макроекономічних показників. Задача кластеризації полягає у розподілі заданої сукупності країн за групами, в межах яких динаміка обраних індикаторів 146


Вибір оптимальної топології нейронної мережі…

І. І. Стрельченко

протягом зазначеного періоду буде подібною. Вище було встановлено вимоги до критерію «подібності» (зрозуміла інтерпретація, відсутність обмежень на однорідність даних, числова оцінка в границях обмеженої шкали рівня подібності реакції динамічних систем). Розглянемо існуючі підходи до визначення поняття «обґрунтованості кластеризації» на предмет відповідності даним вимогам. Перший підхід визначає якість кластеризації як міру відповідності між отриманим розподілом і реально існуючими класами елементів навчальної вибірки [2]. Для поставленої задачі такий вид оцінки є неможливим через відсутність еталонної кластерної структури вибірки за визначеними показниками. Друге визначення якості кластеризації ґрунтується на оцінюванні характеристик отриманої структури кластерів. З цією метою визначають дві так звані властивості обґрунтованості кластеризації (англійський термін «cluster validity») [2–4]: 1) компактність кластерів – елементи кожного кластеру мають бути розташовані якомога ближче один до одного. Вимірюють за допомогою показників математичної статистики (середня відстань між елементами кластера, середньоквадратичне відхилення), індексів обґрунтованості (RMSSD-індекс, SD-індекс); 2) відокремленість кластерів – кластери мають бути чітко відокремлені один від одного. Вимірюють за допомогою показників математичної статистики (середня відстань між об’єктами з різних кластерів), індексів обґрунтованості (індекс Данна, SDіндекс, RS-індекс). Проте показники обґрунтованості кластеризації не дають відповіді на принципове питання: «Чи характеризуються країни всередині кожного окремого кластера подібністю в коливаннях визначених макроекономічних індикаторів протягом досліджуваного періоду, і в якій мірі?». Зважаючи на це, автор пропонує використати в якості критерію «подібності» ранговий коефіцієнт конкордації Кендала [5–7]. Він характеризує ступінь узгодженості між набором змінних, що є оцінками множини вихідних даних: W

12S , m ( n 3  n) 2

147

(1)


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

де n – кількість об’єктів, що підлягають ранжуванню; m – кількість вибірок; а змінна S – знаходиться за формулою: n

S   ( Ri  R ) 2 ,

(2)

i 1

m

де Ri – сума рангів i-го об’єкту ( Ri   Rij ); R – середнє суми j 1

рангів за всіма об’єктами. У термінах вирішуваної задачі змінні, що увійшли до виразів (1) і (2), мають таку інтерпретацію: n – довжина часового ряду (n = 12); m – кількість країн, що увійшли до конкретного кластеру (приймає значення від 1 до 65). R – вектор рангів від 1 до 12, що проставляються по рядках кожної з п’яти матриць індикаторів окремо для кожної країни таким чином, щоб максимальному значенню індикатора призначався ранг 1, а найменше значення показника отримувало ранг 12. Така процедура повторюється для всіх рядків матриць (m разів за кількістю країн кластера). За таких умов i-ий об’єкт у формулах (1) і (2) описується вектором елементів Rij, які є рангами всіх країн даного кластеру у i-му періоді. Розраховане значення коефіцієнту конкордації вказує, чи існує схожість у тому, як змінювався цільовий показник у межах даної групи країн. Значення коефіцієнта конкордації знаходиться в інтервалі 0 ≤ W ≤ 1. Якщо W = 0, то послідовності рангів різних країн кластеру у відповідні періоди є абсолютно неузгодженими (несхожими). У випадку W = 1 результат інтерпретується як повний збіг у динаміці досліджуваних показників. Чим ближче W до 1, тим більша узгодженість спостерігається у вихідних рядах даних за різними країнами в межах одного кластеру. Використання коефіцієнта конкордації на початковій фазі дослідження має ряд переваг: 1) він немає обмежень щодо типу розподілу вхідних даних; 2) не потрібно попередньо обробляти вихідні дані, щоб співвіднести їх до спільної шкали; 3) відсутні обмеження на розподіл оцінок у рядках матриці рангу, наприклад, нормальний розподіл або лінійні співвідношення; 148


Вибір оптимальної топології нейронної мережі…

І. І. Стрельченко

4) має просту та інтуїтивно зрозумілу інтерпретацію. Значення коефіцієнта конкордації дозволить оцінити рівень подібності у динаміці відібраних індикаторів у кризовий період. Для того аби протестувати ефективність використання коефіцієнта конкордації для визначення оптимальної топології карти Кохонена, розрахуємо певні його стартові значення для подальшого порівняння. Зокрема, розділимо вихідну вибірку вручну на дві групи відповідно до загальноприйнятої класифікації Міжнародного валютного фонду на країни з розвиненою економікою та групу країн з економікою, що розвивається. Обчислимо значення коефіцієнта конкордації для кожного з п’яти індикаторів. Результати розрахунків представлено у вигляді пелюсткової діаграми на рис. 1. Валютний курс 0,6 0,5 0,4 0,3 0,2

Вартість державних облігацій

ВВП

0,1 0

Міжнародна інвестиційна позиція

Валютні резерви

Рис. 1. Пелюсткова діаграма рангового коефіцієнта конкордації для двох груп країн за класифікацією МВФ: країни з розвинутою економікою – суцільна лінія; країни з економікою, що розвивається – переривчаста лінія

Значення коефіцієнта конкордації свідчать про низький рівень подібності динаміки досліджуваних індикаторів у межах кожної групи. Зокрема, для групи країн з розвинутою економікою лише два з п’яти показників мають значення коефіцієнта конкордації трохи більші за 0,5: для валютного курсу W1 = 0,5183 і міжнародної інвестиційної позиції W3 = 0,5426. Що стосується групи країн з економікою, котра розвивається, значення коефіцієнта для всіх 149


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

показників не перевищує 0,4. Це вказує на те, що процес проходження світової фінансової кризи 2007–2009 рр. різними країнами не залежав від того, чи вони належать до групи країн з розвинутою економікою або таких, що розвиваються. Отже, відповідно до мети дослідження постає питання розбиття множини досліджуваних країн на групи, однорідні за процесом проходження через фінансову кризу. Це вимагає вирішення задачі побудови нейронної мережі типу карти Кохонена з топологією, оптимальною за обраним критерієм. Для вибору оптимальної структури майбутнього класифікатора на основі рангового коефіцієнта конкордації розроблено та програмно реалізовано в системі MATLAB алгоритм, що складається з таких кроків: 1) задається кількість кластерів n нейронної мережі. Верхня межа показника визначається з емпіричного співвідношення [8]:

N , (3) %e де Nnv – розмір навчальної вибірки (Nnv = 65); %e – відсоток помилки навчання (%e = 0,1). Звідси максимально можлива кількість кластерів max(N) = 6; 2) відбувається попередня нормалізація даних; 3) будується нейронна мережа із заданою на першому кроці кількістю кластерів N; 4) обчислюються коефіцієнти рангової конкордації для отриN nv 

W11k , ... W1kj , ... W1kl     , де l – маної кластерної структури  k  Wi1 , ... Wijk , ... Wilk     W k , ... W k , ... W k  Nj Nl   N1

кількість макроекономічних індикаторів (l = 5), k – номер ітерації алгоритму; N l

5) розраховується критерій оптимальності PONk   Wijk ; i1 j 1

6) відбувається порівняння параметрів оптимальності – поточної та отриманої на попередній ітерації: якщо PONk  PONk 1 , то 150


Вибір оптимальної топології нейронної мережі…

І. І. Стрельченко

структура нейронної мережі, що має більше значення параметра оптимальності, зберігається окремо в робочій області; 7) ітерації алгоритму продовжуються до тих пір, доки не будуть перевірені всі можливі кластерні структури. Кілька структур нейронної мережі, що були отримані підчас моделювання, наведено на рис. 2.

Рис. 2. Структура карти Кохонена, отримана на різних ітераціях роботи алгоритму

Результатом роботи оптимізаційного алгоритму стала карта Кохонена, що розбиває початкову вибірку на шість груп і має топологію, оптимальну за обраним критерієм. Візуалізацію підсумкової кластерної структури наведено на рис. 3. 151


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Рис. 3. Кластерна структура нейронної мережі типу карти Кохонена, оптимальна за обраним критерієм

На рис. 4 зображено пелюсткову діаграму рангового коефіцієнта конкордації, що відповідає нейронній мережі з оптимальною топологією. Валютний курс 1 0,8 0,6 Вартість державних облігацій

0,4

ВВП

0,2 0

Валютні резерви

Міжнародна інвестиційна позиція

Рис. 4. Пелюсткова діаграма рангового коефіцієнта конкордації, що відповідає оптимальній кластерній структурі нейронної мережі-класифікатора 152


Вибір оптимальної топології нейронної мережі…

І. І. Стрельченко

Порівнюючи отримані значення коефіцієнта робимо висновок про суттєве зростання подібності в динаміці макроекономічних індикаторів (валовий внутрішній продукт, зовнішні зобов’язання резидентів країни перед нерезидентами, валютний курс, обсяг золотовалютних резервів, вартість державних облігацій) всередині кожної з шести груп у порівнянні зі стартовою класифікацією. Так, значення коефіцієнта конкордації не опускається нижче 0,5 і в 50 % випадків знаходиться у межах від 0,7 до 0,9, що свідчить про високий рівень подібності у реакції досліджуваних динамічних економічних систем зі сформованих груп на протікання світової фінансової кризи 2007–2009 рр. Для перевірки зроблених висновків щодо адекватної роботи алгоритму побудовано графіки динаміки темпів змін валютного курсу для 1-го та 2-го кластерів, котрі характеризуються високими значеннями коефіцієнта конкордації – W1181  0,7832 і W2181  0,7962, відповідно (рис. 5). А також для третього кластера, що характеризується трохи нижчим рівнем подібності: W3181  0,6052. З отриманої візуалізації на рис. 5 чітко видно схожість у динаміці валютного курсу, що була притаманна економікам країн всередині кожного кластера під час фінансової кризи 2007– 2009 рр. Щільність розташування графіків динаміки відповідає абсолютним значенням коефіцієнта конкордації. Так, кластер номер два (Австралія, Канада, Нова Зеландія, Норвегія, Швеція, Індонезія, Кірибаті, Самоа, Тонга, Вануату, Угорщина, Польща, Сербська Республіка), котрий має найвище значення коефіцієнта, демонструє настільки високу подібність, що подекуди лінії графіків збігаються. А період максимального падіння валютного курсу для всіх країн даної групи є ідентичним і припадає на четвертий квартал 2008 року. Трохи розмитішою виглядає сукупність графіків динаміки темпів зміни валютного курсу в кластері номер один (Єврозона, Естонія, Литва, Чехія, Данія, Ізраїль, Сінгапур, Швейцарія, Сполучені Штати Америки та ін.). Проте на рисунку чітко видно точку максимального просідання вартості національних грошових одиниць по відношенню до долара США – це четвертий квартал 2008 року. Та, на відміну від другого кластера, йому передувало 153


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

помітне зростання валютного курсу у четвертому кварталі 2007 року – першому кварталі 2008 року.

Рис. 5. Графіки динаміки темпів змін валютного курсу для країн, що потрапили у перший, другий і третій кластери, відповідно 154


Вибір оптимальної топології нейронної мережі…

І. І. Стрельченко

Інша динаміка характеризує країни, що увійшли до третього кластера (Бангладеш, Вірменія, Грузія, Молдова). Він характеризується довшим латентним періодом [9] і максимальним падінням показника у першому півріччі 2009 року. Значення коефіцієнта конкордації W3181  0,6052 очікувано супроводжується ще меншою близькістю розташування ліній у просторі, проте їх форма, що відповідає напрямку реакції економічних систем країн на протікання світової фінансової кризи, є дуже подібною.

Висновки і перспективи подальших досліджень у даному напрямку У результаті проведеного дослідження запропоновано та вперше обґрунтовано використання непараметричного критерію – рангового коефіцієнта конкордації – для застосування в задачах класифікації динамічних економічних систем. Він відповідає вимогам щодо зрозумілої інтерпретації, відсутності обмежень на однорідність даних, числової оцінки в границях обмеженої шкали рівня подібності реакції динамічних систем. Розроблено покроковий алгоритм побудови нейронної мережі типу карти Кохонена, призначеної для вирішення задачі класифікації вихідної вибірки відповідно до обраного критерію. Отримані переконливі результати щодо коректності застосування рангового коефіцієнта конкордації для вирішення класу задач класифікації багатовимірних даних, коли кожний досліджуваний об’єкт характеризується набором характеристик у динаміці на певну хронологічну глибину. Проведене експериментальне дослідження дозволило розподілити вихідну вибірку з шістдесяти п’яти країн на шість кластерів за максимальним значенням критерію оптимальності. В середині кожної групи динаміка кожного індикатора характеризується високим рівнем подібності, що підтверджено абсолютними значеннями коефіцієнта конкордації та графічною візуалізацією отриманих результатів. Розроблений підхід може бути використаний під час вирішення задач розподілу на кластери інших об’єктів, котрі мають схожі особливості класифікаційних ознак. Зокрема, в задачах медичної 155


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

сфери (для роботи з кардіограмами пацієнтів із серцево-судинними захворюваннями, що мають тривалу історію хвороби), соціальної сфери (для оцінки стану розвитку країн за рівнем життя населення, станом медичного обслуговування, смертності та ін.), машинного навчання (пошуку закономірностей в інтернетзапитах користувачів, підбору контекстної реклами тощо).

Література 1. Jothi S. Avoiding Network Performance Degradation Problem in Zigbee / S. Jothi, D. Daniel, J. Durairani, A. Rekha // International Journal of Innovative Research in Computer and Communication Engineering. – 2015. – Vol. 3. – Is. 3. – P. 1438–1445. 2. Hammah E. Validity Measures for the Fuzzy Cluster Analysis of Orientations / E. Hammah, E. Reginald, J. Curran // IEEE Transacions on pattern analysis and machine intelligence. – 2000. – Vol. 22. – Is. 12. – P. 1467–1472. 3. Chen Li. Clustering for Approximate Similarity Search in HighDimensional Spaces / Chen Li, E. Y. Chang, H. Garcia-Molina, G. Wiederhold // IEEE Transactions on Knowledge and Data Engineering. – 2002. – Vol. 14. – No. 4. – P. 792–808. 4. Kanth K. Dimensionality reduction for similarity searching in dynamic databases / K. Kanth, D. Agrawal, A. Singh // Proceedings of the 1998 ACM SIGMOD international conference on Management of data (Seattle, Washington, USA), 1998. – P. 166–176. 5. Kendall M. G. Rank correlation methods / M. G. Kendall // New York: Hafner Publishing Co. – 1955. – 160 p. 6. Kendall M. G. The problem of m rankings / M. G. Kendall, B. S. Babington // Annals of Mathematical Statistics. – 1939. – No. 10. – Vol. 3. – P. 275–287. 7. Legendre P. Species associations: The Kendall coefficient of concordance revisited / P. Legendre // Journal of Agricultural, Biological, & Environmental Statistics. – 2005. – Vol. 10. – P. 226–245. 8. Hush D. Progress in supervised neural network / D. Hush, B. Horne // IEEE Signal Processing Magazine. – 1993. – No. 10. – Vol. 1. – P. 8–39. 9. Матвійчук А. В. Використання системи випереджальних індикаторів для прогнозування негативних зрушень на фінансовому ринку України / А. В. Матвійчук, І. І. Стрельченко // Фінанси України. – 2015. – № 8. – С. 74–87. – Режим доступу: http://nbuv.gov.ua/ UJRN/Fu_2015_8_7. 156


Вибір оптимальної топології нейронної мережі…

І. І. Стрельченко

References 1. Jothi, S., Daniel, D., Durairani, J.A., & Rekha, A. (2015). Avoiding Network Performance Degradation Problem in Zigbee. International Journal of Innovative Research in Computer and Communication Engineering, 3(3), 1438–1445. 2. Hammah, E., Reginald, E., & Curran, J. (2000). Validity Measures for the Fuzzy Cluster Analysis of Orientations. IEEE Transacions on pattern analysis and machine intelligence, 22(12), 1467–1472. 3. Chen, Li, Chang, E. Y., Garcia-Molina, H., & Wiederhold, G. (2002, July). Clustering for Approximate Similarity Search in High-Dimensional Spaces. IEEE Transactions on Knowledge and Data Engineering, 14(4), 792–808. doi: 10.1109/TKDE.2002.1019214 4. Kanth, K., Agrawal, D., & Singh, A. (1998, June 01–04). Dimensionality reduction for similarity searching in dynamic databases. Proceedings of the 1998 ACM SIGMOD international conference on Management of data (Seattle, Washington, USA), 166–176. doi: 10.1145/276304.276320 5. Kendall, M. G. (1955). Rank correlation methods. New York: Hafner Publishing Co. 6. Kendall, M. G., & Babington, B. S. (1939). The problem of m rankings. Annals of Mathematical Statistics, 10(3), 275–287. 7. Legendre, P. (2005). Species associations: The Kendall coefficient of concordance revisited. Journal of Agricultural, Biological, & Environmental Statistics, 10, 226–245. 8. Hush, D., & Horne, B. (1993). Progress in supervised neural network. IEEE Signal Processing Magazine, 10(1), 8–39. 9. Matviychuk, A. V., & Strelchenko, I. I. (2015). Vykorystannya systemy vyperedzhauchikh indykatoriv dlya prognozuvannya negatyvnykh zrushen’ na finansovomu rynku Ukrainy. Finansy Ukrainy (Finance of Ukraine), 8, 74–87. Retrieved from http://nbuv.gov.ua/UJRN/Fu_2015_8_7 [in Ukrainian]. Стаття надійшла до редакції 13.06.2017

157


УДК 330.46:519.71

ЗАСТОСУВАННЯ МАТЕМАТИЧНИХ МОДЕЛЕЙ ДЛЯ ГОЛОСОВОЇ ІДЕНТИФІКАЦІЇ СУБ’ЄКТІВ У СФЕРІ ФІНАНСОВОЇ БЕЗПЕКИ

Є. Ю. Щербаков Кандидат економічних наук, начальник науково-виробничого відділу ТОВ «Науково-виробничий центр «Інфозахист» вул. Верховинна, 59, м. Київ, 03115, Україна yshcherbakov@warfare-tec.com

У статті проведено дослідження з вибору найефективніших математичних методів та оптимальних комбінацій параметрів попередньої обробки даних у вирішенні завдань біометричної ідентифікації. Досліджено етапи підготовки даних, поданих у вигляді часових рядів, для завдань розпізнавання образів. Встановлено ознаки потоку даних, які можуть бути використані як вхідні параметри для побудови моделі класифікації. Проведено порівняльний аналіз точності моделей класифікації, побудованих з використанням штучних нейронних мереж, комітетів дерев прийняття рішень та алгоритму опорних векторів, а також порівняння показників витрат комп’ютерного часу на побудову таких моделей. Для зменшення витрат часу для пошуку гіперпараметрів запропоновано застосовувати двоетапний підхід зі скороченням розміру навчальної вибірки та залученням спрощених математичних методів на попередньому етапі пошуку. Проведена експериментальна перевірка підтвердила доцільність застосування такого підходу в процесі оптимізації параметрів підготовки даних і конфігурації нейронної мережі та засвідчила його ефективність з точки зору витрат комп’ютерного часу. Висновки з проведеного дослідження та побудовані моделі можуть бути використані банківськими структурами та іншими установами, зацікавленими в біометричній ідентифікації особи за голосом. Ключові слова: Біометрична ідентифікація, нейромережа, комітети дерев прийняття рішень, оптимізація гіперпараметрів, витрати процесорного часу.

© Є. Ю. Щербаков, 2017

158


Застосування математичних моделей…

Є. Ю. Щербаков

ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ДЛЯ ГОЛОСОВОЙ ИДЕНТИФИКАЦИИ СУБЪЕКТОВ В СФЕРЕ ФИНАНСОВОЙ БЕЗОПАСНОСТИ

Е. Ю. Щербаков Кандидат экономических наук, начальник научно-производственного отдела ООО «Научно-производственный центр «Инфозахист» ул. Верховинная, 59, г. Киев, 03115, Украина yshcherbakov@warfare-tec.com

В статье проведено исследование, посвященное выбору наиболее эффективных математических методов и поиску оптимальных комбинаций параметров предварительной обработки данных в решении задач биометрической идентификации. Исследованы этапы подготовки данных, представленных в виде временных рядов, для задач распознавания образов. Установлены признаки потока данных, которые могут быть использованы как входные параметры для построения модели классификации. Проведен сравнительный анализ точности моделей классификации, построенных с использованием искусственных нейронных сетей, комитетов деревьев принятия решений и алгоритма опорных векторов, а также сравнение показателей затрат компьютерного времени на построение таких моделей. Для уменьшения затрат времени для поиска гиперпараметров предложено применять двухэтапный подход с сокращением объема обучающей выборки и привлечением упрощенных математических методов на предварительном этапе поиска. Проведенная экспериментальная проверка подтвердила целесообразность применения такого подхода в процессе оптимизации параметров подготовки данных и конфигурации нейронной сети, а также показала его эффективность с точки зрения затрат компьютерного времени. Выводы из проведенного исследования и построенные модели могут быть использованы банковскими структурами и другими учреждениями, заинтересованными в биометрической идентификации личности по голосу. Ключевые слова: Биометрическая идентификация, нейросеть, комитеты деревьев принятия решений, оптимизация гиперпараметров, расходы процессорного времени.

159


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

APPLICATION OF MATHEMATICAL MODELS FOR VOICE IDENTIFICATION IN THE FIELD OF FINANCIAL SECURITY

Yehor Shcherbakov PhD in Economics, Head of the Scientific and Production Department LLC "Scientific and Production Center "INFOZAHIST" 59 Verhovynna Str., Kyiv, 03115, Ukraine yshcherbakov@warfare-tec.com The article is devoted to choosing the most effective mathematical methods and optimal parameters combinations on data preparation and modeling in solving the problems of biometric identification. Stages of the time series data transformation into the form, applicable for pattern recognition tasks, are discovered. The components of the data flow that can be used as input parameters for building a classification model are developed. A comparative analysis of the accuracy of classification models built using artificial neural networks, decision trees committees and support vector algorithm is performed. It’s given the comparison of the cost of computer time to build such models. To reduce the computational cost of searching for hyperparameters there proposed to use two-phased approach on reducing the size of the training sample and simplifying mathematical methods in the preliminary step of search. Experimental testing confirmed the applicability of the approach to optimize the parameters of the data and configuration of the neural network and its efficiency in terms of cost of computer time. Findings from the research and the built models may be used by banking institutions and other organizations interested in biometric identification by voice. Keywords: Biometric identification, neural network, Random forest method, hyper-parameters optimization, computational costs. JEL Classіfіcatіon: C45, C61, C89

Постановка проблеми та її зв’язок із важливими науковими чи практичними завданнями Підтвердження особи є однією з суттєвих складових банківського процесу. Так, у 2003 році ідентифікація клієнта стала безумовною вимогою до всіх фінансових інститутів США при проведенні всіх фінансових транзакцій [1]. Окрім того, відповідно до програми запобігання відмиванню грошей, впровадженої урядом США [2], обов’язковій ідентифікації підлягають не тільки фізичні особи, які здійснюють банківські операції, але й особи, пов’язані з управлінням юридичними особами, а також задіяні у опе160


Застосування математичних моделей…

Є. Ю. Щербаков

раціях з кредитними спілками, ощадними асоціаціями та деякими іншими фінансовими установами. У той же час, розвиток технологій і рівня сервісу фінансових структур вимагає методів ідентифікації особи, які дозволяли б здійснення операцій та обслуговування віддалено, засобами телефонного банкінгу, інтернет-банкінгу тощо. Деякі з банківських операторів починають переходити на біометричні технології ідентифікації, зокрема один з найбільших світових банків Barclays, який запровадив систему пасивної голосової автентифікації клієнтів. Згідно з [2] для перевірки автентичності цією установою потребується близько 20 секунд аудіо-даних. Окрім того, біометрична ідентифікація вважається безпечнішим методом, ніж автентифікація на основі пароля або процесу «секретне питання», і тому її розвиток та поширення може вбачатись одним із пріоритетних напрямків підвищення якості та безпеки обслуговування у фінансовій сфері. Аналіз останніх досліджень та публікацій Розпізнавання особи за голосом відноситься до класу задач розпізнавання образів [4]. У більшості досліджень [5] розділяються завдання розпізнавання голосового мовлення, розпізнавання особи, що говорить (диктора), та підтвердження автентичності особи, що говорить (диктора). У задачі розпізнавання диктора вхідними показниками для моделювання у більшості джерел розглядаються мел-частотні кепстральні коефіцієнти та кепстральні коефіцієнти лінійного передбачення, а також використовуються характеристичні вектори довжиною від 12 [6] до 60 [7, 8] показників, тобто діапазонів частот, для яких здійснюється обчислення сумарної енергії сигналу. Разом з тим, порівняння використання різного типу вхідних показників, проведене у [9], показало, що використання мелчастотних кепстральних коефіцієнтів дає кращі результати, ніж використання кепстральних коефіцієнтів лінійного передбачення. У [7] висвітлено позитивний ефект від видалення шумової компоненти вхідного сигналу, а також запропоновано використовувати метод опорних векторів при побудові класифікатора. У [6, 10] для побудови систем розпізнавання особи, що говорить, та мови, на якій ця особа говорить, пропонується використовувати нейронні мережі, зокрема нейронні мережі глибокого навчання. Запропоновано використовувати нейронну мережу з 161


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

великою кількістю прихованих шарів, один з яких є так званим «вузьким місцем» моделі, завданням якого є пониження розмірності вектора вхідних параметрів.

Виділення невирішених раніше частин загальної проблеми, котрим присвячується стаття Незважаючи на те, що напрацювання щодо аналізу аудіоданих і часових послідовностей мають достатньо тривалу історію, з огляду на широкий асортимент доступних на сьогодні математичних методів, вибір найефективніших з них для аналізу мовлення залишається дискусійним питанням. Окрім того, незважаючи на те, що останнім часом набули значної популярності методи математичного аналізу, пов’язані з розпізнаванням зображень та аудіо-потоків на основі нейронних мереж, вибір конфігурації мережі та вхідних даних для неї є завданням, яке доводиться щоразу заново вирішувати при побудові інформаційної системи, зважаючи на особливості її застосування. Відповідно, ця стаття присвячена дослідженню з вибору найефективніших математичних методів, оптимальних комбінацій параметрів підготовки даних і побудови моделей розпізнавання особи за голосом. Формулювання мети і завдання дослідження Метою статті є розробка методу розпізнавання особи, що говорить, на основі частотного аналізу діалогу за участі цієї особи, що передбачає вирішення таких завдань: 1) формування вектора факторів впливу для проведення аналізу та розпізнавання голосів; 2) розробка алгоритму та його реалізація у вигляді програмного скрипта для автоматизації розпізнавання особи, що говорить, у діалозі з іншою особою, зокрема, банківським оператором; 3) формування навчальної вибірки, що включає записи монологів і діалогів з різних джерел, включаючи стільниковий зв’язок, супутниковий телефон, радіозв’язок короткохвильового діапазону; 4) вибір математичного інструментарію та побудова моделі, що дозволяє визначати особу, що говорить, за її голосом з достатньою достовірністю; 5) аналіз якості, прогностичних можливостей та оперативності роботи побудованої моделі. 162


Застосування математичних моделей…

Є. Ю. Щербаков

Виклад основного матеріалу дослідження з обґрунтуванням отриманих наукових результатів Загальними етапами у побудові будь-якої системи оброблення даних засобами машинного навчання є: - попереднє оброблення даних і виявлення впливових факторів для моделювання у вигляді числових змінних; - вибір класу математичних методів, який буде застосований для побудови класифікатора; - оптимізація моделі та пошук оптимальних параметрів і гіперпараметрів моделювання; - тестування показників точності отриманої моделі. Згідно з [8], необхідними етапами роботи для побудови системи розпізнавання особи, що говорить, є: - введення голосових даних у цифровому вигляді (як числової послідовності); - виявлення впливових факторів (ознак) для аналізу; - визначення ймовірності належності голосу до кожного з потенційних кандидатів (можливих суб’єктів); - визначення найбільш імовірного суб’єкта та встановлення особи диктора. Розглянемо детальніше реалізацію кожного з зазначених етапів. Підготовка даних і виявлення впливових факторів як числових змінних Згідно з [5] розпізнавання особи, що говорить, так само як розпізнавання голосового мовлення, ґрунтується на особливостях фізіології голосового апарату людини та особливостях сприйняття звуку людиною. Так, оскільки показником, що характеризує мовлення кожної конкретної людини є переважно тональність звуку голосу (яка залежить від фізичних розмірів та акустичних характеристик голосового апарату людини) та характер переходу між звуками, можна дійти висновку, що впливовими факторами для розпізнавання повинні бути домінуючі частоти та швидкість зміни цих частот. Оскільки ж сприйняття людиною звукових частот має не лінійний, а логарифмічний характер, відповідним чином повинні бути трансформовані частотні показники і для моделювання. Таким чином, підготовка числових змінних для моделювання буде складатись з таких дій: 1) Отримання запису звуку людського мовлення у вигляді числової послідовності, на зразок до представленої на рис. 1. 163


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Рис. 1. Відображення числової послідовності цифрового запису голосу

2) Розділення потоку цифрових аудіо-даних на фрагменти заданої тривалості із згладжуванням меж фрагменту. Зазвичай довжина фрагменту обирається в діапазоні від 25 мілісекунд до 0,5 секунди, і є одним з гіперпараметрів моделі розпізнавання. Згладжування здійснюється мультиплікацією послідовності та віконної функції Блекмана [11] відповідної розмірності та виконується для кожного фрагменту. Приклад змісту фрагмента наведено на рис. 2.

Рис. 2. Відображення числової послідовності одного фрагмента голосу для аналізу 164


Застосування математичних моделей…

Є. Ю. Щербаков

3) Здійснення швидкого перетворення Фур’є та переведення сигналу у частотний діапазон. При цьому здійснюється також переведення із фізичних одиниць частоти звуку (Герц) у психофізичні (Мел) за формулою [12]: f   (1) m  1127 ln 1 ,  700  де m – частота сигналу в Мелах; f – частота сигналу в Герцах. Переведення із фізичних одиниць у психофізичні дозволяє виявити для подальшого математичного аналізу більшу варіативність у тій зоні частот, яка зазвичай домінує при сприйнятті голосу людиною, що дозволяє наблизити модель за показниками точності розпізнавання до людського сприйняття. Порівняння спектрів, складених по фізичних і психофізичних одиницях, наведено на рис. 3.

Рис. 3. Відображення спектрального складу фрагмента за шкалою Герц і Мел

4) Для того, щоб на підставі наявної мел-спектральної характеристики отримати вектор числових характеристик, придатних для проведення моделювання, здійснюється інтегрування частотних даних визначеною кількістю трикутних частотних фільтрів. Кількість фільтрів, нижня та верхня межі їх діапазону також є гі165


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

перпараметрами моделі. Схематично фільтри, які застосовуються до спектрального складу моделі, наведено на рис. 4.

Рис. 4. Відображення спектрального складу фрагмента за шкалою Мел і фільтрів, які застосовуються для переведення його у числовий вектор

5) У результаті інтегрування даних, отриманих із застосуванням фільтрів, формується вектор чисел, на зразок до зображених на рис. 5, які можуть бути використані як вхідні параметри для моделі.

Рис. 5. Вектор, який відображає спектральний склад одного фрагмента 166


Застосування математичних моделей…

Є. Ю. Щербаков

Після того, як ці операції проведено для всієї сукупності спостережень навчальної вибірки аудіо-даних, стає можливим перейти до етапу побудови моделі на основі цих даних та оцінювання її адекватності.

Побудова моделі голосової ідентифікації суб’єктів на основі наявних даних Для класифікації фрагментів аудіо-даних за дикторами у цій статі розглянуто такі типи моделей: - штучні нейронні мережі; - класифікатори на основі комітетів дерев прийняття рішень (Random forest); - алгоритм опорних векторів. Відповідно до [13] на початковому етапі пошуку найкращої моделі необхідно провести попереднє дослідження з використанням найоперативнішого методу для встановлення так званої «відправної точки» точності роботи моделі. Це дозволяє оцінити ефективність подальших дій з оптимізації параметрів моделі та застосування інших класів моделей. У даному випадку за найшвидший метод побудови моделей голосової ідентифікації було обрано класифікатори на основі комітетів дерев прийняття рішень (Random forest). Початковими гіперпараметрами моделі, які використано для формування масиву числових даних для аналізу, обрано на основі [14] такі: - кількість Мел-фільтрів: 26; - тривалість одного фрагменту: 0,03 секунди; - нижня межа діапазону частот: 10 Герц; - верхня межа діапазону частот: 4000 Герц. Критерієм оцінювання точності моделей слугував відсоток коректного визначення належності фрагмента до відповідної множини аудіо-даних запису голосу на крос-валідації при розділенні наявної вибірки даних на навчальну та тестову у співвідношенні 70 % на 30 %. У навчальній і тестовій вибірках використано в загальній сукупності 25 хвилин аудіо-записів мовлення 10 різних осіб і виділено окрему категорію даних «шум», яка не належить до людського мовлення. За таких умов було отримано показники точності побудованих моделей, що наведені у табл. 1. 167


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Таблиця 1 ПАРАМЕТРИ МОДЕЛЕЙ ТА ПОРІВНЯЛЬНІ РЕЗУЛЬТАТИ ЇХ АПРОБАЦІЇ № п/п

Тип моделі

Кількість Кількість Витрати Точність вхідних нейронів Кількість класифікації на процесорного параметрів у прихованому ітерацій крос-валідації, часу на (вхідних шарі (вирощених навчання побудову % нейронів) дерев) моделі, с.

1

Random Forest

26

100

79,67

80,32

2

Нейронна мережа

26

10

600

73,30

429,61

3

Нейронна мережа

26

20

600

77,54

772,95

4

Нейронна мережа

26

30

600

78,32

1225,86

5

Алгоритм опорних векторів

26

75,32

2145,70

Витрати часу на побудову моделі оцінювались для реалізації процесу мовою R на апаратній платформі Intel i3. Як бачимо з табл. 1, базовим математичним інструментарієм для швидкої побудови ефективної моделі розпізнавання голосу можуть слугувати класифікатори Random forest. Моделі, засновані на використанні штучних нейронних мереж, за ефективністю наближаються до Random forest, хоча при цьому потребують суттєво більшого часу для навчання та проведення додаткових досліджень з пошуку оптимальної конфігурації мережі й визначення кількості ітерацій навчання. З метою підвищення точності моделювання на наступному етапі необхідним є проведення пошуку в просторі гіперпараметрів оптимальної структури моделі та підготовки вхідних даних.

Оптимізація моделі розпізнавання диктора та пошук оптимальних гіперпараметрів моделювання Як зазначається у [7, 10], для підвищення точності класифікації доцільно використовувати, зокрема, перший і другий дельтакоефіцієнти від послідовностей спектральних коефіцієнтів, які інколи називаються «похідними» таких послідовностей. У свою 168


Застосування математичних моделей…

Є. Ю. Щербаков

чергу, у [15, с. 65] дельта-коефіцієнт для MFCC-послідовностей визначається як: dt 

 1  ct   ct   , 2 1 2

де dt – дельта-коефіцієнт (аналог похідної першого порядку) в момент часу t; ct-θ, ct+θ – відповідні статичні MFCC-коефіцієнти в моменти часу t – θ та t + θ; Θ – розмір напів-вікна (виражений у кількості часових фрагментів-кадрів), яке використовується для обчислення похідної. Розмір вікна застосовується до та після поточного кадру та обирається як один з гіпер-параметрів моделювання. Дельта-коефіцієнт другого порядку аналогічним чином вираховується із використанням замість статичних коефіцієнтів ct-θ, ct+θ відповідних їм дельта-коефіцієнтів першого порядку dt-θ та dt+θ. Як бачимо, оскільки для побудови кожної моделі гіперпараметр Θ обирається одноразово як константне значення, похідні, вирахувані таким чином у момент часу t, є лінійною комбінацією MFCC-коефіцієнтів у межах обраного вікна Θ з деякими незмінними чисельними коефіцієнтами. З іншого боку, зважаючи на здатність штучних нейронних мереж моделювати лінійні комбінації вхідних параметрів, можна стверджувати, що з метою підвищення точності класифікації за допомогою нейромережевого класифікатора припустимим є використання в якості вхідних даних замість першої та другої похідної наведеного вигляду звичайної послідовності спектральних коефіцієнтів, доповненої MFCC-спектральними коефіцієнтами Θ попередніх і Θ наступних кадрів. Виходячи з викладеного, для підвищення точності моделі необхідно здійснити пошук оптимального набору її гіперпараметрів за такими вимірами: - кількість спектральних фільтрів (довжина вектора фільтрів) для одного кадру; - тривалість одного кадру в секундах; - нижня межа діапазону частот, які аналізуються; 169


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

- верхня межа діапазону частот; - порогове заповнення кадру, нижче якого кадр вважається порожнім; - кількість додаткових кадрів, які включаються до аналізу; - кількість нейронів у прихованому шарі (у разі використання нейронної мережі); - кількість ітерацій навчання (у разі використання нейронної мережі). При цьому, як зазначається у [16], серед методів, які зазвичай застосовуються для пошуку гіперпараметрів, найпоширенішими є: - регулярний перебір комбінацій гіперпараметрів із заданим кроком; - випадковий пошук комбінації за встановленою кількістю спроб; - послідовна оптимізація за кожним із параметрів. На початковому етапі дослідження випробуємо найпростіший метод оптимізації гіперпараметрів – регулярний перебір комбінацій із заданим кроком. Для прикладу, пошук оптимального розміру кадру за умови незмінності інших параметрів моделі виявив таку залежність точності моделі, виміряної за результатами кросвалідації, від розміру кадру, що зображено на рис. 6.

Рис. 6. Залежність точності моделі від розміру кадру за незмінних інших параметрах 170


Застосування математичних моделей…

Є. Ю. Щербаков

Як бачимо з рис. 6, за умови незмінності інших параметрів точність моделі виявляє загальну тенденцію до зростання зі збільшенням тривалості одного кадру, в межах якого аналізується спектральний склад (але не більше 4 секунд). Зауважимо також, що з огляду на високу варіативність отриманих результатів, пошук за умови змінюваності інших параметрів може виявити інші оптимальні значення цієї змінної, що буде розглянуто нижче. З урахуванням винайденої оцінки оптимального значення розміру кадру та за умови незмінності інших параметрів процес пошуку оптимальної кількості спектральних Мел-фільтрів відображено на рис. 7.

Рис. 7. Залежність точності моделі від обраної кількості Мел-фільтрів за незмінних інших параметрах

У той же час, дослідження точності розпізнавання голосу диктора одночасно за двома зазначеними гіперпараметрами (розмір кадру та кількість Мел-фільтрів), дає результати, які доцільніше подати у вигляді тривимірної поверхні, представленої на рис. 8. Як видно з рис. 8, поверхня залежності точності моделі від цих гіперпараметрів характеризується високою нерівномірністю та може проявити глобальний оптимум, який відрізняється від оптимальних значень, знайдених по кожному з цих двох параметрів окремо. 171


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Рис. 8. Залежність точності моделі від обраного розміру кадру та кількості Мел-фільтрів (спільно)

З огляду на це, пошук оптимальної комбінації гіперпараметрів має ґрунтуватись на таких самих підходах, як і пошук оптимальних параметрів самої математичної моделі. Разом з тим, зважаючи на стохастичні складові загального процесу попередньої підготовки даних, штучне розбиття їх на навчальну та тестову вибірки, у результатах оцінювання точності моделі присутня суттєва складова, яка може бути охарактеризована як шум. Розглянемо, наприклад, результати пошуку оптимальної кількості нейронів у прихованому шарі нейронної мережі персептронного типу, точність моделювання якої на крос-валідації продемонстрована на рис. 9. Як бачимо з рис. 9, збільшення чи зменшення кількості нейронів у прихованому шарі мережі на один нейрон може призвести до зміни показників точності моделювання в ході тестування в межах 20 %, що викликане впливом зовнішніх причин (стохастичних факторів). При цьому узагальнена точність моделі за розмірності прихованого шару в межах діапазону від 200 до 300 нейронів не змінюється. З огляду на це, наприклад, чисельне знаходження похідної функції точності моделювання від кількості нейронів мережі не є можливим. З цих причин виникають 172


Застосування математичних моделей…

Є. Ю. Щербаков

обмеження у застосуванні прямих методів оптимізації, таких як, наприклад, градієнтний спуск.

Рис. 9. Залежність точності моделі від обраної кількості нейронів у прихованому шарі персептрону за незмінних інших параметрах

Зменшити відносну шумову варіативність результатів оцінювання точності моделі може збільшення кількості спостережень, за якими здійснюється навчання та оцінка роботи моделі, а також проведення кількох процедур оцінювання моделі для кожної комбінації її гіперпараметрів. Разом з тим, зауважимо, що, виходячи з табл. 1, проведення пошуку оптимальних гіперпараметрів шляхом регулярного або випадкового перебору великої кількості моделей потребуватиме значних витрат процесорного часу. З огляду на це, для підвищення ефективності процесів оптимізації моделі розпізнавання голосу диктора та пошуку оптимальних гіперпараметрів моделювання можна застосувати такі підходи: - проведення попереднього швидкого пошуку загальних тенденцій у залежностях точності отриманої моделі від кожного з гіперпараметрів, із використанням невеликої частки наявних навчальних даних; - проведення попереднього пошуку гіперпараметрів на основі найшвидшого з відібраних математичних методів побудови моделі; 173


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

- після знаходження області максимальної точності моделей, проведення детальнішого дослідження в межах звуженого діапазону можливих значень гіперпараметрів із використанням більшої частки навчальних даних і з залученням різних математичних методів для побудови моделей класифікації. Для перевірки адекватності цих підходів проведемо пошук оптимальних значень гіперпараметрів із використанням кожного з них окремо: А) Порівняння результатів пошуку гіперпараметрів на повній і неповній вибірках. Для перевірки гіпотези про можливість проведення пошуку із пришвидшенням за рахунок зменшення навчальної вибірки сформовано два набори даних, у яких в якості навчальної вибірки використано 90 % і 10 % наявних даних, відповідно. Порівняння результатів пошуку оптимальних гіперпараметрів наведено на рис. 10.

Рис. 10. Залежність точності моделі від обраної кількості Мел-фільтрів за незмінних інших параметрах при моделюванні на повній (чорний колір) і зменшеній (сірий) вибірках

Як бачимо на рис. 10, поведінка залежності точності моделювання від кількості спектральних складових співпадає для повної 174


Застосування математичних моделей…

Є. Ю. Щербаков

та часткової вибірок, із очікуваним зменшенням загальної точності моделі, побудованої на часткових даних. При цьому, як бачимо на рис. 11, витрати часу на побудову моделей для повної та часткової вибірок різнились у середньому в 50 разів.

Рис. 11. Залежність витрат часу на побудову моделей на повній (чорний колір) і зменшеній (сірий) вибірках

Це підтверджує припустимість використання підходу щодо зменшення розміру навчальної вибірки на етапі швидкого пошуку оптимальних гіперпараметрів моделі. Б) Порівняння результатів пошуку гіперпараметрів на основі різних математичних методів класифікації. Для перевірки гіпотези про можливість проведення пошуку гіперпараметрів на основі різних математичних моделей здійснимо таку саму процедуру, як і в попередньому випадку, але із застосуванням випробуваних вище методів Random forest і штучних нейронних мереж. Порівняння результатів пошуку оптимальних гіперпараметрів за цими підходами наведено на рис. 12.

175


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Рис. 12. Залежність точності моделі від обраної кількості Мел-фільтрів при моделюванні за методом класифікації Random forest (чорний колір) та із застосуванням нейронної мережі (сірий)

Як видно з рис. 12, поведінка точності моделей на основі зазначених двох методів співпадає. При цьому різниця у витратах часу на побудову нейромережі зі структурою 100 нейронів у прихованому шарі та 1000 ітерацій градієнтного наближення в деяких випадках становить більше ніж 100 разів, порівняно з Random forest, що можна бачити з рис. 13.

Рис. 13. Залежність витрат часу на побудову моделі за методом класифікації Random forest (чорний колір) і нейронної мережі (сірий) 176


Застосування математичних моделей…

Є. Ю. Щербаков

Проведений аналіз підтверджує припустимість використання підходу щодо застосування спрощених математичних методів на етапі швидкого пошуку оптимальних гіперпараметрів моделі. Для перевірки результативності застосування вказаних вище підходів з метою прискорення пошуку оптимальної комбінації гіперпараметрів моделі проведено пошук за вибіркою, яка складається з 500 випадкових комбінацій значень шести гіперпараметрів: - кількість спектральних фільтрів; - тривалість одного кадру в секундах; - нижня та верхня межа діапазону частот, які аналізуються; - порогове заповнення кадру, нижче якого кадр вважається порожнім; - кількість кадрів до та після поточного, які враховуються при аналізі. Необхідно зазначити, що рівномірний розподіл випадкових значень у межах заданого діапазону використано для усіх гіперпараметрів, окрім тривалості одного кадру в секундах. Так, для тривалості кадру не застосовувались значення, які могли в поєднанні з заданою кількістю кадрів до та після поточного, що враховуються при аналізі, дати загальну необхідну тривалість аудіопотоку для розпізнавання більше 2,5 секунд. Це обумовлено вимогами фактичної можливості ідентифікації особи в телефонній розмові за вимовлянням ключового слова або мінімальної цілісної фрази одного з учасників діалогу. Як показав аналіз, нерівномірна щільність розподілу ймовірності при випадковому виборі значення гіперпараметру, так само як і наявність пов’язаних гіперпараметрів, суттєво впливають на поведінку точності моделі в ході пошуку глобального оптимуму. Так, тенденція до зростання точності моделі з підвищенням кількості додаткових кадрів, які враховуються при моделюванні (рис. 14), вплинула на поведінку точності моделі залежно від тривалості одного кадру (рис. 15), яка більше не проявляє монотонної тенденції до зростання, як це було при аналізі за умови незмінності інших гіперпараметрів (див. рис. 6). 177


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Рис. 14. Залежність точності моделі від кількості додаткових кадрів, які враховуються при моделюванні, за результатами пошуку в просторі змінних комбінацій гіперпараметрів

Рис. 15. Залежність точності моделі від обраної тривалості одного кадру, за результатами пошуку в просторі змінних комбінацій гіперпараметрів 178


Застосування математичних моделей…

Є. Ю. Щербаков

Пошук у просторі гіперпараметрів зі змінними випадковими комбінаціями дозволив виявити оптимуми значень нижньої та верхньої межі діапазону частот, які використовуються для аналізу (рис. 16 і 17).

Рис. 16. Залежність точності моделі від обраної нижньої межі діапазону частот, за результатами пошуку в просторі змінних комбінацій гіперпараметрів

Рис. 17. Залежність точності моделі від обраної верхньої межі діапазону частот, за результатами пошуку в просторі змінних комбінацій гіперпараметрів 179


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Що ж стосується поведінки таких гіперпараметрів як порогове значення заповнення кадру, нижче якого кадр вважається порожнім (рис. 18), та кількість використаних спектральних фільтрів (рис. 19), які проявляють монотонну тенденцію до зростання, то їх значення в практичному застосуванні мають обмеження, обумовлені ймовірністю виродження аудіо-потоку в порожню множину (у разі використання порогового значення заповнення вище 0,02) та неприпустимим зростанням витрат часу на побудову моделі при збільшенні кількості фільтрів (як показано на рис. 13).

Рис. 18. Залежність точності моделі від обраного порогового значення заповнення кадру, нижче якого кадр вважається порожнім, за результатами пошуку в просторі змінних комбінацій гіперпараметрів

В) Перевірка стабільності роботи моделі для знайдених оптимальних значень гіперпараметрів. За результатами пошуку в просторі гіперпараметрів було знайдено таку комбінацію, яка забезпечила побудову моделі з показником точності на крос-валідації на рівні 98,6 %. Разом з тим, наявність у процесі попередньої обробки даних і побудови 180


Застосування математичних моделей…

Є. Ю. Щербаков

моделі стохастичних складових (таких як розділення масиву даних на тренувальну та крос-валідаційну вибірки, вирощування комітету дерев прийняття рішень або ініціалізація початкового стану нейронної мережі) обумовлює необхідність проведення перевірки повторюваності отриманих результатів.

Рис. 19. Залежність точності моделі від обраної кількості Мел-фільтрів, за результатами пошуку в просторі змінних комбінацій гіперпараметрів

Як було запропоновано вище, для проведення такої перевірки доречним є здійснення детальнішого повторюваного дослідження в межах звуженого діапазону можливих значень гіперпараметрів, у тому числі з залученням різних математичних методів для побудови моделей класифікації. Серед результатів проведеного вище пошуку на вибірці з 500 можливих комбінацій гіперпараметрів оберемо 10 таких, які виявили найвищі показники точності побудованої з їх використанням спрощеної моделі (табл. 2).

181


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Таблиця 2

№ п/п

Кількість спектральних фільтрів

Тривалість одного кадру, с

Мінімальна частота, Мел

Максимальна частота, Мел

Поріг відсікання тиші

Кількість додаткових кадрів

Точність класифікації суб’єкта (у межах 10 можливих класів)

Витрати компю’терного часу на підготовку даних, с

Витрати комп’ютерного часу на побудову моделі, с

КОМБІНАЦІЇ ГІПЕРПАРАМЕТРІВ МОДЕЛЮВАННЯ ТА ПОРІВНЯЛЬНІ РЕЗУЛЬТАТИ ЇХ АПРОБАЦІЇ

1

36

0,34

9

2635

0,011

7

98,61 %

16,59

7,85

2

46

0,22

10

3230

0,015

6

98,37 %

10,8

7,06

3

47

0,29

27

3214

0,019

6

98,28 %

20,25

9,37

4

44

0,64

45

2855

0,018

2

98,20 %

8,11

0,59

5

39

0,54

22

2619

0,008

4

98,17 %

9,54

1,68

6

19

0,79

7

2231

0,017

2

98,17 %

8,53

0,31

7

30

0,48

2

2144

0,004

5

98,13 %

17,02

5,59

8

30

0,37

15

2371

0,009

6

98,11 %

17,69

6,88

9

47

0,45

3

2557

0,008

4

98,08 %

24,54

5,27

10

49

0,52

31

3521

0,019

4

98,06 %

12,78

2,11

За обраними комбінаціями гіперпараметрів проведемо повторне дослідження, під час якого для кожної з них побудуємо 10 нових моделей та оцінимо повторюваність отриманих результатів. Загальна кількість підготовлених навчальних вибірок і побудованих моделей на цьому етапі складе 100. Оціночну точність моделі залежно від обраних комбінацій гіперпараметрів за результатами повторного дослідження наведено на рис. 20.

182


Застосування математичних моделей…

Є. Ю. Щербаков

183


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Рис. 20. Залежність точності моделі від обраної комбінації гіперпараметрів, за результатами пошуку в межах звуженого діапазону можливих значень 184


Застосування математичних моделей…

Є. Ю. Щербаков

Як бачимо на рис. 20, проведення повторного дослідження точності моделей, отриманих з використанням 10 найефективніших комбінацій гіперпараметрів, підтвердило найвищу результативність комбінації № 2 (з наведених у табл. 2). Найбільша точність класифікації за її використання сягнула 98,97 % при перевірці на крос-валідаційній вибірці. Із застосуванням побудованої моделі класифікації стає можливим впровадження механізму розпізнавання голосів як складової частини системи ідентифікації клієнтів банківської установи при обслуговуванні засобами телефонного банкінгу. При практичній імплементації запропонованого підходу та побудованих моделей найдоцільнішим є не просто визначення особи, що говорить, з переліку можливих варіантів, а й відображення ступеня належності звукового ряду до класу, що відповідає певній особі (для тих класів, для яких ця належність не є нульовою), за кожним з фрагментів (кадрів) аудіо-запису або аудіопотоку під час розмови в режимі реального часу. Здійснимо перевірку роботи моделі на тестовому фрагменті аудіо-запису, наведеному на початку статті. Візуалізацію процесу розпізнавання голосів наведено на рис. 21.

Рис. 21. Візуалізація результатів розпізнавання голосів на тестовому записі діалогу клієнта з оператором кол-центру банківської установи 185


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Як бачимо з рис. 21, опрацювання запису за допомогою побудованої моделі дозволило діагностувати діалог між клієнтом банківської установи (Суб’єкт № 1) та оператором кол-центру (Суб’єкт № 2) із високим ступенем впевненості при розділенні змішаних аудіо-даних.

Висновки і перспективи подальших досліджень у даному напрямку Проведене дослідження підтвердило припустимість практичного використання технологій розпізнавання образів, зокрема біометричної ідентифікації за голосом, у банківській сфері. Експериментальне дослідження ефективності низки альтернативних методів класифікації дозволило дійти таких висновків: 1) застосування біометричної ідентифікації при здійсненні банківських операцій засобами телекомунікаційного зв’язку дозволяє підвищити рівень їх безпеки завдяки можливості досягнення високої точності визначення особи з використанням сучасних моделей класифікації (штучні нейронні мережі та комітети дерев прийняття рішень); 2) для досягнення максимальної точності роботи моделі необхідним є проведення пошуку оптимальної комбінації параметрів підготовки та перетворення даних, а також параметрів моделювання (гіперпараметрів) для конкретних умов застосування моделей класифікації; 3) здійснення пошуку оптимуму в просторі гіперпараметрів за своєю результативністю позитивно відрізняється від послідовного пошуку оптимального значення за кожним із гіперпараметрів, але потребує більших витрат часу, що обумовлює потребу в розробленні нових методичних підходів до пришвидшення такого процесу; 4) для скорочення часу на здійснення пошуку оптимуму в просторі гіперпараметрів результативним виявилось застосування на першому етапі часткових вибірок навчальних даних і математичних моделей, які забезпечують швидший пошук оптимальних параметрів класифікації; 5) для точнішого визначення оптимальної комбінації гіперпараметрів необхідним є здійснення повторюваного дослідження 186


Застосування математичних моделей…

Є. Ю. Щербаков

з метою зменшення впливу стохастичних складових на процес підготовки даних, розділення масиву на навчальну та тестову вибірки, а також побудову моделей класифікації різних типів і структур; 6) з огляду на ймовірність впливу стохастичних складових процесу побудови моделей, при здійсненні пошуку оптимуму в просторі гіперпараметрів застосування таких методів оптимізації, як градієнтний спуск, може дати хибні результати. З огляду на зазначене, напрямами подальшого дослідження доцільно розглядати: 1) застосування для класифікації аудіо-даних, представлених у вигляді часових рядів, штучних нейронних мереж із складнішими типами архітектури, такими як згорткова (convolutional), рекурентна та нейронна мережа з довгою короткочасною пам’яттю (LSTM); 2) застосування для пришвидшення пошуку глобального оптимуму в просторі гіперпараметрів статистичних методів, які дозволили б знайти оптимальну комбінацію за мінімальної кількості спроб, зокрема, Байєсівської оптимізації; 3) застосування регресійних методів для побудови наближених моделей поведінки показників точності (наприклад, їх апроксимації поліномом n-го ступеня) залежно від гіперпараметрів та обчислення оптимальних комбінацій шляхом аналітичного знаходження їх екстремумів.

Література 1. Interagency Interpretive Guidance on Customer Identification Program Requirements under Section 326 of the USA PATRIOT Act [Електронний ресурс] // U.S. Department of the Treasury. – 2005. – Режим доступу: https://www.fincen.gov/resources/statutes-regulations/guidance/ interagency-interpretive-guidance-customer-identification. 2. Treasury § 103.121 Subpart I — Anti-Money Laundering Programs [Електронний ресурс] // USA Monetary Offices. – Режим доступу: https://www.gpo.gov/fdsys/pkg/CFR-2010-title31-vol1/pdf/CFR-2010title31-vol1-sec103-121.pdf. 3. Banking on the power of speech [Електронний ресурс]. – Режим доступу: https://wealth.barclays.com/en_gb/home/international-banking/ insight-research/manage-your-money/banking-on-the-power-of-speech.html. 187


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

4. Homayoon B. Fundamentals of Speaker Recognition / Beigi Homayoon. – Berlin: Springer Science+Business Media, 2011. – 860 p. 5. Cassidy S. COMP449: Speech Recognition (Lecture notes) / Steve Cassidy. – Sydney, Australia: Macquarie University, 2002 [Електронний ресурс]. – Режим доступу: http://web.science.mq.edu.au/~cassidy/ comp449/html/comp449.html. 6. Richardson F. Deep Neural Network Approaches to Speaker and Language Recognition / F. Richardson, D. Reynolds, N. Dehak // IEEE Signal Processing Letters. – 2015. – № 22. – P. 1671–1675. 7. Sturim D. The MIT LL 2010 speaker recognition evaluation system: scalable language-independent speaker recognition / D. Sturim, W. Campbell, N. Dehak etc. // International conference on acoustics, speech and signal processing. – Prague, Czech Republic: IEEE, 2011. – P. 5272–5275. 8. Do M. How to Build an Automatic Speaker Recognition System (lecture notes) / Mihn Do. – Urbana Champaign, Illinois: University of Illinois, 2014. – 11 p. 9. Chechi R. Performance Analysis of MFCC and LPCC Techniques in Automatic Speech Recognition / Rajiv Chechi // India International Journal of Engineering Research & Technology (IJERT). – 2013. – Vol. 2. – Is. 9. – P. 3142–3146. 10. Richardson F. A. Unified Deep Neural Network for Speaker and Language Recognition / F. Richardson, D. Reynolds, N. Dehak // INTERSPEECH 2015 proceedings of conference. – Dresden, Germany: ISCA, 2015. – P. 1146–1150. 11. Allen J. Short Time Spectral Analysis, Synthesis, and Modification by Discrete Fourier Transform / Jont Allen // IEEE Transactions on Acoustics, Speech, and Signal Processing. – 1977. – Vol. 25. – Is. 3. – P. 235–238. 12. Stevens S. S. A scale for the measurement of the psychological magnitude pitch / S. S. Stevens, J. Volkmann, E. B. Newman // Journal of the Acoustical Society of America. – 1937. –Vol. 8. – No. 3. – P. 185–190. 13. Ng A. Machine Learning (lecture notes) [Електронний ресурс] / Andrew Ng. – Stanford, CA: Stanford University. – Режим доступу: http://cs229.stanford.edu/materials/ML-advice.pdf. 14. Adarsh K. Implementation of a Voice – Based Biometric System / K. Adarsh, A. Deepak, R. Diwakar, R. Karthik. – Belgaum, India: Visveswaraya Technological University, 2007. – 101 p. 15. Young S. The HTK Book / S. Young, G. Evermann, D. Kershaw and others. – Cambridge: Cambridge University Engineering Department / Microsoft Corporation, 2002. – 355 p. 188


Застосування математичних моделей…

Є. Ю. Щербаков

16. Claessen M. Hyperparameter Search in Machine Learning / M. Claessen, B. De Moor // MIC 2015: The XI Metaheuristics International Conference. – Agadir, Morocco, 2015. – С. 14.1–14.5.

References 1. US Department of the Treasury. (2005). Interagency Interpretive Guidance on Customer Identification Program Requirements under Section 326 of the USA PATRIOT Act. Retrieved from https://www.fincen.gov/ resources/statutes-regulations/guidance/interagency-interpretive-guidancecustomer-identification. 2. USA Monetary Offices. (2003, May 9). Treasury § 103.121 Subpart I — Anti-Money Laundering Programs. Retrieved from https://www.gpo.gov/fdsys/pkg/CFR-2010-title31-vol1/pdf/CFR-2010title31-vol1-sec103-121.pdf. 3. Barclays. (2017). Banking on the power of speech. Retrieved from https://wealth.barclays.com/en_gb/home/international-banking/insightresearch/manage-your-money/banking-on-the-power-of-speech.html. 4. Homayoon, B. (2011). Fundamentals of Speaker Recognition. Berlin, Germany: Springer Science+Business Media. 5. Cassidy, S. (2002). COMP449: Speech Recognition (Lecture notes). Sydney, Australia: Macquarie University. Retrieved from http://web. science.mq.edu.au/~cassidy/comp449/html/comp449.html. 6. Richardson, F., Reynolds, D., & Dehak, N. (2015). Deep Neural Network Approaches to Speaker and Language Recognition. IEEE Signal Processing Letters, 22, 1671–1675. 7. Sturim, D., Campbell, W., Dehak, N., Karam, Z., McCree, A., Reynolds, D., Richardson, F., Torres-Carrasquillo, P., & Shum, S. (2011). The MIT LL 2010 speaker recognition evaluation system: scalable languageindependent speaker recognition. Proceedings of the International conference on acoustics, speech and signal processing (Prague, Czech Republic: IEEE), 5272–5275. 8. Do, M. (2014). How to Build an Automatic Speaker Recognition System (lecture notes). Urbana Champaign, Illinois: University of Illinois. 9. Chechi, R. (2013). Performance Analysis of MFCC and LPCC Techniques In Automatic Speech Recognition. India International Journal of Engineering Research & Technology, 2(9), 3142–3146. 10. Richardson, F., Reynolds, D., & Dehak, N. (2015). A Unified Deep Neural Network for Speaker and Language Recognition. INTERSPEECH 2015 proceedings of conference (Dresden, Germany: ISCA), 1146–1150. 189


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

11. Allen, J. (1977, June). Short Time Spectral Analysis, Synthesis, and Modification by Discrete Fourier Transform. IEEE Transactions on Acoustics, Speech and Signal Processing, 25(3), 235–238. doi: 10.1109/TASSP. 1977.1162950 12. Stevens, S., Volkmann, J., & Newman, E. (1937). A scale for the measurement of the psychological magnitude pitch. Journal of the Acoustical Society of America, 8(3), 185–190. 13. Ng, A. Machine Learning (lecture notes). Stanford, CA: Stanford University. Retrieved from http://cs229.stanford.edu/materials/MLadvice.pdf. 14. Adarsh, K., Deepak, A., Diwakar, R., & Karthik, R. (2007). Implementation of a Voice – Based Biometric System. Belgaum, India: Visveswaraya Technological University. 15. Young, S., Evermann, G., Kershaw, D., & others. (2002). The HTK Book. Cambridge, UK: Cambridge University Engineering Department / Microsoft Corporation. 16. Claessen, M., & De Moor, B. (2015). Hyperparameter Search in Machine Learning. MIC 2015: The XI Metaheuristics International Conference (Agadir, Morocco: University of Lille), 14.1–14.5. Стаття надійшла до редакції 17.02.2017

190


Нові видання за тематикою журналу

Кононова К. Ю. Інформаційна економіка: моделювання еволюційних процесів : [монографія] / К. Ю. Кононова. – Х.: ХНУ імені В. Н. Каразіна, 2015. – 312 с.

У монографії на підставі постулатів еволюційної економічної теорії досліджуються феномени інформаційної економіки на макро- та мікрорівнях. Обґрунтовано методику ідентифікації стадій розвитку інформаційної економіки, запропоновано макроекономічну модель зміни макрогенерацій. На підставі авторської концепції еволюції популяції економічних агентів розроблено мультиагентну модель макродинаміки системи як результату взаємодії агентів на мікрорівні. Комплекс моделей конкурентної взаємодії користувачів соціальних мереж дає можливість дослідити еволюційні механізми їх розвитку. В роботі використані сучасні методи моделювання, зокрема мультиагентний підхід для імітації еволюції популяції економічних агентів та взаємодії користувачів онлайнових соціальних мереж; засоби штучного інтелекту – для розробки інструментарію ідентифікації стадій розвитку інформаційної економіки. При розробленні моделі зміни макрогенерацій поряд з класичними методами були застосовані нейронні мережі. Питання, розглянуті в монографії, можуть бути цікаві фахівцям в області економіко-математичного моделювання, а також широкому колу читачів, які цікавляться проблемами економічної еволюції та розвитку інформаційної економіки. 191


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2017, № 6

Мінц О. Ю. Методологія моделювання інноваційних інтелектуальних систем прийняття рішень в

економіці:

[монографія]

/

О. Ю. Мінц. – Маріуполь: ДВНЗ «Приазовський державний технічний університет», 2017. – 216 с.

У монографії систематизовано та розширено теоретикометодологічні дослідження процесів синтезу інноваційних інтелектуальних систем прийняття рішень. Визначено методологічні підходи до застосування методів інтелектуальних обчислень, зокрема нейронних мереж, генетичних алгоритмів, нечіткої логіки для моделювання систем прийняття рішень. Запропоновано моделі і методи вдосконалення процесів прийняття рішень у контексті забезпечення життєздатності та конкурентоспроможності суб’єктів національної економіки. Для науковців, викладачів, докторантів, аспірантів і студентів економічних спеціальностей вищих навчальних закладів, представників органів державного управління, керівників і менеджерів підприємств та організацій.

192


Вимоги до оформлення статтей

ІНФОРМАЦІЯ

Шановні колеги! Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» запрошує Вас до публікацій у науково-аналітичному журналі «Нейро-нечіткі технології моделювання в економіці». Журнал виходить раз на рік. Умови подання статті до журналу Для публікації статті до редакції журналу необхідно подати: 1. Електронний варіант статті, оформлений відповідно до наведених нижче вимог. Статті повинні містити вагомі наукові результати, які можуть носити як теоретичний (здійснювати внесок в розвиток теорії та методології нейронних мереж чи нечіткої логіки), так і практичний характер (містити розв’язок конкретної прикладної задачі з побудовою економікоматематичних моделей, їх програмною реалізацією та експериментальним дослідженням їх ефективності). Результати будуть оцінюватися за рівнем їх науково-технічного потенціалу. 2. Заявку мовою статті та англійською, оформлену за наступною формою: «Нейро-нечіткі технології моделювання в економіці» Назва статті ___________________________________________ П.І.Б. автора ___________________________________________ Науковий ступінь, вчене звання __________________________ Місце роботи __________________________________________ Посада _______________________________________________ Контактний телефон ____________________________________ E-mail ________________________________________________ Поштова адреса ________________________________________ Прим. Уся ця інформація подається на кожного автора (крім назви статті, яка дається один раз на весь авторський колектив).

Статті в електронному вигляді українською, російською або англійською мовою разом із заявкою надсилаються на адресу editor@nfmte.com. Файли називати прізвищем першого автора латинськими літерами (наприклад, Savina.doc, Savina_zayav.doc).

193


Вимоги до оформлення статтей

Вимоги до наукових статей, що подаються до науково-аналітичного журналу «Нейро-нечіткі технології моделювання в економіці» Вимоги до стуктури статті 1. Індекс УДК до статті. На першій сторінці у правому верхньому кутку, прописними літерами, шрифт — жирний. 2. Назва статті. Через рядок по центру, прописними літерами, шрифт — жирний. Подається назва статті українською, російською та англійською мовами (переклад). 3. Автор статті. Через рядок по центру вказується ініціали та прізвище автора прописними літерами, шрифт — жирний. Інформація подається українською, російською та англійською мовами (транслітерація). Транслітерувати власні назви, прізвища та імена необхідно згідно постанови Кабінету Міністрів України від 27.01.2010 №55 «Про впорядкування транслітерації українського алфавіту латиницею». 4. Відомості про авторів. З наступного рядка по центру вказати без скорочень науковий ступінь, вчене звання автора. З нового рядка — посаду і місце роботи автора (повністю без скорочень і абревіатур). З нового рядка — повну робочу адресу з поштовим індексом і назвою країни. Всі відомості вказати українською, російською та англійською мовами (використовувати повний офіційний переклад назви організацій). З нового рядка — адресу електронної пошти. Якщо у статті кілька авторів, то по кожному автору наводиться повна інформація згідно пп. 3, 4 з пропущеним рядком між авторами. Більше чотирьох авторів не допускається. 5. Анотація. Через рядок. Анотація має бути структурованою, лаконічною, інформативною та містити такі аспекти: предмет, мету, метод чи методологію дослідження, результати дослідження, сферу застосування результатів, ступінь наукової новизни, висновки. Обсяг анотації — від 100 до 250 слів. Анотація має бути українською, російською та англійською мовами. 6. Ключові слова. Не менше п’яти та не більше десяти слів або словосполучень, курсивом, українською, російською та англійською мовами. 7. Код JEL класифікації до статті. У наступному рядку після ключових слів, кількість може бути від 1 до 5 кодів, в одному рядку, через кому, жирним. Наприклад: JEL Classіfіcatіon: C12, H12. 194


Вимоги до оформлення статтей

8. Текст статті. Через рядок. У стуктурі статті необхідно виділити: — вступ (у якому необхідно висвітлити: постановку проблеми та її зв’язок із важливими науковими чи практичними завданнями; аналіз останніх досліджень та публікацій з обов’язковим посиланням на використані джерела; невирішені раніше частини загальної проблеми, котрим присвячується стаття); — формулювання мети і завдань дослідження; — виклад основного матеріалу дослідження з повним обґрунтуванням отриманих наукових результатів; — висновки і перспективи подальших досліджень у даному напрямку; — два переліки використаних літературних джерел. Перший перелік використаних літературних джерел подається під заголовком «Список літератури» мовою оригіналу і має містити не менше 8 джерел. Бібліографічний опис літературних джерел оформлюється згідно з ДСТУ ГОСТ 7.1:2006 «Система стандартів з інформації, бібліотечної та видавничої справи. Бібліографічний запис. Бібліографічний опис. Загальні вимоги та правила складання». (Приклади оформлення бібліографічного опису наведено в «Бюлетені ВАК України». — 2009. — № 5. — С. 26—30.). Другий перелік використаних літературних джерел подається під заголовком «References», що містить ті самі літературні джерела, але у латинському алфавіті, оформлені за міжнародним бібліографічним стандартом APA-2010. Якщо наукова праця написана мовою, що використовує кирилицю, то її бібліографічний опис необхідно транслітерувати латинськими літерами. Транслітерувати власні назви, прізвища та імена слід згідно з постановою Кабінету Міністрів України від 27.01.2010 № 55 «Про впорядкування транслітерації українського алфавіту латиницею». Назви періодичних україно- та російськомовних видань (журналів, збірників та ін.) подаються транслітерацією, а в дужках — англійською мовою. Наприклад: Finansy Ukrainy (Finance of Ukraine). У кінці кожної позиції необхідно зазначити мову оригіналу: [in Ukrainian], [in Russian] тощо. У кінці статті має бути примітка, що стаття подана для публікації лише до журналу «Нейро-нечіткі технології моделювання в економіці».

195


Вимоги до оформлення статтей

Технічні вимоги до оформлення статті 1. Вимоги до оформлення тексту: — використовувати текстовий редактор MS Word 2003 чи вище; — текстові файли подаються у форматі MS Word з розширенням «doc»; — формат паперу — A4; — гарнітура — Times New Roman Cyr; — кегль — 14; — міжрядковий інтервал — 1,5; — нумерація сторінок — з правого нижнього краю сторінки; — усі поля сторінки по 2 см; від краю аркуша до колонтитула — 1,25 см; — абзац — 1,25 см; — не здійснювати перенос частин слів; — встановити заборону висячих рядків в абзаці; — обсяг статті 0,5 — 2 друк. арк. (12 — 48 стор.); — назви розділів у тексті статті — по центру жирним шрифтом, назви підрозділів — по центру курсивом; — нумерація сторінок, пунктів, рисунків, таблиць, формул подаються арабськими цифрами без символу «№»; — при наборі не застосовувати для форматування тексту додаткові пробіли; — не встановлювати відступ (абзац) першого рядка табуляцією або пробілами (форматування здійснювати лише через параметри абзацу); — лапки необхідно набирати однакові по всій статті; — не використовувати дефіс замість тире. 2. Вимоги до оформлення ілюстрацій: — якість ілюстрації повинна забезпечити її чітке відтворення; — рисунки та графіки у статтю вставляють або у графічному редакторі MS Word, або в одному з форматів jpeg, bmp чи tif з роздільною здатністю не менше ніж 300 dpi (подавати якісні оригінали); — всі об’єкти в рисунках, зроблених у MS Word, мають бути обов’язково згруповані. Текст статті не повинен містити рисунків і/або тексту в рамках рисунків, розташованих поверх/за текстом тощо; — рисунки підписують і нумерують (якщо їх більше ніж один); — підпис має бути під ілюстрацією і позначається скороченим словом «Рис.»; — схеми слід розміщувати після першого посилання на них по тексту; — ілюстрації не повинні виходити на поля; — оскільки друк чорно-білий, не застосовувати фон і колір у графіках, діаграмах тощо. 196


Вимоги до оформлення статтей

3. Вимоги до оформлення таблиць: — перед кожною таблицею необхідно подати слово «Таблиця» з її порядковим номером у статті з вирівнюванням по правому боку; — у наступному рядку наводиться назва таблиці курсивом з вирівнюванням посередині поля, за якою розміщується сама таблиця; — текст таблиці може бути дещо меншим від основного тексту. 4. Вимоги до оформлення формул: — формули набираються тільки допоміжною програмою MS Equation 3.0 (редактор формул в MS Word); — формули вирівнюють по центру; — формули нумерують в круглих дужках праворуч сторінки наскрізною нумерацією. 5. Посилання на використані джерела: — при посиланні в тексті на літературне джерело слід навести порядковий номер у квадратних дужках, який відповідна праця має у списку літератури; — список літератури наводять у кінці статті у порядку згадуваних джерел; — на всі наведені в списку літератури джерела мають бути посилання у тексті статті; — усі цитування у тексті або згадування про отримані іншими авторами результати мають супроводжуватись відповідним посиланням. 6. Примітки: — примітки до тексту розміщуються внизу сторінки з текстом, що потребує пояснень; — примітки до тексту робляться автоматично і нумеруються послідовно арабськими цифрами; — примітки до таблиць та рисунків, в яких наводяться довідкові і пояснювальні дані, можуть нумеруватись послідовно в межах однієї сторінки; — якщо приміток до таблиць чи рисунків на одному аркуші кілька, то після слова «Примітки» ставлять двокрапку, наприклад: Примітки: 1. … 2. … Якщо є одна примітка, то її не нумерують і після слова «Примітка» ставлять крапку. Додатково: — усі статті проходять обов’язкове рецензування; — у тексті статті можуть бути внесені редакційні виправлення під час опрацювання редактором та вичитки коректором; — автори статті несуть відповідальність за правильність і точність наведених у статті термінів, даних, фактів, цитат, статистичних матеріалів тощо, а також за наведення в статті даних, що не є предметом відкритої публікації; — в одному номері може бути опублікована тільки одна стаття автора. 197


Зміст

ЗМІСТ Гаврилюк Г. В. Аналіз вагомості критеріїв в оцінюванні кредитоспроможності фізичних осіб . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Єфанова Т. І. Оцінювання внутрішньорегіональної диференціації на засадах нейронечіткого моделювання . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Кононова Е. Ю. Оценка доверия: теоретические модели и результаты эмпирического исследования на примере социальных сетей . . . . . . . . . . . . . . . . . . . . . . 68

Лисенко Ю. Г., Мінц О. Ю. Моделювання інноваційних інтелектуальних систем прийняття рішень в економіці . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

Стрельченко І. І. Вибір оптимальної топології нейронної мережі в задачах класифікації динамічних економічних систем . . . . . . . . . . . . . . . . . . . . 142

Щербаков Є. Ю. Застосування математичних моделей для голосової ідентифікації суб’єктів у сфері фінансової безпеки . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 Нові видання за тематикою журналу . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

198


Зміст

CONTENTS Ganna Gavrilyuk Analysis of the criteria significance in assessing the creditworthiness of individuals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Tetyana Efanova Evaluation of intra-regional differentiation based on neuro-fuzzy simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Kateryna Kononova Trust evaluation: theoretical models and results of empirical research on social networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

Yuriу Lysenko, Oleksii Mints Modeling of innovative intellectual decision-making systems in the economy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

Inna Strelchenko Selection of a neural network optimum topology in problems of dynamic economic systems classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

Yehor Shcherbakov Application of mathematical models for voice identification in the field of financial security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 New editions on the journal's subject . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

199


Наукове видання

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ Науково-аналітичний журнал Заснований у 2011 р. Виходить двічі на рік

№6

Художники обкладинки Г. Мір Алленде, М. Мейдич Коректор Ю. Пригорницький Верстка О. Руденко Підписано до друку 15.09.17. Формат 6084/16. Папір офсет. № 1. Гарнітура Тип Таймс. Друк офсетний. Ум. друк. арк. 00,00. Обл.-вид. арк. 00,00. Наклад 100 пр. Зам. № 17-5376 Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» 03680, м. Київ, проспект Перемоги, 54/1 Тел./факс (044) 537-61-41; тел. (044) 537-61-44 E-mail: publish@kneu.kiev.ua

Profile for Yurii Kleban

Neuro fuzzy 6  

Neuro fuzzy 6  

Profile for kyura
Advertisement