Page 1

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ Державний вищий навчальний заклад «КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ ЕКОНОМІЧНИЙ УНІВЕРСИТЕТ імені ВАДИМА ГЕТЬМАНА»

Журнал є науковим фаховим виданням України, в якому можуть публікуватися результати дисертаційних робіт на здобуття наукових ступенів доктора і кандидата наук в галузі економіки (наказ МОН України від 26.05.2014 № 642 – оголошення в спецвипуску газети «Освіта України», червень 2014 р.).

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ Науково-аналітичний журнал Заснований у 2011 р. Виходить двічі на рік

№8

Київ 2019


УДК 519.86 Редакційна колегія

Головний редактор А. В. Матвійчук, доктор екон. наук, професор. Заступник гол. ред. Г. І. Великоіваненко, канд. фіз.-мат. наук, професор. Відповідальний секретар І. В. Мірошниченко, канд. екон. наук. Г. Д. Абуселідзе, доктор екон. наук, професор (Грузія); В. О. Бабенко, доктор екон. наук, професор; І. З. Батиршин, доктор фіз.-мат. наук, професор (Мексика); В. В. Вітлінський, доктор екон. наук, професор; Л. С. Гур’янова, доктор екон. наук, доцент; І. А. Джалладова, доктор фіз.-мат. наук, професор; К. Д. Іманов, член-кор. НАН Азербайджану, доктор екон. наук, професор (Азербайджан); А. Б. Камінський, доктор екон. наук, професор; А. Ю. Ків, доктор фіз.мат. наук, професор (Ізраїль); Т. С. Клебанова, доктор екон. наук, професор; В. М. Кобець, доктор екон. наук, доцент; К. Ф. Ковальчук, доктор екон. наук, професор; К. Ю. Кононова, доктор екон. наук, доцент; Ю. Г. Лисенко, членкор. НАН України, доктор екон. наук, професор; І. Г. Лук’яненко, доктор екон. наук, професор; Т. В. Меркулова, доктор екон. наук, професор; Л. Рутковський, член Польської академії наук, доктор наук, професор (Польща); А. Б. Салем, доктор наук, професор (Єгипет); С. О. Семеріков, доктор пед. наук, професор; В. М. Соловйов, доктор фіз.-мат. наук, професор; Т. Федерічі, доктор наук в економіці, професор (Італія); І. М. Хвостіна, канд. екон. наук, доцент; О. І. Черняк, доктор екон. наук, професор; С. Д. Штовба, доктор техн. наук, професор; О. В. Язенін, доктор фіз.-мат. наук, професор (Росія). Адреса редакційної колегії: 03680, м. Київ, просп. Перемоги, 54/1, кімн. 220 ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана» Тел./факс: 044 371 61 09 E-mail: editor@nfmte.com Веб-сайт журналу: http://nfmte.com/ Засновник та видавець Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана»

Свідоцтво про державну реєстрацію КВ № 18370-7170Р, видане Державною реєстраційною службою України 27.10.2011 Рекомендовано до друку Вченою радою КНЕУ Протокол № 1 від 29.08.2019 Загальна та наукова редакція А. Матвійчука

Журнал індексується в міжнародних реферативних базах даних: Index Copernicus, CiteFactor, Ulrichsweb, Global Serials Directory, EBSCO, OAJI, ResearchBible, Google Scholar. ISSN 2306-3289

© КНЕУ, 2019


УДК 330.4, 519.866, 519.246.8 DOI 10.33111/nfmte.2019.003

VISIBILITY GRAPHS AND PRECURSORS OF STOCK CRASHES

Vladimir Soloviev DSc (Physics and Mathematical Sciences), Professor, Head of the Department of Computer Science and Applied Mathematics Kryvyi Rih State Pedagogical University 54 Gagarina Ave., Kryvyi Rih, 50086, Ukraine vnsoloviev2016@gmail.com

Viktoria Solovieva PhD(Economic Sciences), Docent, Associate Professor of the Department of Management and Public Administration Kryvyi Rih Economic Institute of Kyiv National Economic University named after Vadim Hetman 16 Medical Str., Kryvyi Rih, 50090, Ukraine vikasolovieva2027@gmail.com

Anna Tuliakova Master’s Degree in Mathematics, Chief Scientific Officer CONSORIS CONSULTING LLC 28 Predslavynska Str., Kyiv, 03680, Ukraine tuliakovaanna@gmail.com Based on the network paradigm of complexity, a systematic analysis of the dynamics of the largest stock markets in the world has been carried out in the work. According to the algorithm of the visibility graph, the daily values of stock indices are converted into a network, the spectral and topological properties of which are sensitive to the critical and crisis phenomena of the studied complex systems. It is shown that some of the spectral and topological characteristics can serve as measures of the complexity of the stock market, and their specific behaviour in the pre-crisis period is used as indicators-precursors of crisis phenomena. The influence of globalization processes on the world stock market is taken into account by calculating the interconnection (multiplex) measures of complexity, which modifies in some way, but does not change the fundamentally predictive possibilities of the proposed indicators-precursors. Keywords: stock markets, graph theory, complex networks, visibility graph, spectral and topological analyzes, complexity measures, multiplex systems, financial system crashes. © В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова, 2019

3


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

ГРАФИ ВИДИМОСТІ І ПЕРЕДВІСНИКИ ФОНДОВИХ КРАХІВ

В. М. Соловйов Доктор фізико-математичних наук, професор, завідувач кафедри інформатики та прикладної математики Криворізький державний педагогічний університет просп. Гагаріна, 54, м. Кривий Ріг, 50086, Україна vnsoloviev2016@gmail.com

В. В. Соловйова Кандидат економічних наук, доцент, доцент кафедри менеджменту і публічного адміністрування Криворізький економічний інститут ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана» вул. Медична, 16, м. Кривий Ріг, 50090, Україна vikasolovieva2027@gmail.com

А. Ш. Тулякова Магістр математики, Директор з наукової роботи ТОВ «КОНСОРИС КОНСАЛТИНГ» вул. Предславинська, 28, м. Київ, 03680, Україна tuliakovaanna@gmail.com Виходячи з мережної парадигми складності, у роботі проведено системний аналіз динаміки найбільших фондових ринків світу. За алгоритмом графа видимості щоденні значення фондових індексів перетворено у мережу, спектральні і топологічні властивості якої чутливі до критичних і кризових явищ досліджуваних складних систем. Показано, що деякі із спектральних і топологічних характеристик можуть слугувати мірами складності фондового ринку, а їх специфічна поведінка у передкризовий період використовуватись у якості індикаторів-передвісників кризових явищ. Вплив процесів глобалізації на світовий фондовий ринок враховано шляхом розрахунку міжмережніх (мультиплексних) мір складності, які певним чином модифікують, але не змінюють принципово прогнозних можливостей запропонованих індикаторів-передвісників. Ключові слова: фондові ринки, теорія графів, складні мережі, граф видимості, спектральний і топологічний аналізи, міри складності, мультиплексні системи, крахи фінансових систем.

4


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

ГРАФЫ ВИДИМОСТИ И ПРЕДВЕСТНИКИ ФОНДОВЫХ КРАХОВ

В. Н. Соловьев Доктор физико-математических наук, профессор, заведующий кафедры информатики и прикладной математики Криворожский государственный педагогический университет просп. Гагарина, 54, г. Кривой Рог, 50086, Украина vnsoloviev2016@gmail.com

В. В. Соловьева Кандидат экономических наук, доцент, доцент кафедры менеджмента и публичного администрирования Криворожский экономический институт ГВУЗ «Киевский национальный экономический университет имени Вадима Гетьмана» ул. Медицинская, 16, г. Кривой Рог, 50090, Украина vikasolovieva2027@gmail.com

А. Ш. Тулякова Магистр математики, Директор по научной работе ООО «КОНСОРИС КОНСАЛТИНГ» ул. Предславинская, 28, г. Киев, 03680, Украина tuliakovaanna@gmail.com В работе проведен системный анализ динамики крупнейших фондовых рынков мира, базируясь на сетевой парадигме сложности. Согласно алгоритму графа видимости ежедневные значения фондовых индексов преобразованы в сеть, спектральные и топологические свойства которой чувствительны к критическим и кризисным явлениям исследуемых сложных систем. Показано, что некоторые из спектральных и топологических характеристик могут служить мерами сложности фондового рынка, а их специфическое поведение в предкризисный период использоваться в качестве индикаторов-предвестников кризисных явлений. Влияние процессов глобализации на мировой фондовый рынок учтено путем расчета межсетевых (мультиплексных) мер сложности, которые определенным образом модифицируют, но не меняют принципиально прогнозных возможностей предложенных индикаторов-предвестников. Ключевые слова: фондовые рынки, теория графов, сложные сети, граф видимости, спектральный и топологический анализы, меры сложности, мультиплексные системы, крахи финансовых систем. JEL Classification: F37, C69

5


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Introduction Data from both fundamental and technical analysis indicate that there are enough reasons for the recession now. Among the main ones are the threat of further collapse in the financial markets, the trade war with China, and the consequences of a long shutdown. Analysts also note the weakening of the positive impact of fiscal incentives. Participants in the debt market also bet on a rapid recession. The US yield curve took the form of a short-term inversion, signaling the likelihood of a downturn in the near future. This indicator is the most accurate and almost did not give false predictions in the history. Also, the danger isthat China and Saudi Arabia, the largest owners of American public debt, facing economic and budgetary problems, will simply be forced to sell US government bonds. It will almost inevitably trigger a massive escape of investors from the US public debt. As for the stock market, after the 2008 crisis, the US market (its largest segment) recovered to its mid-2000 levels, when the Dow Jones index approached around 10500 points in October 2010. Since then, by January 2018, Dow Jones has reached its maximum level about 26600, having rolled over 8 years approximately in 2,5 times. The current virtually continuous growth — one of the longest in the history of the US stock market. For comparison: for the period from the beginning of 1928 to September 1929, the Dow Jones index rose from the level of 190 to 382, which is almost double. At the same time, the rally before the crisis in 2008 was much more modest: an increase from the level of 10000 (September 2005) to the maximum July 2007 about 13000 was only 1.3 times. The technical analysis shows a significant probability of continuing the fall of the stock market and the development of a crisis situation. According to a recent report by experts from the World Economic Forum on Global Risk Factors in 2019, the main ones are the economic confrontation between the largest countries and the achievement of the pivotal pace of global economic growth [1]. One of the most prestigious anti-crisis management experts Nouriel Roubini predicts the global financial crisis in 2020 [2]. In his view, there are at least ten reasons for this, the main of which, in addition to the above, is the excessive level of credit in 6


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

many developing countries and in some developed countries; excessive use of high frequency/algorithmic stock trading will increase the likelihood of a very sharp collapse of the markets (flash crash). Therefore, in the face of a possible recession, it is important to timely carry out a forward-looking analysis of financial markets, to identify and test indicators of likely crises with a view to their early prevention. The doctrine of the unity of the scientific method states that for the study of events in socio-economic systems, the same methods and criteria are applicable as in the study of natural phenomena. Significant success was achieved within the framework of interdisciplinary approaches and the theory of self-organization — synergetics, which according to the classification of G. Malinetsky [3] is on the verge of a new paradigm. The modern paradigm of synergetics is a complexity paradigm. In the paradigm of complexity it is possible to investigate, based on the methods of mathematical modeling, data of natural sciences and interdisciplinary approaches, and set very deep questions [4]. In the framework of the complexity paradigm it became apparent that we should move from well-studied systems and processes, taking into account the minimal number of new entities that are characteristic of the social sciences or the humanities. Apparently, one of these entities is the bonds, that is, what characterizes the interaction of the elements that are part of the system, that makes parts of the whole. The set of these links is called network. The new interdisciplinary study of complex systems, known as the complex networks theory, laid the foundation for a new network paradigm of synergetics [3]. He studies the characteristics of networks, taking into account not only their topology, but also statistical properties, the distribution of weights of individual nodes and edges, the effects of information dissemination, robustness, etc. [5–8]. Complex networks include electrical, transport, information, social, economic, biological, neural and other networks [9–11]. The network paradigm has become dominant in the study of complex systems since it allows you to enter new quantitative measures of complexity not existing for the time series [12]. Moreover, the network paradigm provides adequate support for the core concepts of Industry 4.0 [13].

7


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Statement of the research task Previously, we introduced various quantitative measures of complexity for individual time series [14, 15]. Significant advantage of the introduced measures is their dynamism, that is, the ability to monitor the time of change in the chosen measure and compare with the corresponding dynamics of the output time series. This allowed us to compare the critical changes in the dynamics of the system, which is described by the time series, with the characteristic changes of concrete measures of complexity. It turned out that quantitative measures of complexity respond to critical changes in the dynamics of a complex system, which allows them to be used in the diagnostic process and prediction of future changes. In [15], we introduced network complexity measures and adapted them to study system dynamics. But networks are rarely isolated. Therefore, it is necessary to take into account the interconnection interaction, which can be realized within the framework of different models [16]. We will consider it by simulating so-called multiplex networks, the features of which are reduced to a fixed number of nodes in each layer, but they are linked by different bonds [16].

Methods of converting time series into graphs Most complex systems inform their structural and dynamic nature by generating a sequence of certain characteristics known as time series. In recent years, interesting algorithms for the transformation of time series into a network have been developed, which allows to extend the range of known characteristics of time series even to network ones. Recently, several approaches have been proposed to transform time sequences into complex networklike mappings. These methods can be conventionally divided into three classes [17]. The first is based on the study of the convexity of successive values of the time series and is called visibility graph (VG) [17, 19]. The second analyzes the mutual approximation of different segments of the time sequence and uses the technique of recurrent analysis [17]. The recurrent diagram reflects the existing repetition of phase trajectories in the form of a binary matrix whose elements are 8


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

units or zeros, depending on whether they are close (recurrent) with given accuracy or not, the selected points of the phase space of the dynamic system. The recurrence diagram is easily transformed into an adjacency matrix, on which the spectral and topological characteristics of the graph are calculated [15, 18]. Finally, if the basis of forming the links of the elements of the graph is to put correlation relations between them, we obtain a correlation graph [15, 17]. To construct and analyze the properties of a correlation graph, we must form a adjacency matrix from the correlation matrix. To do this, you need to enter a value which, for the correlation field, will serve as the distance between the correlated agents. Such a distance may be dependent on the ratio of the correlation Cij value x(i, j ) = 2 1 − Cij . So, if the correlation coefficient between the two assets is significant, the distance between them is small, and, starting from a certain critical value xcr, assets can be considered bound on the graph. For an adjacency matrix, this means that they are adjacent to the graph. Otherwise, the assets are not contiguous. In this case, the binding condition of the graph is a prerequisite. The main purpose of such methods is to accurately reproduce the information stored in the time series in an alternative mathematical structure, so that powerful graph theory tools could eventually be used to characterize the time series from a different point of view in order to overcome the gap between nonlinear analysis of time series, dynamic systems and the graphs theory. The use of the complexity of recurrent networks to prevent critical and crisis phenomena in stock markets has been considered by us in a recent paper [18]. Therefore, in this paper we will focus on algorithms of the VG and multiplex VG (MVG). The algorithm of the VG is realized as follows [19]. Take a time series Y (t ) = [ y1 , y2, ,..., yn ] of length п. Each point in the time series data can be considered as a vertex in an associative network, and the edge connects two vertices if two corresponding data points can «see» each other from the corresponding point of the time series (Fig. 1). Formally, two values ya of the series (at a point in time t a ) and y b (at a point in time t b ) are connected, if for any other value ( yc , tc ), which is placed between them (that is, t a  tc  tb ), the condition is satisfied:

(

9

)


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

yc  ya + ( yb − ya )

2019, № 8

tc − t a . tb − ta

(1)

Note that the visibility graph is always connected by definition and also is invariant under affine transformations, due to the mapping method. An alternative (and much simpler) algorithm is the horizontal visibility graph (HVG) [20], in which a connection can be established between two data points a and b, if one can draw a horizontal line in the time series joining them that does not intersect any intermediate dataheight yc by the following geometrical criterion: ya , yb  yc for all c such that ta  tc  tb ).

Fig. 1. Illustration of constructing the visibility graph (red lines) and the horizontal visibility graph (green lines)

In multiplex networks, there are two tasks: (1) turn separate time series on the network for each layer; (2) connect the intra-loop networks to each other. The first problem is solved within the framework of the standard algorithms described above. For interlayer interactions we use modified algorithm of VG. In this case, the normalized individual points of the time series are mutually visible, if (as in the case of a single row) the above conditions are fulfilled. For multiplex networks, the algorithm of the MVG for the three layers is presented in Fig. 2. 10


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

Fig. 2. Scheme for forming bonds between three layers of the multiplex network [28]

For constructed graph methods described above, one can calculate spectral and topological properties.

Spectral and topological graph properties Spectral theory of graphs is based on algebraic invariants of a graph — its spectra. The spectrum of graph G is the set of eigenvalues of a matrix Sp(G) corresponding to a given graph. For a adjacency matrix А of a graph, there exists an characteristic polynomial I − A , which is called the characteristic polynomial of a graph PG ( ) . The eigenvalues of the matrix А (the zeros of the polynomial I − A ) and the spectrum of the matrix А (the set of eigenvalues) are called respectively their eigenvalues and the spectrum of graph G. The eigenvalues of the matrix А satisfy the equality Ax = x ( x – non-zero vector). Vectors x satisfying this equality are called eigenvectors of matrix А (or graph G) corresponding to their eigenvalues. Another common type of graph spectrum is the spectrum of the Laplace matrix L. 11


Đ?ЕЙРО-Đ?ЕЧІТКІ ТЕмĐ?ОЛОГІЇ ĐœĐžĐ”Đ•Đ›ĐŽĐ’Đ?Đ?Đ?ĐŻ Đ’ ЕКОĐ?ĐžĐœĐ†ĐŚĐ†

2019, â„– 8

The Laplace matrix is used to calculate the tree graphs, as well as to obtain some important spectral characteristics of the graph. Laplace matrix, L = D – A where D — diagonal matrix of order n: ďƒŹd , i = j , dij = ďƒ­ i ďƒŽ0, i ď‚š j ,

(2)

where di — the degree of the corresponding vertex of the graph. The spectrum đ?‘†đ?‘?đ??ż (đ??ş) of the matrix L is the root of the characteristic equation ď Ź I − L = ď Ź I − D + A = 0.

(3)

Comparing the spectra đ?‘†đ?‘? , đ?‘†đ?‘?đ??ż it is easy to establish that: S p ( G ) = ď › ď Ź1 , ď Ź2 ,..., ď Źn ď ? , S pL ( G ) = ď › r − ď Źn , r − ď Źn −1 ,..., r − ď Ź1 ď ? ,

where ď Ź1 = r . The number zero is the eigenvalue of the matrix L, which corresponds to an eigenvector whose coordinates are equal to unity. The multiplicity of the null eigenvalue is equal to the number of connected components of the graph. The rest of eigenvalues L are positive. The least of the positive eigenvalues ď Ź2 is called the index of algebraic connectivity of the graph. This value represents the ÂŤforceÂť of the connectivity of the graph component and is used in the analysis of reliability and synchronization of the graph. Important derivative characteristics are spectral gap, graph energy, spectral moments and spectral radius. The spectral gap is the difference between the largest and the next eigenvalues of the adjacency matrix and characterizes the rate of return of the system to the equilibrium state. The graph energy is the sum of the modules of the eigenvalues of the graph adjacency matrix: n

E (G ) = ďƒĽ ď Źi .

(4)

i =1

The spectral radius is the largest modulus of the eigenvalue of the adjacency matrix. Denote by Nc the value which corresponds to an ÂŤaverage eigenvalueÂť of the graph adjacency matrix: 12


Графи Đ˛Đ¸Đ´Đ¸ĐźĐžŃ Ń‚Ń– Ń– ĐżĐľŃ€ĐľĐ´Đ˛Ń–Ń Đ˝Đ¸ĐşĐ¸â€Ś

Đ’. Đœ. ХОНОвКОв, Đ’. Đ’. ХОНОвКОва, Đ?. Ш. Đ˘ŃƒĐťŃ?кОва 1

đ?‘ đ?‘? = đ?‘™đ?‘› ( ∑đ?‘›đ?‘–=1 đ?‘’đ?‘Ľđ?‘?(đ?œ†đ?‘– )) đ?‘›

(5)

and is called natural connectivity. The k-th spectral moment of the adjacency matrix is determined by the expression: mk ( A) =

1 n k ďƒĽ ď Źi , n i =1

(6)

where ď Źi is the eigenvalues of the adjacency matrix, n is the number of vertices (nodes) of the graph G. Among the topological measures one of the most important is the node degree k — the number of links attached to this node. For nondirected networks, the node’s degree ki is determined by the sum ki = ďƒĽ aij , where the elements aij of the adjacency matrix. j

To characterize the ÂŤlinear sizeÂť of the network, useful concepts of mean ⌊đ?‘™âŒŞ and maximum lmax shortest paths. For a connected network of n nodes, the average path length is equal to ⌊đ?‘™âŒŞ =

2 đ?‘›(đ?‘›âˆ’1)

∑đ?‘–>đ?‘— đ?‘™đ?‘–đ?‘— ,

(7)

where lij — the length of the shortest path between the nodes. The diameter of the connected graph is the maximum possible distance between its two vertices, while the minimum possible is the radius of the graph. If the average length of the shortest path gives an idea of the whole network and is a global characteristic, the next parameter — the clustering coefficient — is a local value and characterizes a separate node. For a given node m, the clustering coefficient Cm is defined as the ratio of the existing number of links between its closest neighbors Em to the maximum possible number of such relationships: Cm =

2 Em . km (km − 1)

(8)

In (8) km (km − 1) / 2 is the maximum number of links between the closest neighbors. The clustering coefficient of the entire network is defined as the average value Cm of all its nodes. The clustering

13


Đ?ЕЙРО-Đ?ЕЧІТКІ ТЕмĐ?ОЛОГІЇ ĐœĐžĐ”Đ•Đ›ĐŽĐ’Đ?Đ?Đ?ĐŻ Đ’ ЕКОĐ?ĐžĐœĐ†ĐŚĐ†

2019, â„– 8

coefficient shows how many of the nearest neighbors of the given node are also the closest neighbors to each other. He characterizes the tendency to form groups of interconnected nodes — clusters. For reallife networks, the high values of the clustering coefficient are high. Another feature of the node is the betweenness. It reflects the role of the node in establishing network connections and shows how many shortest paths pass through this node. Node betweenness Ďƒm is defined as ď łm = ďƒĽ iď‚š j

B(i, m, j ) , B(i, j )

(9)

where B (i, j ) — the total number of shortest paths between nodes i and j, B (i, m, j ) — the number of shortest paths between i,j those passing through the node m. The value (9) is also called the load or betweenness centrality. One of the main characteristics of the network is the distribution of nodes P(k), which is defined as the probability that the node i has a degree ki = k. For most natural and actual artificial networks there is a power distribution đ?‘ƒ(đ?‘˜)~ 1â „đ?‘˜ đ?›ž , đ?‘˜ ≠0, đ?›ž > 0.

(10)

Also important topological characteristics are the vertex eccentricity — the largest distance between m and any other vertex, that is, how far the vertex is from the other vertices of the graph. The centrality of the vertex measures its relative importance in the graph. At the same time, the farness of a node is defined as the sum of its distances to all other nodes, and its closeness is defined asthe reciprocal of the farness. Another important measure is the link density in the graph, which is defined as the existing number of links ne, divided by the expression (n – 1)/2, where n is the number of nodes of the graph. A multilayer/multiplex network is a pair (G, C) where G = {Gď Ą ; ď Ą ďƒŽ {1,..., M }} there is a family of graphs (whether directed or not, weighed or not) Gď Ą = ( X ď Ą , Eď Ą ) , called layers; and C = {Eď Ąď ˘ ďƒ? X ď Ą ď‚´ X ď ˘ ; ď Ą , ď ˘ ďƒŽ {1,...,M}, ď Ą ď‚š ď ˘ } .

14

(11)


Графи Đ˛Đ¸Đ´Đ¸ĐźĐžŃ Ń‚Ń– Ń– ĐżĐľŃ€ĐľĐ´Đ˛Ń–Ń Đ˝Đ¸ĐşĐ¸â€Ś

Đ’. Đœ. ХОНОвКОв, Đ’. Đ’. ХОНОвКОва, Đ?. Ш. Đ˘ŃƒĐťŃ?кОва

The latter is a set of links between nodes of different layers Ga and Gď ˘ at ď Ą ď‚š ď ˘ . Each element Ea is intralayer bonds M in contrast to the elements of each Eď Ąď ˘ (ď Ą ď‚š ď ˘ ) , called interlayer bonds. A set of nodes of a layer Ga is denoted X ď Ą = {x1ď Ą ,..., xď ĄNď Ą } , and a đ?›ź adjacency matrix as đ??´[đ?›ź] = (đ?‘Žđ?‘–đ?‘— ) ∊ đ??ľđ?‘ đ?›ź Ă—đ?‘ đ?›ź , where 1, (đ?‘Ľđ?‘–đ?›ź , đ?‘Ľđ?‘—đ?›ź ) ∈ đ??¸đ?›ź , đ?›ź đ?‘Žđ?‘–đ?‘— ={ 0

(12)

for 1 ď‚Ł i, j ď‚Ł Nď Ą and 1 ď‚Ł ď Ą ď‚Ł M . For an interlayer adjacency matrix đ?›źđ?›˝ we have đ??´[đ?›ź,đ?›˝] = (đ?‘Žđ?‘–đ?‘— ) ∊ đ??ľđ?‘ đ?›źĂ—đ?‘ đ?›˝ , where đ?›˝

đ?›ź đ?›źđ?›˝ đ?‘Žđ?‘–đ?‘— = {1, (đ?‘Ľđ?‘– , đ?‘Ľđ?‘— ) ∈ đ??¸đ?›źđ?›˝ , 0

(13)

for 1 ≤ đ?‘– ≤ đ?‘ đ?›ź , 1 ≤ đ?‘— ≤ đ?‘ đ?›˝ and 1 ≤ đ?›ź, đ?›˝ ≤ đ?‘€, đ?›ź ≠đ?›˝. A multiplex network is a partial case of interlayer networks and contains a fixed number of nodes connected by different types of links. Multiplex networks are characterized by correlations of different nature [16], which enable the introduction of additional multiplexes. Let’s evaluate the quantitative overlap between the various layers. The average edge overlap equal [28]

ď ˇ=

ďƒĽ ďƒĽ ďƒĽď Ą a ď Ą M ďƒĽ ďƒĽ (1 − ď ¤ ďƒĽ i

i

[ ] ij

j i

j i

0,

aij[ď Ą ]

)

,

(14)

and determines the number of layers in which this bond is present. Its value lies on the interval [1/ M , 1] and equals 1/M if the connection (i, j ) exists only in one layer, that is, if there is a layer a such that aij[ď Ą ] = 1, aij[ ď ˘ ] =0  ď ˘ ď‚š ď Ą . If all layers are identical, then ω = 1. Consequently, this measure can serve as a measure of the coherence of the output time series: high values ω indicate a noticeable correlation in the structure of time series. The total overlap Oιβ between the two layers Îą and β is defined as the total number of bonds that are shared between the layers Îą and β: 15


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

O =  aij aij ,

(15)

where    . For a multiplex network, the vertex degree k become a vector ki = (ki[1] ,..., ki[ M ] ) ,

(16)

where ki[ ] is the degree of the node in the layer, that is, while the elements of the matrix of adjacency for the layer. Specificity of the vector character of the degree of the peak in multiplex networks allows for the introduction of additional interlayer characteristics. One of these is the overlap of the node’s degree M

oi =  ki[ ] .

(17)

 =1

The next measure quantitatively describes the interlayer correlations between the degrees of the selected node in two different layers. If, chosen from M the layers of the pair ( ,  ) characterized by the distribution of degrees P (k [ ] ), P (k [  ] ) , the so-called interlayer mutual information is determined by the formula: I ,  =  P(k [ ] , k [  ] ) log

P(k [ ] , k [  ] ) , P(k [ ] ) P(k [  ] )

(18)

where P(k [ ] , k [  ] ) is the probability of finding a node degree k [ ] in a layer  and degree k [  ] in a layer β. The higher the Ia,β value, the more correlated are the distributions of the levels of the two layers, and, consequently, the structure of the time series associated with them. We also find the mean value Ia,β for all possible pairs of layers — the scalar value <Ia,β> that quantifies the information flow in the system. The quantity that quantitatively describes the distribution of the node degree i between different layers is the entropy of the multiplexed degree: ki  ki  ln . oi  =1 oi M

Si = −

16

(19)


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

Entropy is zero if all nodes are in the same layer and vice versa, has the maximum value when they are evenly distributed between different layers. That is, the higher the value Si, the even more links evenly the nodes’ connections are distributed between the layers. A similar magnitude is the multiplex participation coefficient: 2 M  M  ki[ ]   1 −   Pi =  . M − 1   =1  oi    

(20)

Pi takes values on the interval [0,1] and determines that homogeneous links of node i are distributed among M the layers. If all links of the node i lie in one layer, Pi = 0 and Pi = 1 if the node has a precisely defined number of links in each of the M layers. Consequently, the larger the coefficient Pi is, the more evenly distributed the participation of the node in the multiplex. Obviously, the magnitudes Si and Pi are very similar. We will show that some of these spectral and topological measures serve as measures of complexity of the system, and the dynamics of their changes allows us to build predictors of crisis situations on financial markets.

Analysis of previous publications Recently, the first papers using the spectral and topological characteristics of dynamic systems presented as networks have appeared. Thus, in [21] it has been investigated universal and nonuniversal allometric scaling behaviors in the visibility graphs of 30 world stock market indices. It has been established that the nature of such behavior is due by the fat-tailedness of the return distribution, the nonlinear long-term correlation, and a coupling effect between these two influential factors. The author [22] compared the mean degree value and clustering coefficient for a group of companies included in the DAX 30 index basket. He observed the companies from the DAX 30 index for two time periods: the first from the beginning of 2008 through the end of 2009 and the second from the beginning of 2010 up to the end of 2011 as these include the dates — a period of crisis (7th October 2008 — 31st December 2008) and a period of recovery (7th May 2010 — 17


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

3rd August 2010). Contrary to expectations, the results differed little from the relatively low accuracy of the HVG procedure compared to VG. In the work [23], the data of 2571 stock companies in 2012 and the data of 2578 stock companies in 2013 are collected from Chinese stock market. Every year, data of these stock companies are randomly arranged. These data are then converted into some complex networks based on the visibility graph method. For these complex networks, degree distribution and clustering coefficient are considered. These results show that the complex networks have the power-law distribution and small-world properties. The authors of the article [24] construct an indicator to measure the magnitude of the super-exponential growth of stock prices, by measuring the degree of the price network, generated from the price time series. Twelve major international stock indices have been investigated. The work results show that this new indicator has strong predictive power for financial extremes, both peaks and troughs. By varying the models parameters, authors show the predictive power is very robust. The new indicator has a better performance than the indicator based on a well-known model of log-periodic oscillations of D. Sornette [25]. Authors of another work [26] analyze high frequency data from S&P 500 via the HVG method, and find that all major crises that have taken place worldwide for the last twenty years, affected significantly the behavior of the price-index. Nevertheless, they observe that each of those crises impacted the index in a different way and magnitude. These results suggest that the predictability of the price-index series increases during the periods of crises. In the work [27] the researchers study the visibility graphs built from the time series of several stock market indices. They propose a validation procedure for each link of these graphs against a null hypothesis derived from ARCH-type modelling of such series. Building on this framework, made it possible to devise a market indicator that turns out to be highly correlated and even predictive of financial instability periods. Multiplex networks are actively used to simulate complex networks of different nature: from financial (stock market [26–29], banks [30], guarantee market [31]) to social [32]. Particular attention should be paid to the work [29], in which the above multiplex measures are analyzed for the subject of correlations with known stock markets crises. 18


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

Yet there is no systematic analysis of network and multiplex measures and the construction of indicators-predictors of the crisis phenomena in the stock market.

Experimental results and their discussion The time series of daily values of stock market indexes for the period from 01/01/1983 to 10/01/2019 were selected as databases, which contained significant changes in the indexes, and were identified as crisis phenomena [33]. Among the set of stock indexes are the following: SP (S&P 500) — USA; FCHI (CAC 40) — France; DAX (DAX PERFORMANCE-INDEX) — Germany; N225 (Nikkei 225) — Japan; HSI (HANG SENG INDEX) — China; BSESN (S&P BSE SENSEX) — India; KS11 (KOSPI Composite Index) — South Korea; GSPTSE (S&P / TSX Composite index) — Canada; BVSP (IBOVESPA) — Brazil. Since historical intervals in storing stock indexes are different, we have formed two databases. One of them includes only three indices, but since 1983. The next is already 9 daily index values, but for a shorter period of time — since 2004 (Fig. 3).

b)

a)

Fig. 3. Dynamics of daily values of stock indexes (a) of the USA, Canada and Japan during 1983–2019 and (b) the aggregate of all the considered indices for the period 2004–2019 19


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

The first short database allows you to analyze the seven most wellknown crises (shown in Fig. 3.a), while the second one is only 4 (Fig. 3.b). Calculations of spectral and topological measures by methods of VG, HVG were carried out in the following way. The time window was chosen, for example, a year or two (approximately 250 or 500 trading days), for which the corresponding graphs were constructed and their spectral, topological and multiplex properties were calculated. Next, the window was shifted step by step, for example, one week (5 trading days) and the procedure repeated until the time series were exhausted. The results of calculations for revived time series of graphs are shown in Figs. 4–6. Knowing the time of the onset of the crisis and comparing the time series with the dynamics of a certain indicator, it is possible to investigate its dependence on certain or other characteristic changes in the stock market: pre-crisis, crisis and post-crisis periods.

a)

b)

c)

d)

Fig. 4. Dynamics of the S&P 500 index and the spectral (a), (b), topological (c) and spectral with the topological (d) measure of the network constructed by the visibility graph algorithm 20


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

From the spectral measures, we consider it important to predict the algebraic connectivity ( 2 — Fig. 4.a), the maximal eigenvalues of the adjacency matrix (spectral radius) and the maximal node degree (λmax and Dmax — Fig. 4.b). From the topological measures, the average path length (APLen — Fig. 4.c) is found, which is in accordance with formula (7). Fig. 4.d demonstrates the universality of the spectral behavior (the graph natural connectivity Nc and the second spectral moment of the adjacency matrix M2) and the topological (mean node degree Da and link density Ld). Figure 4 shows that all of the above spectral measures have maximum values in pre-crisis periods. The complex system has the greatest complexity. With the approach of the crisis, the complexity of the system decreases, recovering from the crisis. Some of the topological, in particular, APLen, the diameter of the graph, etc., show an opposite relationship. Indeed, in more complex systems you can always find shorter paths that connect any nodes. During the crisis (reducing complexity, increasing the chaotic component), the length of the corresponding path increases. Parameters such as the width of the window w and the step of its displacement along the time series are important. When w is small, the degree of complexity fluctuates noticeably, reacting not only to crises, but also to more or less noticeable fluctuations of the index. On the contrary, with too much window width there is a noticeable smoothing of the appropriate measure and if two crises are at a distance that is smaller than w , the indicators of both crises are averaged and less informative. If you choose an oversized parameter Δt, you might miss the actual crisis that distorts the indicator. As far as multiplex measures are concerned, they are very similar in their dynamics to the spectral and topological representations above (see Fig. 5). In the case of a shorter sample of a base of three layers (Figs. 5.a, 5.b), we have the antisymmetric behavior of the multiplex measures O, o, I (formulas (15), (17), (18)) and S , P (formulas (19), (20)). A similar, albeit more noisy picture is observed in the case of a shorter observation time, but with 9 layers of base (Figs. 5.c, 5.d). 21


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

a)

b)

c)

d)

Fig. 5. Dynamics of S&P 500 index and multiplex measures for a base of three (a), (b) and nine layers (c), (d). The graph was built using the multiplex visibility graph

Figures 5 show that both multiplex measures are excellent indicators that warn in advance about the approaching crisis phenomenon, that is, are indicator-predictor. The MVG algorithm does not fundamentally change the picture, but predictive indicators are not as clear as in the case of VG. Fig. 6.a shows this conclusion on the example of the spectral radius, and Figs. 6.c, 6.d — multiplex measures. Fig. 6.b shows the immutability of the dynamics of the spectral measure (on an example of algebraic connectivity) with a decrease in the width of a moving window from 500 to 250 days.

22


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

b)

a)

d)

c)

Fig. 6. Dynamics of the S&P 500 index and the spectral and multiplex complexity measures, calculated on the basis of algorithms VG, MVG, MHVG

Conclusions Thus, we have demonstrated the possibility of studying complex socio-economic systems as part of a network paradigm of complexity. A time series can be represented in an equivalent way — a network, or a multiplex network, which has a wide range of characteristics; both spectral and topological, and multiplexed. Examples of known financial crises have shown that most of the network measures can serve as indicators-precursors of crisis phenomena and can be used for possible early prevention of unwanted crises in the financial markets. They are an extension of the already proposed by us and «working» indicators, which use other measures of complexity [34].

23


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

It should be noted that the proposed indicators-precursors do not solve the more general problem of forecasting future values or trends of the stock market. In this way, it is possible to use new approaches (see, for example, [35, 36]) or alternative methods based on algorithms of (deep) machine learning [37].

Список літератури 1. The Global Risks Report 2019. World Economic Forum. 2019. URL: http://www3.weforum.org/docs/WEF_Global_Risks_Report_2019.pdf. 2. Roubini N., Rosa B. The Makings of a 2020 Recession and Financial Crisis. 2018. URL: https://www.project-syndicate.org/commentary/financialcrisis-in-2020-worse-than-2008-by-nouriel-roubini-and-brunello-rosa-201809?barrier=accesspaylog. 3. Малинецкий Г. Г. Теория самоорганизации. На пороге IV парадигмы. Компьютерные исследования и моделирование. 2013. Т. 5, № 3. С. 315–366. 4. Prigogine I. From Being to Becoming Time and Complexity in the Physical Sciences. New York: W. H. Freeman & Company, 1980. 272 p. 5. Barrat A., Barthelemy M., Vespignani A. Dynamical processes on complex networks. Boston: Cambridge University Press, 2008. 347 p. 6. Cohen R., Havlin S. Complex networks. Structure, robustness and function. New York: Cambridge University Press, 2010. 248 p. 7. Albert R., Barabasi A.-L. Statistical Mechanics of Complex Networks. Reviews of Modern Physics. 2002. Vol. 74. P. 47–97. 8. Newman M., Watts D., Barabási A.-L. The Structure and Dynamics of Networks. Princeton: Princeton University Press, 2006. 456 p. 9. Newman M. E. J. The structure and function of complex networks. SIAM Reviews. 2003. Vol. 45, No. 2. P. 167–256. 10. Boccaletti S., Latora V., Moreno Y., Chavez M., Hwang D.-U. Complex networks: Structure and dynamics. Physics Reports. 2006. Vol. 424, Is. 4–5. P. 175–308. 11. Bianconi G. Interdisciplinary and physics challenges in network theory. Europhysics Letters. 2015. Vol. 111, № 5. P. 1–7. 12. Danilchuk G., Soloviev V. Dynamics of graph spectral entropy in financial crisis. Socio-economic aspects of economics and management. 2015. Vol. 2. P. 227–234. 13. Марш П. Новая промышленная революция. Потребители, глобализация и конец массового производства / Пер. с англ. А. Шоломицкой. — М.: Изд-во Института Гайдара, 2015. 420 с. 14. Соловйов В. М., Соловйова К. В. Кількісні методи оцінки складності в прогнозуванні соціально-економічних систем. Прогнозування 24


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

соціально-економічних процесів: сучасні підходи та перспективи: монографія / За ред. О. І. Черняка, П. В. Захарченка. Бердянськ: Видавець Ткачук О. В., 2012. 542 с. 15. Соловйов В. М. Мережні міри складності соціальноекономічних систем. Вісник Черкаського університету. Серія «Прикладна математика. Інформатика». 2015. № 38 (371). С. 67–79. 16. Boccaletti S., Bianconi G., Criado R., delGenio C. I., GómezGardeñes J., Romance M., Sendiña-Nadal I., Wang Z., Zanin M. The structure and dynamics of multilayer networks. Physics Reports. 2014. Vol. 544, No. 1. P. 1–122. 17. Donner R. V., Small M., Donges J. F., Marwan N., Zou Y., Xiang R., Kurths J. Recurrence-based time series analysis by means of complex network methods. International Journal of Bifurcation and Chaos. 2011. Vol. 21, No. 4. P. 1019–1046. 18. Соловйов В. М., Тулякова А. Ш. Графодинамічні методи дослідження складності сучасних фондових ринків. Нейро-нечіткі технології моделювання в економіці. 2016. № 5. С. 152–179. 19. Lacasa L., Luque B., Ballesteros F., Luque J., Nuño J.C. From time series to complex networks: The visibility graph. PNAS. 2008. Vol. 105, No. 13. P. 4972–4975. 20. Luque B., Lacasa L. Ballesteros F., Luque J. Horizontal visibility graphs: Exact results for random time series. Physical Review E. 2009. Vol. 80, Iss. 4. P. 1–11. 21. Qian M. C., Jiang Z. Q., Zhou W. X. Universal and nonuniversal allometric scaling behaviors in the visibility graphs of world stock market indices. Journal of Physics A: Mathematical and Theoretical. 2010. Vol. 43, No. 33. P. 1–12. 22. Birch J. L. Modelling Financial Markets using Methods from Network Theory: Thesis degree of Doctor in Philosophy. Liverpool, 2015. 132 p. URL: https://livrepository.liverpool.ac.uk/2028739/1/BirchJen_Aug2015_ 2028739.pdf. 23. Liu F., Wang N., Wei D. Analysis of Chinese Stock Market by Using the Method of Visibility Graph. The Open Cybernetics & Systemics Journal. 2017. Vol. 11. P. 36–43. 24. Yan W., Serooskerken E. T. Forecasting Financial Extremes: A Network Degree Measure of Super-Exponential Growth. PLoSONE. 2015. Vol. 10, No. 9. P. 1–15. 25. Johansen A., Ledoit O., Sornette D. Crashes as critical points. International Journal of Theoretical and Applied Finance. 2000. Vol. 3, No. 2. P. 219–255. 26. Vamvakaris M. D., Pantelous A. A., Zuev K. M. Time series analysis of S&P 500 index: A horizontal visibility graph approach. Physica A. 2018. Vol. 497. P. 41–51.

25


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

27. Serafino M., Gabrielli A., Cardarelli G., Cimini G. Statistical validation of financial time series via visibility graph. 2017. P. 1-9. URL: arXiv:1710.10980v1. 28. Nicosia V., Lacasa L., Latora V. Network structure of multivariate time series. Scientific Reports. 2015. Vol. 5. P. 1–7. 29. Musmeci N., Nicosia V., Aste T., Di Matteo T., Latora V. The multiplex dependency structure of financial markets. Complexity. 2017. P. 1–13. 30. Bargigli L., di Iasio G., Infante L., Lillo F., Pierobon F. The multiplex structure of interbank networks. Quantitative Finance. 2015. Vol. 15. P. 673–691. 31. Li S., Wen S. Multiplex Networks of the Guarantee Market: Evidence from China. Complexity. 2017. P. 1–7. 32. Stephen C. Dynamic Phase and Group Detection in Pedestrian Crowd Data Using Multiplex Visibility Graphs. Procedia Computer Science. 2015. Vol. 53, No. 1. P. 410–419. 33. Stock Market. Yahoo Finance : website. URL: http://finance.yahoo.com (Last accessed: 11.01.2019). 34. Soloviev V., Belinskij A. Methods of nonlinear dynamics and the construction of cryptocurrency crisis phenomena precursors. Proceedings of the 14th International Conference on ICT in Education, Research and Industrial Applications. Integration, Harmonization and Knowledge Transfer. Kyiv, 2018. Vol. II. P. 116–127. URL: http://ceur-ws.org/Vol2104/paper_175.pdf. 35. Soloviev V., Saptsin V., Chabanenko D. Financial time series prediction with the technology of complex Markov chains. Computer Modelling and New Technologies. 2010. Vol. 14, No. 3. P. 63–67. 36. Soloviev V., Saptsin V., Chabanenko D. Markov Chains application to the financial-economic time series prediction. Computer Modeling and New Technologies. 2011. Vol. 15, No. 3. P. 16–20. URL: arXiv:1111.5254v1. 37. Chatzis S. P., Siakoulis V., Petropoulos A., Stavroulakis E., Vlachogiannakis N. Forecasting stock market crisis events using deep and statistical machine learning techniques. Expert Systems With Applications. 2018. Vol. 112. P. 353–371.

References 1. World Economic Forum. (2019). The Global Risks Report 2019. Retrieved from http://www3.weforum.org/docs/WEF_Global_Risks_ Report_2019.pdf. 2. Roubini, N., & Rosa, B. (2018). The Makings of a 2020 Recession and Financial Crisis. Retrieved from https://www.project-syndicate.org/ commentary/financial-crisis-in-2020-worse-than-2008-by-nouriel-roubiniand-brunello-rosa-2018-09?barrier=accesspaylog. 26


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

3. Malinetskiy, G. G. (2013). Teoriya samoorganizatsii. Na poroge IV paradigmy. Kompyuternyye issledovaniya i modelirovaniye (Computer research and modeling), 5(3), 315–366 [in Russian]. 4. Prigogine, I. (1980). From Being to Becoming Time and Complexity in the Physical Sciences. New York, NY: W.H. Freeman & Company. 5. Barrat, A., Barthelemy, M., & Vespignani, A. (2008). Dynamical processes on complex networks. Boston, MA: Cambridge University Press. DOI: 10.1017/CBO9780511791383. 6. Cohen, R., & Havlin, S. (2010). Complex networks. Structure, robustness and function. New York, NY: Cambridge University Press. DOI: 10.1017/CBO9780511780356. 7. Albert, R., & Barabasi, A.-L. (2002). Statistical Mechanics of Complex Networks. Reviews of Modern Physics, 74, 47–97. DOI: 10.1103/RevModPhys.74.47. 8. Newman, M., Watts, D., & Barabási, A.-L. (2006). The Structure and Dynamics of Networks. Princeton, NJ: Princeton University Press. 9. Newman, M. E. J. (2003). The structure and function of complex networks. SIAM Reviews, 45(2), 167–256. DOI: 10.1137/S003614450342480. 10. Boccaletti, S., Latora, V., Moreno, Y., Chavez, M., & Hwang, D.-U. (2006). Complex networks: Structure and dynamics. Physics Reports, 424(4–5), 175–308. 11. Bianconi, G. (2015, September 1). Interdisciplinary and physics challenges in network theory. Europhysics Letters, 111(5), 1–7. DOI: 10.1209/0295-5075/111/56001. 12. Danilchuk, H., & Soloviev, V. (2015). Dynamics of graph spectral entropy in financial crisis. Socio-economic aspects of economics and management, 2, 227–234. 13. Marsh, P. (2012). The New Industrial Revolution: Consumers, Globalization and the End of Mass Production. London, UK: Yale University Press. 14. Soloviev, V. M., & Solovieva, K. V. (2012). Kіl’kіsnі metody otsіnky skladnostі v prognozuvannі sotsіalno-ekonomіchnykh system. In O. І. Chernyak & P. V. Zakharchenko (Eds.), Prognozuvannya sotsіal’noekonomіchnykh protsesіv: suchasnі pіdkhody ta perspektyvy (pp. 170–184). Berdyansk, Ukraine: Vidavets’ Tkachuk O. V. [in Ukrainian]. 15. Soloviev, V. N. (2015). Merezhnі mіry skladnostі sotsіal’noekonomіchnykh system. Vіsnik Cherkas’kogo unіversitetu. Serіya «Prikladna matematika. Іnformatika» (Bulletin of the Cherkasy University. Series «Applied Mathematics. Computer Science»), 38(371), 67–79 [in Ukrainian]. 16. Boccaletti, S., Bianconi, G., Criado, R., delGenio, C.I., GómezGardeñes, J., Romance, M., Sendiña-Nadal, I., Wang, Z., & Zanin, M. (2014). The structure and dynamics of multilayer networks. Physics Reports, 544(1), 1–122. DOI: 10.1016/j.physrep.2014.07.001.

27


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

17. Donner, R. V., Small, M., Donges, J. F., Marwan, N., Zou, Y., Xiang, R., & Kurths, J. (2010). Recurrence-based time series analysis by means of complex network methods. International Journal of Bifurcation and Chaos, 21(4), 1019–1046. DOI: 10.1142/S0218127411029021. 18. Soloviev, V. N., & Tuliakova, A. Sh. (2016). Grafodynamіchnі metody doslіdzhennya skladnostі suchasnykh fondovykh rynkіv. Nejronechitki tekhnolohii modeliuvannia v ekonomitsi (Neuro-Fuzzy Modeling Techniques in Economics), 5, 152–179 [in Ukrainian]. 19. Lacasa, L., Luque, B., Ballesteros, F., Luque, J., & Nuño, J. C. (2008, April 1). From time series to complex networks: The visibility graph. PNAS, 105(13), 4972–4975. DOI: 10.1073/pnas.0709247105. 20. Luque, B., Lacasa, L. Ballesteros, F., & Luque, J. (2009). Horizontal visibility graphs: Exact results for random time series. Physical Review E, 80(4), 1–11. DOI:10.1103/PhysRevE.80.046103. 21. Qian, M. C., Jiang, Z. Q., & Zhou, W. X. (2010). Universal and nonuniversal allometric scaling behaviors in the visibility graphs of world stock market indices. Journal of Physics A: Mathematical and Theoretical, 43(33), 1–12. DOI: 10.1088/1751-8113/43/33/335002. 22. Birch, J. L. (2015). Modelling Financial Markets using Methods from Network Theory: PhD Thesis. Liverpool, UK: University of Liverpool. Retrieved from https://livrepository.liverpool.ac.uk/2028739/1/BirchJen_ Aug2015_2028739.pdf. 23. Liu, F., Wang, N., & Wei, D. (2017). Analysis of Chinese Stock Market by Using the Method of Visibility Graph. The Open Cybernetics & Systemics Journal, 11, 36–43. 24. Yan, W., & Serooskerken, E. T. (2015, September 4). Forecasting Financial Extremes: A Network Degree Measure of Super-Exponential Growth. PLoSONE, 10(9), 1–15. DOI:10.1371/journal.pone.0128908. 25. Johansen, A., Ledoit, O., & Sornette, D. (2000). Crashes as critical points. International Journal of Theoretical and Applied Finance, 3(2), 219– 255. DOI: 10.1142/S0219024900000115. 26. Vamvakaris, M. D., Pantelous, A. A., & Zuev, K. M. (2018). Time series analysis of S&P 500 index: A horizontal visibility graph approach. Physica A, 497, 41–51. DOI: 10.1016/j.physa.2018.01.010. 27. Serafino, M., Gabrielli, A., Cardarelli, G., & Cimini, G. (2017, October 30). Statistical validation of financial time series via visibility graph, 1–9. Retrieved from arXiv:1710.10980v1. 28. Nicosia, V., Lacasa, L., & Latora, V. (2015). Network structure of multivariate time series. Scientific Reports, 5, 1–7. DOI: 10.1038/srep15508. 29. Musmeci, N., Nicosia, V., Aste, T., Di Matteo, T., & Latora, V. (2017, September 20). The multiplex dependency structure of financial markets. Complexity, 1–13. DOI: 10.1155/2017/9586064. 30. Bargigli, L., di Iasio, G., Infante, L., Lillo, F., & Pierobon, F. (2015). The multiplex structure of interbank networks. Quantitative Finance, 15, 673–691. 28


Графи видимості і передвісники…

В. М. Соловйов, В. В. Соловйова, А. Ш. Тулякова

31. Li, S., & Wen, S. (2017, July 9). Multiplex Networks of the Guarantee Market: Evidence from China. Complexity, 1–7. DOI: 10.1155/2017/9781890. 32. Stephen, C. (2015). Dynamic Phase and Group Detection in Pedestrian Crowd Data Using Multiplex Visibility Graphs. Procedia Computer Science, 53(1), 410–419. DOI: 10.1016/j.procs.2015.07.318. 33. Yahoo Finance. (2019). Stock Market. Retrieved from https://finance.yahoo.com. 34. Soloviev, V., & Belinskij, A. (2018, May 14–17). Methods of nonlinear dynamics and the construction of cryptocurrency crisis phenomena precursors. In V. Ermolayev, M. C. Suárez-Figueroa et al. (Eds.), Proceedings of the 14th International Conference on ICT in Education, Research and Industrial Applications. Integration, Harmonization and Knowledge Transfer (Kyiv, Ukraine) (pp. 116–127). Retrieved from http://ceur-ws.org/Vol-2104/paper_175.pdf. 35. Soloviev, V., Saptsin,V., & Chabanenko, D. (2010). Financial time series prediction with the technology of complex Markov chains. Computer Modelling and New Technologies, 14(3), 63–67. 36. Soloviev, V., Saptsin, V., & Chabanenko, D. (2011). Markov Chains application to the financial-economic time series prediction. Computer Modeling and New Technologies, 15(3), 16–20. Retrieved from arXiv:1111.5254v1. 37. Chatzis, S. P., Siakoulis, V., Petropoulos, A., Stavroulakis, E., & Vlachogiannakis, N. (2018). Forecasting stock market crisis events using deep and statistical machine learning techniques. Expert Systems With Applications, 112, 353–371. DOI: 10.1016/j.eswa.2018.06.032. Стаття надійшла до редакції 10.02.2019

29


УДК 519.85:658 DOI 10.33111/nfmte.2019.030

ГЕОМАРКЕТИНГОВИЙ ПІДХІД В ЗАДАЧІ РОЗМІЩЕННЯ: ПОРІВНЯЛЬНИЙ АНАЛІЗ ТРЬОХ АЛГОРИТМІВ КЛАСТЕРИЗАЦІЇ

К. Ю. Кононова Доктор економічних наук, доцент, професор кафедри економічної кібернетики та прикладної економіки Харківський національний університет ім. В.Н. Каразіна площа Свободи, 4, м. Харків, 61022, Україна kateryna.kononova@gmail.com

Д. О. Кострінчук Магістрант кафедри економічної кібернетики та прикладної економіки Харківський національний університет ім. В.Н. Каразіна площа Свободи, 4, м. Харків, 61022, Україна den1912962317@gmail.com В результаті дослідження було вирішено задачу оптимізації мережі кав’ярень у місті Харків, яка полягала в тому, щоб знайти такі місця розташування торгівельних точок, щоб мережа кав’ярень рівномірно покривала усе місто, а окремі кав’ярні знаходилися на прийнятній відстані одна від одної та забезпечували максимальний трафік потенційних клієнтів. Для вирішення задачі було використано геомаркетинговий підхід, що дозволяє поряд з маркетинговою інформацією враховувати просторові дані. Розроблено низку моделей кластеризації та проведено серію експериментів із кожною з них. Аналіз результатів експериментів показав, що базова модель хоча і задовольняє вимогам рівномірного покриття міста мережею кав’ярень, але вона не враховує характеристики потенційних клієнтів. Багатофакторна модель, навпаки, хоча і дозволяє врахувати маркетингову інформацію, проте не спрямована на пошук кластерів, для яких з центру до околиці можна дістатися за прийнятний час. В результаті застосування зваженої однофакторної моделі було проведено кластеризацію окремо для різних сегментів потенційних клієнтів, для кожного з яких була вирішена задача розміщення. Результати отриманої кластеризації задовольнили усім потребам бізнесу. В результаті заміни метрики Хаверсіна для підрахунку фактичної відстані між двома координатами на дані API Google maps було враховано особливості міського трафіку та уточнено межі кластерів. Ключові слова: геомаркетинговий підхід, задача розміщення, кластеризація, метод зміщення середнього значення, самоорганізаційна карта, метод K-середніх, API, Гугл карта.

© К. Ю. Кононова, Д. О. Кострінчук, 2019

30


Геомаркетинговий підхід в задачі…

К. Ю. Кононова, Д. О. Кострінчук

ГЕОМАРКЕТИНГОВЫЙ ПОДХОД В ЗАДАЧЕ РАЗМЕЩЕНИЯ: СРАВНИТЕЛЬНЫЙ АНАЛИЗ ТРЕХ АЛГОРИТМОВ КЛАСТЕРИЗАЦИИ

Е. Ю. Кононова Доктор экономических наук, доцент, профессор кафедры экономической кибернетики и прикладной экономики Харьковский национальный университет им. В.Н. Каразина площадь Свободы, 4, г. Харьков, 61022, Украина kateryna.kononova@gmail.com

Д. А. Костринчук Магистрант кафедры экономической кибернетики и прикладной экономики Харьковский национальный университет им. В.Н. Каразина площадь Свободы, 4, г. Харьков, 61022, Украина den1912962317@gmail.com В результате исследования была решена задача размещения сети кофеен в городе Харьков, которая заключалась в том, чтобы найти такие места расположения торговых точек, чтобы сеть кофеен равномерно покрывала весь город, а отдельные кафе находились на приемлемом расстоянии друг от друга и обеспечивали максимальный трафик потенциальных клиентов. Для решения задачи был использован геомаркетинговый подход, позволяющий наряду с маркетинговой информацией учитывать пространственные данные. Разработан ряд моделей кластеризации и проведены серии экспериментов с каждой из них. Анализ результатов экспериментов показал, что базовая модель хотя и удовлетворяет требованиям равномерного покрытия города сетью кофеен, но она не учитывает характеристики потенциальных клиентов. Многофакторная модель, наоборот, хотя и позволяет учесть маркетинговую информацию, однако не направлена на поиск кластеров, для которых из центра до окраины можно добраться за приемлемое время. В результате применения взвешенной однофакторной модели была проведена кластеризация отдельно для различных сегментов потенциальных клиентов, для каждого из которых была решена задача размещения. Результаты полученной кластеризации удовлетворили всем потребностям бизнеса. В результате замены метрики Хаверсина для подсчета реального расстояния между двумя координатами на данные API Google maps были учтены особенности городского трафика и уточнены границы кластеров. Ключевые слова: геомаркетинговый подход, задача размещения, кластеризация, метод сдвига среднего значения, самоорганизующаяся карта, метод K-средних, API, Гугл карта.

31


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

A GEOMARKETING APPROACH IN THE PLACEMENT PROBLEM: A COMPARATIVE ANALYSIS OF THREE CLUSTERIZATION ALGORITHMS

Kateryna Kononova

DSc (Economic Sciences), Docent, Professor of Department of Economic Cybernetics and Applied Economics V. N. Karazin Kharkiv National University 4 Svobody Sq., Kharkiv, 61022, Ukraine kateryna.kononova@gmail.com

Denis Kostrinchuk MS, Department of Economic Cybernetics and Applied Economics V.N. Karazin Kharkiv National University 4 Svobody Sq., Kharkiv, 61022, Ukraine den1912962317@gmail.com As a result of the study, the problem of placing a coffee shop network in Kharkiv was solved in order to find such locations for outlets so that the coffee shop network evenly covers the entire city and different cafes are at an acceptable distance from each other and provide maximum traffic of potential customers. To solve the problem, a geomarketing approach was used which along with marketing information allows taking spatial data into account. A number of clustering models were developed and a series of experiments were conducted with each of them. The analysis of the results of experiments showed that the basic model although meets the requirements of uniform coverage of the city with a chain of coffee houses, but it does not take into consideration the characteristics of potential customers. The multifactor model, on the contrary, although allows taking into account marketing information, but it is not aimed at finding clusters for which you can get from the center to the outskirts in acceptable time. As a result of applying a weighted one-factor model, clustering was carried out separately for different segments of potential customers, for each of them the placement problem was solved. The results of clustering satisfied all needs of the business. After replacement the way of calculating distance between two coordinates from Haversine distance metric to Google maps API data, the urban traffic features were taken into account and clusters boundaries were refined. Keywords: geomarketing approach, problem of placing, clustering, mean shift, SOM, Kmeans, API, Google map. JEL Classification: C45, C69, R34, L10

Вступ. Фактор розміщення є одним з основоположних в бізнесі, адже економічні показники компанії істотно залежать від ефективності прийняття рішення щодо місця розташування торгівельних точок, виробництв, офісів тощо. 32


Геомаркетинговий підхід в задачі…

К. Ю. Кононова, Д. О. Кострінчук

Вдале розташування — це не тільки розширення клієнтської бази, а й індикатор статусу: у кожному місті є райони з поганою або, навпаки, бездоганною репутацією. Тож сприйняття бренду може сильно відрізнятися залежно від того, в якому саме районі був відкритий офіс компанії [10]. Крім того, розташування в районі, де більшість компаній представляють певну сферу бізнесу, асоціює нову компанію з успішними його представниками. Найочевиднішою є важливість вдалого розташування в ресторанному бізнесі. В багатьох дослідженнях показано, що певні частини міста залучають клієнтів набагато частіше, ніж інші [7, 19]. В якості об’єкта дослідження в роботі обрано пункт громадського харчування та поставлено задачу пошуку місць оптимального розташування мережі кав’ярень у місті Харків. Задача полягала в тому, щоб знайти такі місця розташування торгівельних точок, щоб мережа кав’ярень рівномірно покрила усе місто, окремі кав’ярні знаходилися на прийнятній відстані одна від одної (а саме не більш ніж в півгодини ходи або 10 мін. автотранспортом) та забезпечувала максимальний трафік потенційних клієнтів. Ефективним і потужним способом вирішення даного завдання є геомаркетинговий підхід, який разом із маркетинговою інформацією, використовує просторові дані (координатна, адресна, реєстрова або інша прив’язка) [6]. Даний підхід широко використовується для вирішення задачі розміщення. В науковій літературі досліджені різні аспекти цього питання. Роботи Монтеяно [13] та Серайник [16] присвячені огляду моделей, що використовуються в геомаркетингових дослідженнях. У праці Бекті та ін. [3] інструменти геомаркетингу застосовано для дослідження факторів, що впливають на рішення клієнтів. У статті Розу та ін. [14] за допомогою геомаркетингового підходу вирішується завдання вибору місця розташування торгового центру. Вибір робився на основі моделі «location-allocation», яка спрямована на максимізацію покриття. В якості вхідних даних використано потенційні місця для будівництва торгового центру, розташування всіх існуючих ТЦ, щільність населення. Чимало робіт присвячено аналізу завдання розміщення в конкретній галузі. Найбільш популярною є сфера роздрібної торгівлі продуктами харчування. Знаходження оптимального місця розташування супермаркету було розглянуто в роботах [2, 9, 18]. Зокрема, у праці Бавієра-Пуіг та ін. [2] запропоновано двоетапний підхід: на першому етапі вирішується задача розташування, на 33


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

другому базова модель доповнюється геомаркетинговими змінними. Розроблена модель корисна при формуванні стратегії розміщення супермаркетів, оскільки вона оцінює їх загальні продажі. Алгоритми геомаркетингу широко застосовуються в міжнародній і вітчизняній практиці. Серед закордонних компаній, що пропонують такі послуги, однією з найвідоміших є WIGeoGIS [17], яка вирішує завдання вибору та аналізу місця розташування за допомогою геомаркетингового підходу. Серед українських — GeoDesign.info [8], що на основі геоданих аналізує переваги та ризики розвитку бізнесу в місті Київ. Але деталі алгоритмів, які вони використовують у своїй практиці, є комерційною таємницею, тож заздалегідь немає можливості перевірити якість отриманих прогнозів. Тому задача порівняльного аналізу результатів роботи різних алгоритмів залишається актуальною. У даній роботі представлено аналіз кількох варіантів кластеризації з використанням просторових даних для пошуку оптимальних місць розташування торговельних точок мережі кав’ярень середнього цінового сегменту, а саме: – базова модель на основі просторових даних; − багатофакторна модель з урахуванням маркетингової інформації; − зважена однофакторна модель з урахуванням міського трафіка. Тож представлено методи збору та підготовки даних, проаналізовано результати моделювання й зроблено висновки. Базова модель. Побудова базової моделі на основі просторових даних потребує вирішення питання про елементарну одиницю моделювання. В якості об’єктів, що підлягають кластеризації, можна було б обрати абстрактні геометричні фігури (саме таке розбиття пропонує, наприклад, GeoDesign [8]). Перевагою такого підходу є одноманітність елементарних об’єктів. Крім того, формально в контексті базової моделі таке розбиття зробити дуже просто. Однак збір маркетингових даних для подальшого моделювання в межах кожного формального багатокутника практично неможливий. У випадку поділу на квартали, ми маємо ту ж саму проблему збору маркетингової інформації, адже це замала одиниця з точки зору наявності відповідних статистичних даних. З огляду на доступність маркетингових даних, найпростіший спосіб збору інформації забезпечує розбиття міста на адміністративні райони. В цьому випадку ми маємо статистику населення районів у відкритому доступі, оцінки інших показників також робити легше. Однак тут ми стикаємося з іншою проблемою — структура 34


Геомаркетинговий підхід в задачі…

К. Ю. Кононова, Д. О. Кострінчук

жителів і працюючого населення, а також їх трафік сильно відрізняються в межах одного району. Крім того, на відміну від випадку з багатокутниками, розміри районів можуть сильно відрізнятися один від одного, що протирічить вимогі внутрішньої однорідності елементарних одиниць моделювання. Тому в контексті базової моделі, коли для моделювання буде використано лише просторові дані, розбиття міста на адміністративні райони також не підходить. Таким чином, для виявлення елементарної одиниці моделювання слід вибрати варіант, при якому структура показників є сталою в межах одного об’єкту, а самі об’єкти мають більш-менш однаковий розмір. Тому для побудови базової моделі в роботі обрано варіант розбиття міста на історичні райони відповідно до класифікації порталу для пошуку нерухомості ЛУН [20]. Але цей розподіл також виявився не ідеальним — деякі ділянки міста не було віднесено до жодного району, якісь райони займали занадто велику площу, деякі райони, навпаки, виявилися занадто малі у порівнянні з іншими. Тому в класифікацію районів внесено відповідні зміни та отримано список із 45 історичних районів, географічні дані про які можуть бути використані для базової моделі (рис. 1). Для відображення районів на карті міста використано засіб MapBox [12], який дозволяє створювати динамічні карти, використовуючи шари, що задаються користувачем.

Рис. 1. Розбиття міста на райони 35


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Для кластеризації в роботі обрано алгоритм на основі ковзного вікна Mean Shift, що базується на центроїдному підході [4, 15]. Для використання даного алгоритму з географічними координатами необхідно обрати метрику відстані. Оскільки розмір ковзного вікна (параметр R) для полегшення подальшої інтерпретації вирішено задавати в кілометрах, тому прийнято рішення про використання метрики Хаверсіна, за якою обчислюється найкоротша відстань між двома точками на сфері на основі їх географічних координат — широти та довготи: 𝑑 = 2𝑟 ∙ 𝑠𝑖𝑛−1 (√𝑠𝑖𝑛2 (

𝑥1 − 𝑥2 𝑦1 − 𝑦2 ) + 𝑐𝑜𝑠(𝑥1 )𝑐𝑜𝑠(𝑥2 )𝑠𝑖𝑛2 ( )), 2 2

де d — відстань між точками (в км); r — радіус земної кулі (6371 км); x1, x2 — географічна довгота двох точок; y1, y2 — географічна широта двох точок. Результати експериментів з різними розмірами ковзного вікна представлені в табл. 1. Таблиця 1 РЕЗУЛЬТАТИ ЕКСПЕРИМЕНТІВ R

Кількість кластерів

Кількість шумових точок

Кількість районів в найбільшому кластері

1,5

5

33

3

2

10

15

5

2,5

10

7

7

3

8

5

10

3,5

8

1

12

4

7

2

15

4,5

6

3

20

5

6

2

22

Аналіз табл. 1 показує, що оптимальним є розбиття на вісім кластерів з розміром ковзного вікна 3,5 км, адже в цьому випадку ми отримуємо мінімальну кількість шумових точок (тобто неохоплених районів) при достатній кількості історичних районів у найбільшому кластері. У даному варіанті з центру кластера до його 36


Геомаркетинговий підхід в задачі…

К. Ю. Кононова, Д. О. Кострінчук

меж можна дістатися пішки протягом 30–40 хв або за 5–10 хв на автомобілі, що можна назвати прийнятною відстанню. На рис. 2 для кожного кластера позначені координати центру у вигляді значка будівлі, самі кластери впорядковані від найбільшого (перший кластер) до найдрібнішого (кластер № 8).

Рис. 2. Результат розрахунків базової моделі

Базова модель хоча і задовольняє вимогам рівномірного покриття міста мережею кав’ярень, що знаходяться на прийнятній відстані одна від одної, але вона має ряд істотних недоліків. Головний з них — модель не враховує характеристики потенційних споживачів у межах кожного району. Відповідно, необхідно застосувати підхід, що забезпечить подолання цієї проблеми. Багатофакторна модель з урахуванням маркетингової інформації. Питання пошуку даних є одним із найскладніших в геомаркетингових дослідженнях. Проблема полягає в тому, що 37


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

дані в тому вигляді, в якому вони потрібні для дослідження, або не існують взагалі, або їх немає у відкритому доступі: практично неможливо знайти інформацію про чисельність населення в межах мікрорайонів і кварталів або середньозважені доходи їх жителів. Можливим виходом є оцінка цих показників на базі інших, які можна зібрати. Для цього використовуються логічні припущення про взаємозв’язки між факторами [19]. На основі подібних логічних припущень були оцінені такі показники: 1) чисельність населення району оцінено на основі підрахунку кількості квартир і приватних будинків у його межах; 2) фінансову спроможність жителів району оцінено на основі розрахунку середньої ціни за один квадратний метр при купівлі квартири; 3) кількість працюючого населення в районі оцінено за кількістю адміністративних будівель. Оскільки демографічна інформація у відкритих джерелах є тільки в межах адміністративних районів, прийнято рішення оцінити даний показник на основі підрахунку кількості квартир і приватних будинків. Для цього за допомогою картографічного порталу 2ГІС [1] у межах кожного району зібрано інформацію щодо поверховості всіх житлових будинків. Для оцінки кількості квартир цих будинків за даними порталу Kartagoroda [11] сформовано невелику вибірку будинків, для кожного з яких відомі кількість квартир і поверховість. На основі цих даних виведено залежність між кількістю поверхів будинку та кількістю квартир у ньому. Ґрунтуючись на цій залежності, для кожного будинку в Харкові оцінено кількість квартир. Кількість приватних будинків взято безпосередньо з порталу 2ГІС. Фінансову спроможність жителів району оцінено виходячи з середньої ціни за один квадратний метр при купівлі нерухомості, яка була розрахована на основі всіх оголошень на порталі продажу житлової нерухомості ЛУН [20]. Для оцінки кількості працюючого населення зроблено припущення, що вона залежить від кількості адміністративних будівель у районі. Інформацію про адміністративні споруди також взято на порталі 2ГІС [1]. Отримані дані разом із координатами було використано для побудови багатофакторної моделі. З цією метою обрана комбінація алгоритмів SOM (самоорганізаційна карта) та Kmeans (метод K-середніх) [5]. 38


Геомаркетинговий підхід в задачі…

К. Ю. Кононова, Д. О. Кострінчук

Результати побудови SOM можна відобразити у вигляді теплової карти для кожної ознаки (рис. 3).

Рис. 3. Теплові карти факторів на SOM

Як бачимо з карт, правий нижній кут зайняли райони, що мають найбільшу кількість жителів. У той же час фінансово найспроможніші райони знаходяться в лівому нижньому кутку карти. Райони з найбільшою кількістю працюючого населення знаходяться внизу карти. Клітини отриманої двовимірної сітки кластеризовано та отримано 12 кластерів (рис. 4). Аналіз результатів кластеризації показав, що деякі недоліки базової моделі багатофакторна модель вирішила (тепер враховується маркетингова інформація щодо потенційних клієнтів), проте деякі переваги першої моделі були втрачені. А саме, головний з них — багатофакторна модель не спрямована на те, щоб знайти кластери, для яких від центру до околиці можна дістатися за прийнятний час. Таким чином, отриманий результат не задовольняє ані вимозі рівномірного по39


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

криття міста мережею кав’ярень, ані вимозі, щоб окремі кав’ярні знаходилися на прийнятній відстані одна від одної.

Рис. 4. Результат роботи SOM та Kmeans

Зважена однофакторна модель з урахуванням міського трафіка. Як показав аналіз результатів розрахунків багатофакторної моделі, на її основі важко зрозуміти, на підставі саме якого критерію необхідно давати рекомендацію про розміщення кав’ярень. Вибрати оптимальний кластер можна як на підставі найбільшої кількості районів у ньому, так і з огляду на максимальну кількість жителів або працюючого населення. Тобто важливо розуміти, хто саме є потенційним клієнтом компанії. Наприклад, якщо кав’ярня орієнтована на сегмент працюючого населення, то необхідно вибрати кластери з найбільшою кількістю адміністративних будівель. Якщо ж цільова аудиторія — жителі спальних районів із середнім або високим доходом, то 40


Геомаркетинговий підхід в задачі…

К. Ю. Кононова, Д. О. Кострінчук

необхідно планувати розташування кав’ярень у кластерах з найбільшою кількістю квартир середнього та високого цінових сегментів. У будь-якому випадку немає необхідності враховувати одночасно всі фактори для вирішення задачі розміщення. Таким чином, якщо спиратися лише на один критерій, необхідно провести попередню фільтрацію районів, виключивши такі, в яких або немає представників даного сегмента взагалі, або їх недостатня кількість. Тоді для вирішення завдання кластеризації можна використовувати метод зміщення середнього значення Mean Shift [15], що дозволить подолати недоліки багатофакторної моделі. У цьому випадку для врахування маркетингової інформації можна застосувати метод зваженої кластеризації, коли вага кожної точки задається шляхом її дублювання певну кількість разів. При цьому для встановлення ваги використовується фактор, який характеризує даний сегмент. Оскільки мережа кав’ярень орієнтована на середній ціновий сегмент, у рамках дослідження проведено кластеризацію окремо для трьох груп: 1) жителів району із середніми доходами; 2) жителів району з високими доходами; 3) працюючого населення. Для кожного з сегментів була вирішена задача розміщення. Результати отриманої кластеризації задовольнили потребам бізнесу, а саме вимогам щодо рівномірного покриття мережею кав’ярень усього міста (коли окремі кав’ярні знаходяться на прийнятній відстані одна від одної) та забезпечення максимального трафіку потенційних клієнтів. Проте для впровадження отриманих результатів бажано удосконалити модель шляхом урахування особливостей дорожньої будови та міського трафіку, адже дотримання вимоги щодо прийнятної відстані між окремими кав’ярнями мережі суттєво залежить від ситуації на дорогах міста. Для вирішення даної проблеми змінено метод розрахунку відстані — замість метрики Хаверсіна для вимірювання фактичної відстані між двома координатами використано API сервіс Google maps. Проведено серію експериментів для різних годин протягом доби, різних днів тижня, з урахуванням сезону та ситуації з пробками на дорогах. У результаті уточнено межі кластерів і виконано вимогу щодо розташування мережі кав’ярень. Результати розрахунків наведено на рис. 5. 41


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

а)

б) 42

2019, № 8


Геомаркетинговий підхід в задачі…

К. Ю. Кононова, Д. О. Кострінчук

в) Рис. 5. Результати кластеризації за зваженою однофакторною моделлю з урахуванням трафіка: а) для сегмента з високим доходом б) для сегмента з середнім доходом в) для працюючого сегмента

Висновки. У результаті дослідження вирішено задачу пошуку місць оптимального розташування торговельних точок мережі кав’ярень у місті Харків, щоб мережа рівномірно покрила усе місто, окремі кав’ярні знаходилися на прийнятній відстані одна від одної (а саме не більш ніж півгодини ходи або 10 хв автотранспортом) та забезпечували максимальний трафік потенційних клієнтів. На основі геомаркетингового підходу, що дозволяє поряд з маркетинговою інформацією враховувати просторові дані, роз43


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

роблено низку моделей кластеризації та проведено серію експериментів за кожною з них. Аналіз їх результатів показав, що базова модель хоча і задовольняє вимогам рівномірного покриття міста мережею кав’ярень, що знаходяться на прийнятній відстані одна від одної, але вона не враховує характеристики потенційних споживачів у межах кожного району. Багатофакторна модель хоча і дозволяє врахувати маркетингову інформацію, проте не спрямована на пошук кластерів, для яких із центру до околиці можна дістатися за прийнятний час. Таким чином, отриманий на основі багатофакторної моделі результат не задовольняв ані вимозі рівномірного покриття міста мережею кав’ярень, ані вимозі, щоб окремі кав’ярні знаходилися на прийнятній відстані одна від одної. У результаті застосування зваженої однофакторної моделі було проведено кластеризацію окремо для різних сегментів потенційних клієнтів: мешканців із середніми та високими доходами, а також працюючого населення. Результати отриманої кластеризації задовольнили потребам бізнесу, а саме вимогам щодо рівномірного покриття мережею кав’ярень усього міста (коли окремі кав’ярні знаходяться на прийнятній відстані одна від одної) та забезпечення максимального трафіка потенційних клієнтів. У результаті заміни метрики Хаверсіна для підрахунку фактичної відстані між двома координатами на дані API Google maps враховано особливості міського трафіка та уточнено межі кластерів. У цілому, найважливіший фактор успішного вирішення задачі розташування — вибір оптимального алгоритму кластеризації. Саме глибоке розуміння принципів функціонування алгоритму та сутності поставленого завдання дозволило отримати ефективні результати, що можуть бути застосовні не лише у сфері харчування, але й в інших галузях.

Список літератури 1. 2ГИС : веб-сайт. URL: https://2gis.ua/kharkov (дата звернення: 06.05.2019). 2. Baviera-Puig A., Buitrago-Vera J., Escriba-Pere C. Geomarketing models in supermarket location strategies. Journal of Business Economics and Management. 2016. Vol. 17, No. 6. P. 1205–1221. URL: https://journals.vgtu.lt/index.php/JBEM/article/view/2303/1855.

44


Геомаркетинговий підхід в задачі…

К. Ю. Кононова, Д. О. Кострінчук

3. Bekti R., Pratiwi N., Jatipaningrum M. Multiplicative Competition Interaction Model to obtained Retail Consumer Choice based on Spatial Analysis. IOP Conference Series: Earth and Environmental Science. 2018. № 187. P. 1-9. DOI: 10.1088/1755-1315/187/1/012041. 4. Data Mining — Cluster Analysis. tutorialspoint.com : website. URL: https://www.tutorialspoint.com/data_mining/dm_cluster_analysis.htm (Last accessed: 07.05.2019). 5. Downs G. M., Barnard J. M. Hierarchical and non-Hierarchical Clustering. 1995. URL: https://www.daylight.com/meetings/mug96/barnard/ E-MUG95.html. 6. Find optimal store locations. desktop.arcgis.com : website. URL: http://desktop.arcgis.com/ru/arcmap/latest/extensions/business-analyst/findoptimal-store-locations-mean-store.htm (Last accessed: 07.05.2019). 7. GCSE Location. BBC : website. URL: https://www.bbc.co.uk/ bitesize/guides/z84kq6f/revision/1. 8. Geodesign.info : website. URL: https://geodesign.info/ (Last accessed: 06.05.2019). 9. Grassi V. Estratégias de localização de uma rede de supermercados: o geomarketing aplicado à companhia zaffari em Porto Alegre. Porto Alegre: Universidade Federal do Rio Grande do Sul, 2010. 55 p. DOI: 10.13140/RG.2.2.23534.31041. 10. Heil K. Location strategy. referenceforbusiness.com : website. URL: https://www.referenceforbusiness.com/management/Int-Loc/LocationStrategy.html (Last accessed: 08.05.2019). 11. Карта Харькова с улицами и номерами домов. Kartagoroda : вебсайт. URL: https://kartagoroda.com.ua/ (дата звернення: 06.05.2019). 12. Mapbox : website. URL: https://www.mapbox.com/ (Last accessed: 07.05.2019). 13. Montejano J.A., Cruz Bello G.M. Geomarketing Localization Models. Espacialidades, Revista de temas Contemporáneos sobre lugares, política y cultura. 2018. Vol. 8, No. 01. P. 95–120. URL: http://espacialidades.cua.uam.mx/vol/08/2018/01/06_Montejano_y_Cruz.pdf. 14. Rosu L., Blăgeanu A., Ionuţ-Ciprian I. Geomarketing. A New Approach in Decision Marketing: Case Study — Shopping Centres in IASI. Lucrările seminarului geografic ‘Dimitrie Cantemir’. 2013. No. 36. P. 123–133. URL: https://www.researchgate.net/publication/291956981_GEOMARKETINGA_NEW_APPROACH_IN_DECISION_MARKETING_CASE_STUDY__SHOPPING_CENTRES_IN_IASI. 15. Seif G. The 5 Clustering Algorithms Data Scientists Need to Know. Towards data science : website. 2018. URL: https://towardsdatascience. com/the-5-clustering-algorithms-data-scientists-need-to-know-a36d136ef68.

45


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

16. Serajnik T., Amaduzzi S., Paulus G. Geomarketing Analyses of the Città Fiera Mal. GI_Forum. 2014. Vol. 1. P. 105–114. DOI: 10.1553/giscience2014s105. 17. Transparency and success. Geomarketing supports retailers. Wigeogis : website. URL: https://www.wigeogis.com/en/retail_geomarketing (Last accessed: 07.05.2019). 18. Xiao D., Ye W. Combining GIS and the Analytic Hierarchy Process to Analyze Location of Hypermarket. IOP Conference Series: Earth and Environmental Science. 2019. Vol. 237, Iss. 3. P. 1–5. DOI: 10.1088/17551315/237/3/032012. 19. Бондарь А., Хворостухин Д. Определение наиболее перспективного расположения пунктов общественного питания на основе гистехнологий. Вестник науки и образования. 2018. Vol. 1, No. 8 (44). P. 121–124. URL: https://cyberleninka.ru/article/v/opredelenie-naiboleeperspektivnogo-raspolozheniya-punktov-obschestvennogo-pitaniya-na-osnovegis-tehnologiy-na-primere-uchastka. 20. Комфортний вибір квартир. ЛУН : веб-сайт. URL: https://flatfy.lun.ua (дата звернення: 06.05.2019).

References 1. 2GIS. (2019). Retrieved from https://2gis.ua/kharkov. 2. Baviera-Puig, A., Buitrago-Vera, J., & Escriba-Pere, C. (2016). Geomarketing Models in Supermarket Location Strategie. Journal of Business Economics and Management, 17(6), 1205–1221. DOI: 10.3846/16111699.2015.1113198. 3. Bekti, R., Pratiwi, N., & Jatipaningrum, M. (2018). Multiplicative Competition Interaction Model to obtained Retail Consumer Choice based on Spatial Analysis. IOP Conference Series: Earth and Environmental Science, 187(1), 1–9. DOI: 10.1088/1755-1315/187/1/012041. 4. Data Mining — Cluster Analysis. (2019). Retrieved from https://www.tutorialspoint.com/data_mining/dm_cluster_analysis.htm. 5. Downs, G.M., & Barnard, J.M. (1995, December 1). Hierarchical and non-Hierarchical Clustering. Retrieved from https://www.daylight.com/ meetings/mug96/barnard/E-MUG95.html. 6. ArcGIS. (2019). Find optimal store locations. Retrieved from http://desktop.arcgis.com/ru/arcmap/latest/extensions/business-analyst/findoptimal-store-locations-mean-store.htm. 7. BBC. (2019). GCSE Location. Retrieved from https://www.bbc.co.uk/ bitesize/guides/z84kq6f/revision/1. 8. Geodesign.info. (2019). Retrieved from https://geodesign.info/. 9. Grassi, V. (2010). Estratégias de localização de uma rede de supermercados: o geomarketing aplicado à companhia zaffari em Porto 46


Геомаркетинговий підхід в задачі…

К. Ю. Кононова, Д. О. Кострінчук

Alegre. Porto Alegre, Brasilia: Universidade Federal do Rio Grande do Sul. DOI: 10.13140/RG.2.2.23534.31041. 10. Heil, K. (2012). Location strategy. Retrieved from https://www. referenceforbusiness.com/management/Int-Loc/Location-Strategy.html. 11. Kartagoroda. (2019). Retrieved from https://kartagoroda.com.ua. 12. Mapbox. (2019). Retrieved from https://www.mapbox.com/. 13. Montejano, J.A., & Cruz Bello, G.M. (2018, February 5). Geomarketing Localization Models. Espacialidades, Revista de temas Contemporáneos sobre lugares, política y cultura, 8(1), 95–120. Retrieved from http://espacialidades.cua.uam.mx/vol/08/2018/01/06_Montejano_y_Cruz.pdf. 14. Rosu, L., Blăgeanu, A., & Ionuţ-Ciprian, I. (2013). Geomarketing. A New Approach in Decision Marketing: Case Study — Shopping Centres in IASI. Lucrările seminarului geografic ‘Dimitrie Cantemir’, 36, 123–133. Retrieved from https://www.researchgate.net/publication/291956981_ GEOMARKETING_-A_NEW_APPROACH_IN_DECISION_MARKETING_ CASE_STUDY_-_SHOPPING_CENTRES_IN_IASI. 15. Seif, G. (2018). The 5 Clustering Algorithms Data Scientists Need to Know. Retrieved from https://towardsdatascience.com/the-5-clusteringalgorithms-data-scientists-need-to-know-a36d136ef68. 16. Serajnik, T., Amaduzzi, S., & Paulus, G. (2014). Geomarketing. Analyses of the Città Fiera Ma. GI_Forum, 1, 105–114. DOI: 10.1553/giscience2014s105. 17. Wigeogis. (2019). Transparency and success. Geomarketing supports retailers. Retrieved from https://www.wigeogis.com/en/ retail_geomarketing. 18. Xiao, D., & Ye, W. (2019). Combining GIS and the Analytic Hierarchy Process to Analyze Location of Hypermarket. IOP Conference Series: Earth and Environmental Science, 237(3), 1–5. DOI: 10.1088/17551315/237/3/032012. 19. Bondar, A., & Khvorostukhin, D. (2018). Opredelenie naibolee perspektivnogo raspolozheniya punktov obshestvennogo pitaniya na osnove gistekhnologiy (Finding the most perspective foodservice outlet location based on GIS-technologies). Vestnik nauki i obrazovaniya (Bulletin of science and education), 1, 8(44), 121–124. Retrieved from https://cyberleninka.ru/ article/v/opredelenie-naibolee-perspektivnogo-raspolozheniya-punktovobschestvennogo-pitaniya-na-osnove-gis-tehnologiy-na-primere-uchastka [in Russian]. 20. LUN. (2019). Retrieved from https://flatfy.lun.ua. Стаття надійшла до редакції 13.06.2019

47


УДК 519.86:336.77 DOI 10.33111/nfmte.2019.048

ЗАСТОСУВАННЯ БАГАТОШАРОВИХ ПЕРСЕПТРОНІВ ДЛЯ КЛАСИФІКАЦІЇ ПОЗИЧАЛЬНИКІВ-ЮРИДИЧНИХ ОСІБ

О. В. Григорович Магістр з економічної кібернетики, аспірант кафедри економіко-математичного моделювання Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» проспект Перемоги, 54/1, м. Київ, 03680, Україна olha.hryhorovych@gmail.com Статтю присвячено пошуку оптимальної архітектури нейронної мережі типу багатошаровий персептрон для мінімізації похибки першого роду при вирішенні задачі класифікації позичальниківюридичних осіб за рівнем кредитоспроможності. Проведено експериментальні дослідження із більше ніж 3000 моделями персептронного типу в інструментальному пакеті STATISTICA Neural Networks. Зроблено висновки і рекомендації щодо поділу генеральної сукупності спостережень на навчальну, тестову та контрольну вибірки з метою підвищення ефективності діагностування позичальників, котрим загрожує дефолт. Виявлено, що оптимальна кількість пояснювальних змінних для адекватної оцінки кредитоспроможності юридичних осіб має бути більшою 10. За таких умов середня точність передбачення дефолтів позичальників становить 80,23 % (відповідно, помилка першого роду є меншою за 20 %). Для найбільш адекватних моделей, відібраних у ході дослідження, похибка першого роду становить 10,69 %–13,69 %. Отримані експериментальні розрахунки підтверджують можливість і доцільність практичного застосування нейронних мереж персептронного типу при оцінці кредитоспроможності позичальників-юридичних осіб. Ключові слова: кредитоспроможність, нейронна мережа, багатошаровий персептрон, фінансові показники, класифікація, юридична особа.

ПРИМЕНЕНИЕ МНОГОСЛОЙНЫХ ПЕРСЕПТРОНОВ ДЛЯ КЛАССИФИКАЦИИ ЗАЕМЩИКОВ-ЮРИДИЧЕСКИХ ЛИЦ

О. В. Григорович Магистр по экономической кибернетике, аспирант кафедры экономико-математического моделирования Государственное высшее учебное заведение «Киевский национальный экономический университет имени Вадима Гетьмана» проспект Победы, 54/1, г. Киев, 03680, Украина olha.hryhorovych@gmail.com Статья посвящена поиску оптимальной архитектуры нейронной сети типа многослойный персептрон с целью минимизации ошиб© О. В. Григорович, 2019

48


Застосування багатошарових персептронів…

О. В. Григорович

ки первого рода при решении задачи классификации заемщиковюридических лиц по уровню кредитоспособности. Проведены экспериментальные исследования с более чем 3000 моделями персептронного типа в инструментальном пакете STATISTICA Neural Networks. Сделаны выводы и рекомендации по разделению генеральной совокупности наблюдений на учебную, тестовую и контрольную выборки с целью повышения эффективности диагностирования заемщиков, которым грозит дефолт. Выявлено, что оптимальное количество объясняющих переменных для адекватной оценки кредитоспособности юридических лиц должно превышать 10. При таких условиях средняя точность предсказания дефолтов заемщиков составляет 80,23 % (соответственно, ошибка первого рода меньше 20 %). Для наиболее адекватных моделей, отобранных в ходе исследования, ошибка первого рода составляет 10,69 %–13,69 %. Полученные экспериментальные расчеты подтверждают возможность и целесообразность практического применения нейронных сетей персептронного типа при оценке кредитоспособности заемщиков-юридических лиц. Ключевые слова: кредитоспособность, нейронная сеть, многослойный персептрон, финансовые показатели, классификация, юридическое лицо.

APPLICATION OF MULTILAYER PERCEPTRONS TO LEGAL ENTITIES BORROWERS CLASSIFICATION

Olha Hryhorovych Master’s Degree in Economic Cybernetics, PhD student, Department of Economic and Mathematical Modeling State Higher Educational Establishment “Kyiv National Economic University named after Vadym Hetman” 54/1 Peremogy Avenue, Kyiv, 03680, Ukraine olha.hryhorovych@gmail.com The article is devoted to the search for the optimal architecture of a neural network such as a multilayer perceptron in order to reduce the type I error in solving the problem of classifying borrowers-legal entities by credit level. Experimental studies have been conducted with more than 3000 multilayer perceptron models in the STATISTICA Neural Networks toolbox. Conclusions and recommendations have been made regarding the dividing dataset into training, test and validation samples to improve prediction of the borrower’s default. It was revealed that the optimal number of explanatory variables for an adequate assessment of the creditworthiness of legal entities should exceed 10. Under such conditions, the average accuracy of prediction of defaults of borrowers is 80.23 % (respectively, the type I error is less than 20 %). For the most adequate models selected during the study, the type I error is 10.69 %–13.69 %. The obtained experimental calculations confirm the

49


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

possibility and expediency of the practical application of perceptrontype neural networks in assessing the creditworthiness of borrowerslegal entities. Keywords: creditworthiness, neural network, multilayer perceptron, financial indicators, classification, legal entity. JEL Classіfіcatіon: G21, C45, C51

Постановка проблеми. Ефективне функціонування кредитного ринку є однією з передумов стабільності фінансової системи країни, а також створює умови для економічного зростання. На жаль, ринок кредитування в Україні піддається впливу низки негативних зовнішніх (платежі за зовнішнім боргом, уповільнення зростання ВВП, військовий конфлікт, відчуження територій і втрата ринків збуту) і внутрішніх (низькі кредитні стандарти, нехтування лімітами концентрації боргів, кредитування пов’язаних осіб, високий обсяг валютного кредитування) чинників, що стають основою масових дефолтів за боргами. За часткою непрацюючих кредитів Україна є лідером серед країн Європи та Азії. У країнах ЄС даний показник не перевищує 5 %, а у кредитному портфелі вітчизняних платоспроможних банків частка непрацюючих кредитів становить 50 % [1]. 60% 54,9%

55% 50%

50,2%

45% 40%

40,0%

35% 06.17

12.17

06.18

12.18

06.19

Всі кредити Кредити фізичним особам Кредити корпоративному сектору

Рис. 1. Динаміка частки непрацюючих кредитів у портфелях банків Джерело: [2]

50


Застосування багатошарових персептронів…

О. В. Григорович

Як бачимо, протягом останніх років в Україні спостерігається позитивна динаміка зниження частки непрацюючих кредитів у портфелях банків, однак скорочення частки непрацюючих кредитів суб’єктам господарювання відбувається повільнішими темпами порівняно з кредитами фізичним особам, що, в тому числі, вказує на застосування менш ефективних засобів аналізу кредитоспроможності юридичних осіб. З метою зниження частки непрацюючих кредитів виникає потреба у проведенні ефективної оцінки кредитоспроможності позичальника на етапі розгляду кредитної заявки. Сучасні інструменти економіко-математичного моделювання допомагають істотно підвищити точність оцінювання, що мінімізуватиме збитки банківської установи та допоможе підвищити прибуток шляхом збільшення об’ємів активних операцій комерційного банку. Аналіз останніх досліджень і публікацій. Традиційно методи класифікації позичальників поділяються на 2 типи: параметричні (дискримінантний аналіз [3, 4], логістична регресія [5, 6] тощо) та непараметричні, що застосовуються дедалі частіше, оскільки не ґрунтуються на припущеннях щодо розподілу вхідних даних (дерева прийняття рішень [6, 7], нейронні мережі [3, 8, 9, 10], нечітка логіка [11–13], генетичні алгоритми [14], метод k-найближчих сусідів [15] та ін.). Серед непараметричних методів найчастіше використовують інструментарій штучних нейронних мереж і нечіткої логіки. Однак, нечітка логіка вимагає експертного встановлення правил прийняття рішень, що вносить певну суб’єктивність до розрахунків, є доволі складною у застосуванні та демонструє близькі до інших непараметричних методів результати класифікації. Нейронні мережі позбавлені цих недоліків, характеризуються високою адаптивністю та здатністю до самонавчання (узагальнення), що підвищує точність моделювання. Наприклад, у дослідженні Веста Д. [8] проаналізовано 5 типів нейронних мереж, котрі можуть бути застосовані для оцінки надійності позичальника: багатошаровий персептрон (MLP), радіально-базисна функція (RBF), векторне квантування (LVQ), нечіткий адаптивний резонанс (FAR) і комітет експертів (об’єднання нейронних мереж різних типів), що, відповідно до результатів дослідження, виявився найточнішою архітектурою для оцінки кредитоспроможності. Проблематика застосування нейронних мереж для розв’язання задач моделювання кредитних ризиків до51


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

сліджена у працях вітчизняних науковців Великоіваненко Г. І. [16, 17], Матвійчука А. В. [18], Cавіної C. С., Беня В. П. [19, 20], Мінца О. Ю. [21] та ін. Проте питання вибору оптимальної архітектури нейромережі та її конфігурації для класифікації юридичних осіб-позичальників банків потребує подальшого ґрунтовного дослідження. Метою статті є проведення експериментального дослідження з пошуку оптимальної архітектури та параметрів нейронних мереж персептронного типу для вирішення задачі класифікації позичальників-юридичних осіб за рівнем кредитоспроможності. Виклад основного матеріалу. Основним завданням оцінювання кредитного ризику є віднесення потенційного позичальника до одного з двох класів: «надійний позичальник», котрий імовірно виконає фінансове зобов’язання, або «ненадійний», чия кредитна заява повинна бути відхилена через високий ризик дефолту за фінансовим зобов’язанням [8]. У задачі класифікації позичальників-юридичних осіб за рівнем кредитного ризику нульовою гіпотезою є припущення про незадовільну кредитоспроможність потенційного позичальника. Відповідно, похибка І роду буде спостерігатись при віднесенні позичальника, котрий не виконає зобов’язання, до класу «надійних», похибка ІІ роду — при віднесенні кредитоспроможного позичальника до класу «ненадійних». Похибка І роду є витратнішою для банківських установ, оскільки в такому разі позичальник втрачає як суму виданого кредиту, так і відсотки за ним. При похибці ІІ роду банк лише недоотримує прибуток за відсотками по кредиту. Проведений аналіз опублікованих праць з моделювання кредитоспроможності позичальників-юридичних осіб і власні дослідження з даного напряму обумовили вибір нейронних мереж персептронного типу для вирішення задачі класифікації позичальників за рівнем кредитного ризику та обґрунтування мети даної роботи. Основний блок такої мережі — формальний нейрон, що є алгоритмічно реалізованою моделлю, елементи якої мають прямі аналоги компонент біологічних нейронів. На вхід нейрона подаються сигнали xi, при цьому з кожним входом пов’язана синаптична вага wi (зв’язок між нейронами), i=1, n . У тілі нейрона вираховується функція активації, що перетворює багатовимірний простір входів на скалярний вихід: 52


Застосування багатошарових персептронів…

n  y =   wi xi + b  ,  i =1 

О. В. Григорович

(1)

де y — вихідний сигнал нейрона, n — кількість входів, xi — значення i-го вхідного показника, wi — вага i-го входу нейрона, b — параметр зміщення вхідного сигналу, що подається на функцію активації (bias), Ѱ — функція активації нейрона [18, с. 44]. У даному дослідженні в якості функцій активації нейронів використовувались такі функції: експоненціальна (exponential у пакеті STATISTICA Neural Networks), гіперболічний тангенс (tanh), логістична (logistic) функція, а також функції тотожності (identity) та софтмакс (softmax) — для вихідного шару. Побудова нейронної мережі передбачає такі кроки: 1) відбір пояснювальних змінних; 2) вибір типу мережі, функцій активації, співвідношення навчальної, тестової та контрольної вибірок; 3) навчання мереж і відбір найбефективніших на основі тестової помилки; 4) перевірка адекватності навчання на основі контрольної похибки. Для розв’язання задачі класифікації позичальниківюридичних осіб у даному дослідженні застосовувалась нейронна мережа типу багатошаровий персептрон (multilayer perceptron — MLP). До головних особливостей багатошарових персептронів належать: застосування нелінійних функцій активації; наявність одного або кількох шарів прихованих нейронів, що дозволяють мережі навчатись, поступово видобуваючи найважливіші ознаки з вхідного вектора; високий ступінь зв’язаності завдяки зміні синаптичних з’єднань і їх вагових коефіцієнтів [22, с. 220]. Архітектуру багатошарового персептрона з одним прихованим шаром представлено на рис. 2, де xi — значення i-го вхідного показника, i=1, n ; wil(2) — значення вагового коефіцієнта, що поєднує i-ий нейрон першого шару та l-ий нейрон другого шару нейронної мережі, l= 1, p ; wlj(3) — значення вагового коефіцієнта, що поєднує l-ий нейрон другого шару та j-ий нейрон третього шару нейронної мережі, j=1, m ; yj — значення j-го вихідного показника. 53


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

Вхідний шар

2019, № 8

Прихований шар

Вихідний шар

w11(2) x1

w11(3)

w12

(2)

w1m(3)

… y1

xi

wl1(3) wlm(3)

wn1

(2)

wp1(3)

wnl

xn

ym

(2)

wpm(3) wnp

(2)

Рис. 2. Базова архітектура тришарового персептрона Джерело: [18, с. 53]

Перетворення вхідних сигналів у нейронах багатошарового персептрона здійснюється з урахуванням вагових коефіцієнтів міжнейронних зв’язків за функцією:

y j =  (j3)  b(j3) +  wlj(3)   l( 2)  bl( 2) +  wil( 2)   i(1) (xi )  , 

p

 

l =1 

n

i =1

   

(2)

де  i(1) () — функція активації i-го, i=1, n , нейрона вхідного шару нейронної мережі; ( 2) ( 2)  l () , bl — функція активації та параметр зміщення суматора l-го, l= 1, p , нейрона другого шару; ( 3)  j () , b(j3) — функція активації та параметр зміщення суматора j-го, j= 1, m , нейрона вихідного шару. 54


Застосування багатошарових персептронів…

О. В. Григорович

У багатошарових персептронах навчання проводиться із застосуванням алгоритму зворотного поширення помилки, що передбачає два проходження по всіх шарах мережі: пряме і зворотнє. При прямому проходженні образ (вхідний вектор) подається на сенсорні вузли мережі, після чого поширюється мережею від шару до шару. Під час прямого проходження усі синаптичні ваги мережі фіксовані, а під час зворотного ваги налаштовуються згідно з правилом корекції помилок, а саме: фактичний вихід мережі віднімається від бажаного (цільового) відгуку, в результаті чого формується сигнал помилки. Цей сигнал поширюється мережею у напрямку, зворотному синаптичним зв’язкам. Синаптичні ваги налаштовуються з метою максимального наближення вихідного сигналу мережі до бажаного в статистичному сенсі [22, с. 220]. Пошук найбільш адекватної структури персептрона зумовлює необхідність проведення експериментів із великим числом мереж різних конфігурацій, інколи навчаючи кожну з них кілька разів і порівнюючи отримані результати. При цьому кількість нейронів вхідного шару відповідає кількості незалежних змінних, а число нейронів вихідного шару дорівнює 2. Головним критерієм вибору найбільш ефективної мережі є контрольна похибка. У рамках даного дослідження побудова моделей проводилась з використанням пакету STATISTICA Neural Networks. Генеральна сукупність, очищена від спостережень, що містили аномальні викиди та пропущені значення, складалась із записів стосовно понад 8000 позичальників (серед яких 390 зазнали дефолту). Кожний запис містить показники попередньої кредитної історії та дані бухгалтерської звітності підприємств на момент видачі кредиту, для яких було обраховано 70 фінансових показників. Оскільки використання такої кількості факторів на практиці неминуче призводить до «прокляття розмірності», нейромережі конструювались на основі від 6 до 20 пояснюючих змінних, відібраних за трьома критеріями: Джині (Gini), V Крамера (Cramer’s V) та інформаційна значущість (Information Value). У ході проведення дослідження встановлено, що найнижчі похибки I роду властиві для моделей, пояснюючі змінні яких відібрано на основі V Крамера. До первинного переліку незалежних змінних включено фінансові показники, що наведені у табл. 1. 55


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Таблиця 1 ПЕРЕЛІК ФІНАНСОВИХ ПОКАЗНИКІВ ДЛЯ ПОБУДОВИ МОДЕЛЕЙ Незалежна змінна

V Крамера

К1

0,6379

Наявність дефолту за попередніми зобов’язаннями

К2

0,6351

Покриття боргу операційним грошовим потоком

К3

0,6069

Відношення операційного грошового потоку до фінансових витрат

К4

0,5958

Покриття боргу чистим доходом

К5

0,5706

Рентабельність виробництва

К6

0,5678

Оборотність дебіторської заборгованості

К7

0,5675

Рентабельність продажу

К8

0,5660

Маневреність робочого капіталу

К9

0,5531

Коефіцієнт фінансової незалежності

К10

0,5491

Частка боргу в активах підприємства

К11

0,5454

Відношення інвестицій у необоротні активи до амортизації

К12

0,5425

Оборотність активів

К13

0,5408

Рентабельність активів (ROE)

К14

0,5396

Відношення боргу до доходу

К15

0,5381

Відношення довгострокових зобов’язань до суми основних засобів та оборотних активів

К16

0,5331

Покриття боргу валовим прибутком

К17

0,5301

Відношення фінансових витрат до валового прибутку

К18

0,5224

Динаміка обсягу прибутку до вирахування витрат за відсотками, сплати податків та амортизаційних відрахувань за мінусом нефінансованих капітальних витрат (cash EBITDA)

К19

0,5095

Прибутковість активів

К20

0,5078

Рентабельність власного капіталу

Фінансовий показник

Джерело: розроблено автором

56


Застосування багатошарових персептронів…

О. В. Григорович

При роботі з усією генеральною сукупністю, де частка ненадійних позичальників становила лише 5 %, побудова адекватної моделі була неможливою, адже при такому співвідношенні надійних і ненадійних позичальників середня точність класифікації досягає 95,42 %, за якої похибка другого роду становить 0,07 %, у той час як похибка першого роду для деяких моделей сягає 100 %. Тому було прийнято рішення працювати з вибіркою, де спостереження з обох класів представлені у співвідношенні 50 % / 50 %, у результаті чого обсяг генеральної сукупності зменшено до 798 спостережень задля забезпечення однакової репрезентативності надійних і ненадійних позичальників. У ході дослідження проаналізовано більше ніж 3000 моделей типу багатошаровий персептрон. Виявлено, що оптимальні результати класифікації позичальників, котрі зазнали дефолту, досягаються за умови поділу генеральної сукупності на навчальну, тестову та контрольну вибірки у пропорції 70 : 15 : 15 (ілюстрацію такого дослідження наведено на рис. 3). 90,00%

85,00% 80,00% 75,00% 70,00% 6

7

8

9

10

70%-15%-15%

11

12

13

14

70%-10%-20%

15

16

17

18

19

20

70%-20%-10%

Рис. 3. Точність класифікації позичальників, які зазнали дефолту, при різній кількості факторів і пропорціях навчальних, тестових та контрольних вибірок Джерело: розроблено автором

Розмір навчальної вибірки залишався на рівні 70 % для достатньої репрезентативності обох класів позичальників. Середня 57


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

точність класифікації позичальників, котрі зазнали дефолту, за різних пропорцій тестових і контрольних вибірок становить відповідно: 1) 70 % : 15 % : 15 % — 80,23 %; 2) 70 % : 10 % : 20 % — 80,06 %; 3) 70 % : 20 % : 10 % — 79,13 %. Збільшення частки контрольної або тестової вибірки до 20 % при контрольній перевірці не приводить до зменшення помилки I роду. Також з рис. 3 можна бачити, що оптимальна кількість незалежних змінних для адекватної оцінки кредитоспроможності юридичних осіб становить не менше 11. Наведемо у табл. 2 перелік найадекватніших моделей, розрахованих для випадку, коли розмір навчальної вибірки становить 70 % від обсягу генеральної сукупності, тестової — 15 %, контрольної — 15 %. Таблиця 2 ПОКАЗНИКИ АДЕКВАТНОСТІ МОДЕЛЕЙ ТИПУ БАГАТОШАРОВИЙ ПЕРСЕПТРОН РІЗНИХ КОНФІГУРАЦІЙ Архітектура мережі, кількість входів, кількість нейронів проміжного та вихідного шару

Відсоток Відсоток Відсоток правильно правильно правильно класифікованих класифікованих класифікованих позичальників позичальників позичальників у навчальній у тестовій у контрольній вибірці, % вибірці, % вибірці, %

Функція активації прихованого шару

Функція активації вихідного шару

MLP 11-6-2

91,52

90,68

90,68

гіперболічсофтмакс ний тангенс

MLP 12-8-2

91,70

90,68

91,53

логістична софтмакс

MLP 13-15-2

92,06

90,68

92,37

гіперболічсофтмакс ний тангенс

MLP 14-10-2

91,70

91,53

92,37

гіперболічний тангенс софтмакс

MLP 18-14-2

93,66

92,37

92,37

гіперболічсофтмакс ний тангенс

Джерело: розроблено автором

58


Застосування багатошарових персептронів…

О. В. Григорович

Як свідчать дані табл. 2, відібрані пояснюючі змінні є достатніми для побудови адекватних моделей, адже відсоток правильно класифікованих позичальників-юридичних осіб із контрольної вибірки знаходиться на одному рівні з аналогічним показником для тестової вибірки, а в окремих випадках навіть перевищує його. Для побудованих моделей властиві досить низькі значення похибки І роду (висока точність класифікації позичальників, що зазнали дефолту). У табл. 3 наведено точність діагностування підприємств з обох класів найефективнішими нейромережами (позичальники, котрі зазнали дефолту, позначені через «1», а які виконали зобов’язання — через «0»). Таблиця 3 ТОЧНІСТЬ КЛАСИФІКАЦІЇ ПОЗИЧАЛЬНИКІВ Архітектура мережі, кількість входів, кількість нейронів проміжного та вихідного шару

Клас позичальника

Відсоток правильно класифікованих спостережень

0

96,22

1

86,31

0

95,88

1

87,07

0

97,25

1

86,31

0

96,22

1

86,69

0

97,59

1

89,31

MLP 11-6-2 MLP 12-8-2 MLP 13-15-2 MLP 14-10-2 MLP 18-14-2

Отже, для відібраних у ході проведення дослідження моделей похибка І роду становить 10,69 %–13,69 %, що свідчить про їх адекватність і можливість застосування банківськими установами при оцінці кредитоспроможності позичальників-юридичних осіб. Висновки. У дослідженні запропоновано використання багатошарових персептронів для оцінки кредитоспроможності позичальників-юридичних осіб. Побудова моделей передбачала етапи: 1) відбір пояснювальних змінних; 2) вибір типу мережі, функцій 59


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

активації, співвідношення навчальної, тестової та контрольної вибірок; 3) навчання мереж та відбір найефективніших на основі тестової помилки; 4) перевірка адекватності навчання на основі контрольної похибки. Проведено експериментальне дослідження із більше ніж 3000 моделями типу багатошаровий персептрон у інструментальному пакеті STATISTICA Neural Networks. Виявлено, що оптимальні результати діагностування позичальників, котрі зазнали дефолту, досягаються за умови поділу генеральної сукупності на навчальну, тестову та контрольну вибірки у пропорції 70 % : 15 % : 15 %. Оптимальна кількість пояснювальних змінних для адекватної оцінки кредитоспроможності юридичних осіб становить більше 10. За таких умов середня точність класифікації позичальників, що зазнали дефолту становить 80,23 %. Для п’яти найефективніших моделей, відібраних у ході дослідження (MLP 11-6-2, MLP 12-8-2, MLP 13-15-2, MLP 14-10-2, MLP 18-14-2), похибка І роду становила 10,69 %–13,69 %, що підтверджує можливість їхнього використання банківськими установами при оцінці кредитоспроможності позичальників-юридичних осіб.

Список літератури 1. Звіт про фінансову стабільність, червень 2019 р. Національний банк України : веб-сайт. URL: https://nbu1.bank.gov.ua/admin_uploads/ article/FSR_2019-R1.pdf. 2. Огляд банківського сектору, серпень 2019 року. Національний банк України : веб-сайт. URL: https://bank.gov.ua/file/download?file= Banking_Sector_Review_2019-08.pdf. 3. Новоселецький О. М., Якубець О. В. Моделювання кредитоспроможності юридичних осіб на основі дискримінантного аналізу та нейронних мереж. Нейро-нечіткі технології моделювання в економіці. 2014. № 3. C. 120–150. URL: http://nfmte.com/assets/journal/3/ Novoseletskyy_Yakubets.pdf. 4. Casin P. Categorical multiblock linear discriminant analysis. Journal of Applied Statistics. 2017. Vol. 45, No 8. P. 1396–1409. DOI: 10.1080/02664763.2017.1371678. 5. Савіна С. С., Бень В. П. Об’єднання моделей logit-регресій як комітету експертів для оцінки кредитоспроможності позичальника. Нейро-нечіткі технології моделювання в економіці. 2015. № 4. С. 154– 188. URL: http://nfmte.com/assets/journal/4/Savina_Ben.pdf. 60


Застосування багатошарових персептронів…

О. В. Григорович

6. Joos P., Vanhoof K., Sierens N., Ooghe H. Credit classification: a Comparison of Logit Models and Decision trees. Proceedings notes of the Workshop on Application of Machine Learning and Data Mining in Finance. 1998. P. 59–72. 7. Malik R., Hermawan H. Credit Scoring Using CART Algorithm and Binary Particle Swarm Optimization. International Journal of Electrical & Computer Engineering. 2018. Vol. 8, No. 6. P. 5425–5431. DOI: 10.11591/ ijece.v8i6.pp5425-5431. 8. West D. Neural Network Credit Scoring Models. Computers & Operations Research. 2000. Vol. 27, No. 11–12. P. 1131–1152. DOI: 10.1016/s0305-0548(99)00149-5. 9. Zhao Z., Xu S., Kang B. H., Kabir M. M. J., Liu Y., Wasinger R. Investigation and improvement of multi-layer perception neural networks for credit scoring. Expert Systems with Applications. 2015. Vol. 42, No. 7. P. 3508–3516. DOI: 10.1016/j.eswa.2014.12.006. 10. Tsai C., Wu J. Using neural network ensembles for bankruptcy prediction and credit scoring. Expert Systems with Applications. 2008. Vol. 34, No. 4. P. 2639–2649. DOI: 10.1016/j.eswa.2007.05.019. 11. Akkoç S. Exploring the nature of credit scoring: a neuro fuzzy approach. Fuzzy Economic Review. 2019. Vol. 24, No. 1. P. 3–24. DOI: 10.25102/fer.2019.01.01. 12. Клебан Ю. В. Діагностика платоспроможності підприємств із застосуванням нечіткої моделі Такагі-Сугено. Нейро-нечіткі технології моделювання в економіці. 2015. № 4. C. 62–79. URL: http://nfmte.com/ assets/journal/4/Kleban.pdf. 13. Matviychuk A. Bankruptcy prediction in transformational economy: discriminant and fuzzy logic approaches. Fuzzy economic review. 2010. Vol. XV, No. 1. P. 21–38. DOI: 10.25102/fer.2010.01.02. 14. Huang J., Tzeng G., Ong C. Two-stage genetic programming (2SGP) for the credit scoring model. Applied Mathematics and Computation. 2006. Vol. 174, No. 2. P. 1039–1053. DOI: 10.1016/j.amc.2005.05.027. 15. Mukid M. A., Widiharih T., Rusgiyono A., Prahutama A. Credit scoring analysis using weighted k nearest neighbor. Journal of Physics: Conference Series. 2018. Vol. 1025. P. 1–7. DOI: 10.1088/1742-6596/1025/1/012114. 16. Великоіваненко Г. І., Корчинський В. В., Чернишова В. В. Дослідження ефекту перенавчання нейронних мереж на прикладі задачі аплікаційного скорингу. Нейро-нечіткі технології моделювання в економіці. 2016. № 5. С. 3–23. URL: http://nfmte.com/assets/journal/5/ Velykoivanenko_Chernyshova_Korchynskyi.pdf. 17. Великоіваненко Г. І., Трокоз Л. О. Нейро-нечітка модель оцінювання прострочених позик комерційного банку. Нейро-нечіткі технології моделювання в економіці. 2014. № 3. C. 23–66. URL: http://nfmte.com/assets/journal/3/Velykoivanenko_Trokoz.pdf. 61


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

18. Матвійчук А. В. Штучний інтелект в економіці: нейронні мережі, нечітка логіка: монографія. К.: КНЕУ, 2011. 439 с. 19. Великоіваненко Г. І., Савіна С. С., Колечко Д. В., Бень В. П. Побудова ансамблів моделей кредитного скорингу. Нейро-нечіткі технології моделювання в економіці. 2018. № 7. C. 34–77. DOI: 10.33111/ nfmte.2018.034. 20. Савіна С. С., Бень В. П. Вибір архітектури нейромережі для розв’язання задачі класифікації надійності позичальників-фізичних осіб. Нейро-нечіткі технології моделювання в економіці. 2016. № 5. C. 123–151. URL: http://nfmte.com/assets/journal/5/Savina_Ben'.pdf. 21. Мінц О. Ю. Методологія моделювання інноваційних інтелектуальних систем прийняття рішень в економіці: монографія. Маріуполь: ДВНЗ «Приазовський державний технічний університет», 2017. 216 с. 22. Хайкин С. Нейронные сети: полный курс, 2-е издание. М.: Издательский дом «Вильямс», 2006. 1104 с.

References 1. The National Bank of Ukraine. (2019). Zvit pro finansovu stabilnist, cherven 2019 r. Retrieved from https://bank.gov.ua/admin_uploads/article/ FSR_2019-R1.pdf?v=4 [in Ukrainian]. 2. The National Bank of Ukraine. (2019). Ohliad bankivskoho sektoru, serpen 2019 r. Retrieved from https://bank.gov.ua/file/download?file= Banking_Sector_Review_2019-08.pdf [in Ukrainian]. 3. Novoseletskyi, O. M., & Yakubets, O. V. (2014). Modeliuvannia kredytospromozhnosti yurydychnykh osib na osnovi dyskryminantnoho analizu ta neironnykh merezh. Nejro-nechitki tekhnolohii modeliuvannia v ekonomitsi (Neuro-Fuzzy Modeling Techniques in Economics), 3, 120–150. Retrieved from http://nfmte.com/assets/journal/3/Novoseletskyy_Yakubets.pdf [in Ukrainian]. 4. Casin, P. (2017). Categorical multiblock linear discriminant analysis. Journal of Applied Statistics, 45(8), 1396–1409. DOI: 10.1080/ 02664763.2017.1371678. 5. Savina, S. S., & Ben, V. P. (2015). Obiednannia modelei logitrehresii yak komitetu ekspertiv dlia otsinky kredytospromozhnosti pozychalnyka. Nejro-nechitki tekhnolohii modeliuvannia v ekonomitsi (Neuro-Fuzzy Modeling Techniques in Economics), 4, 154–188. Retrieved from http://nfmte.com/assets/journal/4/Savina_Ben.pdf [in Ukrainian]. 6. Joos, P., Vanhoof, K., Sierens, N., & Ooghe, H. (1998). Credit classification: a Comparison of Logit Models and Decision trees. Proceedings notes of the Workshop on Application of Machine Learning and Data Mining in Finance, 59–72. 62


Застосування багатошарових персептронів…

О. В. Григорович

7. Malik, R. F., & Hermawan, H. (2018). Credit Scoring Using CART Algorithm and Binary Particle Swarm Optimization. International Journal of Electrical & Computer Engineering, 8(6), 5425–5431. DOI: 10.11591/ ijece.v8i6.pp5425–5431. 8. West, D. (2000). Neural Network Credit Scoring Models. Computers & Operations Research, 27(11–12), 1131–1152. DOI: 10.1016/s03050548(99)00149-5. 9. Zhao, Z., Xu, S., Kang, B. H., Kabir, M. M. J., Liu, Y., & Wasinger, R. (2015). Investigation and improvement of multi-layer perceptron neural networks for credit scoring. Expert Systems with Applications, 42(7), 3508– 3516. DOI: 10.1016/j.eswa.2014.12.006. 10. Tsai, C., & Wu, J. (2008). Using neural network ensembles for bankruptcy prediction and credit scoring. Expert Systems with Applications, 34(4), 2639–2649. DOI: 10.1016/j.eswa.2007.05.019. 11. Akkoç, S. (2019). Exploring the nature of credit scoring: a neuro fuzzy approach. Fuzzy Economic Review, 24(1), 3–24. DOI: 10.25102/ fer.2019.01.01. 12. Kleban, Yu. V. (2015). Diahnostyka platospromozhnosti pidpryiemstv iz zastosuvanniam nechitkoi modeli Takagi-Sugeno. Nejro-nechitki tekhnolohii modeliuvannia v ekonomitsi (Neuro-Fuzzy Modeling Techniques in Economics), 4, 62–79. Retrieved from http://nfmte.com/assets/journal/ 4/Kleban.pdf [in Ukrainian]. 13. Matviychuk, A. (2010). Bankruptcy prediction in transformational economy: discriminant and fuzzy logic approaches. Fuzzy economic review, 15(1), 21–38. DOI: 10.25102/fer.2010.01.02. 14. Huang, J., Tzeng, G., & Ong, C. (2006). Two-stage genetic programming (2SGP) for the credit scoring model. Applied Mathematics and Computation, 174(2), 1039–1053. DOI: 10.1016/j.amc.2005.05.027. 15. Mukid, M. A., Widiharih, T., Rusgiyono, A., & Prahutama, A. (2018). Credit scoring analysis using weighted k nearest neighbor. Journal of Physics: Conference Series, 1025, 1–7. DOI: 10.1088/1742-6596/1025/1/012114. 16. Velykoivanenko, H. I., Korchynskyi, V. V., & Chernyshova, V. V. (2016). Doslidzhennia efektu perenavchannia neironnykh merezh na prykladi zadachi aplikatsiinoho skorynhu. Nejro-nechitki tekhnolohii modeliuvannia v ekonomitsi (Neuro-Fuzzy Modeling Techniques in Economics), 5, 3–23. Retrieved from http://nfmte.com/assets/journal/5/Velykoivanenko_Chernyshova_ Korchynskyi.pdf [in Ukrainian]. 17. Velykoivanenko, H. I., & Trokoz, L. O. (2014). Neiro-nechitka model otsiniuvannia prostrochenykh pozyk komertsiinoho banku. Nejronechitki tekhnolohii modeliuvannia v ekonomitsi (Neuro-Fuzzy Modeling Techniques in Economics), 3, 23–66. Retrieved from http://nfmte.com/ assets/journal/3/Velykoivanenko_Trokoz.pdf [in Ukrainian].

63


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

18. Matviychuk, A. V. (2011). Shtuchnyi intelekt v ekonomitsi: neironni merezhi, nechitka lohika: monohrafiia. Kyiv, Ukraine: KNEU [in Ukrainian]. 19. Velykoivanenko, H. I., Savina, S. S., Kolechko, D. V., & Ben, V. P. (2018). Pobudova ansambliv modelei kredytnoho skorynhu. Nejro-nechitki tekhnolohii modeliuvannia v ekonomitsi (Neuro-Fuzzy Modeling Techniques in Economics), 7, 34–77. DOI: 10.33111/nfmte.2018.034 [in Ukrainian]. 20. Savina, S. S., & Ben, V. P. (2016). Vybir arkhitektury neiromerezhi dlia rozviazannia zadachi klasyfikatsii nadiinosti pozychalnykiv-fizychnykh osib. Nejro-nechitki tekhnolohii modeliuvannia v ekonomitsi (Neuro-Fuzzy Modeling Techniques in Economics), 5, 123–151. Retrieved from http://nfmte.com/assets/journal/5/Savina_Ben'.pdf [in Ukrainian]. 21. Mints, O. Yu. (2017). Metodolohiia modeliuvannia innovatsiinykh intelektualnykh system pryiniattia rishen v ekonomitsi: monohrafiia. Mariupol, Ukraine: DVNZ “Pryazovskyi derzhavnyi tekhnichnyi universytet” [in Ukrainian]. 22. Haykin, S. (1998). Neural Networks — A Comprehensive Foundation, Second Edition. New Jersey, NJ: Prentice-Hall. Стаття надійшла до редакції 11.08.2019

64


УДК 519.868:339.92 DOI 10.33111/nfmte.2019.065

ЗАСТОСУВАННЯ МЕТОДІВ МАШИННОГО НАВЧАННЯ ДО ПРОГНОЗУВАННЯ ЧАСОВИХ РЯДІВ КРИПТОВАЛЮТ

В. Д. Дербенцев Кандидат економічних наук, доцент, професор кафедри інформатики та системології Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» проспект Перемоги, 54/1, м. Київ, 03680, Україна derbvd@kneu.edu.ua

Г. І. Великоіваненко Кандидат фізико-математичних наук, професор, завідувач кафедри економіко-математичного моделювання Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» проспект Перемоги, 54/1, м. Київ, 03680, Україна ivanenko@kneu.edu.ua

Н. В. Даценко Старший викладач кафедри економіко-математичного моделювання Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» проспект Перемоги, 54/1, м. Київ, 03680, Україна d_tashakneu@ukr.net Робота присвячена питанням прогнозування короткострокової динаміки часових рядів криптовалют за допомогою методів машинного навчання (ML). Проаналізовано методологічні засади, переваги та недоліки використання ML-алгоритмів при дослідженні фінансових часових рядів. Проведено прогнозні розрахунки динаміки трьох найбільш капіталізованих криптовалют (Bitcoin, Ethereum, Ripple) на 90денний часовий горизонт як за допомогою запропонованого методу бінарного авторегресійного дерева (BART), так і з використанням нейронних мереж (багатошарового персептрону, MLP) та ансамблю моделей дерев регресії та класифікації (випадковий ліс, RF). Перевагою побудованих моделей є те, що їх застосування не накладає жорстких обмежень на статистичні властивості досліджуваних часових рядів, при цьому в якості предикторів використовуються лише минулі значення цільової змінної. Проведено порівняльний аналіз прогностичних властивостей побудованих моделей, згідно з яким усі моделі в цілому достатньо адекватно описують динаміку досліджуваних криптовалют, при цьому похибки прогнозу цін за середньою абсолютною про© В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко, 2019

65


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

центною похибкою (MAPE) для моделей BART та MLP склали в середньому 3,5 %, а для моделі RF — в межах 5 %. Проведені комп’ютерні експерименти підтвердили доцільність застосування розглянутих ML моделей для задач короткострокового прогнозування фінансових часових рядів. Побудовані моделі та їх ансамблі можуть бути покладені в основу алгоритмів для автоматизованих торгових систем, призначених для інтернеттрейдінгу. Ключові слова: машинне навчання, модель бінарного авторегресійного дерева, випадковий ліс, нейронна мережа, короткострокове прогнозування, криптовалюта, фінансовий часовий ряд.

ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ К ПРОГНОЗИРОВАНИЮ ВРЕМЕННЫХ РЯДОВ КРИПТОВАЛЮТ

В. Д. Дербенцев Кандидат экономических наук, доцент, профессор кафедры информатики и системологии Государственное высшее учебное заведение «Киевский национальный экономический университет имени Вадима Гетьмана» проспект Победы, 54/1, г. Киев, 03680, Украина derbvd@kneu.edu.ua

Г. И. Великоиваненко Кандидат физико-математических наук, профессор, заведующий кафедры экономико-математического моделирования Государственное высшее учебное заведение «Киевский национальный экономический университет имени Вадима Гетьмана» проспект Победы, 54/1, г. Киев, 03680, Украина ivanenko@kneu.edu.ua

Н. В. Даценко Старший преподаватель кафедры экономико-математического моделирования Государственное высшее учебное заведение «Киевский национальный экономический университет имени Вадима Гетьмана» проспект Победы, 54/1, г. Киев, 03680, Украина d_tashakneu@ukr.net Работа посвящена вопросам прогнозирования краткосрочной динамики временных рядов криптовалют с помощью методов машинного обучения (ML). Проанализированы методологические основы, преимущества и недостатки использования MLалгоритмов при исследовании финансовых временных рядов. Проведены прогнозные расчеты динамики трех наиболее капитализированных криптовалют (Bitcoin, Ethereum, Ripple) на 90-

66


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

дневный временной горизонт как с помощью предложенного метода бинарного авторегрессионного дерева (BART), так и с использованием нейронных сетей (многослойного персептрона, MLP) и ансамбля моделей деревьев регрессии и классификации (случайный лес, RF). Преимуществом построенных моделей является то, что их применение не накладывает жестких ограничений на статистические свойства изучаемых временных рядов, причем в качестве предикторов используются только предыдущие значения целевой переменной. Проведен сравнительный анализ прогностических свойств построенных моделей, согласно которому все модели в целом достаточно адекватно описывают динамику исследуемых криптовалют, при этом ошибки прогноза цен, рассчитанные по средней абсолютной процентной погрешности (MAPE), для моделей BART и MLP составили в среднем 3,5 %, а для модели RF — в пределах 5 %. Проведенные компьютерные эксперименты подтвердили целесообразность применения рассмотренных ML моделей для задач краткосрочного прогнозирования финансовых временных рядов. Построенные модели и их ансамбли могут быть положены в основу алгоритмов для автоматизированных торговых систем, предназначенных для интернет-трейдинга. Ключевые слова: машинное обучение, модель бинарного авторегрессионного дерева, случайный лес, нейронная сеть, краткосрочное прогнозирование, криптовалюта, финансовый временной ряд.

MACHINE LEARNING APPROACH FOR FORECASTING CRYPTOCURRENCIES TIME SERIES

Vasyl Derbentsev PhD (Economic Sciences), Docent, Professor of Informatics and Systemology Department State Higher Educational Establishment "Kyiv National Economic University named after Vadym Hetman" 54/1 Peremogy Avenue, Kyiv, 03680, Ukraine derbvd@kneu.edu.ua

Halyna Velykoivanenko PhD (Physics and Mathematical Sciences), Professor, Head of Department of Economic and Mathematical Modeling State Higher Educational Establishment "Kyiv National Economic University named after Vadym Hetman" 54/1 Peremogy Avenue, Kyiv, 03680, Ukraine ivanenko@kneu.edu.ua

67


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Natalia Datsenko Lecturer of Department of Economic and Mathematical Modeling State Higher Educational Establishment "Kyiv National Economic University named after Vadym Hetman" 54/1 Peremogy Avenue, Kyiv, 03680, Ukraine d_tashakneu@ukr.net This paper is devoted to the problems of the short-term forecasting cryptocurrencies time series using machine learning approach. The methodological principles, advantages and disadvantages of using ML-algorithms in the study of financial time series are analyzed. The 90-day time horizon of the three most capitalized cryptocurrencies (Bitcoin, Ethereum, Ripple) dynamics has been estimated both using the proposed Binary Autoregressive Tree model (BART), and Neural Networks (Multilayer Perceptron, MLP) and an ensemble of Classification and Regression Trees models (Random Forest, RF). The built models have such advantages as their application does not impose strict limitation on the statistical properties of the studied time series, with only past values of the target variable being used as predictors. Comparative performance of the predictive ability of the constructed models is carried out, according to which all the models adequately describe the dynamics of the cryptocurrencies. Price forecast errors calculated by the MAPE for the BART and MLP models were on average 3.5 %, and for RF model — within 5 %. Computer experiments have confirmed the feasibility of using proposed ML-models for the short-term forecasting of financial time series. The constructed models and their ensembles can become the basis for the algorithms for automated trading systems for online trading. Keywords: machine learning, binary autoregressive tree model, regression and classification tree ensemble, neural network, short-term forecasting, cryptocurrency, financial time series. JEL Classіfіcatіon: C53, C63, G10

Вступ Бурхливий розвиток і впровадження цифрових валют і технології блокчейн протягом останнього десятиріччя є однією із найсуперечливіших і найнеоднозначніших інноваційних технологій сучасної глобальної економіки. Значні коливання курсової вартості криптовалют, а також юридична неврегульованість операцій з ними у більшості країн світу зумовило значні ризики 68


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

інвестицій у криптоактиви. Це привело до гострих дискусій щодо їх місця та ролі у сучасній економіці. Тому питання розробки адекватних методів і моделей прогнозування цін на криптовалюти є актуальними як для наукової спільноти, так і для фінансових аналітиків, інвесторів і трейдерів. З методологічної точки зору можна виділити два принципово різні підходи до вирішення задачі прогнозування курсової динаміки. Перший полягає у побудові причинно-наслідкової казуальної моделі, яка описує взаємозв’язок між курсовою вартістю активу та іншими макроекономічними змінними. Інший підхід ґрунтується на аналізі спостережень досліджуваної змінної, а для здійснення прогнозу використовуються моделі часових рядів. Аналіз останніх теоретичних і прикладних досліджень свідчить, що на цінову динаміку криптовалют впливають багато латентних чинників, при цьому ці ключові фактори (драйвери) ще недостатньо вивчені та ідентифіковані [1–4]. Переважна більшість дослідників схиляється до думки, що на курсову вартість криптовалют не мають суттєвого впливу фундаментальні фактори, а визначається вона співвідношенням між попитом і пропозицією. Окрім цього, часові ряди криптовалюти характеризуються високим ступенем волатильності, нестаціонарністю та негаусівськими законами розподілу [5]. Тому застосування традиційних методів прогнозування, що ґрунтуються на використанні казуальних моделей, побудованих в рамках відповідної теоретичної концепції, або класичних моделей часових рядів виявляється малоефективним. Останні два десятиріччя до задач прогнозування фінансовоекономічних часових рядів почали застосовуватись методи та алгоритми машинного навчання, які розробляються в рамках парадигми Data Science [6–8], а для трейдінгу почали використовувати різноманітні автоматизовані торгові системи — боти, які побудовані на цих алгоритмах. При цьому головна увага дослідників була зосереджена переважно на використанні таких методів, як нейронні мережі та регресії на опорних векторах (Support Vector Regression). Застосування цих методів виявилось ефективним для задач прогнозування як «традиційних» фінансових активів (фондових 69


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

індексів, курсової вартості акцій тощо) [9–13], так і для інноваційних фінансових інструментів, зокрема, криптографічних валют [14–17]. Іншими потужними методами машинного навчання для задач прогнозування виявились дерева класифікацій і регресій та їх ансамблі (Classification and Regression Tree, C&RT), запропоновані Лео Брейманом з колегами [18, 19]. Необхідно зауважити, що моделі C&RT є ефективнішими для задач класифікації та регресії для випадку наявності у моделі пояснюючих змінних, але гірше пристосовані для роботи з часовими рядами [12]. У роботах [20, 21] запропоновано модель бінарного аворегресійного дерева, що є узагальненням моделей C&RT для випадку скалярних часових рядів. Результати застосування цих моделей до задач прогнозування курсової вартості криптовалют показали їх більшу ефективність, ніж моделей часових рядів семейства ARIMA-ARFIMA. Мета і завдання дослідження Головною метою нашої роботи є побудова ефективної моделі короткострокового прогнозування динаміки курсів криптовалют з урахуванням результатів проведення порівняльного дослідження прогностичних властивостей алгоритму бінарного авторегресійного дерева, штучних нейронних мереж та ансамблів регресійних дерев. Виклад основного матеріалу Методологія машинного навчання Протягом останнього часу серед дослідників і фахівців фінансового ринку все більшої популярності набуває новий напрям — машинне навчання (Machine Learning, ML), який знаходиться на стику математичної статистики, методів оптимізації та комп’ютерного моделювання, але має також і власну специфіку, обумовлену проблемами обчислювальної ефективності та перенавчання. Багато методів ML тісно пов’язані з видобутком інформації та інтелектуальним аналізом даних (Data Mining, DM) і розроблялися як альтернатива класичним статистичним підходам. Головною відмінністю ML від класичного моделювання є те, що алгоритми самі інтерпретують дані, тобто немає методологічної необхідності проводити їх початкову декомпозицію. Залежно 70


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

від мети аналізу ці алгоритми самі «вибудовують» логіку моделювання на основі наявних даних. Це дозволяє уникнути складного та тривалого предмодельного етапу статистичної перевірки різноманітних гіпотез щодо досліджуваного процесу. У зв’язку з цим основна задача дослідження зводиться до перевірки здатності методів ML ефективно аналізувати часові ряди криптовалют (як скалярні, так і векторні), виявляти в них приховані паттерни та часові кореляції, що є основою для здійснення якісних прогнозів. Вся сучасна технологія ML побудована на концепції шаблону (паттерну), що відображає фрагменти багатоаспектних зв’язків аналізованих даних, зокрема закономірності, які характерні для певних їх наборів. Важливою особливістю ML є те, що методи, які використовуються для пошуку шаблонів, не передбачають апріорної структури даних, їх статистичних властивостей і типу взаємозв’язків. У рамках парадигми ML розроблено низку потужних підходів, методів та алгоритмів: нейронні мережі (Artificial Neural Network, ANN), метод опорних векторів (Support Vector Machine, SVM), дерева класифікацій і регресій (Classification and Regression Tree, C&RT), ансамблі дерев регресій і класифікацій (Random Forest, RF; Gradient Boosting, XGBoost), глибокі нейронні мережі та глибоке навчання (Deep Learning, DL), ядерні методи (Kernel Methods) тощо [6]. Серед методів машинного навчання найбільшої популярності одержали нейронні мережі різноманітної архітектури, зокрема мережі глибинного навчання. Численні емпіричні дослідження свідчать про ефективність застосування ANN до задач розпізнавання образів, аналізу зображень і голосових повідомлень, машинного перекладу тощо. Їх усе частіше використовують для аналізу та прогнозування часових рядів, зокрема у фінансовій сфері. У роботах [9, 10, 14] показано, що ANN мають кращі прогностичні властивості, ніж моделі часових рядів та інші алгоритми ML для задач прогнозування фінансових показників. Іншим потужним класом моделей ML є дерева регресій і класифікацій та їх ансамблі. Але питанням застосування для задач аналізу часових рядів алгоритмам даної групи було приділено значно менше уваги, зокрема і в фінансовій сфері [12, 13]. 71


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Кожен з цих методів і підходів має власні переваги та недоліки. Беззаперечною перевагою зазначених методів є те, що вони: − не потребують жодних апріорних знань та/або припущень щодо вхідних даних; − мають високий рівень автоматизації, тобто математичний апарат для їх реалізації присутній у більшості програмних продуктів з інтелектуального аналізу даних; − здатні опрацьовувати масиви різнорідних даних як кількісних (метричних), так і якісних (категоріальних). Серед недоліків як ANN, так і C&RT, є їх схильність до перенавчання (overfitting) та велика кількість гіперпараметрів, що потребують налаштування. Перенавчання моделі призводить до того, що похибки прогнозу можуть суттєво зростати при застосуванні моделі до нових (або при збільшенні вибірки) даних. Для ANN притаманна «непрозорість» функції, що описує залежність між вхідними та вихідними нейронами, та значні витрати часу на налаштування. Крім того, вибір архітектури мережі, кількості прихованих шарів, нейронів на кожному з них і функцій активації в загальному випадку є нетривіальною задачею. До головних недоліків моделей дерев регресії та класифікації відносять їх меншу точність для задач регресії (порівняно, наприклад, з ANN) та неоднозначність вибору кращого фінального дерева (для задачі прогнозу). Але їх перевагами є те, що вони є інтуїтивно зрозумілими та простими при візуалізації та інтерпретації, тобто є прозорими для аналізу. Однак надто складні розгалужені дерева також важко піддаються змістовній інтерпретації, тому при їх використанні доводиться шукати компроміс між складністю дерева та його точністю. Ця проблема притаманна для переважної більшості ML алгоритмів. Що стосується алгоритму RF, який полягає у побудові ансамблю простих класифікаторів (дерев) та одержанні усередненої оцінки прогнозу кожного з дерев, які будуються на різних підмножинах ознак та випадково обраних навчальних підвибірках даних, то він набагато менш схильний до перенавчання, проте з точки зору змістовної інтерпретації є не надто «прозорим». Ми будемо використовувати технологію машинного навчання з вчителем (supervise learning), тобто навчальна та тестова вибірки містять класифікаційний набір прикладів. У нашому випадку 72


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

це значення прогнозу цільової змінної на один крок вперед (one step ahead forecast) Yt при відомих значеннях цільової змінної у p попередні моменти часу Yt −1 , Yt − 2 ,..., Yt − p (рис. 1).

Yt −1 Yt − 2  Yt − p

Yˆt

Рис. 1. Модель чорної скриньки для здійснення прогнозу

Таким чином, наша гіпотеза полягає у тому, що

(

)

P (Yt Y1 , Y2 ,..., Yt −1 , ) = F Yt Yt − p , Yt − p +1 ,..., Yt −1 ,  , p  t  T ,

(1)

де F (  ,  ) — сімейство умовних розподілів імовірності, що представляють модель;  — вектор невідомих параметрів; T — кількість спостережень у вихідному часовому ряді (навчальній вибірці). При цьому функція гіпотези має вигляд:

(

)

Yˆt = fˆ Yt − p , Yt − p +1 ,..., Yt −1 ,  +  t .

(2)

Тобто в якості факторів або ознак (в ML термінології — «фіч», feature) ми використовуємо лише минулі значення цільової змінної. Для здійснення прогнозу динаміки криптовалют та порівняння прогностичних властивостей різних ML алгоритмів ми використали три моделі: алгоритм бінарного авторегресійного дерева (Binary Auto Regressive Tree, BART), модель багатошарового персептрона (Multilayer Perceptron, MLP) та модель ансамблю дерев регресії «випадковий ліс» (RF). Загальну схему проведення нашого дослідження представлено на рис. 2. 73


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

Предобробка

2019, № 8

Збір даних

Навчальна вибірка

Тестова вибірка

Розмічений вхід

Розмічений вхід

Навчання

Навчання з учителем Налаштування Модель прогнозування Прогноз

Вихід

Результати прогнозування

Рис. 2. Концептуальна схема проведення дослідження

Необхідно зауважити, що при застосуванні методів ML доводиться вирішувати проблему «bias-variance trade-off», яка полягає в тому, що при настроюванні параметрів моделі доводиться шукати компроміс між похибкою прогнозу, зумовленою його зміщенням (Bias), та нестабільними значеннями параметрів (Var):

(

)

()

()

2 PE (Yt ) = M  Yt − fˆ (Yt )  = Bias 2 fˆ + Var fˆ +  2 ,  

(3)

де PE(Yt) — похибка прогнозу для довільного момену часу t; M(·) — оператор математичного сподівання; Yt , fˆ (Yt ) — точне значення часового ряду та його прогнозована оцінка, відповідно; Bias(·) — середнє зміщення прогнозу по усіх наборах даних; Var(·) — дисперсія похибки, яка в загальному випадку залежить від кількості параметрів моделі та їх точності (дисперсії); σ2 — неусувна похибка. Модель бінарного авторегресійного дерева Бінарне авторегресійне дерево (BART) — модель дерева класифікації та регресії, на листях якого містяться авторегресійні моделі ARIMA [20, 21]. Ця модель є узагальненням стандартних моделей C&RT та адаптацією до задач прогнозування часових 74


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

рядів. BART поєднує класичний алгоритм C&RT [18] та стандартні авторегресійні моделі ARIMA Бокса-Дженкінса. У BART для аналізу часового ряду застосовується метод «віконного» перетворення даних. Цільова змінна Yt в даному алгоритмі залежить від p попередніх значень досліджуваного часового ряду Yt −1 , Yt − 2 ,..., Yt − p . Таке розділення вхідного простору на сегменти (рис. 3) дозволяє побудувати для кожного з них власну (локальну) модель та представити кусково-задану функцію як дерево авторегресії в інтуїтивно наглядній формі.

Yt − 2

Yt −1 Yt Рис. 3. Умовний приклад розбиття даних з двома лаговими змінними на підмножини

При побудові BART кількість гілок (розгалужень) на кожному рівні дорівнює 2, оскільки будується бінарне авторегресійне дерево (тобто таке, яке має двох нащадків з кожного вузла). Процес побудови авторегресійного дерева виконується послідовно (ітераційно) та описується наступним алгоритмом [20, 21]. Етап 1. На першому кроці визначається порогове значення для розщеплення початкового (кореневого) вузла, яке береться як 75


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

медіана Ме (другий квантиль Q50%) навчального ряду (вибірки) Y до моменту часу t (Yt) і розраховується за формулою:

( )

(

)

Me Y t = Q50% = 0,5 * Yt min + Yt max ,

(4)

де Yt min ,Yt max — мінімальне та максимальне значення часового ряду Y до моменту часу t. Медіана часового ряду визначається як медіана розподілу реалізації випадкової величини до моменту часу t. Для стаціонарного ряду та ряду з симетричним розподілом ця величина не залежить від моменту спостереження і тоді вибіркова медіана буде співпадати з середнім значенням усього часового ряду, тобто Me(Y t ) = Y . Авторегресійна оцінка дерева на першому рівні розбиття буде мати вигляд:

( )

( )

f Y t = Me Y t I R (Yt -1 ) ,

(5)

де R — простір даних піддерева (на першому кроці вся навчальна вибірка); I R (Yt-1 ) — індикаторна функція простору, що набуває бінарних значень (фактично це набір правил потрапляння змінної Yt-1 у лівий або правий підпростори даних). На першому кроці весь часовий ряд за критерієм Yt −1  Me(Y t )t : p  t  T розбивається на дві підмножини:

( )

( ) t : p  t  T .

R1 = Yt −1  R : Yt −1  Me Y t ,R2 = Yt −1  R : Yt −1  Me Y t

Етап 2. На другому кроці обирається одна з підмножин, одержаних на першому кроці, яка також поділяється на дві частини. Визначається лагова змінна для розщеплення, наприклад Yt-k , k (1,2,..., p ) , та будуються спадкові лівий R1 і правий R2 підпростори даних (для спрощення запису індекси номеру ітерацій ми опустили): R1 = Yt − k  R : Yt − k  ,R2 = Yt − k  R : Yt − k   t : p  t  T . (6)

76


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

Тоді регресійна оцінка на наступному рівні розбиття набуває вигляду

( )

 1  1  f Y t =   Yt (−ik) I R1 (Yt − k ) +   Yt (−ik) I R2 (Yt −k ),  M I1   N I2 

(7)

де I1 = i, Yt (−ik)  R1 , I 2 = i, Yt (−ik)  R2  — множина індексів спостережень Yt (−ik) , що потрапляють у підпростори R1 та R2, відповідно; M, N — кількість елементів у цих підпросторах. Тут нижній індекс t–k характеризує лаг спостереження (предиктора), за яким буде здійснюватись розщеплення, а верхній індекс у дужках (i) — це номери спостережень Yt −k t : p  t  T , що потрапляють у лівий R1 і правий R2 підпростори даних після здійснення розщеплення. Фактично, регресійна оцінка (7) є середнім арифметичним спостережень, що потрапили у лівий і правий підпростори даних після здійснення розщеплення. Необхідно зауважити, що як у класичному алгоритмі Бреймана C&RT [18], так і його модифікаціях (наприклад, CHAID, С.4.5), незважаючи на його назву (дерево регресії та класифікації), насправді прогноз не здійснюється за допомогою регресійної моделі. В якості прогнозу обирається середнє арифметичне спостережень, які потрапили у відповідний підпростір даних (атомарний вузол-лист дерева, який не підлягає подальшому розщепленню). Тому в якості прогнозованого значення береться константа, одержана за формулою виду (7) (після виконання певної кількості кроків алгоритму). Отже, для використання класичного алгоритму C&RT та його модифікацій для задач прогнозування часових рядів необхідно будувати складні розгалужені дерева, намагаючись одержати на листках дерева невелику кількість однорідних спостережень. А це, як було зазначено вище, досить часто призводить до перенавчання моделі та, як наслідок, до значних похибок прогнозу на контрольній (або тестовій) вибірці, яку не було використано при оцінці параметрів моделі. Для подолання цього недоліку класичного алгоритму нами було запропоновано будувати на листках локальні авторегресійні моделі ARIMA, які здатні краще апроксимувати дані, що потрапили у певну підмножину (лист дерева) після виконання деякої 77


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

кількості кроків розбиття простору вхідних даних. Оцінкою кращого розбиття за усією моделлю BART є найменша сума квадратів різниць:

()

(

(

1 T R fˆ =  Yt − fˆ Yt −1 , Yt −2 ,...,Yt − p T t = p +1

))

2

,

(8)

де fˆ () — функція гіпотези (2). В алгоритмі BART в якості цієї функції нами було запропоновано обирати модель типу ARIMA. Етап 3. Для кожного вузла, одержаного на попередньому кроці, здійснюється пошук нового кращого розщеплення. Для цього задаються два аргументи: змінна Yt-k, k ϵ(1,2…, p), за якою буде здійснюватись розщеплення (сплітування), та порогове значення цієї змінної α. У дослідженні ми використовували в якості порогових значень квантилі відповідного емпіричного розподілу випадкової величини Y (значення, яке задана випадкова величина не перевищує з певною ймовірністю):   (Q10% , Q25% , Q40% , Q50% , Q60% , Q75% , Q90% ).

(9)

З можливих на цьому кроці варіантів розщеплення обирається «краще» за прийнятим правилом. Ці процедури проводяться аналогічно алгоритму C&RT. Відмінність полягає в прийнятих правилах, критеріях оцінки та зупинці розщеплення. У BART запропоновано альтернативний критерій обрання кращого розщеплення (або критерій інформативності) на основі показника ентропії, оскільки це приводить до зменшення складності дерева. У даному алгоритмі визначається ентропійний інформаційний виграш. Вихідна ентропія всієї вибірки на першому кроці буде ˆ H (M , N ) . В якості функції ентропії ми використали ентропію Шенона (10). Вона характеризує кількість інформації (або, іншими словами, ступінь невизначеності) щодо початкового поділу вибірки на два класи (підмножини), що здійснюється на першому етапі згідно порогу (4). Частотна ймовірність потрапляння певноN M го спостереження буде дорівнювати та для лівого M +N M +N R1 та правого R2 підпростору, відповідно. 78


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

На кожному кроці оцінюється ймовірність як частота віднесення деякого спостереження Yt-k, k ϵ(1,2…, p) для t  p + 1,..., T , до певної підмножини (піддерева) і розраховується ентропія Ĥ l-ї підвибірки до здійснення розщеплення ( y l  Y ): n   m Hˆ (m, n ) = H  + , M +N M +N

(10)

де m, n — кількість спостережень, які відповідають умовам належності підмножинам R1 і R2 для відповідного вузла до здійснення розщеплення за обраним предиктором (m  M , n  N ) . Після здійснення l-го розщеплення в обраному вузлі за певним предиктором Yt-k (внаслідок чого ми отримаємо додаткову інформацію ϕ щодо приналежності певного спостереження відповідl ному підпростору даних) ентропія підвибірки y1  R1l буде Hˆ (m, n ) , а ймовірність появи об’єкта з цієї вибірки буде обчисl люватись як m + n . Аналогічно для вибірки y 2  R2l ентропія

M +N

буде Hˆ (M − m, N − n ) з відповідною імовірністю (M − m ) + (N − n ) . M +N

Тут R1l та R2l — лівий і правий підпростори даних після здійl l снення l-го розщеплення, а y1 та y2 — множини спостережень l Yt (−ik) , що потрапили у ці підпростори, y1  y 2 = y . l

l

Таким чином, ентропія всієї вибірки після отримання інформації ϕ обчислюється за формулою m+n ˆ M + N − ( m + n) ˆ Hˆ  (m,n ) = H (m,n ) + H (M − m,N − n ) . (11) M +N M +N

Вираз (11) показує ентропію вибірки після того, як стало відомо, що при здійсненні розбиття певного вузла за умовою Yt-k ≤ α предиктор Yt-k виділив m спостережень із M і n спостережень із N. У такому разі зменшення ентропії складатиме

( )

IGainC ,y l = Hˆ (m, n ) − Hˆ  (m, n ) ,

що називається ентропійним інформаційним виграшем. 79

(12)


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Тут перший доданок характеризує ентропію у батьківському вузлі, а другий (обчислений за (11)) є зваженою сумою ентропії у вузлах нащадках після розщеплення. Отже, вираз (12) характеризує зменшення вибіркової ентропії (або приріст інформації) до і після здійснення розщеплення в обраному вузлі за певним предиктором (в нашому випадку лаговою змінною Yt-k). Таким чином, для здійснення кожного наступного розщеплення обирається той вузол та лагова змінна (і, відповідно, порогове значення α), які забезпечать максимальне зменшення ентропії (12). Етап 4. На наступному кроці здійснюється оцінка «вартості» дерева, яка характеризує співвідношення між точністю апроксимації та складністю (розгалуженістю) побудованого дерева. У BART вартість дерева визначається на основі критерію ранньої зупинки. В якості такого критерію ми використовували розширений байєсівський інформаційний критерій (Extended Bayesian Information Criterion, EBIC), який мінімізує статистику

()

EBIC = T  ln R fˆ + J  ln (T ) + 2  ln (b ) ,

(13)

де T — кількість прикладів навчальної вибірки; R ( fˆ ) — середньоквадратична похибка (8); J — кількість параметрів налаштування моделі; b — величина, яка характеризує складність моделі та дорівнює добутку розміру дерева (кількість розгалужень у дереві) на кількість лагових змінних (p). Таким чином у виразі (13) перший доданок — це значення логарифмічної функції середньоквадратичної похибки, а другий є штрафом за складність моделі. Етап 5. Розщеплення вузлів проводиться до тих пір, поки значення статистики EBIC зменшується. Якщо обране розщеплення ефективне за ентропійним інформаційним виграшем (12), то потрібно його виконати та перейти знову до етапу 3 (розглянути інші неопрацьовані вузли). В іншому випадку побудоване дерево вважається оптимальним, а процедура виконання алгоритму BART — завершеною. Оскільки кінцевою метою наведеного алгоритму є прогнозування, то на вузлах-листях нами запропоновано будувати стан80


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

дартну авторегресійну модель класу ARIMA, яка є базовою галузевою моделлю аналізу та моделювання часових рядів. Як у цілому для регресійних дерев C&RT, так і, зокрема, для BART, процедура спрощення (тобто ранньої зупинки розгалуження дерева) є важливішою, ніж для дерев класифікації. Це пояснюється тим, що дерева регресії, як правило, є складнішими та розгалуженішими, оскільки діапазон значень досліджуваного показника (наприклад, ціни криптовалюти) значно ширше, ніж для якісних (категоріальних) даних. Модель «випадкового лісу» Алгоритм випадкового лісу ґрунтується на побудові ансамблю класифікаційних (регресійних) дерев, кожне з яких утворюється з підвибірок вихідної навчальної вибірки з використанням беггінгу (скорочення від «bootstrap aggregating») [19]. Беггінг — це метод створення ансамблю моделей на основі різних випадкових вибірок з вихідного набору даних. Вибірки формуються рівномірно із заміною і називаються підсилюючими вибірками (bootstrap samples) [6]. Ефективність беггінгу досягається завдяки тому, що базові алгоритми, які пройшли навчання на різних підвибірках, будуть суттєво відрізнятись один від одного, при цьому їхні помилки взаємно компенсуються при «голосуванні». А також за рахунок того, що об’єкти-викиди (аномальні спостереження, стрибки часового ряду) можуть не потрапляти до деяких навчальних підвибірок. Беггінг особливо корисний у поєднанні з деревоподібними моделями, які є чутливими до зміни навчальних даних. В алгоритмі RF беггінг поєднується з методом випадкових підпросторів, коли кожне дерево будується за різними випадково обраними підмножинами ознак (фіч), які називаються вибірками підпростору (subspace sampling). Метод випадкових підпросторів дозволяє знизити корельованість між деревами та уникнути перенавчання, оскільки базові алгоритми навчаються на різних підмножинах ознак, які також обираються випадковим чином. У результаті, різноманіття ансамблю буде ще більшим, при цьому зменшується час його налаштування, оскільки кожне з дерев можна навчати паралельно. Одержаний у такий спосіб ансамбль називається випадковим лісом (random forest, RF). 81


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

RF метод застосовується як для задач класифікації, так і для регресії, крім цього за допомогою RF також можна проводити відбір предикторів і пошук відхилень при аналізі даних. Значення прогнозу з використанням алгоритму RF знаходиться шляхом усереднення прогнозів, одержаних кожним деревом ансамблю (або «голосуванням» дерев для задач класифікації). На відміну від окремих дерев, цей алгоритм набагато менше схильний до перенавчання та дає більш чутливу (гнучку) границю прийняття рішень. Модель нейронної мережі В якості моделі ANN ми використали найпростішу та найпоширенішу архітектуру багатошарового персептрона з одним вхідним шаром нейронів, одним прихованим шаром і вихідним шаром, що містить один вихід — оцінку прогнозу досліджуваного часового ряду на один крок (рис. 4). Незважаючи на таку просту архітектуру, згідно з теоремою Колмогорова внаслідок використання суперпозиції нелінійних функцій активації на прихованому та вихідному шарах мережі можна виявити складні нелінійні паттерни в даних і змоделювати з достатньою точністю невідому нелінійну функцію досліджуваного часового ряду. Вхід

Прихований шар

Yt −1

1

1

Yt − 2

2

2

Yˆt k

Yt − p

p

k

р – кількість нейронів

k – кількість нейронів

Рис. 4. Модель тришарового персептрона 82


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

Значення виходу мережі залежать від її конфігурації, вагових коефіцієнтів міжнейронних зв’язків та функцій активації нейронів прихованого та вихідного шарів: ,

(14)

де f (), g () — функції активації нейронів прихованого та вихідного шару, відповідно; wi — ваги зв’язків між i-им нейроном прихованого шару та виходом мережі; ωji — ваги зв’язків між j-им нейроном вхідного та i-им нейроном прихованого шарів; b0 , bi — зміщення (bias) нейронів вихідного та прихованого шарів. У процесі навчання MLP, яке полягає у знаходженні вагових коефіцієнтів (синаптичних ваг), використовується функція похибки (error or cost function), що визначає різницю між цільовою змінною та виходом мережі (аналогічно до (8)). Пошук мінімуму функції похибки здійснювався за допомогою методу градієнтного спуску (gradient descent), втіленого в алгоритмі зворотного поширення похибки (back-propagation algorithm). Статистична база дослідження Для чисельної реалізації моделей короткострокового прогнозування динаміки криптовалют з використанням алгоритмів BART, RF і MLP було обрано часові ряди щоденних котирувань трьох найбільш капіталізованих (станом на 21.08.2019) криптовалют: біткоіна (BTC), ефіріума (ETH) та ріпла (XRP). Вибірка даних складає 1482 спостереження за період з 01.08.2015 по 21.08.2019 за інформацією сервісу Yahoo Finance [22]. Для аналізу було обрано ціни закриття, які було взято як в абсолютному вираженні, так і в натуральних логарифмах, що дозволяє стабілізувати варіативність (дисперсію) досліджуваних рядів (рис. 5). Перші 1392 спостереження для побудованих нами моделей було розділено у співвідношенні 80 % на 20 % між навчальною та тестовою вибіркою та використано для оптимізації структури і параметрів моделей, а останні 90 спостережень було зарезервовано для оцінки якості прогнозу на незалежних даних. 83


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Емпіричні результати Оскільки усі три типи моделей для здійснення прогнозу використовують лише минулі спостереження досліджуваного часового ряду, то одним із головних завдань їх ідентифікації є вибір глибини лагу p. Згідно з результатами багатьох емпіричних досліджень, для «традиційних» фінансових активів (фіатних валют, фондових та товарних індексів, курсів акцій тощо), які торгуються протягом п’яти днів на тиждень, існує циклічний лаг, який є кратним 5, якщо використовувати щоденні спостереження [10, 11]. 12,00

ln (BTC)

ln (ETH*10)

ln (XRP*1000)

10,00 8,00 6,00 4,00

01.08.2019

01.06.2019

01.04.2019

01.02.2019

01.12.2018

01.10.2018

01.08.2018

01.06.2018

01.04.2018

01.02.2018

01.12.2017

01.10.2017

01.08.2017

01.06.2017

01.04.2017

01.02.2017

01.12.2016

01.10.2016

01.08.2016

01.06.2016

01.04.2016

01.02.2016

01.12.2015

01.10.2015

0,00

01.08.2015

2,00

Рис. 5. Динаміка щоденних цін закриття BTC, ETH та XRP за період 1.08.2015 — 21.08.2019 (дол. США, логарифмічна шкала)

Оскільки криптовалюти торгуються у режимі 24/7, то цілком очікуваним буде наявність сезонного лагу, кратного 7 дням. Проведення кореляційного аналізу із використанням автокореляційної та часткової автокореляційної функції підтверджує нашу гіпотезу: для усіх трьох досліджуваних коінів наявні статистично-значущі кореляції на лагах 7, 14, 21, 28, окрім цього існують кореляції і на деяких інших лагах. Схожі результати одержано, зокрема, у роботах [5, 17]. Для здійснення короткострокового прогнозу ми тестували 3 класи моделей (BART, RF, MLP) з різною глибиною лагу 84


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

p = 7, 14, 21 для кожної з криптовалют. Модельні розрахунки для MLP і RF проводились у пакеті Satistica 8.0, а для реалізації алгоритму BART було використано MS Azure Machine Learning Studio із застосуванням R-скрипту. Згідно з прийнятою нами гіпотезою щодо глибини лагу в якості моделей MLP ми тестували такі архітектури: − із 7 вхідними та від 4 до 12 нейронів прихованого шару; − із 14 вхідними та від 5 до 15 нейронів прихованого шару; − із 21 вхідними та від 6 до 21 нейронів прихованого шару. В якості функцій активації було обрано такі найпоширеніші функції, як логістична, гіперболічний тангенс, експоненційна та тотожна (лінійна). Навчання мереж для кожної з криптовалют і різних значеннях лагу (кількості вхідних нейронів) проводилось протягом 100 епох, з яких для кожного випадку обиралось п’ять кращих (з точки зору мінімальної похибки PE (3) на тестовій вибірці та відповідності залишків моделі нормальному розподілу) архітектур. Остаточний прогноз для кожної з криптовалют було одержано як розрахунок ансамблю мереж, тобто середньоарифметичне п’яти відповідних кращих моделей MLP. Для реалізації RF ми встановили такі метапараметри: загальна кількість дерев 200, максимальна глибина дерева 10, кількість предикторів у кожному дереві — 3, 5, 7 для моделей RF-7, RF-14 та RF-15, відповідно. Для реалізації BART було обрано максимальну глибину дерева 15, а мінімальна кількість прикладів (спостережень) у вузлі дорівнювала 20. Розрахунки було здійснено як для абсолютних значень цін, так і для їх логарифмів. Для оцінки точності прогнозу ми скористались такими метриками, як середня абсолютна процентна похибка (Mean Percentage Absolute Error, MAPE) та середньоквадратична похибка (Root Mean Square Error, RMSE), що розраховуються за формулами: MAPE =

ˆ 1 n Yt − f (Yt )  100% ,  n t =1 Yt

(15) RMSE =

(

)

2 1 n  Yt − fˆ (Yt ) . n t =1

85


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Cлід зазначити, що показник RMSE можна застосувати тільки для оцінки якості різних прогнозів для одного фінансового інструменту (часового ряду). Він надає інформацію про величину похибки, але не про те, наскільки ця похибка велика у порівнянні з реальним значенням котирування. На відміну від RMSE, MAPE у процентах дозволяє оцінити ефективність прогнозів як окремих моделей, так і їх ансамблів для різних активів і порівнювати їх між собою. Необхідно зауважити, що точність прогнозу за метриками (15) для логарифмів цін досліджуваних часових рядів виявилась у цілому не вищою, ніж для абсолютних значень цін. Цей факт підтверджує тезу про значно меншу чутливість алгоритмів ML, зокрема моделей нейронних мереж, регресійних дерев і їх ансамблів до статистичних властивостей досліджуваних рядів, ніж класичних статистичних та економетричних методів. На рис. 6–8 наведено остаточні результати прогнозування динаміки абсолютних значень цін досліджуваних криптовалют на 90денний часовий горизонт, який здійснювався за технологією однокрокового прогнозу без переналаштування параметрів моделей. 14000 BTC TARGET BART-14 RF-14 MLP-14

13000

12000

11000

10000

9000

8000

7000 1

5

9

13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89

Рис. 6. Прогноз динаміки BTC (лаг p=14) 86


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

360 340 ETH TARGET BART-21 RF-21 MLP-21

320 300 280 260 240 220 200 180 160 1

5

9

13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93

Рис. 7. Прогноз динаміки ETH (лаг p=21) 0,50 XRP TARGET BART-14 RF-14 MLP-14

0,48 0,46 0,44 0,42 0,40 0,38 0,36 0,34 0,32 0,30 0,28 0,26 0,24 1

5

9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93

Рис. 8. Прогноз динаміки XRP (лаг p=14) 87


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Безпосередній аналіз графіків дозволяє зробити висновок про в цілому достатньо адекватне слідування моделей реальним даним, враховуючи складну осцилюючу динамічну поведінку досліджуваних рядів, при цьому для BTC простежується наявність зростаючої тенденції, а для ETH та XRP — навпаки. Також можна побачити, що всі моделі, незважаючи на в цілому адекватне врахування наявних тенденцій динаміки криптовалют, демонструють певне запізнення щодо реальних даних. Підсумкові результати оцінки точності прогнозу на 90 днів за усіма моделями для досліджуваних рядів наведено у табл. 1. Таблиця 1 РЕЗУЛЬТАТИ ОЦІНКИ ТОЧНОСТІ ПРОГНОЗУ BTC

Модель

MAPE, %

ETH RMSE

MAPE, %

XRP RMSE

MAPE, %

RMSE

Глибина лагу p=7 BART-7

3,71

535,2

3,39

11,74

3,07

0,0154

RF-7

7,11

971,9

7,44

21,8

3,94

0,0196

MLP-7

3,69

529,8

3,53

12,17

3,07

0,0153

Глибина лагу p=14 BART-14

3,83

541,9

3,37

11,86

3,42

0,0167

RF-14

5,6

756,9

6,48

19,82

4,08

0,0203

MLP-14

3,95

559,1

3,51

12,16

3,41

0,0162

Глибина лагу p=21 BART-21

3,94

558,5

3,69

12,55

3,83

0,0183

RF-21

5,54

739,3

4,52

14,55

3,92

0,0212

MLP-21

4,28

610,8

3,84

13,17

2,98

0,0151

Як свідчать результати моделювання, наведені в табл. 1, точність прогнозу як алгоритму BART, так і MLP виявилась значно вищою для усіх лагів і рядів, ніж для алгоритму RF. Порівняно невисока точніcть прогнозування RF може бути обумовлена тим, що для його ефективної реалізації необхідне використання значно більшої кількості факторів. Можна побачити, що точність RF зростає при збільшенні глибини лагу. 88


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

Що стосується порівняння ефективності MLP і BART, то як свідчать дані рис. 6–8 та табл. 1, ці моделі показали точність одного порядку: найменша похибка для BTC склала 3,69 % (модель MLP), для ETH — 3,37 % (BART), для XRP — 2,98 % (MLP). Дещо неочікуваною виявилось незначне зменшення точності як MLP, так і BART (принаймні для BTC та ETH) при збільшенні глибини лагу. На нашу думку, це може бути пов’язано з перенавчанням зазначених моделей. Висновки та перспективи подальших досліджень Одержані нами результати моделювання короткострокової динаміки криптовалют дозволяють зробити висновок щодо ефективності використання для вирішення подібних задач методів та алгоритмів машинного навчання, зокрема, моделей нейронних мереж, регресійних (авторегресійних) дерев та їх ансамблів. Згідно з результатами проведеного дослідження, ці моделі дозволяють зробити короткостроковий прогноз із похибкою в межах 3–4 %. При цьому необхідно зауважити, що ми використовували лише мінімальний набір даних — тільки лагові значення досліджуваних рядів (цін закриття). Точність прогнозу можна підвищити, якщо використовувати більш повний дата сет, наприклад, включити до моделей такі фактори, як ціни відкриття, максимальна, мінімальна та середня ціна, обсяг торгів тощо. Окрім цього можна використовувати також різноманітні індекси, осцилятори, зокрема плинні середні різних порядків, що враховують динаміку тренду. Щодо використання для задач прогнозування фінансових часових рядів моделей нейронних мереж, то в цій роботі ми застосували просту модель мережі персептронного типу з одним прихованим шаром. Використання мереж із більш складною архітектурою: рекурентних, самоорганізованих, глибинного навчання тощо має також підвищити точність прогнозних розрахунків. Підсумовуючи, зауважимо, що, на наш погляд, перспективним напрямом розвитку технологій прогнозування фінансових часових рядів є побудова комбінованих деревоподібних моделей і нейронних мереж, зокрема ансамблів моделей типу випадкового лісу, в якому в якості атомарних дерев використовують моделі BART, при цьому в якості елементарних предикторів у деревах типу BART можна використати замість регресій (авторегресій) мережі персептронного типу. 89


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Список літератури 1. Top Economists Stiglitz, Roubini and Rogoff Renew Bitcoin Doom Scenarios. CNBC: website. URL: https://www.cnbc.com/2018/07/09/nobelprize-winning-economist-joseph-stiglitz-criticizes-bitcoin.html. 2. Selmi R., Tiwari A., Hammoudeh S. Efficiency or speculation? A dynamic analysis of the Bitcoin market. Economic Bulletin. 2018. Vol. 38, Iss. 4. P. 2037–2046. 3. Cheah E., Fry J. Speculative bubbles in Bitcoin markets? An empirical investigation into the fundamental value of bitcoin. Economic Letters. 2015. Vol. 130. P. 32–36. 4. Ciaian P., Rajcaniova M., Kancs D. The economics of BitCoin price formation. Applied Economics. 2016. Vol. 48, Iss. 19. Р. 1799–1815. 5. Catania L., Grassi S. Modelling Crypto-Currencies Financial TimeSeries. CEIS Research Paper. 2017. Vol. 15, Iss. 8, No. 417. P. 1–39. URL: https://ideas.repec.org/p/rtv/ceisrp/417.html. 6. Flach P. Machine Learning: The Art and Science of Algorithms that Make Sense of Data. Cambridge: Cambridge University Press, 2012. 400 р. 7. Bontempi G., Taieb S., Borgne Y. Machine Learning Strategies for Time Series Forecasting. Business Intelligence. eBISS 2012. Lecture Notes in Business Information Processing. Berlin, Heidelberg: Springer-Verlag, 2013. Vol. 138. P. 62–77. DOI: 10.1007/978-3-642-36318-4_3. 8. Persio L., Honchar O. Multitask machine learning for financial forecasting. International Journal of Circuits, Systems and Signal Processing. 2018. Vol. 12. P. 444–451. 9. Boyacioglu M., Baykan O. K. Predicting direction of stock price index movement using artificial neural networks and support vector machines: The sample of the Istanbul Stock. Exchange Expert Systems with Applications. 2011. Vol. 38, Iss. 5. P. 5311–5319. 10. Матвійчук А. В. Моделювання економічних процесів із застосуванням методів нечіткої логіки: Монографія. К.: КНЕУ, 2007. 264 c. 11. Okasha M. K. Using Support Vector Machines in Financial Time Series Forecasting. International Journal of Statistics and Applications. 2014. Vol. 4, № 1. P. 28–39. DOI: 10.5923/j.statistics.20140401.03. 12. Varghade P., Patel R. Comparison of SVR and Decision Trees for Financial Series Prediction. International Journal on Advanced Computer Theory and Engineering. 2012. Vol. 1, Iss. 1. P. 101–105. 13. Kumar M. Forecasting Stock Index Movement: A Comparison of Support Vector Machines and Random Forest. SSRN Working Paper. Indian Institute of Capital Markets 9th Capital Markets Conference Paper. 2006. P. 1–16. DOI: 10.2139/ssrn.876544. 14. Hitam N. A., Ismail A. R. Comparative Performance of Machine Learning Algorithms for Cryptocurrency. ResearchGate. 2018. P. 1–11. URL: https://www.researchgate.net/publication/327415267. 90


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

15. Akyildirim E., Goncuy A., Sensoy A. Prediction of Cryptocurrency Returns using Machine Learning. ResearchGate. 2018. P. 1–28. URL: https://www.researchgate.net/publication/329322600. 16. Yao Y., Yi J., Zhai S., Lin Y., Kim T., Zhang G., Lee L. Y. Predictive Analysis of Cryptocurrency Price Using Deep Learning. International Journal of Engineering & Technology. 2018. Vol. 7, No. 3.27. P. 258–264. DOI: 10.14419/ijet.v7i3.27.17889. 17. Alessandretti L., ElBahrawy A., Aiello L., Baronchelli A. Anticipating Cryptocurrency Prices Using Machine Learning. Complexity. 2018. Vol. 2018. P. 1–16. DOI: 10.1155/2018/8983590. 18. Breiman L., Friedman H., Olshen R. A., Stone C. J. Classification and Regression Trees. Belmont: Wadsworth International Group, 1984. 368 р. 19. Breiman L. Random Forests. Machine Learning. 2001. № 45. P. 5–32. DOI: 10.1023/A:1010933404324. 20. Даценко Н.В. Застосування дерев класифікації та регресії до прогнозування часових рядів фінансових інструментів. Вчені записки. Сер. Економіко-математичні методи. 2018. № 19. С. 169–181. 21. Derbentsev V., Datsenko N., Stepanenko O., Bezkorovainyi V. Forecasting Cryptocurrency Prices Time Series Using Machine Learning. CEUR Workshop Proceedings. 2019. Vol. 2422. P. 320–334. URL: http://ceur-ws.org/Vol-2422/paper26.pdf. 22. Stock Market. Yahoo Finance : website. URL: https://finance.yahoo.com (Last accessed: 22.08.2019).

References 1. CNBC. (2018, July 9). Top Economists Stiglitz, Roubini and Rogoff Renew Bitcoin Doom Scenarios. Retrieved from https://www.cnbc.com/2018/ 07/09/nobel-prize-winning-economist-joseph-stiglitz-criticizes-bitcoin.html. 2. Selmi, R., Tiwari, A., & Hammoudeh, S. (2018). Efficiency or speculation? A dynamic analysis of the Bitcoin market. Economic Bulletin, 38(4), 2037–2046. 3. Cheah, E., & Fry, J. (2015). Speculative bubbles in Bitcoin markets? An empirical investigation into the fundamental value of bitcoin. Economic Letters, 130, 32–36. 4. Ciaian, P., Rajcaniova, M., & Kancs, D. (2016). The economics of BitCoin price formation. Applied Economics, 48(19), 1799–1815. 5. Catania, L., & Grassi, S. (2017). Modelling Crypto-Currencies Financial Time-Series. CEIS Research Paper, 15(8), 1–39. Retrieved from https://ideas.repec.org/p/rtv/ceisrp/417.html. 6. Flach, P. (2012). Machine Learning: The Art and Science of Algorithms that Make Sense of Data. Cambridge, UK: Cambridge University Press. 91


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

7. Bontempi, G., Taieb, S., & Borgne, Y. (2013). Machine Learning Strategies for Time Series Forecasting. In: M. A. Aufaure, & E. Zimányi (Eds.), Business Intelligence. eBISS 2012. Lecture Notes in Business Information Processing, 138 (pp. 62–77). Berlin, Heidelberg, Germany: SpringerVerlag. DOI: 10.1007/978-3-642-36318-4_3. 8. Persio, L., & Honchar, O. (2018). Multitask machine learning for financial forecasting. International Journal of Circuits, Systems and Signal Processing, 12, 444–451. 9. Boyacioglu, M., & Baykan, O.K. (2011). Predicting direction of stock price index movement using artificial neural networks and support vector machines: The sample of the Istanbul Stock. Exchange Expert Systems with Applications, 38(5), 5311–5319. 10. Matviychuk, A. V. (2007). Modeliuvannia ekonomichnykh protsesiv iz zastosuvanniam metodiv nechitkoi lohiky. Kyiv, Ukraine: KNEU [in Ukrainian]. 11. Okasha, M. K. (2014). Using Support Vector Machines in Financial Time Series Forecasting. International Journal of Statistics and Applications, 4(1), 28–39. DOI: 10.5923/j.statistics.20140401.03. 12. Varghade, P., & Patel, R. (2012). Comparison of SVR and Decision Trees for Financial Series Prediction. International Journal on Advanced Computer Theory and Engineering, 1(1), 101–105. 13. Kumar, M. (2006). Forecasting Stock Index Movement: A Comparison of Support Vector Machines and Random Forest. SSRN Working Paper. Indian Institute of Capital Markets 9th Capital Markets Conference Paper, 1–16. DOI: 10.2139/ssrn.876544. 14. Hitam, N. A., & Ismail, A. R. (2018). Comparative Performance of Machine Learning Algorithms for Cryptocurrency Forecasting, ResearchGate, 1–11. Retrieved from https://www.researchgate.net/publication/327415267. 15. Akyildirim, E., Goncuy, A., & Sensoy, A. (2018). Prediction of Cryptocurrency Returns using Machine Learning, ResearchGate, 1–28. Retrieved from https://www.researchgate.net/publication/329322600. 16. Yao, Y., Yi, J., Zhai, S., Lin, Y., Kim, T., Zhang, G., & Lee, L. Y. (2018). Predictive Analysis of Cryptocurrency Price Using Deep Learning. International Journal of Engineering & Technology, 7(3.27), 258–264. DOI: 10.14419/ijet.v7i3.27.17889. 17. Alessandretti, L., ElBahrawy, A., Aiello, L., & Baronchelli, A. (2018). Anticipating Cryptocurrency Prices Using Machine Learning. Complexity, 2018, 1–16. DOI: 10.1155/2018/8983590. 18. Breiman, L., Friedman, H., Olshen, R. A., & Stone, C. J. (1984). Classification and Regression Trees. Belmont, NJ: Wadsworth International Group. 19. Breiman, L. (2001). Random Forests. Machine Learning, 45, 5–32. DOI: 10.1023/A:1010933404324. 92


Застосування методів…

В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко

20. Datsenko, N.V. (2018). Zastosuvannia derev klasyfikatsii ta rehresii do prohnozuvannia chasovykh riadiv finansovykh instrumentiv. Vcheni zapysky. Seriia Ekonomiko-matematychni metody (Scientific notes. Series of Economic and Mathematical Methods), 19, 169-181 [in Ukrainian]. 21. Derbentsev, V., Datsenko, N., Stepanenko, O., & Bezkorovainyi, V. (2019). Forecasting Cryptocurrency Prices Time Series Using Machine Learning. CEUR Workshop Proceedings, 2422, 320–334. Retrieved from http://ceur-ws.org/Vol-2422/paper26.pdf. 22. Yahoo Finance. (2019). Stock Market. Retrieved from https://finance.yahoo.com. Стаття надійшла до редакції 28.08.2019

93


УДК 519.86+330.46 DOI 10.33111/nfmte.2019.094

ДОСЛІДЖЕННЯ СПОСОБІВ ТРАНСФОРМАЦІЇ ДАНИХ В КОНТЕКСТІ ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ МОДЕЛЕЙ КРЕДИТНОГО СКОРИНГУ

Ю. В. Клебан Магістр з економічної кібернетики, викладач кафедри економіко-математичного моделювання та інформаційних технологій Національний університет «Острозька академія» вул. Семінарська, 2, м. Острог, Рівненська обл., 35800, Україна yuriy.kleban@oa.edu.ua У статті проведено дослідження з пошуку найефективнішого підходу до попередньої обробки характеристичних ознак позичальників з метою підвищення точності передбачення дефолтів за кредитними зобов’язаннями. Проаналізовано три основних способи подання даних на входи моделей кредитного скорингу: застосування початкових пояснюючих змінних без трансформації, переведення категоріальних характеристик у набір фіктивних змінних, біннінг показників із розрахунком вагомості ознаки (WOE) для кожної категорії. Для отримання висновків щодо систематичного впливу цих підходів було проведено по 10 повторюваних ітерацій з побудови нейромережевих моделей персептронного типу за кожним із цих трьох способів підготовки вхідних факторів. Кожна скорингова модель оцінювалась за широким набором показників інтегральної та точкової ефективності. Результати проведених експериментів засвідчили практично за всіма критеріями перевагу запропонованого автором методологічного підходу до попередньої обробки даних шляхом розбиття кількісних змінних на категорії із забезпеченням тренду їх показників вагомості ознаки та дотриманням обмежень на обсяг спостережень у кожній групі. Ключові слова: скорингова модель, нейронна мережа, кредитоспроможність, біннінг, вагомість ознаки (WOE), інформаційна значущість (IV), коефіцієнт Джині.

ИССЛЕДОВАНИЕ СПОСОБОВ ТРАНСФОРМАЦИИ ДАННЫХ В КОНТЕКСТЕ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ МОДЕЛЕЙ КРЕДИТНОГО СКОРИНГА

Ю. В. Клебан Магистр по экономической кибернетике, преподаватель кафедры экономико-математического моделирования и информационных технологий Национальный университет «Острожская академия» © Ю. В. Клебан, 2019

94


Дослідження способів трансформації…

Ю. В. Клебан

ул. Семинарская, 2, г. Острог, Ровенская обл., 35800, Украина yuriy.kleban@oa.edu.ua В статье проведено исследование, посвященное поиску наиболее эффективного подхода к предварительной обработке характеристических признаков заемщиков с целью повышения точности предсказания дефолтов по кредитным обязательствам. Проанализированы три основных способа представления данных на входы моделей кредитного скоринга: применение исходных объясняющих переменных без трансформации, преобразование категориальных характеристик в набор фиктивных переменных, биннинг показателей с расчетом весомости признака (WOE) для каждой категории. Для получения выводов относительно систематического влияния данных подходов было проведено 10 повторяющихся итераций с построением нейросетевых моделей персептронного типа на основе каждого из этих трех способов подготовки входных факторов. Все скоринговые модели оценивались по широкому набору показателей интегральной и точечной эффективности. Результаты проведенных экспериментов продемонстрировали практически по всем критериям преимущество предложенного автором методологического подхода к предварительной обработке данных путем разбиения количественных переменных на категории с обеспечением тренда их показателей весомости признака и соблюдением ограничений по объему наблюдений в каждой группе. Ключевые слова: скоринговая модель, нейронная сеть, кредитоспособность, биннинг, весомость признака (WOE), информационная значимость (IV), коэффициент Джини.

STUDYING THE METHODS OF DATA TRANSFORMATION IN THE CONTEXT OF INCREASING THE EFFECTIVENESS OF CREDIT SCORING MODELS

Yuriy Kleban Master’s Degree in Economic Cybernetics Lecturer of Department of Economic and Mathematical Modeling and Information Technology National University of Ostroh Academy 2 Seminarska Str., Ostroh, Rivne region, 35800, Ukraine yuriy.kleban@oa.edu.ua The article highlights a study on the search for the most effective approach to pre-processing the characteristics of borrowers in order to improve the accuracy of predicting defaults on credit obligations.

95


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Three main ways of providing data to the inputs of credit scoring models are analyzed: the use of the initial explanatory variables without transformation, the conversion of categorical characteristics into a set of dummy variables, binning the indicators with the calculation of the weights of evidence (WOE) for each category. To obtain conclusions about the systematic impact of these approaches, 10 repeated iterations were carried out with the construction of perceptron-type neural network models based on each of these three methods of preparing input factors. All scoring models were evaluated by a wide range of indicators of integrated and point efficiency. The results of the experiments showed by almost all criteria the advantage of the methodological approach proposed by the author for preliminary data processing by dividing quantitative variables into categories, ensuring the trend in values of their weights of evidence and observing restrictions on the volume of observations in each group. Keywords: scoring model, neural network, creditworthiness, binning, weight of evidence (WOE), informational value (IV), Gini coefficient. JEL: C45, C51, C52, C53

І. Вступ Складна геополітична та економічна ситуація в Україні з 2014 року призвела до ліквідації та реорганізації більше половини комерційних банків [1]. За даними Національного банку України частка непрацюючих кредитів на балансах банків протягом останніх років стабільно перевищує 50 %. Щоправда, вона поступово знижується, але лише завдяки статистичному ефектові від зростання загального портфеля [2, с. 5]. За часткою непрацюючих кредитів українські банки лідирують у світі: на 1 квітня 2019 року вона становила 51,7 % кредитного портфеля платоспроможних банків [2, с. 17]. Кредитний ризик є найбільш значущим з усіх банківських ризиків, що визначається Національним банком України в нормативному документі [3] як «наявний або потенційний ризик для надходжень і капіталу, який виникає через неспроможність сторони, що взяла на себе зобов’язання, виконати умови будь-якої фінансової угоди із банком або в інший спосіб виконати взяті на себе зобов’язання». Його значущість зумовлена тим, що кредитні операції є основним напрямком діяльності банків. Це підтверджується статистичними даними [4], за якими частка доходів від кредитування в останні роки стабільно перевищує 2/3 загального доходу по банківській системі. Таким чином, кредитний ризик, у 96


Дослідження способів трансформації…

Ю. В. Клебан

результаті його реалізації, може нести за собою найбільші збитки і найнегативніші наслідки порівняно з іншими ризиками банківської діяльності. З метою недопущення зростання проблемної кредиторської заборгованості та подальшого виникнення негараздів у самої кредитної установи виникає потреба в проведенні процедур оцінки надійності позичальника на різних етапах кредитного циклу. Суттєвого підвищення ефективності процесу оцінки кредитних ризиків, збільшення швидкості та якості обслуговування клієнтів, а також зменшення вартості операційних послуг можна досягти за рахунок впровадження механізму скорингової оцінки в системі підтримки прийняття рішень з управління кредитною діяльністю комерційного банку. У контексті інструментарію управління кредитним ризиком скоринг на основі інтегрального показника (скорингового балу) дозволив здійснити впорядкування та розбиття на класи позичальників за рівнем кредитоспроможності на основі множини їх характеристик, інформації про кредит та інших факторів, що можуть здійснювати вплив на спроможність виконання зобов’язань за кредитним договором. Швидкому поширенню скорингу сприяли масовість, ідентичність споживчого кредитування та обмежений час на оцінку ризиків. У результаті скоринг став найпоширенішим інструментом оцінки кредитного ризику позичальників і залишається таким по сьогоднішній день [5, с. 38–55]. Адекватне оцінювання кредитоспроможності клієнтів банківських установ передбачає пошук механізмів підвищення ефективності скорингових моделей. Одним із головних напрямів у вирішенні цього завдання стає забезпечення адекватного врахування найрізноманітнішої інформації щодо позичальника, що визначатиме ризик його дефолту за зобов’язаннями. Оскільки рівень кредитоспроможності позичальника обумовлюється як кількісними факторами, так і якісними, то важливо передбачити ефективну обробку в тому числі таких характеристик, як форма власності, пов’язані особи для юридичних осіб, або ж стать, рівень освіти, посада та ін. для фізичних осіб, щоб на їх основі можна було будувати різноманітні скорингові моделі. Для отримання можливості врахування у скорингових моделях якісних показників виникає потреба в їх перетворенні у кількісну форму. Одним з варіантів вирішення цього завдання є застосування підходу, коли певним характеристикам якісної змінної надаються 97


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

номерні позначення: 0, 1, 2… Наприклад, такий показник, як «Освіта», може приймати значення: «незакінчена середня» — 1; «середня» — 2; «середньотехнічна» — 3, «вища» — 4 тощо. Однак за такого кодування може виникати некоректне впорядкування категорій, адже автоматично встановлюється, що позичальники з середньотехнічною освітою отримують нижчу кількісну оцінку, ніж з вищою освітою. Якщо подібним чином здійснити нумерацію регіонів країни, то такий підхід взагалі стає беззмістовним — кількісне значення одного регіону в кінці алфавіту може у десятки разів перевищувати номер регіону на початку списку, що взагалі нічого не означає з огляду на оцінку ризиковості кредитної поведінки його мешканців. Тож подібний підхід до переведення якісних змінних у числа є некоректним. Інший підхід до кодування якісних характеристик базується на застосуванні фіктивних змінних, який полягає у позначенні належності досліджуваного об’єкта до певної категорії якісного показника бінарною маскою. Тобто, наприклад, характеристика «Освіта» може бути представлена сімома бінарними фіктивними змінними, кожна з яких вказуватиме належність позичальника до відповідної категорії. Зокрема, для позичальника з вищою освітою фіктивна змінна, що відповідає категорії «вища», матиме значення «1», а у шести інших категорій — «0». Звісно, для кодування семи класів якісного показника буде достатньо і шести фіктивних змінних, проте практично для всіх характеристик (як якісних, так і кількісних) додається ще клас з пропущеними значеннями «NULL» (коли в базі даних відсутня інформація за цим показником щодо певного позичальника). При цьому важливо розуміти, що із збільшенням кількості якісних характеристик за такого підходу зростатиме кількість фіктивних бінарних змінних. До того ж, переважна більшість їх значень дорівнюватиме нулю. Тому подібне розширення бази даних і кількості факторів суттєво ускладнюватиме процес побудови скорингових моделей і знижуватиме їх ефективність. Метою цієї статті є удосконалення підходу до трансформації даних за рахунок категоризації факторів моделей кредитного скорингу, призначенням якого є підвищення точності ідентифікації неплатоспроможності позичальників. Проведене у роботі дослідження розширює наявний апарат методів попередньої обробки даних і формування категоріальних змінних для задач моделювання бінарних показників. 98


Дослідження способів трансформації…

Ю. В. Клебан

ІІ. Проблеми трансформації даних у скорингових моделях З метою категоризації показників (розбиття множини значень кількісних змінних на інтервали та переведення якісних змінних у числову форму) було вирішено скористатись загальноприйнятим у скорингу підходом, що ґрунтується на розрахунку показника вагомості ознаки WOE (Weight Of Evidence), який для кожної підгрупи (категорії) позичальників визначає узагальнену кількісну оцінку їх кредитної поведінки. Така оцінка базується на обчисленні часток поганих угод (за якими був оголошений дефолт) і хороших (закритих згідно умов договору) за кожною підгрупою показника відносно загальної кількості поганих і хороших угод, відповідно, з подальшим розрахунком WOE за формулою: B  WOEi = ln i  , i = 1, k ,  Gi 

(1)

де Bi — відношення кількості поганих угод у i-й категорії до загального числа поганих угод у вибірці; Gi — частка хороших угод за i-ю категорією відносно їх загальної кількості; k — кількість підгруп (категорій) змінної. У спеціалізованій літературі [6, 7] рекомендується WOE розраховувати не тільки для якісних показників, але й для кількісних, попередньо здійснивши розбиття усієї множини значень відповідного показника на інтервали. І вже для кожного такого і-го інтервалу розраховується власне WOEi. У принципі, такий підхід має логічне підґрунтя. Адже не можна однозначно стверджувати, що, скажімо, заробітна плата у 30 тис. грн вказує на значно менший кредитний ризик позичальника порівняно з тим, хто зазначив у кредитній заявці зарплату 6 тис. грн. По-перше, для отримання кредиту в умовах української дійсності зацікавлена особа може отримати практично будьяку довідку по заробітній платі (хоча зазвичай навіть такої довідки не потрібно), тож високі її показники не гарантують, що вона є дійсно такою. По-друге, поширеною є практика штучного заниження рівня офіційної зарплатні в комерційних організаціях з метою зменшення податкових відрахувань (при високому рівні доходу, що особа отримує на руки). Таким чином, категорія позичальників із зарплатою у 6 тис. грн може виявитись навіть на99


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

дійнішою, ніж позичальники із заявленими надвисокими доходами. І специфіку поведінки кожної з таких підгруп дозволить виявити саме розрахунок показників WOE. Натомість, оперування моделі з початковими значеннями 30 тис. грн та 6 тис. грн вказувало б на п’ятикратну перевагу першого позичальника з відповідним нарахуванням скорингового балу, що далеко не завжди відповідає логіці економічних процесів. Також варто зазначити, що WOE розраховується як для різних категорій якісного показника чи інтервалів кількісного показника, так і для окремої категорії, відповідної пропущеним даним. Таким чином, застосування WOE надає можливість зробити модель універсальною, тобто такою, яку можна використовувати за будьякого наповнення даних щодо характеристик позичальників. На додаток до цього, при розрахунку WOE здійснюється переведення якісних і кількісних показників різної розмірності до нормалізованих числових значень, придатних для побудови скорингових моделей будь-якого типу. Згідно з дослідженням Дж. Германа [8] переваги застосування показника WOE при побудові скорингових моделей полягають, насамперед, у можливості: 1) ефективної обробки моделлю пропущених значень змінних (оскільки часто у базах даних кредитних організацій різні позичальники характеризуються різними наборами показників, то без цієї властивості доводиться або відкидати спостереження, або видаляти пояснюючі змінні, що суттєво звужує застосовність моделі); 2) виключення впливу екстремальних викидів на якість моделі, що підвищує її стійкість і робастність; 3) приведення всіх вхідних змінних до однієї розмірності (для певних типів економіко-математичних моделей це є суттєвим, оскільки дозволяє нівелювати надмірний вплив окремих показників на результат розрахунків). Для оцінювання ефективності розбиття змінної на категорії та визначення загальної прогностичної сили категоризованого фактора (якісної чи кількісної характеристики, переведеної у категорії з розрахунком відповідного WOE) застосовується показник інформаційної значимості IV (Information Value) [6, 9, 10]: k

IV =  (Bi − Gi )  WOEi . i =1

100

(2)


Дослідження способів трансформації…

Ю. В. Клебан

Чим вищою є інформаційна значимість предиктора, тим сильнішою є залежність від нього вихідної змінної. Коефіцієнти IV, отримані в результаті розрахунку (2), за [6, 9] інтерпретуються таким чином: - IV < 0,02 — характеристика не має прогностичної сили; - 0,02 ≤ IV < 0,1 — слабка прогностична сила; - 0,1 ≤ IV < 0,3 — середня прогностична сила; - 0,3 ≤ IV < 0,5 — висока прогностична сила; - 0,5 ≤ IV — відмінна прогностична сила категоризованої змінної. Проте існують й інші погляди на інтерпретацію рівня інформаційної значимості. Наприклад, за Н. Сіддікі [7] категоризовані змінні, для яких IV перевищує 0,5, мають бути перевірені на завищення прогностичної сили (overpredicting). Їх слід або виключити з процесу моделювання, або використовувати з обережністю. Проблемною ділянкою побудови моделі кредитного скорингу є створення ефективної процедури розбиття множини значень кожної з кількісних характеристик на категорії, що б забезпечувало підвищення точності класифікації позичальників за рівнем їх надійності. Ця процедура дає можливість посилити робастність моделі (її стійкість до випадкових збурень і похибок у даних) та одночасно збільшити її адекватність, адже об’єднання дискретних значень змінних у категорії дозволяє виключити негативний вплив екстремальних викидів, замінюючи їх оцінками систематичного впливу категорії на результуючий показник. Процес категоризації вхідних змінних (або розбиття кількісних змінних на категорії) у скорингу ще називається біннінгом (англ. binning) [6]. Розробка ефективного алгоритму біннінгу зводиться до розв’язання задач визначення оптимального числа категорій та їх діапазонів для кожної з кількісних пояснюючих змінних. Загальноприйнятим правилом при розв’язанні цих задач є те, що кожна категорія має об’єднувати множину сусідніх значень показника з однаковими властивостями відносно їх впливу на кредитоспроможність клієнта. Даному питанню була присвячена низка вітчизняних і закордонних публікацій, короткий аналіз яких подається нижче. У статті А.С. Сорокіна [6] описано процес побудови скорингової моделі, починаючи з поділу даних на тестову та навчальну вибірки та закінчуючи оцінкою параметрів моделі. Також детально описано процедуру біннінгу кількісних змінних із розрахунком 101


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

показників вагомості ознаки WOE та інформаційної значимості IV. Під час поділу змінних на категорії Сорокін керується: • максимізацією показника інформаційної значимості змінної IV як критерію оптимальності біннінгу; • необхідністю розбиття множини значень кількісного показника на категорії, які б забезпечували зростаючий або спадаючий тренд WOE при переході від однієї категорії до іншої; • доцільністю об’єднання категорій з близькими значеннями вагомості ознаки WOE для посилення тенденції її зростання або спадання; • потребою в забезпеченні суттєвого перепаду значень WOE у різних категоріях; • обмеженням максимальної кількості категорій до 50. На доцільності забезпечення суттєвої різниці WOE при переході від однієї категорії до іншої також було наголошено у джерелі [8], де Дж. Херманом проаналізовано три способи біннінгу: • встановлення інтервалів категорій однакової довжини на множині можливих значень показника; • поділ на категорії з однаковою кількістю прикладів; • посилення різниці значень WOE між сусідніми категоріями. У роботі [7] Н. Сіддікі пропонує такі базові рекомендації щодо проведення біннінгу: • пропущені значення показника мають входити в окрему категорію; • кожна категорія повинна містити не менше 5 % вибірки; • кількість надійних чи ненадійних угод у категорії не мають дорівнювати 0. У роботі Н.Б. Палкіна та В.В. Афанасьєфа [11] досліджено проблему оптимального квантування (укрупнення вже утворених категорій) для підвищення точності бінарних класифікаторів. У процесі проведення експерименту вдавалось збільшити точність класифікації при значній втраті інформаційної значимості змінних. Такий результат ставить під сумнів роль показника інформаційної значимості IV як критерію ефективності категоризації пояснюючих змінних. Питання оптимізації процедури біннінгу розкрито не лише у наукових працях, але й висвітлюється у дослідницьких оглядах і патентах аналітичних компаній і вендорів спеціалізованого програмного забезпечення. Зокрема, компанія FICO, яка є «законодавцем» в області конструювання скорингових карт, надає ряд рекомендацій до проведення категоризації кількісної змінної [12]: 102


Дослідження способів трансформації…

Ю. В. Клебан

• кожна категорія має містити достатньо елементів, аби нівелювати вплив екстремальних значень і шуму в вибірці; • кожна категорія має формуватись з елементів, ідентичних за мірою впливу на результуючу змінну; • абсолютні показники інформаційної значимості IV змінної несуть мінімальне змістовне навантаження і мають використовуватись лише для порівняння. Наприклад, у статистичному пакеті STATISTICA 13 реалізований широкий перелік методів і алгоритмів категоризації кількісних змінних. За замовчуванням для біннінгу застосовується метод C&RT (англ. Classification and Regression Trees — дерева класифікації та регресії). Якщо кількість категорій не перевищує 20, алгоритм шукатиме усі можливі комбінації груп для максимізації IV. Коли кількість груп перевищує 20, STATISTICA застосовує CHAID алгоритм (англ. Chi-squared Automatic Interaction Detection — автоматичний детектор взаємодії хі-квадрат). Для поділу кількісних змінних на категорії застосовуються різні типи перетворень, що максимізують зв’язок предикторів із залежною змінною [13], зокрема: 1) монотонне — WOE значення усіх сусідніх категорій (інтервалів) будуть або зростати (позитивний монотонний зв’язок інтервалів предиктора та WOE), або спадати (негативний монотонний зв’язок); 2) квадратичне — функція зв’язку між кодованими інтервалами значень і WOE має U-подібну або перевернуту U-подібну форму; 3) кубічне — функція зв’язку між кодованими інтервалами значень і WOE має вигляд кубічної параболи; 4) користувацьке перетворення — задана за замовчуванням схема біннінгу з використанням C&RT або 10 груп приблизно однакового розміру; 5) кодування без обмежень (no restrictions) — пошук методом повного перебору або CHAID алгоритмом. Попри те, що у проаналізованих вище публікаціях алгоритм біннінгу був достатньо детально описаний і прокоментований, принципи розбиття кількісних змінних на категорії у цих роботах є надто відмінними між собою. Різняться рекомендації щодо розмірів і кількості категорій, правил їх об’єднання, доцільності застосування показника інформаційної значимості тощо. Отже, проведений аналіз існуючих підходів щодо попередньої обробки даних при побудові скорингових моделей, призначених для вирішення задач бінарної класифікації, дозволив виявити 103


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

значну кількість протиріч у численних рекомендаціях і реалізованих процедурах категоризації пояснюючих змінних. Це обумовлює доцільність проведення подальших досліджень з удосконалення методик трансформації даних для побудови математичних моделей кредитного скорингу. ІІІ. Алгоритм формування категорій числових факторів моделі Вирішення завдання розробки ефективної процедури біннінгу зводиться до таких етапів: сформулювати гіпотези щодо оптимальної категоризації кількісних змінних на основі узагальнення світового досвіду з проведення біннінгу; здійснити алгоритмічну та програмну реалізацію процесів поділу кількісних змінних на категорії (відповідно до висунутих гіпотез) та побудови скорингових моделей за різних варіантів біннінгу вхідних даних; систематизувати результати досліджень з обґрунтуванням відповідних висновків і рекомендацій. Здійснити дослідження впливу процедури біннінгу на якість класифікатора можна в рамках методологічного підходу до проведення категоризації кількісних змінних у процесі побудови скорингових моделей [14], зміст якого полягає у виконанні таких дій: 1) збір інформаційної бази, формування навчальної та тестової вибірок; 2) розбиття множин значень пояснюючих змінних на категорії за різними алгоритмами біннінгу; 3) розрахунок для кожної категорії за всіх варіантів біннінгу показників WOE та IV; 4) побудова скорингових моделей на навчальній вибірці для різних варіантів категоризації вхідних змінних; 5) оцінка адекватності побудованих скорингових моделей на тестовій вибірці за критерієм AUROC; 6) аналіз отриманих результатів, формулювання висновків щодо ефективності алгоритмів біннінгу. У процесі аналізу спеціалізованої літератури з питань біннінгу та проведення численних експериментів на реальних даних автором сформульовано низку вимог [14], яким має задовольняти алгоритм поділу кількісних змінних на категорії: • усі записи показника, за якими відсутня інформація, мають бути об’єднані в окрему категорію з відповідним розрахунком її WOE та IV; 104


Дослідження способів трансформації…

Ю. В. Клебан

• у кожній окремій категорії мають бути представлені як закриті згідно умов договору, так і дефолтні кредити; • одне значення показника не може бути поділене між різними категоріями (усі записи з однаковим значенням змінної зводяться до одної категорії); • з метою забезпечення систематичного впливу вхідного показника на результуючу змінну значення WOE мають бути підпорядковані деякому тренду (тобто, WOE повинні або поступово спадати, або зростати при переході від першої до останньої категорії). Доцільність встановлення мінімального розміру категорії обумовлюється необхідністю нівелювання окремих випадкових викидів чи помилок у даних і врахування систематичних впливів у змінах показника на результати розрахунку кредитного ризику. Проте прописувати це окремою вимогою до алгоритму сенсу не було, адже навіть без чіткого обмеження мінімального розміру всі категорії будуть охоплювати досить широкий діапазон значень відповідного показника через необхідність забезпечення представництва обох класів кредитів і дотримання тренду змін WOE. Тож, встановлювати мінімальний розмір категорії чи ні, залишається на розсуд окремого аналітика або програміста. В алгоритмі поелементного формування категорій, розробленому нами у рамках методологічного підходу проведення категоризації кількісних змінних із дотриманням сформульованих вище вимог, було вирішено ввести обмеження на мінімальний розмір категорії (зрештою це обмеження за потреби можна встановити на нульовому рівні). Процес утворення категорій доречно розпочати з поступового об’єднання впорядкованих значень показника, доки їх кількість не перевищить заданий мінімальний розмір групи (при додатковому аналізі наявності у категорії кредитів з обох класів). Звісно, такий процес немає сенсу розпочинати із середини діапазону значень даного показника — його варто ініціювати від мінімального або максимального його значення. І вже поступово розширювати створені категорії та додавати нові, забезпечуючи при цьому дотримання тренду змін WOE. Однак, якщо проводити категоризацію з якогось одного кінця діапазону значень показника, то напрям тренду WOE не завжди вдається правильно визначити. Адже після першої категорії мінімального розміру можуть йти кілька категорій із поступовим зменшенням WOE, але загальний тренд виявиться зростаю105


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

чим. І щоб коректно здійснити біннінг такої змінної, алгоритм доведеться постійно повертати до першої категорії, поступово розширюючи її та корегуючи множину значень другої категорії. І так до останнього елементу, рекурсивно повертаючись на початок. Причому в якийсь момент може виявитись, що після тривалого зростання тренд WOE таки пішов на спад. І алгоритму доведеться заново здійснювати перерозбивку змінної від першої категорії. Відповідно, у створеному нами алгоритмі поелементного формування категорій було вирішено розпочати біннінг одночасно з обох кінців діапазону значень показника. Частіше за все напрям тренду вдається визначити на етапі формування крайніх груп елементів (категорій) за перепадом значень їх WOE. Ці групи генеруються з дотриманням двох додаткових умов (у доповнення до встановлених вище щодо наявності в них представників обох класів і неможливості поділу одного значення показника між різними категоріями): • розмір категорії має бути не меншим встановленого мінімального обмеження; • розширення діапазонів крайніх категорій (додавання нових елементів вибірки до цих груп) відбувається доти, доки збільшується різниця між їх WOE. Після утворення цих крайніх категорій розпочинається формування нових у напрямку до середини множини значень показника. Якщо новостворені категорії відповідають визначеному тренду, то вони фіксуються і процес біннінгу продовжується далі у напрямі до центру загального діапазону. Якщо ж якась із категорій, що додається до крайньої, йде у розріз із встановленим трендом (наприклад, загальний тренд зміни WOE визначений як зростаючий, але друга категорія отримала оцінку WOE нижче за першу), то алгоритм буде поелементно збільшувати крайню категорію та, відповідно, зсувати сусідню, доки вони не відповідатимуть заданому тренду (для вказаного прикладу при розширенні першої категорії в якийсь момент її WOE стане нижчим, ніж у другої категорії). Звісно, може статись, що якась із крайніх категорій отримала значення WOE, яке не відповідає загальній тенденції. Це буде виявлено з розширенням цих категорій, щоб вирівняти загальний тренд. У такому випадку алгоритм сам змінить напрям тренду на протилежний (зростаючий на спадний чи навпаки). 106


Дослідження способів трансформації…

Ю. В. Клебан

IV. Опис даних Для побудови моделей взято набір даних із відкритого доступу [15] для навчання студентів курсу «Data Mining» у Політехнічному університеті Каталонії. Вибірка містить інформацію про кредитоспроможність фізичних осіб і їх характеристики. База даних складається з 4446 спостережень і 14 факторів, які мають як числовий, так і категоріальний характер, опис яких наведено у табл. 1. Таблиця 1 ЗМІСТ БАЗИ ДАНИХ ДЛЯ ДОСЛІДЖЕННЯ КРЕДИТОСПРОМОЖНОСТІ ФІЗИЧНИХ ОСІБ № з/п

Назва показника

Тип

Короткий опис

1

Seniority

Числовий

Стаж, років

2

Home

про житло: ignore, other, owner, Категоріальний Інформація parents, priv, rent

3

Time

Числовий

Період кредитування, місяців

4

Age

Числовий

Вік особи, років

5

Marital

стан: divorced, married, separated, Категоріальний Сімейний single, widow

6

Records

або відсутніть записів про попеКатегоріальний Наявність редні кредитні договори: no_rec, yes_rec

7

Job

та тип працевлаштування Категоріальний Забезпеченість особи: fixed, freelance, others, partime

8

Expenses

Числовий

Витрати на обслуговування кредиту, гр.од.

9

Income

Числовий

Щомісячний дохід, гр.од.

10 Assets

Числовий

Активи, гр.од.

11 Debt

Числовий

Борг, гр.од.

12 Amount

Числовий

Сума кредиту, гр.од.

13 Price

Числовий

Вартість товару, на який виданий кредит, гр.од.

14 Status

Категоріальний Статус повернення: bad, good

Важливим для трансформації даних є розуміння типу фактора, оскільки від цього залежить принцип перетворення елементів, якими він представлений. Для числових змінних кількісна величина елемента має значення, для категоріальних — не має. Наприклад, якщо 107


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

в базі даних значення «no_rec» та «yes_rec» змінної Records замінені на 1 та 2, то це не вказує на перевагу «yes_rec» над «no_rec». Результат виконання умов кредитної угоди Status є бінарним показником із можливими варіантами події «bad» (у числовому виді замінюється на «1» — невиконання умов договору) і «good» («0» — умови договору виконані). Передбаченню підлягає саме подія «bad» (тоді результат розрахунку моделі в інтервалі [0; 1] означатиме ймовірність дефолту за кредитом). Як видно з табл. 2, частка невиконаних договорів у вибірці значно менша, ніж виконаних. Таблиця 2 СТРУКТУРА ВИБІРКИ ЗА ОЗНАКОЮ ВИКОНАННЯ УМОВ КРЕДИТНОГО ДОГОВОРУ

Значення бінарної події

Подія «bad»

Подія «good»

1

0

Разом

Кількість подій

1249

3197

4446

Частка подій

0,281

0,719

1

Аналіз взаємозв’язку між категоріальними змінними та вихідним показником можна здійснити на основі крос-таблиць, формування яких на прикладі співставлення конкретних значень характеристики працевлаштування особи (Job) та статусу кредитного договору (Status) наведено у табл. 3. Таблиця 3 КРОС-ТАБЛИЦЯ ПОКАЗНИКІВ «ПРАЦЕВЛАШТУВАННЯ» (JOB) ТА «СТАТУС КРЕДИТНОЇ УГОДИ» (STATUS) Status

bad good Разом

Job

fixed

freelance

others

partime

Разом

Кількість

580

331

68

270

1249

Частка

0,464

0,265

0,054

0,216

1

Кількість

2223

690

103

181

3197

Частка

0,695

0,216

0,032

0,057

1

Кількість

2803

1021

171

451

4446

Частка

0,630

0,230

0,038

0,101

1

З табл. 3 видно, що частка неповернення кредитів особами, які мають неповну зайнятість, складає 21,6 % серед усіх проблемних 108


Дослідження способів трансформації…

Ю. В. Клебан

позик. При цьому загальна частка неповернених позик особами з неповною зайнятістю 270  100%  60% . Тобто такі позичальники 451

частіше не повертають кредити, ніж виконують свої зобов’язання. Аналогічний аналіз проводиться і для інших змінних. V. Трансформація пояснюючих змінних для застосування у скорингових моделях З метою визначення найефективнішого способу попередньої обробки пояснюючих змінних для їх використання в моделях кредитного скорингу вибробуємо кілька різних підходів до перетворення даних і проведемо порівняльний аналіз точності побудованих на їх основі моделей. Для отримання висновків щодо систематичного впливу цих підходів проведемо по 10 повторюваних ітерацій з побудови моделей одного типу за трьома різними способами підготовки вхідних факторів: на основі даних без трансформації (тип 1), категоріальні характеристики трансформуються у набір фіктивних змінних (тип 2), всі показники категоризуються з розрахунком відповідних WOE (тип 3). При цьому біннінг змінних проводиться лише на тренувальній вибірці (тренувальна та тестова вибірки для кожної моделі на кожній ітерації формуються випадковим чином у пропорції 70/30 зі збереженням початкового співвідношення класів результуючого показника). Отже, перш за все проводиться звичайне перетворення словесних описів категорій на відповідні числові порядкові значення. Так, наприклад, набору значень «divorced», «married», «separated», «single», «widow» змінної «Сімейний стан» (Marital) відоповідатимуть числа 1, 2, 3, 4 та 5, у цьому порядку. Приклад перетворення значень низки категоріальних показників до числових відповідників для модельного набору даних наведено в табл. 4. Для моделі типу 2 категоріальні показники замінюються на фіктивні змінні. При цьому для кожного такого показника утворюється по одній бінарній змінній на кожну категорію, з яких він складається (де бінарній змінній, відповідній поточній категорії, присвоюється значення «1», а усім іншим — «0»). Приклад такого перетворення наведено у табл. 5. 109


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Таблиця 4 ПРИКЛАД ПЕРЕТВОРЕННЯ КАТЕГОРІАЛЬНИХ ПОКАЗНИКІВ ДО ЧИСЛОВИХ ВІДПОВІДНИКІВ №

Status

Home

Marital

Records

Job

1 2 3 4 5

good good bad good good

rent rent owner rent rent

married widow married single single

no_rec no_rec yes_rec no_rec no_rec

freelance fixed freelance fixed fixed

Status

Home

Marital

Records

Job

1 2 3 4 5

0 0 1 0 0

6 6 3 6 6

2 5 2 4 4

0 0 1 0 0

2 1 2 1 1

Таблиця 5 ПЕРЕТВОРЕННЯ КАТЕГОРІАЛЬНИХ ПОКАЗНИКІВ НА ФІКТИВНІ ЗМІННІ ДЛЯ МОДЕЛІ ТИПУ 2 №

Marital

Marital

M_1

M_2

M_3

M_4

M_5

1

married

2

0

1

0

0

0

2

widow

5

0

0

0

0

1

3

married

2

0

1

0

0

0

4

single

4

0

0

0

1

0

5

single

4

0

0

0

1

0

Такий підхід збільшує кількість незалежних змінних, що у свою чергу на великих об’ємах даних призводить до зростання часу на побудову, навчання та тестування моделей. Уникнути таких ускладнень вдається із застосуванням моделей типу 3, в яких кожна змінна (як якісна, так і кількісна) поділяється на категорії з відповідними ним кількісними значеннями WOE. 110


Дослідження способів трансформації…

Ю. В. Клебан

Оскільки якісні змінні вже представлені у категоріях, то для них одразу можна здійснити розрахунок WOE та IV за формулами (1) та (2), відповідно. Оберемо для демонстрації процесу розрахунку цих показників фактор Marital (табл. 6 і рис. 1). Таблиця 6 ПРИКЛАД РОЗРАХУНКУ WOE ТА IV ДЛЯ КАТЕГОРІЙ ЗМІННОЇ «СІМЕЙНИЙ СТАН» (MARITAL) Назва категорії

Номер Кількість Кількість катег. «good» «bad»

Gi

Bi

Bi-Gi

WOE

IV

0,0031

0,3198

0,0010

divorced

1

18

10

0,0081

0,0112

married

2

1664

587

0,7502

0,6559 -0,0944 -0,1344 0,0127

separated

3

50

43

0,0225

0,0480

0,0255

0,7567

0,0193

single

4

451

240

0,2033

0,2682

0,0648

0,2767

0,0179

widow

5

35

15

0,0158

0,0168

0,0010

0,0602

0,0001

2218

895

0,0510

Рис. 1. Гістограма значень груп WOE для категоріальної змінної «Сімейний стан» (Marital) 111


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Як вказано вище, WOE розраховується через співвідношення часток ненадійних «bad» і надійних «good» клієнтів банку відповідної групи у загальній кількості клієнтів того ж класу. Наприклад, для категорії «divorced» значення WOE становить 0,3198, що вказує на більшу частку ненадійних клієнтів у цій групі відносно середнього рівня надійності всіх клієнтів банку. Відповідно, на основі рис. 1 і табл. 6 можна попередньо оцінити ризиковість видачі кредитів для категорій осіб із різним сімейним станом. Так, наприклад, особи, що проживають окремо але фактично є одруженими («separated»), є найбільш ризиковими позичальниками. Також офіційно розведені особи («divorced») та одинокі («single») мають досить високу частку несплати кредитів. При цьому одружені особи («married») є досить надійною категорією позичальників банку. Наступним етапом перетворення якісної змінної для її використання в моделі є заміна значення показника на обчислений WOE (табл. 7). Таблиця 7 ПЕРЕТВОРЕННЯ КАТЕГОРІАЛЬНИХ ЗМІННИХ У ЧИСЛОВУ ФОРМУ ДЛЯ МОДЕЛІ ТИПУ 3 №

Marital

Marital

Marital_WOE

1

married

2

-0,1344

2

widow

5

0,0602

3

married

2

-0,1344

4

single

4

0,2767

5

single

4

0,2767

Для числових факторів процес категоризації має ряд особливостей. З метою біннінгу кількісних змінних застосуємо власний алгоритм формування категорій зі зберженням тренду [14]. Проілюструємо процедуру біннінгу за цим алгоритмом на прикладі змінної «Вік» (Age). Перш за все було сформовано тренувальну вибірку та задано мінімальний розмір категорії на рівні 5 % (156 спостережень). Всього у вибірці 50 унікальних значень показника Age (від 18 до 68 років). На початку процедури кожному такому значенню відповідатиме окрема категорія (табл. 8). 112


Дослідження способів трансформації…

Ю. В. Клебан

Таблиця 8 ПОЧАТКОВЕ РОЗБИТТЯ НА КАТЕГОРІЇ КІЛЬКІСНОЇ ЗМІННОЇ «ВІК» (AGE) Номер категорії

Значення змінної

Кількість «good»

Кількість «bad»

WOE

IV

1

18

2

6

2

19

13

7

3

20

20

14

...

...

...

...

...

...

49

66

6

0

50

68

1

0

Далі проводиться об’єднання сусідніх елементів, що мають нульові значення у стовпці «good» чи «bad». Так, наприклад, рядки 49–50 будуть трансформовані в один (тоді кількість «good» сягне 7, а «bad» — 0). При такому об’єднанні категорія міститиме вже деяку множину значень показника. Відповідно, замість вказівки окремих елементів для позначення категорії задається діапазон — мінімальне та максимальне значення елементів, що увійшли до неї (у даному випадку [66; 68]). Після цього проводиться об’єднання окремо крайніх «верхніх» і крайніх «нижніх» груп із відповідним розрахунком для них WOE та IV, доки не буде досягнуто цими категоріями заданого мінімального розміру та зростатиме різниця WOE між ними. Фрагмент бази після подібного укрупнення крайніх категорій наведено у табл. 9. Таблиця 9 КАТЕГОРИЗОВАНА ЗМІННА «ВІК» ПІСЛЯ УКРУПНЕННЯ КРАЙНІХ КАТЕГОРІЙ Номер категорії

Мінімальне значення

Максимальне значення

Кількість «good»

Кількість «bad»

1

18

23

169

113

0,5050 0,0253

2

24

24

73

36

0,2006 0,0015

WOE

...

IV

...

...

...

...

...

28

50

50

41

14

-0,1670 0,0005

...

29

51

68

357

79

-0,6008 0,0437

Після формування крайніх категорій продовжується процес укрупнення тих, що залишились, у напрямку до середини всієї 113


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

множини значень показника. Проміжний варіант біннінгу змінної «Вік» за авторським алгоритмом [14] наведено у табл. 10. Таблиця 10 КАТЕГОРИЗОВАНА ЗМІННА «ВІК» НА ПЕРЕДОСТАННІЙ ІТЕРАЦІЇ ТРАНСФОРМАЦІЇ Номер категорії

Мінімальне значення

Максимальне значення

Кількість «good»

Кількість «bad»

1 2 3

18 24 26

23 25 37

169 135 913

113 68 373

0,5050 0,0253 0,2218 0,0034 0,0124 0,0001

4 5

38 41

40 44

181 196

92 83

0,2308 0,0049 0,0483 0,0002

6 7 8

45 48 51

47 50 68

142 125 357

51 36 79

-0,1165 0,0008 -0,3373 0,0054 -0,6008 0,0437

WOE

IV

У випадку, якщо нові сформовані категорії не відповідають вже заданому тренду показника WOE, відбувається їх об’єднання з попередніми/наступними категоріями за близькістю WOE. Наприклад, з табл. 10 видно, що групи 4 та 5 не відповідають спадному тренду. На наступному етапі вони приєднуються до групи 3. Кінцевий результат проведення біннінгу кількісних показників за запропонованим алгоритмом поелементного формування категорій з дотриманням тренду значень WOE на прикладі змінної «Вік» (Age) при мінімально допустимому розмірі категорій 5 % наведено у табл. 11 і на рис. 2. Таблиця 11 РЕЗУЛЬТАТ КАТЕГОРИЗАЦІЇ КІЛЬКІСНОЇ ЗМІННОЇ «ВІК» (AGE) Номер категорії

Мінімальне значення

Кількість «good»

Кількість «bad»

WOE

IV

1

18

169

113

0,5050

0,0253

2

24

135

68

0,2218

0,0034

3

26

1290

548

0,0514

0,0016

4

45

142

51

-0,1165

0,0008

5

48

125

36

-0,3373

0,0054

6

51

357

79

-0,6008

0,0430

114


Дослідження способів трансформації…

Ю. В. Клебан

Рис. 2. Гістограма WOE категорій кількісної змінної «Вік» (Age)

Як видно з табл. 11 і рис. 2, сформовані за запропонованим алгоритмом категорії мають спадний тренд показника WOE, який відповідає зростанню частки надійних і зменшенню частки ненадійних клієнтів зі збільшенням віку позичальників. У другому стовпчику табл. 11 вказується мінімальне значення показника, з якого починається відповідна категорія. Тобто ця категорія покриває діапазон від даного значення до мінімума наступної категорії, що міститься рядком нижче. Для останньої категорії (шостої у табл. 11) верхня границя не задається. Так само й перша категорія не обмежується нижньою границею (не обмежується математично, проте у даному випадку законодавчо). Принцип застосування в моделях кредитного скорингу категоризованих значень кількісних змінних такий. Наприклад, згідно табл. 11 вік 46 років потрапляє у групу 4, до якої належать усі значення цього показника в діапазоні [45; 48). При побудові скорингової моделі та подальшому оцінюванні кредитного ризику нових клієнтів усі значення Age з цього діапазону замінюватимуться на Age_WOE = -0,1165, як представлено у табл. 12. 115


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Таблиця 12 ПЕРЕТВОРЕННЯ КІЛЬКІСНОЇ ЗМІННОЇ «ВІК» В КАТЕГОРИЗОВАНУ ФОРМУ ДЛЯ ПОБУДОВИ МОДЕЛІ ТИПУ 3 №

Age

Age_WOE

1 2 3 4 5

22 65 44 33 46

0,5050 -0,6008 0,0514 0,0514 -0,1165

Підкреслимо, що перетворення кількісних змінних до категоріального виду здійснюється на основі запропонованого алгоритму поелементного формування категорій, який передбачає можливість встановлення мінімально допустимого їх розміру. При цьому алгоритм дозволяє оптимізувати мінімальний розмір групи за критерієм максимізації інформаційної значимості показників. У результаті виконання описаних вище процедур з трансформації пояснюючих змінних було отримано три набори даних для побудови відповідних моделей оцінки кредитоспроможності позичальників. VI. Побудова математичних моделей та оцінювання їх ефективності Як зазначалось вище, статус виконання кредитного договору Status є бінарним показником. Тобто, при побудові скорингової моделі залежна змінна набуває значення «1», якщо відбувся дефолт за зобов’язаннями, та «0» — якщо ця подія не наступає. Результатом розрахунку моделі при її застосуванні в процесі оцінювання кредитного ризику буде вже не бінарне число, а дійсне, визначене на інтервалі [0; 1], що вказує на ймовірність дефолту за зобов’язаннями позичальника. Основою для побудови математичних моделей у даному дослідженні слугували нейронні мережі персептронного типу з одним прихованим шаром та одним нейроном вихідного шару із логістичною сигмоїдною функцією активації (щоб результатом розрахунку мережі було число в межах від 0 до 1). Кількість нейронів прихованого шару та їх функції активації підбирались експериментально для отримання найбільшої точності класифікації позичальників із тестової вибірки. 116


Дослідження способів трансформації…

Ю. В. Клебан

Для порівняння ефективності скорингових моделей у даному дослідженні використовувалися такі показники [16–18]: Accuracy — загальна точність класифікації за певного рівня розмежування (cut-off); Balanced Accuracy — збалансована загальна точність класифікації, що враховує пропорції позитивних і негативних подій у вибірці; KS — критерій узгодженості КолмогороваСмірнова; Gini — коефіцієнт Джині та AUROC — площа під ROC-кривою (Receiver Operating Characteristic), які є інтегральними характеристиками якості класифікатора. ROC-крива дозволяє візуально оцінити коректність бінарної класифікації. Вона по осі ординат відображає частку правильно визначених позитивних результатів 1 TPR (True Positive Rate або чутливість — Sensitivity), а по осі абсцис — частку помилково діагностованих позитивних результатів FPR (False Positive Rate) при варіюванні порога відсікання. На рис. 3 зображено ROC-криву, побудовану в процесі тестування моделі типу 1 на ітерації № 1.

Рис. 3. Графік ROC-кривої моделі типу 1 на першій ітерації дослідження 1 Оскільки задачею дослідження є моделювання ймовірності дефолту позичальника, то в даному контексті позитивним результатом буде клас «bad» результуючої змінної Status.

117


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

При порівнянні ефективності моделей лінія поділу класів (cutoff) була встановлена на рівні 0,5, хоча оптимальні лінії cut-off різних моделей мали відмінності, проте незначні (0,5±0,05). У процесі дослідження проведено 10 ітерацій побудови нейронних мереж за трьома підходами до попереденьої обробки даних: NN — на основі даних без трансформації (тип 1), NN_0X — із переведенням категоріальних характеристик у набір фіктивних змінних (тип 2), NN_WOE — на основі категоризованих показників із розрахунком відповідних WOE (тип 3). Результати тестування ефективності всіх побудованих моделей наведені у табл. 13. Таблиця 13 ПОКАЗНИКИ ЕФЕКТИВНОСТІ ПОБУДОВАНИХ НЕЙРОННИХ МЕРЕЖ ЗА ТРЬОМА СПОСОБАМИ ПОПЕРЕДНЬОЇ ОБРОБКИ ДАНИХ № експ.

Модель

NN 1

2

3

4

5

6

AUROC

KS

Gini

Sensitivity

Specificity

Accuracy

Balanced Accuracy

0,8247 0,5170 0,6494 0,4209 0,9265 0,7922

0,6737

NN_WOE 0,8490 0,5530 0,6980 0,4548 0,9316 0,8050

0,6932

NN_0X

0,8429 0,5439 0,6858 0,4350 0,9275 0,7967

0,6813

NN

0,8213 0,5165 0,6426 0,4182 0,9262 0,7794

0,6722

NN_WOE 0,8424 0,5516 0,6848 0,4519 0,9241 0,7877

0,6880

NN_0X

0,8297 0,5179 0,6594 0,4468 0,9262 0,7877

0,6865

NN

0,8177 0,4901 0,6354 0,4357 0,9223 0,7832

0,6790

NN_WOE 0,8294 0,5127 0,6588 0,4121 0,9170 0,7727

0,6645

NN_0X

0,8253 0,5122 0,6506 0,4304 0,9233 0,7824

0,6769

NN

0,8253 0,5086 0,6506 0,4354 0,9308 0,7899

0,6831

NN_WOE 0,8451 0,5553 0,6902 0,4749 0,9308 0,8012

0,7029

NN_0X

0,8329 0,5210 0,6658 0,4591 0,9361 0,8005

0,6976

NN

0,8087 0,4776 0,6174 0,4154 0,9205 0,7682

0,6680

NN_WOE 0,8124 0,4945 0,6248 0,4229 0,9098 0,7629

0,6663

NN_0X

0,8142 0,4810 0,6284 0,4254 0,9313 0,7787

0,6783

NN

0,8234 0,5322 0,6468 0,4219 0,9168 0,7742

0,6693

NN_WOE 0,8352 0,5374 0,6704 0,4583 0,9210 0,7877

0,6897

NN_0X

0,8283 0,5300 0,6566 0,4245 0,9189 0,7764

118

0,6717


Дослідження способів трансформації…

Ю. В. Клебан

Закінч. табл. 13 NN 7

8

9

10

0,8139 0,4865 0,6278 0,4380 0,9151 0,7794

0,6765

NN_WOE 0,8239 0,5087 0,6478 0,4776 0,9130 0,7892

0,6953

NN_0X

0,8237 0,5156 0,6474 0,4644 0,9203 0,7907

0,6924

NN

0,8247 0,5109 0,6494 0,4454 0,9266 0,7944

0,6860

NN_WOE 0,8429 0,5430 0,6858 0,4836 0,9255 0,8042

0,7046

NN_0X

0,8344 0,5295 0,6688 0,4617 0,9255 0,7982

0,6936

NN

0,8079 0,4759 0,6158 0,4251 0,9124 0,7757

0,6688

NN_WOE 0,8211 0,5069 0,6422 0,4251 0,9135 0,7764

0,6693

NN_0X

0,8179 0,4810 0,6358 0,4385 0,9155 0,7817

0,6770

NN

0,8127 0,4737 0,6254 0,4262 0,9374 0,7997

0,6818

NN_WOE 0,8220 0,4900 0,6440 0,4206 0,9312 0,7937

0,6759

NN_0X

0,8252 0,5082 0,6504 0,4318 0,9374 0,8012

0,6846

Як видно з табл. 13, модель типу 3 (на основі категоризованих показників із розрахунком відповідних WOE) має найгіршу точність ідентифікації надійних клієнтів (найменші значення Specificity). При цьому вона ж дозволяє найточніше ідентифікувати подію дефолт (має найвищі значення Sensitivity), що і є метою у вирішенні даної задачі. У табл. 14 представлено зведені з табл. 13 показники переваги моделі кожного типу над іншими за низкою критеріїв ефективності. Таблиця 14 АГРЕГОВАНІ ПОКАЗНИКИ ПЕРЕВАГ МОДЕЛІ КОЖНОГО ТИПУ ЗА РІЗНИМИ КРИТЕРІЯМИ ЕФЕКТИВНОСТІ Тип моделі

Модель

AUROC

R2

KS

Gini

Sensitivity

Specificity

Accuracy

Balanced Accuracy

Тип 1

NN

0

0

0

0

1

3

1

1

Тип 2

NN_0X

2

2

2

2

3

7

5

3

8

8

8

8

6

1

5

6

Тип 3 NN_WOE

Для отримання додаткових висновків відносно дієвості аналізованих підходів до попередньої обробки даних проранжуємо побудовані на їх основі моделі за критерієм AUROC, що є інтегральним показником ефективності класифікатора (табл. 15). 119


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Таблиця 15 РАНГИ КРАЩИХ МОДЕЛЕЙ ЗА ПОКАЗНИКОМ AUROC № експ.

Тип моделі

AUROC

Ранг

1

Тип 3

0,8490

1

4

Тип 3

0,8451

2

8

Тип 3

0,8429

3

2

Тип 3

0,8424

4

6

Тип 3

0,8352

5

3

Тип 3

0,8294

6

10

Тип 2

0,8252

7

7

Тип 3

0,8239

8

9

Тип 3

0,8211

9

5

Тип 2

0,8142

10

Візуалізація

Вивчаючи табл. 13–15 можна помітити, що найвищі показники ефективності демонструють моделі третього типу. Так, у табл. 15 перших шість місць рейтингу та 8 переваг над іншими у 10 ітераціях займають саме моделі, побудовані на основі категоризованих змінних із розрахунком WOE. Це підтверджує гіпотезу про перевагу запропонованого підходу до розбиття кількісних змінних на категорії із забезпеченням дотримання тренду в значеннях їх показників вагомості ознаки над альтернативними способами подання даних на входи скорингових моделей. VII. Висновки У статті вирішується завдання пошуку ефективного підходу до попередньої обробки предикторів з метою підвищення точності моделей кредитного скорингу. У результаті проведеного аналізу наукових праць за даною тематикою та огляду методів обробки даних у спеціалізованих програмних пакетах було вирішено зупинитись на дослідженні трьох основних способів подання даних на входи скорингових моделей: застосування початкових пояснюючих змінних без трансформації, переведення категоріальних характеристик у набір фіктивних змінних, проведення біннінгу показників із розрахунком вагомості ознаки для кожної категорії. Перевірка придатності обраних підходів до обробки даних проводилась на базі нейронних мереж персептронного типу за широким 120


Дослідження способів трансформації…

Ю. В. Клебан

переліком критеріїв інтегральної та точкової ефективності. Результати проведених експериментів засвідчили перевагу запропонованого підходу до розбиття кількісних змінних на категорії з дотриманням тренду в значеннях їх показників вагомості ознаки над альтернативними способами подання даних на входи скорингових моделей. Висока ефективність побудованих на базі такого підходу нейромереж вказує на доцільність застосування подібних технологій на практиці з метою підвищення точності оцінювання кредитоспроможності позичальників і зменшення кредитних ризиків банків.

Список літератури 1. Інформація про дати прийняття рішень Національним банком про визнання банків неплатоспроможними та про ліквідацію, рішень ФГВФО про запровадження тимчасової адміністрації з 2014 року. Національний банк України : веб-сайт. URL: https://bank.gov.ua/supervision/reorganizatliquidat/reorganiz-history (дата звернення: 23.07.2019). 2. Звіт про фінансову стабільність, червень 2019 р. Національний банк України : веб-сайт. URL: https://bank.gov.ua/admin_uploads/ article/FSR_2019-R1.pdf?v=4 (дата звернення: 23.07.2019). 3. Методичні вказівки з інспектування банків «Система оцінки ризиків» : Постанова Правління Національного банку України від 15.03.2004 № 104. URL: https://zakon.rada.gov.ua/laws/show/v0104500-04 (дата звернення: 23.07.2019). 4. Доходи та витрати банків України. Національний банк України : веб-сайт. URL : https://bank.gov.ua/files/stat/Inc_Exp_Banks_2019-03-01.xlsx (дата звернення: 23.07.2019). 5. Anderson R. The credit scoring toolkit: theory and practice for retail credit risk management. Oxford: Oxford University Press, 2007. 731 p. 6. Сорокин А. С. Построение скоринговых карт с использованием модели логистической регрессии. Науковедение. 2014. Вып. 2. С. 1–29. URL : http://naukovedenie.ru/PDF/180EVN214.pdf. 7. Siddiqi N. Credit risk scorecards: developing and implementing intelligent credit scoring. Hoboken : John Wiley & Sons, 2006. 196 p. 8. Jopia H. R Package ‘smbinning’: Optimal Binning for Scoring Modeling. Revolutions : website. 2015. URL : https://blog.revolutionanalytics.com/ 2015/03/r-package-smbinning-optimal-binning-for-scoring-modeling.html. 9. Ковалев М., Корженевская В. Методика построения банковской скоринговой модели для оценки кредитоспособности физических лиц. Вестник Ассоциации белорусских банков. 2007. № 46. С. 16–20. 10. Коляда Ю. В., Бондар В. А. Біннінг у нейромережевих скорингових моделях. Нейро-нечіткі технології моделювання в економіці. 2016. № 5. С. 60–80. 121


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

11. Палкин Н. Б., Афанасьеф В. В. Оптимальное квантование для повышения качества бинарных классификаторов. Штучний інтелект. 2013. № 4. С. 392–399. 12. Building Powerful, Predictive Scorecards: An overview of Scorecard module for FICO Model Builder. Fair Isaac Corporation : website. 2014. 46 p. URL : http://www.fico.com/en/wp-content/secure_upload/Building_ Powerful_Predictive_Scorecards_1991WP.pdf (Last accessed : 10.06.2019). 13. TIBCO Statistica 13.5.0. statsoft.com : website. URL : http://documentation.statsoft.com/portals/0/formula%20guide/Weight%20of %20Evidence%20Formula%20Guide.pdf (Last accessed : 10.06.2019). 14. Матвійчук А. В., Клебан Ю. В. Біннінг кількісних змінних з формуванням тренду для задач скорингу. Моделювання та інформаційні системи в економіці. 2017. Вип. 93. С. 213–229. 15. Gaston S. CreditScoring. github.com : website. https://github.com/gastonstat/ CreditScoring/blob/master/CreditScoring.csv (Last accessed : 10.02.2019). 16. Kuhn M. Building predictive models in R using the caret package Journal of Statistical Software. 2008. Vol. 28, Is. 5. P. 1–26. URL: http://www.jstatsoft.org/article/view/v028i05/v28i05.pdf. 17. Marsaglia G., Tsang W. W., Wang J. Evaluating Kolmogorov’s Distribution. Journal of Statistical Software. 2003. Vol. 8, Is. 18. P. 1–4. URL : http://www.jstatsoft.org/v08/i18/paper. 18. Powers D. M. Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation. Journal of Machine Learning Technologies. 2011. Vol. 2, Is. 1. P. 37–63. URL : https://bioinfopublication.org/files/articles/2_1_1_JMLT.pdf.

References 1. The National Bank of Ukraine. (2019). Informatsiia pro daty pryiniattia rishen Natsionalnym bankom pro vyznannia bankiv neplatospromozhnymy ta pro likvidatsiiu, rishen FHVFO pro zaprovadzhennia tymchasovoi administratsii z 2014 roku. Retrieved from https://bank.gov.ua/supervision/ reorganizat-liquidat/reorganiz-history [in Ukrainian]. 2. The National Bank of Ukraine. (2019). Zvit pro finansovu stabilnist, cherven 2019 r. Retrieved from https://bank.gov.ua/admin_uploads/article/ FSR_2019-R1.pdf?v=4 [in Ukrainian]. 3. The National Bank of Ukraine. (2004). Metodychni vkazivky z inspektuvannia bankiv «Systema otsinky ryzykiv» : Postanova Pravlinnia Natsionalnoho banku Ukrainy vid 15.03.2004 № 104. Retrieved from https://zakon.rada.gov.ua/laws/show/v0104500-04 [in Ukrainian]. 4. The National Bank of Ukraine. (2019, March 1). Dokhody ta vytraty bankiv Ukrainy. Retrieved from https://bank.gov.ua/files/stat/Inc_Exp_Banks_2019-03-01.xlsx. 5. Anderson, R. (2007). The credit scoring toolkit: theory and practice for retail credit risk management. Oxford, UK : Oxford University Press. 122


Дослідження способів трансформації…

Ю. В. Клебан

6. Sorokin, A. S. (2014). Postroyeniye skoringovykh kart s ispolzovaniyem modeli logisticheskoy regressii. Naukovedeniye (Science of Science), 2, 1–29 [in Russian]. 7. Siddiqi, N. (2006). Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring. New Jersey, NJ: John Wiley and Sons. 8. Jopia, H. (2015, March 24). R Package ‘smbinning’: Optimal Binning for Scoring Modeling. Retrieved from https://blog.revolutionanalytics.com/ 2015/03/r-packagesmbinning-optimal-binning-for-scoring-modeling.html. 9. Kovalev, M., & Korzhenevskaya, V. (2007). Metodika postroyeniya bankovskoy skoringovoy modeli dlya otsenki kreditosposobnosti fizicheskikh lits. Vestnik Assotsiatsii belorusskikh bankov (Bulletin of the Belarusian Banks Association), 46, 16–20 [in Russian]. 10. Kolyada, Y. V., & Bondar, V. A. (2016). Binninh u neyromerezhevykh skorynhovykh modelyakh. Neyro-nechitki tekhnolohiyi modelyuvannya v ekonomitsi (Neuro-Fuzzy Modeling Techniques in Economics), 5, 60–80 [in Ukrainian]. 11. Palkin, N.B., & Afanasiev, V. V. (2013). Optimal’noye kvantovaniye dlya povysheniya kachestva binarnykh klassifikatorov. Shtuchnyy Intelekt (Artificial Intelligence), 4, 392–399 [in Russian]. 12. Fair Isaac Corporation. (2014, March). Building Powerful, Predictive Scorecards: An overview of Scorecard module for FICO Model Builder. Retrieved from http://www.fico.com/en/wp-content/secure_upload/ Building_Powerful_Predictive_Scorecards_1991WP.pdf. 13. TIBCO. (2019). TIBCO Statistica 13.5.0. Retrieved from http://documentation.statsoft.com/portals/0/formula%20guide/Weight%20of %20Evidence%20Formula%20Guide.pdf. 14. Matviychuk, A. V., & Kleban, Yu. V. (2017). Binninh kilʹkisnykh zminnykh z formuvannyam trendu dlya zadach skorynhu. Modelyuvannya ta informatsiyni systemy v ekonomitsi (Modeling and information systems in economics), 93, 213–229 [in Ukrainian]. 15. Gaston, S. (2019). CreditScoring. Retrieved from https://github.com/gastonstat/CreditScoring/blob/master/CreditScoring.csv. 16. Kuhn, M. (2008). Building predictive models in R using the caret package. Journal of Statistical Software, 28(5), 1–26. Retrieved from http://www.jstatsoft.org/article/view/v028i05/v28i05.pdf. 17. Marsaglia, G., Tsang, W.W., & Wang, J. (2003). Evaluating Kolmogorov’s Distribution. Journal of Statistical Software, 8(18), 1–4. Retrieved from http://www.jstatsoft.org/v08/i18/paper. 18. Powers, D. M. (2011). Evaluation: From Precision, Recall and FMeasure to ROC, Informedness, Markedness & Correlation. Journal of Machine Learning Technologies, 2(1), 37–63. Retrieved from https://bioinfopublication.org/files/articles/2_1_1_JMLT.pdf. Стаття надійшла до редакції 28.07.2019

123


УДК 330.3; 005.31 DOI 10.33111/nfmte.2019.124

ВПЛИВ РОЗВИТКУ ЧЕТВЕРТОЇ ІНДУСТРІАЛЬНОЇ РЕВОЛЮЦІЇ НА ДИВЕРГЕНЦІЮ І КОНВЕРГЕНЦІЮ ЕКОНОМІЧНОЇ НЕРІВНОСТІ ДЛЯ РІЗНИХ КРАЇН СВІТУ

В. М. Кобець Доктор економічних наук, доцент, професор кафедри інформатики, програмної інженерії та економічної кібернетики Херсонський державний університет вул. Університетська, 27, м. Херсон, 73003, Україна vkobets@kse.org.ua

В. О. Яценко Магістр з міжнародної економіки, аспірант кафедри міжнародної економіки та маркетингу Київський національний університет імені Тараса Шевченка вул. Васильківська, 90а, м. Київ, 03022, Україна valeriayatsenko5@gmail.com Вибір між економічною ефективністю та соціальною справедливістю став ключовою проблемою в економічному розвитку, оскільки в сучасній економічній системі, яка наблизилася до оптимуму Парето, досягнення обох цих цілей є взаємовиключним. Подальше забезпечення балансу між цими цілями можливе лише за кардинальної зміни діючої системи економічних відносин та отримання доступу до нових кривих виробничих можливостей, що може стати цілком реальними в рамках розвитку Індустрії 4.0 та шостої технологічної хвилі. Тим не менш, ніхто не може передбачити соціальний вплив Індустрії 4.0 на суспільство, яке в контексті майбутніх технологічних змін перетворюється на «Суспільство 4.0». Метою даної роботи є здійснення кластерного аналізу нерівності країн під впливом розвитку ІТ. Ми дослідили вплив валового капіталу, витрат на дослідження та розробки для створення інновацій, інтелектуальної власності та експорту високих технологій на нерівність країн, використовуючи аналіз основних компонентів на основі відкритих даних 2012–2015 років. Було визначено 2 основних кластери з 45 країн, які мають ознаки конвергенції та дивергенції завдяки розвитку ІТ. Було також виявлено країни, які мали нерівність в забезпеченні економічної ефективності та соціальної справедливості через інші причини, не пов’язані з розвитком інформаційних технологій. Ключові слова: кластерний аналіз, факторний аналіз, метод головних компонент, метод дендритів, економічна нерівність, четверта промислова революція. © В. М. Кобець, В. О. Яценко, 2019

124


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

ВЛИЯНИЕ ЧЕТВЕРТОЙ ИНДУСТРИАЛЬНОЙ РЕВОЛЮЦИИ НА ДИВЕРГЕНЦИЮ И КОНВЕРГЕНЦИЮ ЭКОНОМИЧЕСКОГО НЕРАВЕНСТВА ДЛЯ РАЗНЫХ СТРАН МИРА

В. Н. Кобец Доктор экономических наук, доцент, профессор кафедры информатики, программной инженерии и экономической кибернетики Херсонский государственный университет ул. Университетская, 27, г. Херсон, 73003, Украина vkobets@kse.org.ua

В. О. Яценко Магистр по международной экономике, аспирант кафедры международной экономики и маркетинга Киевский национальный университет имени Тараса Шевченко ул. Васильковская, 90а, г. Киев, 03022, Украина valeriayatsenko5@gmail.com Выбор между экономической эффективностью и социальной справедливостью стал ключевой проблемой в экономическом развитии, поскольку в нынешней экономической системе, которая приблизилась к оптимуму по Парето, достижение обеих этих целей является взаимоисключающим. Дальнейшее обеспечение баланса между этими целями возможно только при фундаментальном изменении существующей системы экономических отношений и получении доступа к новым кривым производственных возможностей, что может стать вполне реальными в рамках развития Индустрии 4.0 и шестой технологической волны. Тем не менее, никто не может предсказать социальное влияние Индустрии 4.0 на общество, которое в контексте будущих технологических изменений трансформируется в «Общество 4.0». Целью данной работы является проведение кластерного анализа неравенства стран в связи с развитием ИТ. Мы исследовали влияние валового накопления капитала, расходов на исследования и разработки для создания инноваций, интеллектуальной собственности и экспорта высокотехнологичных товаров на неравенство стран с использованием анализа основных компонентов на основе открытых данных за 2012–2015 годы. Было опеределено 2 основных кластера из 45 стран, которые имеют атрибуты конвергенции и дивергенции из-за развития ИТ. Также были выявлены страны, имевшие неравенство в обеспечении экономической эффективности и социальной справедливости по другим причинам, не связанным с развитием информационных технологий. Ключевые слова: кластерный анализ, факторный анализ, метод главных компонент, метод дендритов, экономическое неравенство, четвертая промышленная революция.

125


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

INFLUENCE OF THE FOURTH INDUSTRIAL REVOLUTION ON DIVERGENCE AND CONVERGENCE OF ECONOMIC INEQUALITY FOR VARIOUS COUNTRIES

Vitaliy Kobets DSc (Economic Sciences), Docent, Professor of Department of Informatics, Software Engineering and Economic Cybernetics Kherson State University 27 Universitetska Str., Kherson, 73003, Ukraine vkobets@kse.org.ua

Valeria Yatsenko Master’s Degree in International Economics, PhD student, Department of International Economics and Marketing Taras Shevchenko National University of Kyiv 90a Vasylkivska Str., Kyiv, 03022, Ukraine valeriayatsenko5@gmail.com The choice between economic efficiency and social equity has become a key objection in economic development, since in the current economic system, which has become close to the Pareto optimum, the achievement of both of these goals is mutually exclusive. Further balancing between these goals is possible only with a fundamental change of current system of economic relations and getting access to new curves of production capabilities, which may become quite real within development of Industry 4.0 and 6th technological wave. Nevertheless, nobody can predict the social impact of Industry 4.0 on society, which in the context of future technological changes transforms into Society 4.0. The purpose of this paper is to conduct a cluster analysis of countries inequality due to IT development. We researched impact of gross capital formation, research and development expenditure to create innovations, intellectual property and high-technology exports on inequality of countries using principal component analysis based on open data for 2012–2015. 2 main clusters of 45 countries were identified which have convergence and divergence attributes due to IT development. It was also revealed the countries with inequalities in ensuring economic efficiency and social equity due to other reasons which are not connected with IT development. Keywords: cluster analysis, factor analysis, principal component analysis, dendrite method, economic inequality, fourth industrial revolution. JEL Classification: D63, O14, O47, P51

126


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

Вступ Протягом багатьох століть економічна наука еволюціонувала та змінювалась відповідно до поточних викликів, що втілювалось у логічній зміні мети економічної діяльності: з максимізації прибутку в умовах первісного накопичення капіталу, оптимізації ресурсів у другій половині ХХ ст., до покращення суспільного добробуту в рамках концепції сталого розвитку. У результаті, вибір між економічною ефективністю та соціальною справедливістю постав наріжним каменем в економічній теорії, оскільки за умов функціонування нинішньої економічної системи, яка досягла стану близького до Парето-оптимуму, досягнення обох цих цілей є взаємовиключним. Єдиним способом їх одночасної реалізації виступає принципова зміна усієї системи економічних відносин і, як наслідок, вихід на нові криві виробничих можливостей. Такий сценарій може стати цілком реальним із впровадженням Індустрії 4.0 і переходом на новий шостий технологічний уклад. Проте постає питання соціальних наслідків впливу Індустрії 4.0 на суспільство, яке в рамках майбутніх технологічних змін зазнає потужних трансформацій, перетворившись на Society 4.0. [1], що спроможне змінити існуючий розподіл доходів, за якого 8 % населення світу володіє половиною світового багатства, в той час як на 92 % населення припадає решта [3]. Вивченню проблеми нерівності розподілу суспільного багатства в країнах і між країнами в цілому присвячено велика кількість досліджень вітчизняних і зарубіжних вчених. Так, наприклад, Н. Бірдсал досліджувала дуалістичну природу нерівності, конструктивна форма якої може здійснювати позитивний вплив на економічний розвиток країни [4]. Фактори та природу виникнення нерівності у суспільстві аналізували А. Сбарбелла та Е. Піетронеро [5]. Однак, вивчення впливу Індустрії 4.0 на ступінь розподілу доходів залишається малодослідженим [3] і потребує глибокого комплексного аналізу з метою адаптації країн світу до нової технологічної революції, оскільки різниці в рівнях продуктивності факторів виробництва та доходності формують резерв для зростання як окремих країн і їхніх угруповань, так і для міжнародної економіки в цілому, що дозволяє ідентифікувати нерівномірність як необхідну, проте недостатню умову економічного розвитку та зростання. Саме тому важливим постає питання, які дії необхідно вчинити економічним суб’єктам, аби 127


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

нерівномірність стала достатньою умовою для їхнього подальшого розвитку. Метою даного дослідження є аналіз впливу впровадження Індустрії 4.0 на рівномірність розподілу доходів у міжнародній економіці.

Виклад основного матеріалу 1. Зв’язок нерівності та технологічних змін Друга половина ХХ ст. відзначена рядом «економічних див», які внесли суттєві зміни в розподіл світового економічного впливу. Насамперед йдеться про Японію та країни першої хвилі НІК — «азійських драконів», економічний розквіт яких припав на 50–60-ті та 80-ті рр. минулого століття, відповідно. Не випадково, що пік розвитку цих країн паралельно проходив зі зміною технологічних укладів: четвертого, визначальною інновацією якого був двигун внутрішнього згорання, на п’ятий, рушієм якого стали мікроелектронні компоненти. Саме тому можна зробити логічне припущення про домінанту роль технологічного фактора та активного трансфера технологій у зростанні продуктивності праці та стрімкому розвитку галузей з високим рівнем доданої вартості в цих країнах. Аналогічно можна припустити, що нині в умовах переходу на шостий технологічний уклад у рамках Четвертої промислової революції можна очікувати новий вибух «економічних див», які можуть видозмінити співвідношення економічних сил у глобальному масштабі. Однак, постає питання про ймовірність реалізації подібного сценарію та масштаби його наслідків у міжнародній економіці. Зважаючи на історичну ретроспективу попередніх промислових революцій, країни з відносно більшим обсягом капіталу та виробничих потужностей першими імплементували нові технології і винаходи та, відповідно, першими отримували позитивні ефекти від них. Саме тому логічно передбачити, що розвинені країни, які володіють потужним промисловим комплексом, достатнім обсягом капіталу та розвиненою ІТ сферою отримуватимуть більші ефекти від нової промислової революції та надалі домінуватимуть на міжнародних ринках нових високотехнологічних товарів. Проте, тренд розвитку нинішньої економічної системи є нелінійним, що свідчить про невизначеність наслідків впровадження Індустрії 4.0, які залежать від широкого спектру 128


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

детермінант. На нашу думку, майбутній сценарій розвитку міжнародної економіки в умовах шостого технологічного укладу буде описуватися Х-подібною моделлю та включатиме чотири ймовірні сценарії розвитку (рис. 1).

Рис. 1. Ймовірні сценарії розвитку країн в умовах Індустрії 4.0 Джерело: розроблено авторами

Під впливом таких факторів, як готовність національної економіки до нового технологічного укладу, інституційного забезпечення країни, обсягу міжнародного трансферу технологій, психологічного портрету суспільства країни можуть або зберегти свої лідируючі позиції на світовому ринку, або поступитися ними в результаті запровадження Індустрії 4.0, формуючи чотири ймовірні траєкторії розвитку в трьох часових проміжках: t0 — поточний стан соціально-економічного розвитку; t1 — початок впровадження Індустрії 4.0; t2 — стадія зрілості Індустрії 4.0. 1. Країни, що розвиваються завдяки новим технологіям, відіграватимуть провідну роль у міжнародній економіці Цілком очевидно, що нові галузі виникають лише за наявності необхідних потужностей, які забезпечують появу та поступовий розвиток складніших систем і галузей [5]. Проте транснаціоналізація, міжнародний трансфер технологій і рух капіталу виступа129


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

ють інструментами ліквідації глибинних технологічних розривів і часових лагів між країнами, що відкриває можливість країнам, що розвиваються, відносно швидко та з низькими витратами імплементувати нові технології. Саме таким сценарієм описувався розвиток Східної Азії, в результаті якого Японія повністю змінила ранжування країн, впевнено займаючи місце у топ-3 країн за номінальним ВВП [6], у той час як «дракони» очолили різноманітні міжнародні рейтинги та індекси Doing Business, Economic Freedom, Innovation Index. На користь реалізації даного сценарію можуть слугувати такі аргументи: • нині напрямок економічного розвитку має експоненційну траєкторію, що робить наслідки впровадження Четвертої промислової революції непрогнозованими та радикально відмінними від попередніх революцій; • на відміну від розвинених країн, суб’єкти господарювання країн, що розвиваються, готові брати на себе ризики та здатні набагато швидше адаптуватися до нових економічних умов; • країни, що розвиваються, завдяки трансферу технологій можуть швидко та з відносно низькими витратами налагодити роботу Smart factories and Cyber-Physical Systems, ліквідовуючи відставання від розвинених країн. 2. Розвинені країни поступляться конкурентними перевагами У переважній більшості розвинених країн, а особливо в країнах ЄС, можна спостерігати зростання тенденцій до уникнення ризиків і зниження мотивації до підприємництва, що викликано інертністю соціально-економічних систем цих країн [1] і нездатністю справлятися з невизначеністю ефективно. Як наслідок, траєкторія їхнього розвитку, на відміну від попередніх промислових революцій, матиме спадний темп зростання. 3. Розвинені країни збережуть провідну роль у розподілі глобальних економічних сил Маючи потужний промисловий потенціал, розвинену ІТ сферу, значні обсяги капіталу та сформовану систему зрілих інституцій, розвинені країни є головними ініціаторами Четвертої промислової революції та отримають найбільші виграші від її впровадження у майбутньому. Крім того, розвинені країни зможуть отримати набагато більші позитивні ефекти завдяки розвиненій системі підтримуючих або суміжних з Індустрією 4.0 галузей, утворюючи так званий ефект суміжних галузей. 130


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

Проте таке припущення є справедливим лише для тих країн, які вже розпочали підготовку до впровадження Індустрії 4.0. Оскільки суспільство може не мати достатньо часу для адаптації, завчасна підготовка має все більше і більше значення. Наприклад, Японія вже презентувала концепцію Суспільства 5.0 — п’ятого наукового та технологічного базового плану Японії (2016–2020) [1]. Однак, зважаючи на відносно високу вартість більшості ресурсів у розвинених країнах і, відповідно, низьку цінову конкурентоспроможність нових високотехнологічних товарів, максимізація ефектів від нової Промислової революції відбудеться лише у періоді t2. 4. Країни, що розвиваються, не реалізують можливості Індустрії 4.0 Не маючи достатнього обсягу капіталу та слабку інституціональну структуру, країни, що розвиваються, не зможуть повністю реалізувати всі можливості та переваги нової промислової революції, надалі експлуатуючи ресурс цінової конкурентоспроможності своїх товарів і послуг. У кінцевому випадку реалізація одного із зазначених сценаріїв залежатиме від домінування того чи того фактору конкурентоспроможності — наявної виробничої та технологічної бази або здатності швидко та з найменшими витратами адаптуватися до нової економічної кон’юнктури, оскільки технологічний прогрес відбувається набагато швидше, ніж здатність суспільства абсорбувати зміни [7]. 2. Методологія Незважаючи на велику різноманітність статистичних методів (рис. 2), факторний і кластерний аналіз усе ще залишаються найпопулярнішими для проведення угруповання досліджуваних об’єктів — виявлення їх однорідних груп за набором визначених ознак. Відповідно до методології факторного аналізу, група висококорельованих ознак може бути пояснена та описана невеликою кількістю латентних факторів, які безпосередньо не спостерігаються, але мають суттєвий вплив на цю групу. Натомість, алгоритми кластерного аналізу дозволяють розділити набір об’єктів на однорідні групи за деяким формальним критерієм. Основна особливість цих груп полягає в тому, що об’єкти, які належать до одного кластеру, більше схожі між собою, ніж з об’єктами, які увійшли до інших кластерів. 131


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Багатофакторний статистичний аналіз Статистичні методи

Математичні методи

Інформаційне моделювання

Кластерний аналіз Факторний аналіз

Дисперсійний аналіз Інші

Рис. 2. Різноманітність методів багатофакторного статистичного аналізу Джерело: складено авторами на основі [8–10]

Обидва методи є досить подібними у своїх цілях, проте відмінні у принципах роботи (табл. 1). Враховуючи це, їх зазвичай використовують разом, поетапно усуваючи недоліки один одного. Варто зауважити, що дискримінантний аналіз досить схожий на кластерний аналіз: в обох випадках мета полягає в тому, щоб розділити всі спостереження на кілька груп, але для дискримінантного аналізу кількість і склад груп визначаються заздалегідь. Таблиця 1 ПОРІВНЯННЯ ФАКТОРНОГО ТА КЛАСТЕРНОГО АНАЛІЗУ Факторний аналіз

Спільне (мета)

Кластерний аналіз

обидва призначені для зменшення набору великих даних до меншої розмірності (кластерів)

факторні змінні агрегуються консолідація спостережень на основі часткової дисперсії, шляхом поступового аналізу відстані між ними та вже ствоВідмінне на яку впливає один фактор реними кластерами (механізм) аналізує взаємозв’язок чи по- створює ієрархічну структуру дібність змінних кластерів

У даному дослідженні були використані факторний (метод головних компонент, PCA) і кластерний аналіз. У подальших 132


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

дослідженнях може бути використаний дискримінантний аналіз для визначення правила формування кластерів і прогнозування майбутнього формування та розвитку технологічних кластерів на основі лінійної моделі класифікації (рис. 3).

Рис. 3. Алгоритм дослідження Джерело: складено авторами на основі [8–10]

Незважаючи на всі недоліки кластерного аналізу, такі як описовий характер і дефіцит статистичної бази, цей метод залишається одним із найвикористовуваніших серед усіх статистичних методів через його простоту та високу пояснювальну здатність. 3. Вплив четвертої індустріальної революції на соціальну нерівність Стрімкий розвиток інформаційних технологій підіймає таке дослідницьке запитання: який вплив ІТ та інновації мають на соціальну нерівність для різних країн? 133


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Одним із основних індексів соціальної нерівності є індекс Тейла, що розраховується за співвідношенням 𝑁

1 𝑐𝑖 𝑐𝑖 𝑇 = ∙ ∑ ( ∙ 𝑙𝑛 ), 𝑁 𝑐̅ 𝑐̅

(1)

𝑖=1

де ci — дохід i-го індивіда країни, 𝑐̅ — середній дохід для країни, N — кількість людей в країні. Якщо доходи всіх індивідів рівні, то індекс Тейла нульовий. Якщо дохід всього населення сконцентрований у одного індивіда, то індекс Тейла дорівнює lnN. Щоб порівняти індекси Тейла (TI) для різних країн, використовується середньозважений індекс Тейла із поправкою на ВВП 𝑁

𝐺𝐷𝑃𝑙 1 𝑐𝑖 𝑐𝑖 𝑇𝐼 = ∙ ∑ ( ∙ 𝑙𝑛 ), 𝐺𝐷𝑃 𝑁 𝑐̅ 𝑐̅ 𝑖=1

(2) 𝑛

де GDPl — валовий внутрішній продукт країни l, 𝐺𝐷𝑃 = ∑ 𝐺𝐷𝑃𝑙 — 𝑙=1 світовий ВВП, n — кількість країн. Серед пояснюючих змінних ми можемо використовувати набори даних за 2012–2015 рр. (після введення концепції Четвертої промислової революції у 2011 р.): 1) валове накопичення капіталу у % від ВВП (x1), яке може замінювати ресурси праці [11]; 2) витрати на наукові дослідження і розробки у % від ВВП (x2) для створення інновацій [12]; 3) виплати по інтелектуальній власності (x3), що забезпечують конкурентні переваги для ноухау [13]; 4) частка високотехнологічного експорту у % від промислового експорту (x4) [14]. 4. Кластерний аналіз з використанням макросів Метод головних компонент (PCA) дозволяє зробити попередній аналіз впливу розвитку інформаційних технологій (ІТ) на економічну нерівність. Проте, цього аналізу недостатньо, щоб визначити чіткі межі кластерів країн, нерівність або рівномірність розподілу благ в яких визначається розвитком ІТ. Вирішення даної задачі спрямоване на з’ясування того, наскільки суттє134


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

вий чи несуттєвий вплив ІТ здійснює на розподіл доходів у розвинених країнах і країнах, що розвиваються. Кластерний аналіз дозволяє розподілити країни на однорідні групи за наявності сукупності властивостей, що описують вплив розвитку ІТ на ці країни. Матриця «об’єкти-властивості» формується на основі даних [11–15] та в загальному набуває вигляду (n = 45 — кількість країн, m = 4 — кількість властивостей): 𝑥11 𝑥12 …𝑥1𝑚 𝑥21 𝑥22 …𝑥2𝑚 … …… … 𝑋 = 𝑥𝑖1 𝑥𝑖2 … 𝑥𝑖𝑚 , (3) … …… … (𝑥𝑛1 𝑥𝑛2 …𝑥𝑛𝑚 ) де xij — значення властивості j (j = 1,…, m) для країни з номером i (i = 1,…, n). Загальна схема розв’язання задачі кластерного аналізу реалізується таким чином: 1. формується вибірка країн для аналізу (до вибірки входять країни, для яких є статистична інформація стосовно індексу економічної нерівності [15]); 2. обирається сукупність ознак, що характеризують ІТ фактори, які впливають на економічну нерівність в країнах [11–14]; 3. визначається міра подібності між країнами за сукупністю ознак; 4. формуються кластери; 5. аналізується отримана інформація щодо впливу ІТ факторів на структуру кластерів і нерівність у країнах, що увійшли до них. Для кластерного аналізу використовується ізотонічний або ізоморфний алгоритм. Ізотонічний алгоритм формує групи країн (кластери) з однорідних значень за показниками нерівності (y) за допомогою PCA. Ізоморфний алгоритм у групи включає країни, близькі за структурою, в яких пропорції властивостей (x1, x2, x3, x4) несуттєво відрізняються. Із застосуванням ізоморфного перетворення перш за все здійснюється нормування показників за співвідношенням: 𝑥𝑖𝑗

𝑍𝑖𝑗 =

∑𝑛 𝑖=1 𝑥𝑖𝑗 𝑥𝑖𝑗 ∑𝑚 𝑗=1 ∑𝑛 𝑥

𝑖=1 𝑖𝑗

135

.

(4)


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

У процесі кластеризації відстань між двома країнами i та k розраховується за формулою: 2 𝑑𝑖𝑘 = √∑𝑚 𝑗=1(𝑍𝑖𝑗 − 𝑍𝑘𝑗 ) .

(5)

В ізоморфному перетворенні відстані будуть мінімальні, коли вектори ознак колінеарні, а максимальними — якщо вектори перпендикулярні. Після визначення відстаней між країнами розподіл на групи відбувається за допомогою методу шарів (методу дендритів), відповідно до якого будуються дендрити для визначення сліду даних (тобто утворюється просторова форма шарів). Сутність методу полягає в тому, що для кожного об’єкта (країни) визначається мінімальна відстань до найближчого до нього об’єкта. Потім з цих мінімальних відстаней обирається максимальна, яка задає критичний радіус (визначає відстань, що показує, чи належить об’єкт даному кластеру): 𝑚𝑖𝑛 𝑟 = 𝑚𝑎𝑥 𝑑𝑖𝑗 . 𝑖 𝑗

(6)

Об’єкти, між якими відстань менше критичної, належать до одного кластера. Первинний розподіл об’єктів дозволяє одержати кластери шаровидної або еліпсоїдної форми. Оскільки при виконанні практичних задач такі кластери зустрічаються не завжди (частіше буває складніша форма), то на наступному етапі методу шарів здійснюється побудова дендритів і визначення зв’язності в системі кластерів, що дозволяє їх поєднати в складніші структури, які в більшій мірі відповідають скупченням досліджуваних об’єктів. З метою такого поєднання визначається відстань між кластерами, що дорівнює мінімальній відстані між об’єктами, які входять у ці кластери: 𝐶𝑙𝑘 = 𝑝∈𝑔𝑚𝑖𝑛 𝑑𝑝𝑞 , , 𝑞∈𝑔 𝑙

𝑘

(7)

де dpq — відстань між елементами p кластера l i q кластера k (𝑙, 𝑘 = ̅̅̅̅̅ 1, 𝐺 ), G — кількість груп (кластерів). При перевищенні критичної відстані кластери вважаються незв’язними. Критична відстань дорівнює максимальній з-поміж 136


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

усіх кластерів відстані між сусідніми елементами в одному кластері й обчислюється за формулою: 𝑚𝑎𝑥 𝑚𝑖𝑛 𝐶 = 𝑙=1,𝐺 ̅̅̅̅̅ 𝑝,𝑞∈𝑔 𝑑𝑝𝑞 . 𝑙

(8)

При конструюванні дендриту, що поєднує всі групи, розриваються зв’язки між кластерами, відстань між якими вище критичної. У результаті отримується набір дендритів, незв’язаних між собою. Дані, що входять у кожну підвибірку, можна досліджувати засобами регресійного аналізу. Для вирішення задачі розбиття країн на кластери з використанням ізотонічного перетворення з пошуком сліду авторами було розроблено програму, що складається з таких блоків: 1. Обирається черговий об’єкт А (країна). Якщо він входить хоча б в один ланцюг, то відбувається перехід до наступного об’єкта. 2. Для чергового об’єкта знаходиться такий об’єкт В, відстань до якого від А мінімальна. Далі перевіряється, чи не входить об’єкт В до одного зі вже сформованих ланцюгів. Якщо входить, то об’єкт А додається до ланцюга, в який входить об’єкт В. Якщо ні, то з об’єктів А і В утворюється первинний ланцюг. 3. Якщо є об’єкти, не включені в ланцюги, то здійснюється перехід до п. 1, у протилежному випадку — до п. 4. 4. Знаходиться матриця відстаней між ланцюгами (відстань між ланцюгами дорівнює відстані між найближчими об’єктами в цих ланцюгах). 5. Будується дендрит — до кожного ланцюга приєднується лише один найближчий ланцюг (за виключенням випадку, коли два або більше ланцюгів мають однакові відстані до певного ланцюга). 6. Розраховується критична відстань, що дорівнює сумі середнього значення відстаней між ланцюгами в дендриті (п. 5) і середньоквадратичного значення цих же відстаней. 7. При конструюванні дендриту, що поєднує всі ланцюги, розриваються зв’язки між кластерами, відстань між якими вище критичної. Виконання програми дозволяє визначити матрицю ізоморфних відстаней (рис. 4), відстані між об’єктами ланцюгів (рис. 5) і відстані між ланцюгами (табл. 2). 137


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Рис. 4. Матриця ізоморфних відстаней

Розроблений макрос обчислив 15 ланцюгів: ланцюг 1 (країни 1, 21); ланцюг 2 (країни 2, 12, 3, 17); ланцюг 3 (країни 4, 13, 23, 29); ланцюг 4 (країни 5, 34, 40); ланцюг 5 (країни 6, 26); ланцюг 6 (країни 7, 37, 25); ланцюг 7 (країни 8, 36, 22, 31); ланцюг 8 (країни 9, 39, 10, 27, 28, 33); ланцюг 9 (країни 11, 32, 18); ланцюг 10 (країни 14, 41, 35); ланцюг 11 (країни 15, 24); ланцюг 12 (країни 16, 44, 38); ланцюг 13 (країни 19, 20); ланцюг 14 (країни 30, 45); ланцюг 15 (країни 42, 43). Ілюстрацію відстаней між об’єктами 9–15 ланцюгів наведено на рис. 5.

Рис. 5. Відстані між об’єктами ланцюгів 138


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

Матриця відстаней між об’єктами 15 ланцюгів (рис. 5) дозволяє обчислити мінімальну відстань між ланцюгами (табл. 2) для подальшого їх об’єднання в кластери. Таблиця 2 ВІДСТАНІ МІЖ ЛАНЦЮГАМИ Між країнами

Між кластерами

Відстань

(21; 22)

[1; 7]

0,165415567

(12; 24)

[2; 11]

0,078828257

(4; 36)

[3; 7]

0,159051831

(5; 17)

[2; 4]

0,120105846

(6; 39)

[5; 8]

0,081872222

(5; 25)

[4; 6]

0,126574802

(6; 36)

[5; 7]

0,120105846

(27; 32)

[8; 9]

0,080980923

(27; 32)

[8; 9]

0,080980923

(2; 35)

[2; 10]

0,117821652

(12; 24)

[2; 11]

0,078828257

(5; 16)

[4; 12]

0,131730255

(18; 20)

[9; 13]

0,091566985

(17; 45)

[2; 14]

0,213944224

(6; 43)

[5; 15]

0,102494332

Джерело: розроблено авторами

Підготовлений на основі даних рис. 5 і табл. 2 дендрит буде мати структуру, в якій кластери будуть включати такі ланцюги: кластер 1 ∈ ланцюг 16; кластер 2 ∈ ланцюг 1; кластер 3 ∈ ланцюг 3; кластер 4 ∈ ланцюг 7 ∪ ланцюг 5 ∪ ланцюг 8 ∪ ланцюг 15 ∪ ланцюг 9 ∪ ланцюг 13 (рис. 6); кластер 5 ∈ ланцюг 14; кластер 6 ∈ ланцюг 12; кластер 7 ∈ ланцюг 2 ∪ ланцюг 11 ∪ ланцюг 10 ∪ ланцюг 4 ∪ ланцюг 6 (рис. 7). 139


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Рис. 6. Діаграма дендриту для кластера країн 4 під впливом IT факторів

Рис. 7. Діаграма дендриту для кластера країн 7 під впливом IT факторів

У результаті було отримано 7 кластерів, які описують різноманітний вплив ІТ факторів на нерівномірний розподіл доходів у різних країнах світу. Зокрема, у табл. 3 і 4 наведено значення індекса Тейла та IT факторів, що впливають на нього (валове накопичення капіталу x1, витрати на наукові дослідження і розробки x2, виплати по інтелектуальній власності x3, частка високотехнологічного експорту x4 ), розраховані для країн четвертого та сьомого кластеру, відповідно. 140


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

Таблиця 3 ЗНАЧЕННЯ ІНДЕКСА ТЕЙЛА ТА IT ФАКТОРІВ ДЛЯ КРАЇН ЧЕТВЕРТОГО КЛАСТЕРА x3, млн дол. США

x4, % від промислового експорту

y

1,78

1042,9

16,08

5,06·10-5

26,48

1,62

587,8

18,83

6,44·10-5

Греція

12,80

0,70

370,9

9,07

1,58·10-4

19

Гонконг

25,22

0,73

2018,6

16,18

7,15·10-5

20

Угорщина

19,45

1,26

1701,0

18,12

1,77·10-4

27

Литва

19,37

0,89

38,2

10,42

4,95·10-5

10

Кипр

16,12

0,44

0,0

13,00

2,02·10-6

39

Словакія

20,94

0,80

181,0

9,21

5,13·10-5

9

Хорватія

19,18

0,75

307,4

9,91

5,29·10-5

6

Болгарія

21,94

0,60

184,8

7,75

1,08·10-4

26

Латвія

26,17

0,66

43,7

9,78

2,42·10-5

43

Україна

21,72

0,75

727,0

6,30

1,98·10-4

42

Турція

28,30

0,83

741,0

1,83

1,50·10-3

36

Румунія

26,95

0,48

452,5

6,38

2,66·10-4

8

Колумбія

22,22

0,22

526,9

5,19

1,12·10-4

22

Індонезія

35,07

0,00

1800,1

7,30

2,16·10-3

31

Нова Зеландія

20,92

0,00

973,6

9,79

6,33·10-5

№ п/п

Країни

11

Чеська Республіка

26,19

32

Норвегія

18

x1, x2, % від ВВП % від ВВП

141


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Таблиця 4 ЗНАЧЕННЯ ІНДЕКСА ТЕЙЛА ТА IT ФАКТОРІВ ДЛЯ КРАЇН СЬОМОГО КЛАСТЕРА № п/п

Країни

14 Естонія 41 Іспанія 35 Португалія

x1, % від ВВП

x2, % від ВВП

x3, млн дол. США

x4, % від промислового експорту

y

29,09 19,99 15,72

2,12 1,29 1,38

61,3 0,0 505,4

10,75 6,99 4,14

9,35·10-6 5,25·10-4 2,01·10-4

2

Австрія

23,98

2,91

1955,9

12,84

1,39·10-4

12

Данія

19,47

2,98

1392,5

14,22

3,49·10-5

3 Бельгія 17 Німеччина 24 Ізраїль

23,20 19,31 21,24

2,27 2,87 4,16

2823,6 6399,2 1111,7

11,36 15,98 15,85

2,54·10-4 2,10·10-3 2,59·10-4

15

Фінляндія

22,53

3,42

1775,1

8,55

4,94·10-5

5

Бразилія

21,42

1,13

4198,2

10,49

3,81·10-3

34

20,99

0,88

2332,0

6,95

3,64·10-4

19,97

0,73

2017,1

5,38

6,41·10-4

25 37

Польща Південна Африка Італія Росія

17,86 24,54

1,27 1,03

5588,0 7629,3

7,07 8,38

5,49·10-4 2,09·10-3

7

Канада

24,93

1,78

10903,9

13,78

3,67·10-4

40

На основі даних з табл. 3 та 4 побудуємо регресійні моделі оцінки індекса Тейла (індикатора економічної нерівності) для країн кластера 4 (10) і кластера 7 (11), відповідно: 𝑦 = −0,00041 + 4,83 ∙ 10−6 ∙ 𝑥1 + 9,14 ∙ 10−6 ∙ 𝑥2 + + 3,65 ∙ 10−13 ∙ 𝑥3 − 6,35 ∙ 10−5 ∙ 𝑥4 ,

(10)

𝑦 = −0,00158 − 5,94 ∙ 10−5 ∙ 𝑥1 − 7,62 ∙ 10−4 ∙ 𝑥2 + + 3,79 ∙ 10−14 ∙ 𝑥3 + 1,84 ∙ 10−4 ∙ 𝑥4 .

(11)

Як можна бачити з функції (10), зростання валового накопичення капіталу (x1), витрат на наукові дослідження і розробки (x2) підвищує економічну нерівність, тобто дивергенцію показників нерівності, для країн із кластера 4. Разом із цим, для кластера 7, 142


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

що видно з функції (11), збільшення x1 і x2 знижує індекс Тейла (обумовлює конвергенцію показників нерівності країн). Тобто, зростання на 1 % від ВВП валового накопичення капіталу веде до підвищення (дивергенції) економічної нерівності на 4,83 · 10–6 для кластера 4 і скорочення економічної нерівності (конвергенції) для кластера 7 на 5,94 · 10–5. Зростання витрат на наукові дослідження і розробки на 1 % від ВВП призводить до збільшення економічної нерівності (дивергенції) на 9,14 · 10–6 для кластера 4 і зменшує економічну нерівність (конвергенції) для кластера 7 на 7,62 · 10–4. Збільшення виплат по інтелектуальній власності (x3) на 1 дол. США призводить до посилення економічної нерівності на 3,65 · 10–13 для кластера 4 і на 3,79 · 10–14 для кластера 7. Розширення частки високотехнологічного експорту (x4 ) на 1 % від промислового експорту приводить до зниження економічної нерівності на 6,35 · 10–5 і збільшення на 1,84 · 10–4 для кластерів 4 і 7, відповідно.

Висновки Індустрія 4.0 створює нові можливості для переходу на цифрові технології, розвитку робототехніки, автоматизації всіх бізнес-процесів, створення новітніх продуктів і послуг. Це дає конкурентні переваги для збільшення експорту країн, підвищення глобального рівня конкурентоспроможності, але розширює рівень фрикційного та структурного безробіття, що знижує рівень доходу для окремих осіб і збільшує розрив нерівності між різними верствами населення. Таким чином, передові наукові дослідження та розробки поглибили нерівність між різними країнами. Інтелектуальна власність та експорт високих технологій змінили свій вплив на рівень нерівності. Близько 44 % усіх країн мали нерівність через інші причини, що не пов’язані з розвитком ІТ та розповсюдженням Індустрії 4.0, яка має різну швидкість поширення для різних країн. Для сімнадцяти країн одного з кластерів (Чеська Республіка, Норвегія, Греція, Гонконг, Угорщина, Литва, Кипр, Словакія, Хорватія, Болгарія, Латвія, Україна, Турція, Румунія, Колумбія, Індонезія, Нова Зеландія) переважна більшість IT факторів мають прямий вплив на нерівність, у той час як для іншого кластера із п’ятнадцяти країн (Естонія, Іспанія, Португалія, Австрія, Данія, Бельгія, Німеччина, Ізраїль, Фінляндія, Бразилія, Польща, Пів143


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

денна Африка, Італія, Росія, Канада) — обернений. Зростання валового накопичення капіталу, витрат на наукові дослідження і розробки підвищує економічну нерівність (тобто призводить до конвергенцї розвитку) 17 країн першого зазначеного кластера та скорочує нерівність (тобто сприяє дивергеції розвитку країн) другого вказаного кластера. Збільшення показника інтелектуальної власності приводить до посилення економічної нерівності для країн з обох визначених кластерів. Розширення високотехнологічного експорту, навпаки, приводить до дивергенції країн за ознакою нерівності для першого виділеного кластера та зумовлює конвергенцію розвитку країн за ознакою нерівності для другого зазначеного кластера.

Список літератури 1. Vacek J. On The Road: From Industry 4.0 to Society 4.0. Trendy v Podnikání. 2017. Vol. 7(4). P. 43–49. 2. Kobets V., Yatsenko V., Mazur A., Zubrii M. Data analysis of private investment decision making using tools of Robo-advisers in long-run period. Proceedings of the 14th International Conference on ICT in Education, Research and Industrial Applications. Integration, Harmonization and Knowledge Transfer (Kyiv, Ukraine, 14–17 May), CEUR-WP, 2018. Vol. 2104. P. 144–159. URL: http://ceur-ws.org/Vol-2104/paper_162.pdf. 3. Kuzmenko O., Roienko V. Nowcasting Income Inequality in the Context of the Fourth Industrial Revolution. SocioEconomic Challenges. 2017. Vol. 1. P. 5–12. URL: http://armgpublishing.sumdu.edu.ua/wpcontent/uploads/2016/12/files/sec/issue1/SEC_1_2017_Kuzmenko.pdf. 4. Birdsall N. The World Is Not Flat: Inequality and Injustice in Our Global Economy. WIDER Annual Lecture 9. UNU World Institute for Development Economics Research : website. 2005. 55 p. URL: https://www.wider.unu.edu/sites/default/files/AL09-2005.pdf. 5. Sbardella A, Pugliese E, Pietronero L. Economic development and wage inequality: A complex system analysis. PLoS ONE. 2017. No. 12(9). P. 1–26. URL: https://doi.org/10.1371/journal.pone.0182774. 6. Projected GDP Ranking (2019–2024). Statistics Times : website. URL: http://statisticstimes.com/economy/projected-world-gdp-ranking.php (Last accessed: 17.06.2019). 7. Snihovyi O., Kobets V., Ivanov O. Implementation of Robo-Advisor Services for Different Risk Attitude Investment Decisions Using Machine Learning Techniques. Communications in Computer and Information Science. 2019. Vol. 1007. P. 298–321. 144


Вплив розвитку четвертої…

В. М. Кобець, В. О. Яценко

8. Everitt B.S., Landau S., Leese M. Cluster Analysis. Fourth edition. London: Taylor & Francis, 2001. 237 p. 9. Manly B.F.J. Multivariate Statistical Methods: A primer. Third edition. Boca Raton: Chapman and Hall, 2005. 208 p. 10. Rencher A.C. Methods of Multivariate Analysis. Second edition. New York: John Wiley & Sons, 2002. 738 p. 11. Data set for gross capital formation (% of GDP). Worldbank : website. URL: https://data.worldbank.org/indicator/NE.GDI.TOTL.ZS (Last accessed: 17.06.2019). 12. Data set for research and development expenditure (% of GDP). Worldbank : website. URL: https://data.worldbank.org/indicator/GB.XPD. RSDV.GD.ZS (Last accessed: 17.06.2019). 13. Data set for charges for the use of intellectual property, payments (BoP, current US$). Worldbank : website. URL: https://data.worldbank. org/indicator/BM.GSR.ROYL.CD?view=chart (Last accessed: 17.06.2019). 14. Data set for high-technology exports (% of manufactured exports). Worldbank : website. URL: https://data.worldbank.org/indicator/TX.VAL. TECH.MF.ZS?view=chart (Last accessed: 17.06.2019). 15. Data set for Theil index analysis. Google Drive : website. URL: https://drive.google.com/open?id=1SSb26seUYM2Vj1AjovUN6jnWG3Sx8zMB (Last accessed: 17.06.2019). 16. Kobets V., Poltoratskiy M. Using an evolutionary algorithm to improve investment strategies for industries in an economic system. Proceedings of the 12th International Conference on ICT in Education, Research and Industrial Applications. Integration, Harmonization and Knowledge Transfer (Kyiv, Ukraine, 21–24 June), CEUR-WP, 2016. Vol. 1614. P. 485–501. URL: http://ceur-ws.org/Vol-1614/paper_102.pdf.

References 1. Vacek, J. (2017). On The Road: From Industry 4.0 to Society 4.0. Trendy v Podnikání, 7(4), 43–49. 2. Kobets, V., Yatsenko, V., Mazur, A., & Zubrii, M. (2018, May 14–17). Data analysis of private investment decision making using tools of Roboadvisers in long-run period. In V. Ermolayev, M. C. Suárez-Figueroa et al. (Eds.), Proceedings of the 14th International Conference on ICT in Education, Research and Industrial Applications. Integration, Harmonization and Knowledge Transfer (Kyiv, Ukraine), CEUR-WP, 2104, 144–159. Retrieved from http://ceur-ws.org/Vol-2104/paper_162.pdf. 3. Kuzmenko, O., & Roienko, V. (2017). Nowcasting Income Inequality in the Context of the Fourth Industrial Revolution. SocioEconomic Challenges, 1, 5–12. Retrieved from http://armgpublishing.sumdu.edu.ua/ wp-content/uploads/2016/12/files/sec/issue1/SEC_1_2017_Kuzmenko.pdf. 145


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

4. Birdsall, N. (2005). The World Is Not Flat: Inequality and Injustice in Our Global Economy. WIDER Annual Lecture 9. Retrieved from https://www.wider.unu.edu/sites/default/files/AL09-2005.pdf. 5. Sbardella, A., Pugliese, E., & Pietronero, L. (2017, September 19). Economic development and wage inequality: A complex system analysis. PLoS ONE, 12(9), 1–26. DOI: 10.1371/journal.pone.0182774. 6. Statistics Times. (2019). Projected GDP Ranking (2019-2024). Retrieved from http://statisticstimes.com/economy/projected-world-gdpranking.php. 7. Snihovyi, O., Kobets, V., & Ivanov, O. (2019). Implementation of Robo-Advisor Services for Different Risk Attitude Investment Decisions Using Machine Learning Techniques. Communications in Computer and Information Science, 1007, 298–321. 8. Everitt, B.S., Landau, S., & Leese, M. (2001). Cluster Analysis. Fourth edition. London, UK: Taylor & Francis. 9. Manly, B.F.J. (2005). Multivariate Statistical Methods: A primer. Third edition. Boca Raton, FL: Chapman and Hall. 10. Rencher, A.C. (2002). Methods of Multivariate Analysis. Second edition. New York, NY: John Wiley & Sons. 11. Worldbank. (2019, June 17). Data set for gross capital formation (% of GDP). Retrieved from https://data.worldbank.org/indicator/NE.GDI. TOTL.ZS. 12. Worldbank. (2019, June 17). Data set for research and development expenditure (% of GDP). Retrieved from https://data.worldbank.org/ indicator/GB.XPD.RSDV.GD.ZS. 13. Worldbank. (2019, June 17). Data set for charges for the use of intellectual property, payments (BoP, current US$). Retrieved from https://data.worldbank.org/indicator/BM.GSR.ROYL.CD?view=chart. 14. Worldbank. (2019, June 17). Data set for high-technology exports (% of manufactured exports). Retrieved from https://data.worldbank.org/ indicator/TX.VAL.TECH.MF.ZS?view=chart. 15. Google Drive. (2019, June 17). Data set for Theil index analysis. Retrieved from https://drive.google.com/open?id=1SSb26seUYM2Vj1Ajov UN6jnWG3Sx8zMB. 16. Kobets, V., & Poltoratskiy, M. (2016, June 21–24). Using an evolutionary algorithm to improve investment strategies for industries in an economic system. In V. Ermolayev, A. Spivakovsky et al. (Eds.), Proceedings of the 12th International Conference on ICT in Education, Research and Industrial Applications. Integration, Harmonization and Knowledge Transfer (Kyiv, Ukraine), CEUR-WP, 1614, 485–501. Retrieved from http://ceur-ws.org/Vol-1614/paper_102.pdf. Стаття надійшла до редакції 18.07.2019

146


УДК 338.124.4, 519.865.7 DOI 10.33111/nfmte.2019.147

МОДЕЛЮВАННЯ ПРОЦЕСІВ ТРАНСГРАНИЧНОГО ПОШИРЕННЯ ФІНАНСОВИХ КРИЗ

І. І. Стрельченко Кандидат економічних наук, доцент, докторант кафедри економіко-математичного моделювання Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» проспект Перемоги, 54/1, м. Київ, 03680, Україна iistrelchenko@gmail.com У статті досліджуються особливості процесів поширення кризових явищ через фінансові та торгівельні канали. Наведено основні передумови, що мають бути враховані при моделюванні їх розповсюдження. Зокрема, для опису часової структури цих процесів автором вводиться термін «латентний період» та обґрунтовується алгоритм визначення його часових меж. Проведено кількісне оцінювання ефективності запропонованої концепції. Спираючись на отримані результати здійснено відбір макроекономічних індикаторів, що характеризують стан основних каналів поширення кризових явищ і відображають деформаційні процеси в економіці за деякий час до завершення латентного періоду. В результаті проведеного аналізу та експериментального тестування сформовано систему вхідних класифікаційних характеристик, необхідних для побудови економіко-математичної моделі прогнозування наслідків поширення фінансової кризи: обсяг офіційних золотовалютних резервів без урахування золота; співвідношення грошового агрегату М2 до обсягу золотовалютних резервів; грошовий мультиплікатор; зміна грошового агрегату М0; зміна грошового агрегату М2; спред ставки відсотка по кредитах в іноземній валюті всередині країни до аналогічного показника за кордоном; коефіцієнт монетизації економіки; зростання експорту; зростання імпорту; частка експорту у ВВП. Отримана нейронна мережа-класифікатор на базі самоорганізаційної карти Кохонена розподіляє простір вихідних точок (кожна з котрих має просторову розмірність у десять координат та характеризується часовою глибиною у тривалість латентного періоду для досліджуваної країни) на кластери, в яких динаміка таких індикаторів як ВВП, реальний обмінний курс до СПЗ, обсяг золотовалютних резервів, гарантований державний борг та вартість облігацій зовнішньої державної позики є подібною. Це дозволило сформувати базу сценаріїв можливої поведінки економік під впливом процесів поширення кризових явищ на основі макропоказників, що характеризують стан фінансового та торгівельного каналів поширення. Ключові слова: фінансова криза, канали поширення кризи, латентний період, макроекономічний індикатор, ранговий коефіцієнт конкордації, нейронна мережа, карта Кохонена. © І. І. Стрельченко, 2019

147


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

МОДЕЛИРОВАНИЕ ПРОЦЕССОВ ТРАНСГРАНИЧНОГО РАСПРОСТРАНЕНИЯ ФИНАНСОВЫХ КРИЗИСОВ

И. И. Стрельченко Кандидат экономических наук, доцент, докторант кафедры экономико-математического моделирования Государственное высшее учебное заведение «Киевский национальный экономический университет имени Вадима Гетьмана» проспект Победы, 54/1, г. Киев, 03680, Украина iistrelchenko@gmail.com В статье исследуются особенности процессов распространения кризисных явлений через финансовые и торговые каналы. Приведены основные предпосылки, которые должны быть учтены при их моделировании. В частности, для описания временной структуры этих процессов автором вводится термин «латентный период» и обосновывается алгоритм определения его временных границ. Проведена количественная оценка эффективности предложенной концепции. Опираясь на полученные результаты осуществлен отбор макроэкономических индикаторов, характеризующих состояние основных каналов распространения кризисных явлений и отражающих деформационные процессы в экономике за некоторое время до конца латентного периода. В результате проведенного анализа и экспериментального тестирования сформирована система входных классификационных характеристик, необходимых для построения экономико-математической модели прогнозирования последствий финансового кризиса: объем официальных золотовалютных резервов без учета золота; соотношение денежного агрегата М2 к объему золотовалютных резервов; денежный мультипликатор; изменение денежного агрегата М0; изменение денежного агрегата М2; спрэд ставки процента по кредитам в иностранной валюте внутри страны к аналогичному показателю за рубежом; коэффициент монетизации экономики; рост экспорта; рост импорта; доля экспорта в ВВП. Полученная нейронная сеть-классификатор на основе самоорганизующейся карты Кохонена распределяет пространство исходных точек (каждая из которых имеет пространственную размерность в десять координат и характеризуется временной глубиной в продолжительность латентного периода для исследуемой страны) на кластеры, в середине которых динамика таких индикаторов как ВВП, реальный обменный курс к СПЗ, объем золотовалютных резервов, гарантированный государственный долг и стоимость облигаций внешнего государственного займа является сходной. Это позволило сформировать базу сценариев возможного поведения экономик под влиянием процессов распространения кризисных явлений на основе макропоказателей, характеризующих состояние финансового и торгового каналов распространения. Ключевые слова: финансовый кризис, каналы распространения кризиса, латентный период, макроэкономический индикатор, ранговый коэффициент конкордации, нейронная сеть, карта Кохонена.

148


Моделювання процесів трансграничного…

І. І. Стрельченко

MODELING OF CROSS-BORDER SPREADING OF FINANCIAL CRISIS

Inna Strelchenko PhD (Economic Sciences), Docent, DSc Candidate, Department of Economic and Mathematical Modeling State Higher Educational Establishment “Kyiv National Economic University named after Vadym Hetman” 54/1 Peremogy Avenue, Kyiv, 03680, Ukraine iistrelchenko@gmail.com The article deals with the features of the crisis propagation through financial and trade channels. The basic premises that should be taken into account when modeling them are given. In particular, to describe the temporal structure of these processes, the author introduces the term «latent period» and substantiates an algorithm for determining its time boundaries. A quantitative assessment of the proposed concept efficiency was carried out. Based on the results obtained, a selection of macroeconomic indicators was carried out which characterize the main channels for the spread of crisis phenomena and describe the deformation processes well in advance of the end of the latent period. As a result of analysis and testing, a system of input classification characteristics is formed, which are necessary to build an economic and mathematical model for predicting the effects of the financial crisis spreading: total reserves excluding gold; the ratio of the M2 monetary aggregate to the total reserves; money multiplier; change in the monetary aggregate M0; change in the monetary aggregate M2; spread of interest rates on loans in foreign currency within the country to the same indicator abroad; monetization coefficient; export growth; import growth; export share in GDP. The obtained neural network-classifier divides the space of the starting points (each of which has a spatial dimension of ten coordinates and is characterized by a time depth in the latency period for the country under study) into clusters, within which the dynamics of such indicators as GDP, national currency per SDR, total reserves excluding gold, publicly guaranteed debt and the value of external government loan bonds are similar. This allowed us to form a base of scenarios of the possible behavior of economies under the influence of the processes of the spread of crisis phenomena based on macro indicators characterizing the state of the financial and trade spreading channels. Keywords: financial crisis, channels of crisis spreading, latency period, macroeconomic indicator, rank coefficient of concordance, neural network, Kohonen map. JEL Classification: C45, F36, G15, G17

149


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Вступ Глобалізація та взаємне проникнення економік різних країн розмивають границі фінансових ринків і роблять їх надзвичайно вразливими до кризових процесів. Негативні тенденції, що розпочались в одній сфері господарювання, швидко перекидаються на інші та виходять за географічні межі держав. Нові умови функціонування глобального фінансового ринку потребують проведення ґрунтовних досліджень особливостей розвитку та поширення кризових явищ. Задача макропрогнозування поведінки динамічних об’єктів і систем в умовах різких збурень навколишнього середовища вимагає використання нелінійних моделей. З іншого боку, механізм її опису має бути інтуїтивно зрозумілим та мати чітку економічну інтерпретацію для забезпечення можливості використання отриманих результатів прогнозування відповідальними особами, що приймають рішення. Також при виборі математичного інструментарію потрібно враховувати обмеженість обсягу даних, придатних для розрахунків. Це пов’язано з неоднорідністю статистичної інформації в розрізі країн світу (є відмінності в одиницях вимірювання, методиках розрахунку і т.п.). У зв’язку з цим більш-менш адекватна база даних для моделювання кризових явищ може бути сформована на основі інформації за період протікання світової фінансової кризи 2008–2009 рр., коли більшість країн почали подавати економічну статистику відповідно до методики розрахунку Міжнародного валютного фонду [1]. Крім цього, попередні фінансові кризи мали відмінні рушійні сили, джерела виникнення, канали розповсюдження та вплив на економіки країн світу. Це підводить нас до думки, що термін «макропрогнозування» в контексті поставленої задачі не може розглядатись як спроба передбачення «точки кипіння» економіки, адже для вчасної корекції державної економічної політики це не є першочерговим завданням. На думку автора, важливо однозначно визначити залежність між набором вхідних змінних, котрі є найчутливішими до різких змін в економіках країнпартнерів, та індикативними границями коливань макропоказників, що характеризують стійкість економіки до таких змін, таких як ВВП, валютний курс, обсяг золотовалютних резервів тощо [1]. 150


Моделювання процесів трансграничного…

І. І. Стрельченко

Мета і завдання дослідження Метою даного дослідження є побудова економіко-математичної моделі прогнозування розвитку фінансової кризи на основі системи макроекономічних показників, що характеризують стан основних каналів поширення у докризовий період. На основі проведеного раніше фундаментального аналізу причин виникнення, особливостей протікання та механізмів трансграничного поширення кризових явищ [1–2] сформулюємо базові передумови, котрі необхідно враховувати під час дослідження та моделювання цих процесів: 1. Незважаючи на зрозумілий поділ фінансових криз на чотири типи (валютна, банківська, криза раптового відтоку капіталу або SS-криза (скорочено від англ. sudden stop crisis), суверенного зовнішнього боргу), історія протікання криз свідчить, що глобальні фінансові дисбаланси не можуть бути віднесені до якогось одного типу. Тому існує об’єктивна проблема датування початку та закінчення кризових явищ. 2. Процес транскордонного поширення кризових явищ між фінансовими ринками розподілений у часі та має визначену часову структуру. 3. Стійкість і поведінка економіки окремої країни під час поширення кризи напряму залежить від початкових макроекономічних умов, що характеризують фінансові, торговельні або інформаційні канали зараження. Відповідно до визначених передумов сформулюємо задачі дослідження, вирішення яких дозволить досягти поставленої мети: 1. Розробка алгоритму датування часової структури процесів поширення фінансових криз. 2. Відбір макроекономічних індикаторів, що характеризують стан основних каналів поширення кризових явищ. 3. Побудова економіко-математичної моделі для прогнозування наслідків поширення фінансової кризи на основі системи макроекономічних показників, що характеризують стан основних каналів поширення у докризовий період. Виклад основного матеріалу дослідження Узагальнена статистика одночасного виникнення різних типів фінансових криз і хронологія їх виникнення за даними 138 країн світу в період з 1970 по 2010 роки наведена у табл. 1 і на рис. 1, відповідно. 151


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Таблиця 1 КРОС-СТАТИСТИКА ОДНОЧАСНОГО ВИНИКНЕННЯ РІЗНИХ ТИПІВ ФІНАНСОВИХ КРИЗ ЗА ПЕРІОД З 1970 ПО 2010 рр. Банківська криза

Валютна криза

Криза суверенного боргу

SS-криза

Банківська криза

134

49

16

15

Валютна криза

49

193

25

10

Криза суверенного боргу

16

25

60

6

SS-криза

15

10

6

53

Тип фінансової кризи

Джерело: побудовано автором на основі [3]

Рис. 1. Хронологія виникнення різних типів фінансових криз: пунктирна лінія — валютні кризи; сіра суцільна лінія — банківські кризи; чорна суцільна лінія — SS-кризи; чорна суцільна лінія з маркером — кризи суверенного боргу. Джерело: побудовано автором на основі даних [3]

152


Моделювання процесів трансграничного…

І. І. Стрельченко

Результати ретроспективного аналізу різних типів фінансових криз для 138 країн світу з різним рівнем розвитку та інтеграції фінансових ринків за розглянутий період (1970–2010 рр.) дозволяють зробити висновок про складність виокремлення для аналізу монокризових епізодів. Переважна більшість фінансових криз починається одночасно на двох (чи більше) фінансових ринках, наприклад банківському та валютному, та по внутрішніх каналах розповсюдження перетікають до інших секторів економіки, що може призвести до кризи суверенного державного боргу (наприклад, у Греції та Ісландії в 2010–2015 рр.) або викликати раптовий відтік інвестицій і стати причиною SS-кризи. Результати проведеного аналізу дають можливість зробити висновок, що найбільша кількість фінансових криз є валютними (майже 44 % від загальної кількості). На другому місці за частотою появи — системні банківські кризи (30 %). І майже однакова кількість криз суверенного державного боргу та SS-криз відбулися протягом досліджуваного періоду — 14 % і 12 %, відповідно. Також важливо відмітити, що маючи незначне відтермінування в часі валютна та банківська кризи досить часто відбуваються в парі — це так звані twin-кризи (подвійні кризи). Так, за даними табл. 1 кожна третя банківська криза супроводжується валютною кризою і кожна четверта фінансова криза, що визначається девальвацією вартості національної грошової одиниці, відбувається паралельно з системною кризою у банківському секторі. Проведений аналіз ретроспективних даних показує, що майже половина усіх криз суверенного державного боргу супроводжуються валютними кризами. Проте лише 13 % від усіх криз девальвації вартості національної грошової одиниці врешті призводять до криз державного боргу. Цікаво, що у 25 % випадків від усіх епізодів криз суверенного державного боргу паралельно відбуваються кризи банківські. Зворотна статистика вдвічі менша — 12 % twin-криз. Найрідше трапляються поєднання криз раптової зупинки потоків капіталу з будь-яким іншим типом фінансових криз: 11 % для банківських криз, 5 % для валютних криз і 10 % для криз суверенного державного боргу. Отже, існують об’єктивні причини, що значно ускладнюють дослідження монокриз будь-якого типу — або їх наслідки поєднуються з наслідками криз інших типів, або статистичні дані для аналізу будуть суттєво обмежені. 153


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Тож у роботі автор не робитиме розмежування фінансових криз за типами та визначатиме тривалість кризових процесів всередині кожної окремої країни, спираючись на власне визначення об’єкта дослідження та кількісні міри для датування основних елементів у часовій структурі процесів трансграничного поширення криз на фінансових ринках, що мають чітке економічне обґрунтування. Автор пропонує виділити в часовій структурі процесів трансграничного поширення кризових явищ окремі елементи, що є спільними для будь-якого типу фінансових криз і виникнення яких не залежить від рівня розвитку та інтеграції фінансових ринків окремих країн. З цією метою введемо поняття: латентий період (l) — проміжок часу від початку кризи у країні-джерелі (t0) до моменту часу, коли зафіксовано початок кризи у досліджуваній країні (tp), та період відгуку (v) — проміжок часу від моменту tp до моменту часу, коли зафіксовано скорочення темпів падіння економіки (tk). Із запропонованої термінології видно, що автор розглядає процес трансграничного поширення фінансової кризи як такий, що складається з двох епізодів: 1. Латентний період — триває до тих пір, доки через фінансові та/або торговельні канали передачі негативні зміни у фінансовому секторі країни-джерела не призведуть до падіння основних макроекономічних індикаторів у досліджуваній країні. Його ще можна визначити як період буферизації або накопичення дисбалансів в економіці. Тривалість латентного періоду обумовлюється ступенем інтеграції та розвитку внутрішнього фінансового ринку країни, до якої перенесена криза. Він також визначає час, протягом якого можуть бути створені економічні стимули та корегуючи впливи, що дозволять пом’якшити наслідки фінансової кризи. 2. Період відгуку — триває від початку кризи всередині досліджуваної країни до її закінчення, коли протягом певного часу буде зафіксоване стале зростання таких макроекономічних індикаторів, як валовий внутрішній продукт, курс національної грошової одиниці, об’єм золотовалютних резервів, а також зменшення державного боргу. Період відгуку залежить від стану економіки країни, рівня розвитку правового законодавства, що регулює грошово-фінансові відносини, рівня довіри до органів держаного управління з боку населення, рівня корупції. Останні два пункти суттєво впливають на включення внутрішніх каналів 154


Моделювання процесів трансграничного…

І. І. Стрельченко

поширення кризових явищ і визначають стійкість економіки досліджуваної країни та тривалість періоду відгуку. Як було зазначено вище, різні типи криз можуть перекриватися в одному епізоді, створюючи неоднозначні висновки щодо того, як їх класифікувати. Крім того, процес датування початку та закінчення кризових явищ в економіці прямо залежить від обраної методології. Проте для переважної більшості фінансових криз — валютних, державного боргу та SS-криз, що складають відповідно до обчисленої статистики (див. табл. 1) 70 % від загальної кількості, спільними є механізми стримування різких коливань на внутрішніх фінансових ринках, що реалізуються Міністерством фінансів і Національним банком. Наслідками державного антикризового регулювання є суттєве скорочення золотовалютних резервів. Тому, на думку автора, саме на основі динаміки обсягів золотовалютних резервів потрібно формувати систему визначення терміну початку фінансової кризи. Крім того, доцільно враховувати коливання курсу національної грошової одиниці (за статистикою 40 % усіх криз є валютними або відбуються в парі із суттєвим знеціненням вартості національної грошової одиниці). Беручи до уваги досвід, напрацьований західними фахівцями [3– 6], початок кризи у досліджуваній країні внаслідок процесів трансграничного поширення кризових явищ від країни-джерела через доступні канали зараження (точку tp) в межах даного дослідження будемо фіксувати у випадку реалізації одної або одразу двох подій: 1. коли протягом місяця фіксується зменшення вартості національної грошової одиниці на два стандартні відхилення (обчислені для вибірки з 12 щомісячних значень, що передують даному); 2. коли за місяць фіксується скорочення золотовалютних резервів більше ніж на одне стандартне відхилення (обчислене для вибірки з 12 щомісячних значень, що передують даному). Проведемо тестування ефективності пропонованих умов датування початку кризи при визначенні термінів латентного періоду. З цією метою застосуємо показник NSR (англ. термін noise-tosignal ratio — співвідношення шуму до сигналу), що дозволяє здійснити порівняння частки хибних сигналів (шуму) індикатора з часткою ефективних реалізацій [4, 5]: B A , (1) NSR =  B+ D A+C 155


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

де А — кількість попереджувальних сигналів індикатора в межах сигнального вікна, що були підтверджені зафіксованими фактами настання кризи; В — кількість попереджувальних сигналів індикатора в межах сигнального вікна, що не були підтверджені зафіксованими фактами настання кризи; С — кількість випадків, коли факт настання кризи не супроводжувався попереджувальним сигналом індикатора; D — кількість випадків, коли відсутність попереджувального сигналу індикатора була підтверджена фактами ненастання кризи [5]. При NSR=1 точність передбачення настання кризи дорівнює відсотку помилкового спрацьовування індикатора. Найкращим є індикатор, для якого значення NSR є мінімальним. Визначимо сигнальне вікно як проміжок часу, що безпосередньо передує кризі, протягом якого індикатор повинен формувати сигнал, що вказує на появу негативних зрушень у фінансовій системі. Відповідно до запропонованого визначення латентного періоду довжина сигнального вікна дорівнює 12 місяцям. На рис. 2 і 3 наведено приклад встановлення за запропонованим підходом меж латентного періоду поширення фінансової кризи в Україні у 2008–2009 рр. на основі динаміки відношення курсу національної грошової одиниці до СПЗ (спеціальних прав запозичення) і золотовалютних резервів, відповідно.

Рис. 2. Визначення границь латентного періоду та початку кризи на основі даних про зміну динаміки курсу гривні до СПЗ 156


Моделювання процесів трансграничного…

І. І. Стрельченко

Рис. 3. Визначення границь латентного періоду та початку кризи на основі даних про зміну обсягів офіційних міжнародних резервів в Україні

Пунктирна лінія на рис. 2 відповідає верхній границі допустимих коливань обмінного курсу гривні та визначається відповідно до запропонованого алгоритму як сума середнього значення показника та двох стандартних відхилень у межах сигнального вікна. Тож кінцем латентного періоду є точка з координатами (34; 7,639), що відповідає жовтню 2008 року. Наступний місяць — точка з координатами (35; 8,904) стає початком кризи в країні. З рис. 2 можна побачити, що графік динаміки курсу гривні до СПЗ перетинає цю пунктирну лінію ще раніше — у березні 2008 року. Проте, варто зауважити, цей пунктир розрахований для дванадцятимісячного періоду до жовтня 2008 року. Для березня ця границя допустимих коливань є вищою і графік її не перетинає. Аналогічно відбувається визначення границь латентного періоду та початку кризи на основі динаміки золотовалютних резервів (див. рис. 3). Пунктирна лінія відповідає нижній границі допустимих коливань показника (різниця середнього значення та одного стандартного відхилення в межах сигнального вікна) та визначає кінцем латентного періоду вересень 2008 року. Відповідно до запропонованої термінології в даному випадку автор визначає латентний період як проміжок часу між датою початку фінансової кризи у США — країні-джерелі (лютий 2007 р., коли найбільший на той момент банк світу HSBC був змушений списати іпотечні цінні папери загальною вартістю 10,5 млрд дол. 157


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

США, забезпечені в тому числі субстандартними кредитами) та датою зафіксованого зниження золотовалютних резервів і/або вартості національної грошової одиниці досліджуваної країни (України) понад 1 та 2 стандартних відхилення від середнього на вибірці з 12 попередніх щомісячних значень відповідного показника. Аналогічно визначено тривалість латентного періоду для кожної з 66 країн тестової вибірки. Показник NSR з оцінювання ефективності діагностування початку криз у досліджуваних країнах у межах аналізованого часового періоду складає: 𝑁𝑆𝑅 =

𝐵 𝐵+𝐷

÷

𝐴 𝐴+𝐶

=

91 91+802

÷

124 124+9

= 0,11.

(2)

Проведений аналіз точності датування границь латентного періоду дає підстави зробити висновки, що запропонована методологія дозволяє у 92 % випадків правильно ідентифікувати початок кризи всередині країни в результаті процесів трансграничного поширення кризових явищ. Так, наприклад, для України та Польщі кінець латентного періоду та початок фінансової кризи за обома досліджуваними показниками практично співпадає і припадає на серпень-вересень 2008 року. Отримана різниця в один місяць є закономірною та відображає фінансову політику Національного банку України щодо стримування знецінення національної грошової одиниці та виплати відсотків за міжнародними зобов’язаннями. На наступному кроці проведемо відбір і тестування макроекономічних показників, що задають сукупність початкових умов і характеризують стан каналів поширення кризових явищ, є чутливими до збурень на світових фінансових ринках і можуть бути використані для класифікації економік за рівнем реакції на процеси трансграничного розповсюдження криз. У першу чергу розглянемо фінансовий і торговельний канали зараження. Для вирішення даної задачі скористаємось щомісячними та квартальними значеннями під час кризи 2008–2009 рр. макроекономічних показників 66 країн і їх об’єднань, що відрізняються за рівнем економічного розвитку (зокрема розвинуті країни та країни, що розвиваються) та географічним розташуванням: Австралія, Албанія, Аргентина, Бангладеш, Білорусь, Болгарія, Боснія та Герцеговина, Бразилія, Бруней Даруссалам, Бутан, Вануату, Грузія, Гонконг, Данія, Єврозона, Естонія, Ізраїль, Індонезія, Ісландія, 158


Моделювання процесів трансграничного…

І. І. Стрельченко

Канада, Казахстан, Камбоджа, Киргизька Республіка, Китай (провінція Макао), Китай, Латвія, Литва, Макао, Малайзія, Мальдіви, Мексика, Молдова, Монголія, М’янма, Непал, Нова Зеландія, Норвегія, Об’єднане Королівство Великобританія, Об’єднані Арабські Емірати, Папуа Нова Гвінея, Південна Африка, Південна Корея, Польща, Республіка Азербайджан, Республіка Вірменія, Російська Федерація, Румунія, Самоа, Сербія, Сінгапур, Соломонові острови, Таджикистан, Таїланд, Тонга, Туреччина, Україна, Угорщина, Філіппіни, Хорватія, Центральна Африканська Республіка, Чеська республіка, Чорногорія, Швейцарія, Швеція, Шрі Ланка, Японія. Джерелом первинної статистичної інформації є відкриті дані Міжнародного валютного фонду, Центральних банків Німеччини, Франції та України, Державного комітету статистики України та Британської банківської асоціації. Усі розрахунки проведено на базі інструментарію математичної лабораторії MatLab2017a. По кожному індикатору було обчислено не лише абсолютні значення, а й відносні у вигляді базових темпів зростання. Проведемо візуальний аналіз макроіндикаторів, що характеризують стан фінансового каналу поширення кризових явищ під час латентного періоду на прикладі України. З цією метою побудуємо в одному часовому вікні лінії фактичної зміни обраного показника та кількох індикативних кривих, що одержуються в результаті згладжування вихідного динамічного ряду [2]. Класичний підхід передбачає використання двох ковзних середніх із різною довжиною вікна згладжування. Точка перетину лінії фактичної зміни показника однією або двома ковзними середніми є точкою дивергенції, що позначає початок розбіжності між напрямком індикатора завчасного попередження та досліджуваним макропоказником, сповіщає про сильну корекцію існуючого тренду або його розворот, відображає суттєві зміни у каналах поширення кризових явищ та є сигналом про можливу кризу. Результати тестування на прикладі України відібраних індикаторів, що характеризують стан фінансових каналів поширення кризових явищ, наведені на рис. 4 і 5. На кожному рисунку сірим маркером підсвічено динаміку відповідного індикатора в межах латентного періоду. Окремо винесені координати точок дивергенції. Важливо підкреслити, що усі індикатори стану фінансових каналів поширення характеризуються деформаційними процесами під час латентного періоду. 159


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Рис. 4. Результати тестування макроекономічних індикаторів, що характеризують стан фінансових каналів поширення криз: а) обсяг офіційних золотовалютних резервів без урахування золота, млн дол. США; б) співвідношення грошового агрегату М2 до обсягу золотовалютних резервів, коеф.; в) грошовий мультиплікатор, коеф.; г) зміна грошового агрегату М0, % до попереднього періоду; д) зміна грошового агрегату М2, % до попереднього періоду.

Рис. 5. Результати тестування макроекономічних індикаторів, що характеризують стан фінансових каналів поширення криз: а) спред ставки відсотка по кредитах в іноземній валюті всередині країни до аналогічного показника за кордоном, %; 160


Моделювання процесів трансграничного…

І. І. Стрельченко

б) різниця між ставкою відсотка всередині країни по кредитах та депозитах, %; в) відношення гарантованого боргу до ВВП, коеф.; г) коефіцієнт монетизації економіки, коеф.

На рис. 6 наведено результати тестування на прикладі України відібраних індикаторів, що характеризують стан торгівельних каналів поширення криз.

Рис. 6. Результати тестування макроекономічних індикаторів, що характеризують стан торгівельних каналів поширення криз: а) зростання експорту, % до попереднього періоду; б) зростання імпорту, % до попереднього періоду; в) індекс умов торгівлі, коеф.; г) частка експорту у ВВП, коеф.; д) зростання випуску індустріальної продукції, %.

За результатами тестування, проілюстрованого на рис. 4–6, робимо висновок, що переважна більшість індикаторів є достатньо чутливою до негативних трансформацій у фінансовому та торговельному каналах поширення кризових явищ. Виключення становлять індекс індустріальної продукції (рис. 6.д) та різниця між ставкою відсотка всередині країни по кредитах і депозитах (рис. 5.б). Згідно з результатами тестування ці індикатори продукують сигнал про настання кризи із запізненням. Відповідні зміни у динаміці індикатора проявляються або безпосередньо в момент виникнення кризової події, або взагалі формуються через 1–2 місяці після її початку. 161


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Характерно, що індикатори завчасного попередження, котрі описують стан фінансового каналу поширення криз, відображають деформаційні процеси на світових фінансових ринках за 1–2 квартали раніше ніж індикатори, що характеризують стан торговельного каналу. Особливо помітні коливання в межах латентного періоду спостерігаються у динаміці індикаторів, які визначають обсяги та структуру грошової маси, що знаходиться в обігу (грошові агрегати М0 та М2), а також співвідношення між грошовим агрегатом М2 та іншим показником: обсягом золотовалютних резервів, грошовою базою, валовим внутрішнім продуктом [2]. У межах даного дослідження також проведено тестування волатильності залишків кожного з обраних індикаторів (рис. 7– 9). Дане явище відоме як «кластеризація волатильності» [7–8].

Рис. 7. Волатильність залишків рядів макроекономічних індикаторів, що характеризують стан фінансових каналів поширення криз: а) обсяг офіційних золотовалютних резервів без урахування золота, млн дол. США; б) співвідношення грошового агрегату М2 до обсягу золотовалютних резервів, коеф.; в) грошовий мультиплікатор, коеф.; г) зміна грошового агрегату М0, % до попереднього періоду; д) зміна грошового агрегату М2, % до попереднього періоду.

162


Моделювання процесів трансграничного…

І. І. Стрельченко

Рис. 8. Волатильність залишків рядів макроекономічних індикаторів, що характеризують стан фінансових каналів поширення криз: а) спред ставки відсотка по кредитах в іноземній валюті всередині країни до аналогічного показника за кордоном, %; б) різниця між ставкою відсотка всередині країни по кредитах та депозитах, %; в) відношення гарантованого боргу до ВВП, коеф.; г) коефіцієнт монетизації економіки, коеф.

Рис. 9. Волатильність залишків рядів макроекономічних індикаторів, що характеризують стан торгівельних каналів поширення криз: а) зростання експорту, % до попереднього періоду; б) зростання імпорту, % до попереднього періоду; 163


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

в) індекс умов торгівлі, коеф.; г) частка експорту у ВВП, коеф.; д) зростання випуску індустріальної продукції, %.

За результатами тестування найбільше наростання нелінійностей у динаміці відібраних макропоказників спостерігається на рис. 7. Зазначимо, що отримані висновки щодо чутливості індикаторів до трансформаційних процесів у фінансовому каналі поширення криз збігаються з результатами тестування на основі ковзних середніх. Також підтверджується висновок щодо недоречності використання індикатора «індекс індустріальної продукції» в якості вхідного фактора економіко-математичної моделі класифікації країн за типами реакції на кризові явища через відсутність підтвердженої інформації про можливість формування даним показником сигналів завчасного попередження негативних змін у торговельному каналі поширення фінансових криз. У результаті попереднього аналізу та тестування широкого набору макроекономічних показників сформовано систему вхідних класифікаційних характеристик, що будуть використані для побудови економіко-математичної моделі сегментації країн за подібністю стану та поведінки каналів поширення кризи (і, відповідно, їх реакції на кризові явища в країні-джерелі): 1. обсяг офіційних золотовалютних резервів без урахування золота, млн дол. США; 2. співвідношення грошового агрегату М2 до обсягу золотовалютних резервів, коеф.; 3. грошовий мультиплікатор, коеф.; 4. зміна грошового агрегату М0, % до попереднього періоду; 5. зміна грошового агрегату М2, % до попереднього періоду; 6. спред ставки відсотка по кредитах в іноземній валюті всередині країни до аналогічного показника за кордоном, %; 7. коефіцієнт монетизації економіки, коеф.; 8. зростання експорту, % до попереднього періоду; 9. зростання імпорту, % до попереднього періоду; 10. частка експорту у ВВП, коеф. Усі індикатори обчислені відповідно до методології МВФ, викладеної в офіційному виданні Cпеціального стандарту поширення даних [9]. Потрібно відмітити, що в підсумку 70 % відібраних індикаторів презентують фінансовий канал поширення кри164


Моделювання процесів трансграничного…

І. І. Стрельченко

зових явищ. Також характерно, що половина обраних індикаторів є складеними — одержаними в результаті ділення одного макроекономічного показника на інший. Причому для розрахунку трьох індикаторів задіяний обсяг грошового агрегату М2. Дане спостереження є важливим для розуміння механізму процесів, що спонукають до накопичення критичних дисбалансів у фінансовому секторі [2, 10]. Відібраний набір індикаторів стану каналів поширення фінансових криз дає підґрунтя для побудови економіко-математичної моделі, що дозволить сформувати базу сценаріїв можливої поведінки економік під впливом зовнішніх збурень. Фактично значення цих індикаторів на кінець латентного періоду за відсутності інших корегувальних впливів (макропруденціальної політики уряду) визначають реакцію і стійкість економіки під час кризи. Під можливими сценаріями поведінки в рамках даного дослідження автор має на увазі подібність динаміки окремих макропоказників, що характеризують стійкість економічної системи до критичних змін в економіках країн-партнерів протягом двох років з початку кризи (після закінчення латентного періоду). Найчастіше в якості макропоказників, що дозволяють оцінити наслідки процесів поширення кризових явищ для окремої економіки, використовують: ВВП, валютний курс, обсяг золотовалютних резервів, ставка відсотка за ОЗДП (облігації зовнішньої державної позики), зовнішній державний борг. Таким чином, основне завдання дослідження зводиться до встановлення відповідності між вхідними значеннями індикаторів каналів поширення на кінець латентного періоду та динамікою макропоказників, що характеризують сценарії поведінки економік під час кризи. Тобто, класифікаційна модель повинна розподіляти простір досліджуваних об’єктів (кожен з яких описується десятьма відібраними ознаками та характеризується часовою глибиною у тривалість латентного періоду для досліджуваної країни) на кластери, всередині яких динаміка таких індикаторів як ВВП, валютний курс, обсяг золотовалютних резервів, ставка відсотка за ОЗДП і зовнішній державний борг є подібною. Практична реалізація економіко-математичної моделі розподілу країн за сценаріями поведінки внаслідок фінансових криз у країнах-партнерах була здійснена на основі нейронної мережі Кохонена. Для її побудови застосовано алгоритм, запропонований та описаний автором у [11]. 165


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Число можливих сценаріїв визначатиме кількість кластерів карти Кохонена. Питання визначення їх оптимальної кількості є відкритим і завжди залишається на розсуд дослідника. З метою уникнення створення надлишкової множини сценаріїв, які будуть описувати одиничні залежності між обраними показниками, а також збільшення гнучкості та універсальності отриманих розв’язків автор пропонує визначати множину класів (кількість нейронів), до кожного з яких увійдуть країни зі схожими паттернами реакції на процеси поширення кризових явищ, на основі коефіцієнта конкордації [12–14]. Навчальна вибірка для конструювання карти Кохонена включає щоквартальні дані по десяти обраних індикаторах (𝐼𝑖 , 𝑖 = 1, … , 10), які характеризують стан фінансового та торговельного каналів поширення криз під час латентного періоду для 66 країн світу. Проте тривалість латентного періоду для різних країн є відмінною, тому часовий проміжок, що увійшов до підсумкової навчальної вибірки, складає чотири квартали до завершення латентного періоду. Позначимо через L — останній квартал латентного періоду, тоді схематична структура даних підсумкової навчальної вибірки для кожної країни матиме вигляд: 𝐼1𝐿−3 𝐼1𝐿−2 𝐼1𝐿−1 𝐿 ( 𝐼1

𝐼2𝐿−3 ⋯ 𝐼𝑖𝐿−3 ⋯ 𝐼2𝐿−2 ⋯ 𝐼𝑖𝐿−2 ⋯ 𝐼2𝐿−1 ⋯ 𝐼𝑖𝐿−1 ⋯ 𝐼2𝐿 ⋯ 𝐼𝑖𝐿 ⋯

𝐿−3 𝐼10 𝐿−2 𝐼10 𝐿−1 . 𝐼10 𝐿 𝐼10 )

(3)

Статистичні дані, що увійшли до навчальної вибірки, є однорідними, розрахованими за однією методологією. Країни в навчальній вибірці є різними за рівнем інтеграції до світового фінансового ринку, розвитку економіки та географічним розташуванням. Тож навчальну вибірку можна вважати репрезентативною. Для кращого розуміння внутрішніх механізмів і динаміки трансграничного поширення кризових явищ побудуємо чотири нейронні мережі Кохонена для кожного з останніх чотирьох кварталів латентного періоду (L–3, L–2, L–1, L). Результати моделювання зображені на рис. 10. 166


Моделювання процесів трансграничного…

І. І. Стрельченко

а)

б)

в)

г)

Рис. 10. Динаміка розподілу країн на карті Кохонена за станом фінансового та торгівельного каналів поширення напередодні фінансової кризи 2008–2009 рр.: а) за 4 квартали до кінця латентного періоду; б) за 3 квартали до кінця латентного періоду; в) за 2 квартали до кінця латентного періоду; г) за 1 квартал до кінця латентного періоду.

167


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

На рис. 10 чітко прослідковується така тенденція: 1. За рік до початку кризи досліджувані країні розподілились за двома великими сусідніми (а, відповідно, і близькими за динамікою економічних процесів) кластерами, що включають 37 і 24 країни (рис. 10.а) та в цілому відповідають класифікації МВФ щодо розподілу економік на розвинуті та з ринками, що розвиваються. Зокрема, до найбільшої групи (третій кластер) увійшли країни: Албанія, Аргентина, Білорусь, Болгарія, Боснія та Герцеговина, Бразилія, Бутан, Грузія, Ісландія, Індонезія, Казахстан, Камбоджа, Киргизька Республіка, Малайзія, Мальдіви, Мексика, Молдова, Монголія, М’янма, Папуа Нова Гвінея, Південна Африка, Республіка Азербайджан, Республіка Вірменія, Румунія, Самоа, Сербія, Соломонові острови, Таджикистан, Таїланд, Тонга, Туреччина, Угорщина, Україна, Філіппіни, Центральна Африканська Республіка, Чорногорія, Шрі Ланка. До другої за розміром групи (четвертий кластер) потрапили Австралія, Бруней Даруссалам, Гонконг, Данія, Естонія, Єврозона, Ізраїль, Канада, Китай, Королівство Великобританія, Латвія, Литва, Макао, Нова Зеландія, Норвегія, Об’єднані Арабські Емірати, Південна Корея, Польща, Сінгапур, Хорватія, Чеська Республіка, Швейцарія, Швеція, Японія. Окремі кластери також склали: перший — Бангладеш, другий — Вануату та Фіджі, шостий — Непал. Загалом це країни, що за даними ООН входять до групи найменш розвинутих країн світу. До п’ятого кластеру потрапила Російська Федерація. Для даного розподілу (рис. 10.а) характерні найнижчі показники коефіцієнту конкордації як для кожного окремого кластера, ̅̅̅̅̅̅̅ так і в середньому по всій карті Кохонена (𝑊 𝐿−3 = 0,395). Це свідчить про те, що за рік до кризи ще немає ознак її наближення, як то втеча капіталу з країн, економіки яких розвиваються, тощо. Відповідно, країни перебувають у звичному для себе режимі. 2. Наближаючись до кінця латентного періоду розміри цих двох найбільших кластерів починають зменшуватись за рахунок країн, які мігрують між ними та утворюють нові групи зі зростаючим рівнем подібності реакції показників, що характеризують рівень стійкості економік до процесів трансграничного поширення кризових явищ. В результаті зближення значень цих показників відбувається поступове зростання коефіцієнта конкордації 168


Моделювання процесів трансграничного…

І. І. Стрельченко

для країн кожного кластера, набуваючи максимального рівня за квартал до початку кризи (середнє значення за всіма кластерами карти Кохонена ̅̅̅̅ 𝑊𝐿 = 0,716). Остання нейромережа (рис. 10.г) розподіляє країни вибірки на 9 кластерів таким чином: перший кластер — Албанія, Болгарія, Боснія та Герцеговина, Грузія, Індонезія, Естонія, Латвія, Литва, М’янма, Об’єднані Арабські Емірати, Польща, Республіка Сербія, Румунія, Туреччина, Угорщина, Хорватія, Чеська Республіка, Чорногорія; другий кластер — Австралія, Данія, Єврозона, Нова Зеландія, Ізраїль, Королівство Великобританія, Норвегія, Швейцарія, Швеція, Японія; третій кластер — Непал; четвертий кластер — Бангладеш, Білорусь, Ісландія, Казахстан, Камбоджа, Киргизька Республіка, Малайзія, Молдова, Монголія, Папуа Нова Гвінея, Південна Африканська Республіка, Республіка Азербайджан, Республіка Вірменія, Російська Федерація, Таджикистан, Україна, Центральна Африканська Республіка, Шрі Ланка; п’ятий кластер — Аргентина, Бразилія, Бруней Даруссалам, Мальдіви, Мексика, Таїланд, Філіппіни; шостий кластер — Бутан, Вануату; сьомий кластер — Самоа, Тонга, Фіджі; восьмий кластер — Гонконг, Канада, Китай, Макао, Республіка Корея, Сінгапур; дев’ятий кластер — Соломонові острови. Аналіз результатів моделювання передкризової поведінки країн на даних за один квартал до кінця латентного періоду вказує на те, що розподіл нейромережею країн вибірки за кластерами добре узгоджується з фактичними даними про наслідки світової фінансової кризи в світі. Так, до першого та четвертого кластерів увійшли по 18 країн, переважна більшість з яких є країнами, що розвиваються. Країни обох груп характеризуються недосконалими фінансовими ринками та правилами їх функціонування (останнє більшої мірою стосується країн четвертого кластера). Тож поширення фінансової кризи 2008–2009 рр. у ці країни відбувалось у першу чергу крізь торговельні канали, а отже із запізненням, що збільшило тривалість латентного періоду на 1 місяць для країн першого кластера та 1 квартал для країн четвертого кластера. Відмінність у термінах початку кризи можна пояснити 169


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

географічним розташуванням країн першого кластера, що закономірно сприяло тісним торговельним зв’язкам із країнами з розвинутими фінансовими ринками — Єврозони, Японією, Китаєм та Гонконгом. Головна особливість першого кластера полягає в тому, що незважаючи на значне погіршення економічної ситуації у 2008–2009 рр., він характеризується набагато коротшим періодом рецесії та відновлення. Наприклад Польща, що мала падіння курсу злотого майже у два рази та зменшення прямих інвестицій на 16 %, вже у 2009 році отримала зростання ВВП на 1,7 %. Країни, що увійшли до четвертого кластера, мали найгіршу динаміку відібраних показників економічної безпеки під час кризи 2008–2009 рр. і найдовший період відновлення та рецесії. Деякі з них досягли докризових показників економічного зростання лише у 2012–2013 рр. Зазначимо, що 9 із 18 країн четвертого кластера є представниками бувшого Радянського Союзу і у розглянутий період мали тісні торговельно-економічні зв’язки. У даний кластер потрапила, зокрема, Україна. За 2008 рік ВВП країни скоротився на 5,5 %, а за 2009 рік — майже на 16 %. Гривня втратила більше 50 % вартості. У четвертому кластері також знаходиться Ісландія — країна, що належить до розвинутих, проте протягом кризи 2008–2009 рр. курс національної грошової одиниці проти американського долара впав у 2 рази і країна вперше серед розвинутих країн звернулась по допомогу до МВФ. У другий і восьмий кластери потрапила переважна більшість країн із розвинутими фінансовими ринками, які щільно інтегровані до світового. Тож поширення кризи у 2007–2008 рр. відбувалось у першу чергу через фінансові канали. Це зумовило скорочення латентного періоду на 1–3 місяці в порівнянні з першим і четвертим кластерами. У країнах кластера номер два наслідки кризи суттєво вплинули на аналізовані показники економічної безпеки, зокрема відбулося скорочення ВВП у середньому на 4,1 % у групі, фондового ринку — до 2,5 %, із відновленням докризових показників розвитку економіки у 2010–2011 рр. У той же час у країнах восьмого кластера відбулося лише скорочення темпів зростання економіки. Відповідно, країни цього кластера характеризуються найкоротшими термінами відновлення економіки. Докризові показники розвитку були досягнуті ними в період з 2009 по 2010 рр. Яскравим прикладом поведінки країн восьмого кластера під час кризи є Канада — країна, що історично має тісні фінансово170


Моделювання процесів трансграничного…

І. І. Стрельченко

торговельні зв’язки із США (країною-джерелом процесів трансграничного поширення кризових явищ 2008–2009 рр.). З другої половини 2008 року, у міру розвитку глобальної економічної кризи, уряд Канади виробив антикризовий план регулювання економіки, що серед інших заходів включав підтримку фінансового сектора, великого, малого бізнесу, окремих галузей промисловості, інфраструктурних проектів. Крім того, результативними виявилися державні заходи щодо соціальної підтримки населення. У підсумку це сприяло стабільності фінансової та банківської системи країни. У результаті з 2008 року після глобальної фінансової кризи економіка Канади знову стала однією з найсильніших у світі серед країн із розвинутою економікою. До п’ятого кластеру увійшли країни, що мають традиційно тісні торговельно-економічні зв’язки із США (Аргентина, Бразилія, Мальдіви, Мексика, Філіпіни) та Японією (Бруней Даруссалам, Таїланд, Філіпіни). Через таку особливість, кризи у цих країнах спричинили в першу чергу масову втечу інвесторів, що стало причиною зростання державного боргу, скорочення золотовалютних резервів і зменшення вартості національних грошових одиниць. Економіки країн даної групи знаходились на підйомі до початку кризи, тож процеси трансграничного поширення переважно крізь торговельні канали призвели до скорочення темпів економічного зростання. А в результаті адекватної та своєчасної програми антикризових заходів не мали катастрофічних наслідків, як, наприклад, у країнах четвертої групи. До третього, шостого, сьомого та дев’ятого кластерів потрапили країни, що за класифікацією ООН мають найнижчі індекси рівня життя населення. Їх економіки є досить ізольованими від світового фінансового ринку, тож наслідки кризи 2008–2009 рр. є найбільш відтермінованими (до одного кварталу порівняно з іншими групами) і спричинили значні погіршення в і без того відверто слабких економічних системах.

Висновки і перспективи подальших досліджень Отримані результати проведеного дослідження дозволяють зробити висновки, що нейромережеві моделі є ефективним інструментом завчасного виявлення ознак наближення фінансових криз. Причому за квартал до кінця латентного періоду (де його 171


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

межі визначаються на основі запропонованого автором алгоритму) вдається чітко передбачити ймовірний сценарій розвитку подій усередині економічної системи на основі системи індикаторів, що характеризують деформаційні процеси, які відбуваються у фінансовому та торговельному каналах поширення кризових явищ. Серед подальших напрямків проведення досліджень першочерговим вбачається проведення моделювання зі встановлення коефіцієнтів еластичності між набором вхідних індикаторів і п’ятьма обраними показниками стійкості окремо для кожної з дев’яти груп країн. Отримані залежності дозволять виробити рекомендації щодо можливих антикризових заходів, спрямованих на зменшення наслідків майбутніх фінансових криз.

Список літератури 1. Стрельченко І. І. Концептуальні засади макропрогнозування на основі системи нейронних мереж. Економічний аналіз. 2017. Т. 27, № 2. С. 68–73. 2. Матвійчук А. В., Стрельченко І. І. Використання системи випереджальних індикаторів для прогнозування негативних зрушень на фінансовому ринку України. Фінанси України. 2015. № 8. С. 74–87. URL: http://nbuv.gov.ua/UJRN/Fu_2015_8_7. 3. Babecký J., Havránek T., Matějů J., Rusnák M., Šmídková K., Vašíček B. Banking, Debt, and Currency Crises: Early Warning Indicators for Developed Countries. ECB Working Paper. 2012. No. 1485. 43 p. URL: https://www.ecb.europa.eu/pub/pdf/scpwps/ecbwp1485.pdf. 4. Kaminsky G., Lizondo S., Reinhart C. Leading indicators of currency crises. IMF Stuff Papers. 1998. Vol. 45, No. 1. P. 1–48. 5. Ferrari S., Pirovano M. Early warning indicators for banking crises: a conditional moments approach. MPRA Paper. 2015. No. 62406. 24 p. URL: https://mpra.ub.uni-muenchen.de/62406/1/MPRA_paper_62406.pdf. 6. Behn M., Detken C., Peltonen T., Schudel W. Setting countercyclical capital buffers based on early warning models: Would it work? ECB Working Paper. 2013. No. 1604. 44 p. URL: https://www.ecb.europa.eu/ pub/pdf/scpwps/ecbwp1604.pdf. 7. Engle R. F. Autoregressive Conditional Heteroscedasticity with Estimates of Variance of United Kingdom Inflation. Econometrica. 1982. № 50 (4). P. 987–1008. 8. Soloviev V., Belinskij A. Methods of nonlinear dynamics and the construction of cryptocurrency crisis phenomena precursors. Proceedings of 172


Моделювання процесів трансграничного…

І. І. Стрельченко

the 14th International Conference on ICT in Education, Research and Industrial Applications. Integration, Harmonization and Knowledge Transfer. Kyiv, 2018. Vol. II. P. 116–127. URL: http://ceur-ws.org/Vol2104/paper_175.pdf. 9. The Special Data Dissemination Standard. IMF: website. 2013. 113 p. URL: https://www.imf.org/external/pubs/ft/sdds/guide/2013/sddsguide13.pdf. 10. Стрельченко І. І. Моделювання трансграничного розповсюдження кризових явищ на основі комплексу нейронних мереж. Нейронечіткі технології моделювання в економіці. 2016. № 5. С. 180–198. URL: http://nfmte.com/assets/journal/5/Strelchenko.pdf. 11. Стрельченко І. І. Вибір оптимальної топології нейронної мережі в задачах класифікації динамічних економічних систем. Нейро-нечіткі технології моделювання в економіці. 2017. № 6. С. 142–157. URL: http://nfmte.com/assets/journal/6/Strelchenko.pdf. 12. Kendall M. G. Rank correlation methods. New York: Hafner Publishing Co, 1955. 160 p. 13. Kendall M. G., Babington B. S. The problem of m rankings. Annals of Mathematical Statistics. 1939. No. 10, Vol. 3. P. 275–287. 14. Legendre P. Species associations: The Kendall coefficient of concordance revisited. Journal of Agricultural, Biological, & Environmental Statistics. 2005. Vol. 10. P. 226–245.

References 1. Strelchenko, I. I. (2017). Konceptual'ni zasady makroprognozuvannya na osnovi systemy nejronnykh merezh. Ekonomichny Analiz (Economic analysis), 2, 68–73. DOI: 10.35774/econa2017.02.068 [in Ukrainian]. 2. Matviychuk, A. V., & Strelchenko, I. I. (2015). Vykorystannya systemy vyperedzhal’nykh indykatoriv dlya prognozuvannya negatyvnykh zrushen’ na finansovomu rynku Ukrainy. Finansy Ukrainy (Finance of Ukraine), 8, 74–87. Retrieved from http://nbuv.gov.ua/UJRN/Fu_2015_8_7 [in Ukrainian]. 3. Babecký, J., Havránek, T., Matějů, J., Rusnák, M., Šmídková, K., & Vašíček, B. (2012, October). Banking, Debt, and Currency Crises: Early Warning Indicators for Developed Countries. ECB Working Paper, 1485. Retrieved from https://www.ecb.europa.eu/pub/pdf/scpwps/ecbwp1485.pdf. 4. Kaminsky, G., Lizondo, S., & Reinhart, C. (1998). Leading indicators of currency crises. IMF Stuff Papers, 45(1), 1–48. 5. Ferrari, S., & Pirovano, M. (2015, February 2). Early warning indicators for banking crises: a conditional moments approach. MPRA Paper, 62406. Retrieved from https://mpra.ub.uni-muenchen.de/62406/1/MPRA_ paper_62406.pdf. 173


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

6. Behn, M., Detken, C., Peltonen, T., & Schudel, W. (2013, November). Setting countercyclical capital buffers based on early warning models: Would it work? ECB Working Paper, 1604. Retrieved from https://www.ecb.europa.eu/pub/pdf/scpwps/ecbwp1604.pdf. 7. Engle, R. F. (1982). Autoregressive Conditional Heteroscedasticity with Estimates of Variance of United Kingdom Inflation. Econometrica, 50(4), 987–1008. 8. Soloviev, V., & Belinskij, A. (2018, May 14–17). Methods of nonlinear dynamics and the construction of cryptocurrency crisis phenomena precursors. In V. Ermolayev, M. C. Suárez-Figueroa et al. (Eds.), Proceedings of the 14th International Conference on ICT in Education, Research and Industrial Applications. Integration, Harmonization and Knowledge Transfer (Kyiv, Ukraine) (pp. 116–127). Retrieved from http://ceur-ws.org/Vol-2104/paper_175.pdf. 9. IMF. (2013). The Special Data Dissemination Standard. Retrieved from https://www.imf.org/external/pubs/ft/sdds/guide/2013/sddsguide13.pdf. 10. Strelchenko, I. I. (2016). Modeliuvannia transhranychnoho rozpovsiudzhennia kryzovykh yavyshch na osnovi kompleksu neironnykh merezh. Nejro-nechitki tekhnolohiyi modelyuvannya v ekonomitsi (Neuro-fuzzy modeling techniques in economics), 5, 180–198. Retrieved from http://nfmte.com/assets/journal/5/Strelchenko.pdf [in Ukrainian]. 11. Strelchenko, I. I. (2017). Vybir optymalnoi topolohii neironnoi merezhi v zadachakh klasyfikatsii dynamichnykh ekonomichnykh system. Nejro-nechitki tekhnolohiyi modelyuvannya v ekonomitsi (Neuro-fuzzy modeling techniques in economics), 6, 142–157. Retrieved from http://nfmte.com/assets/journal/6/Strelchenko.pdf [in Ukrainian]. 12. Kendall, M. G. (1955). Rank correlation methods. New York, NY: Hafner Publishing Co. 13. Kendall, M. G., & Babington, B. S. (1939). The problem of m rankings. Annals of Mathematical Statistics, 10(3), 275–287. 14. Legendre, P. (2005). Species associations: The Kendall coefficient of concordance revisited. Journal of Agricultural, Biological, & Environmental Statistics, 10, 226–245. Стаття надійшла до редакції 13.07.2019

174


УДК 330.4, 336.744, 519.866 DOI 10.33111/nfmte.2019.175

RISK AND RETURN FOR CRYPTOCURRENCIES AS ALTERNATIVE INVESTMENT: KOHONEN MAPS CLUSTERING

Andrii Kaminskyi DSc (Economic Sciences), Professor, Professor of Economic Cybernetics Department Taras Shevchenko National University of Kyiv 90a Vasylkivska Street, Kyiv, 03022, Ukraine kaminskyi.andrey@gmail.com

Ihor Miroshnychenko PhD (Economic Sciences), Associate Professor of Department of Economic and Mathematical Modeling State Higher Educational Establishment “Kyiv National Economic University named after Vadym Hetman” 54/1 Peremogy Avenue, Kyiv, 03680, Ukraine ihor.miroshnychenko@kneu.ua

Kostiantyn Pysanets PhD (Economic Sciences), Assistant Professor of Economic Cybernetics Department Taras Shevchenko National University of Kyiv 90a Vasylkivska Street, Kyiv, 03022, Ukraine pysanets.kk@gmail.com The active development of cryptocurrencies in recent years allows identifying the process of forming new class of alternative investment assets. There was formed a sample of cryptocurrencies based on criteria capitalization and historical returns for estimation investment risk of this asset class. The sample included 327 cryptocurrencies, each of which has a capitalization of more than $ 1 mln. Measurement of investment risk was carried out on the basis of five approaches. The first one is grounded on the variability indicators. The second approach includes risk assessment in the context of asymmetry. The third is based on the concept of capital formation as part of the risk measures VaR and CVaR. The fourth focuses on measuring sensitivity risk. The fifth approach supposes using the Hurst exponent to measure risk. Based on the measures of these approaches, a comprehensive risk assessment was carried out. To cluster cryptocurrencies by riskiness, indicators from each group were selected, to which the technique of Kohonen self-organizing map was applied. The result was a partition of cryptocurrencies into three clusters. The analysis of the results is proposed and the corresponding conclusions and recommendations are made. Keywords: cryptocurrencies, alternative investments, risk measurement, Hurst exponent, Kohonen self-organizing map. © А. Б. Камінський, І. В. Мірошниченко, К. К. Писанець, 2019

175


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

РИЗИК ТА ДОХІДНІСТЬ КРИПТОВАЛЮТ ЯК АЛЬТЕРНАТИВНИХ ІНВЕСТИЦІЙ: КЛАСТЕРИЗАЦІЯ НА ОСНОВІ КАРТ КОХОНЕНА

А. Б. Камінський Доктор економічних наук, професор, професор кафедри економічної кібернетики Київський національний університет імені Тараса Шевченка вул. Васильківська, 90а, м. Київ, 03022, Україна kaminskyi.andrey@gmail.com

І. В. Мірошниченко Кандидат економічних наук, доцент кафедри економіко-математичного моделювання Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» проспект Перемоги, 54/1, м. Київ, 03680, Україна ihor.miroshnychenko@kneu.ua

К. К. Писанець Кандидат економічних наук, асистент кафедри економічної кібернетики Київський національний університет імені Тараса Шевченка вул. Васильківська, 90а, м. Київ, 03022, Україна pysanets.kk@gmail.com Активний розвиток криптовалют в останні роки дозволяє ідентифікувати процес формування нового класу альтернативних інвестиційних активів. Для оцінки інвестиційного ризику цього класу активів у дослідженні була сформована вибірка криптовалют, заснована на критеріях капіталізації та історичної доходності. Вибірка включала 327 криптовалют, які мали капіталізацію більше 1 млн дол. США. Вимірювання інвестиційного ризику здійснювалося на основі п’яти підходів. Перший з них заснований на показниках варіативності. Другий підхід включав оцінки ризику в контексті асиметрії. Третій ґрунтувався на концепції формування капіталу в межах мір ризику VaR та CVaR. Четвертий був сфокусований на ризику чутливості. П’ятий підхід передбачав використання для вимірювання ризику показника Херста. На основі мір із зазначених підходів було здійснено комплексне оцінювання ризику. Для кластеризації криптовалют за ризиковістю були вибрані індикатори з кожної групи, до яких була застосована технологія самоорганізаційних карт Кохонена. Результатом стало розбиття криптовалют у три кластера. Наведено аналіз отриманих результатів та зроблені відповідні висновки і рекомендації. Ключові слова: криптовалюта, альтернативні інвестиції, вимірювання ризику, показник Херста, самоорганізаційні карти Кохонена.

176


Ризик та дохідність.…

А. Б. Камінський, І. В. Мірошниченко, К. К. Писанець

РИСК И ДОХОДНОСТЬ КРИПТОВАЛЮТ КАК АЛЬТЕРНАТИВНЫХ ИНВЕСТИЦИЙ: КЛАСТЕРИЗАЦИЯ НА ОСНОВЕ КАРТ КОХОНЕНА

А. Б. Каминский Доктор экономических наук, профессор, профессор кафедры экономический кибернетики Киевский национальный университет имени Тараса Шевченко ул. Васильковская, 90а, г. Киев, 03022, Украина kaminskyi.andrey@gmail.com

И. В. Мирошниченко Кандидат экономических наук, доцент кафедры экономико-математического моделирования Государственное высшее учебное заведение «Киевский национальный экономический университет имени Вадима Гетьмана» проспект Победы, 54/1, г. Киев, 03680, Украина ihor.miroshnychenko@kneu.ua

К. К. Писанец Кандидат экономических наук, ассистент кафедры экономический кибернетики Киевский национальный университет имени Тараса Шевченко ул. Васильковская, 90а, г. Киев, 03022, Украина pysanets.kk@gmail.com Активное развитие криптовалют за последние годы позволяет идентифицировать процесс формирования нового класса альтернативных инвестиционных активов. Для оценки инвестиционного риска этого класса активов в исследовании была сформирована выборка криптовалют, основанная на критериях капитализации и исторической доходности. Выборка включала 327 криптовалют, которые имели капитализацию больше 1 млн дол. США. Измерение инвестиционного риска осуществлялось на основе пяти подходов. Первый из них основан на применении показателей вариативности. Второй подход включал оценки риска в контексте асимметрии. Третий основывался на концепции формирования капитала в рамках мер риска VaR и CVaR. Четвертый был сфокусирован на риске чувствительности. Пятый подход предполагал использование для измерения риска показателя Херста. На основе мер из указанных подходов была осуществлена комплексная оценка риска. Для кластеризации криптовалют по их рисковости были выбраны индикаторы из каждой группы, к которым была применена технология самоорганизующихся карт Кохонена. Результатом стало разбиение криптовалют на три кластера. Приведен анализ полученных результатов и сделаны соответствующие выводы и рекомендации.

177


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

Ключевые слова: криптовалюта, альтернативные инвестиции, оценка риска, показатель Хёрста, самоорганизующаяся карта Кохонена. JEL Classіfіcatіon: С45, F31

1. Introduction Origin of cryptocurrencies and their rapid growth illustrate the many-sided phenomenon of modern financial relations. This phenomenon is reflected in four characteristics of cryptocurrencies, which can be distinguished as fundamental [1, 2]. They are: decentralization, pseudoanonymity, transparency and low transaction costs. These characteristics provide attractability and genuine interest for cryptocurrencies. Decentralization is lack of any intermediator and regulator for account management and payments with cryptocurrencies. In contrast of classical banking payments cryptocurrencies payments can be fulfilled directly peer-to-peer. Pseudoanonymity and transparency are reflected in fact that participants of cryptocurrency’s transaction (as example, buyers and sellers) typically use “public and private keys” [3]. They typically are not reflected real identifiers like surname, address etc. The lack of intermediator (such as bank in classical transaction) makes it difficult to identify the participator of transaction. However, given that cryptocurrencies use blockchain technology, it is incorrect to talk about complete anonymity. Blockchain technology is completely open in design. Every transaction has been recorded on the blockchain, which is publicly viewable. Public record of all transactions provides some possibilities to identify the parties of transactions, especially if a person’s identity is linked to a public key. This means that in reality anonymity is being replaced by pseudo-anonymity. Low transaction costs property is well illustrated by an example shown in [2, p. 10]: transaction fees in Bitcoin system on average 0,16 USD, whereas average transaction fees of international money transfer approximatively equal 7,09 % at the end of 2017. The foregoing properties have proven to be useful. This is illustrated by extreme development of cryptocurrencies market. There were 2110 cryptocurrencies in March 2019 [4]. The capitalization of cryptocurrencies market in that time was 137,6B USD [5], but changing through the time essentially. There are different goals of possible using cryptocurrencies, which are described in [6]. If we 178


Ризик та дохідність.…

А. Б. Камінський, І. В. Мірошниченко, К. К. Писанець

concentrate to cryptocurrency users, it is possible to indicate three basic directions of their using in aggregate form [3]. The first direction includes, in fact, the use of cryptocurrencies to pay for goods and services. Payments are realized without regulators and intermediators. There is no doubt that Bitcoin is atop. It is possible to pay by Bitcoin in many shops, restaurants and hotels. The net of sales outlet where possible to pay by Bitcoin is constantly raising. Other cryptocurrencies lag Bitcoin in this direction. Second direction involve peer-to-peer payments. Peer-to-peer cash systems allow each person directly hand it to another person without any confirmations or approvals from anyone. The logic of peer-topeer payments was established by unknown inventor of Bitcoin Satoshi Nakamoto in the paper “A Peer-to-Peer Electronic Cash System” [7]. Third direction of cryptocurrency concerns to hold them for investment purposes. It may be investment into one cryptocurrency or create portfolio from cryptocurrencies. More advanced investment strategies include combination cryptocurrencies with “classical investments” in one portfolio. We focus our research within the framework of third direction. Taking into account modern division of investment classes on traditional and alternative [8] we consider cryptocurrencies as alternative investment assets. The important question of considering cryptocurrencies as alternative investment concerns analysis of “riskreturn correspondence” inside this asset class. We have considered risk in our research from different points of view and have used different risk measures. Classification of cryptocurrencies based on risk-return correspondence with different risk measures is the goal of our research. We have applied tools of self-organizing maps (SOM) for goal attainment. The structure of our article is following. Chapter 2 is devoted to the approaches for investment risk measurement. Strengths and weaknesses of each approach have been discussed. Additionally, we have added into consideration Hurst exponent. The logic of interpretation of Hurst exponent as risk measurement is presented at [9]. Chapter 3 presents data mining for cryptocurrencies. Chapter 4 contains basic results of our research — using the SOM for clustering cryptocurrencies by riskiness based on parameter sets of with and without Hurst exponent. Chapter 4 also covers issues of risk-return correspondence analysis, which disclose the specificity of crypto179


Đ?Đ&#x2022;Đ&#x2122;Đ Đ&#x17E;-Đ?Đ&#x2022;ЧĐ&#x2020;ТĐ&#x161;Đ&#x2020; ТĐ&#x2022;ĐĽĐ?Đ&#x17E;Đ&#x203A;Đ&#x17E;Đ&#x201C;Đ&#x2020;Đ&#x2021; Đ&#x153;Đ&#x17E;Đ&#x201D;Đ&#x2022;Đ&#x203A;ĐŽĐ&#x2019;Đ?Đ?Đ?ĐŻ Đ&#x2019; Đ&#x2022;Đ&#x161;Đ&#x17E;Đ?Đ&#x17E;Đ&#x153;Đ&#x2020;ĐŚĐ&#x2020;

2019, â&#x201E;&#x2013; 8

currencies as alternative assets. Last Chapter presents conclusions from our research.

2. Investment risk measurement One of the basic characteristics of investment is return. The classical return of asset over a period of time [đ?&#x2018;Ą; đ?&#x2018;Ą + 1] will be expressed through formula: đ?&#x2018;&#x2026;đ?&#x2018;Ą,đ?&#x2018;Ą+1 =

đ?&#x2018;&#x192;đ?&#x2018;Ą+1 â&#x2C6;&#x2019; đ?&#x2018;&#x192;đ?&#x2018;Ą , đ?&#x2018;&#x192;đ?&#x2018;Ą

where Pt and Pt+1 prices of such asset at times t and t + 1 correspondingly. Our research considers Pt as price of corresponding cryptocurrency in USD. Typically, Rt,t+1 will be a random variable, because future price Pt+1 is unknown. Thereafter R, which reflect return through the time, is also random variable. Other approach is based on the using logarithmic return which define by formula: đ?&#x2018;&#x2026;đ?&#x2018;Ą = đ?&#x2018;&#x2122;đ?&#x2018;&#x203A; (

đ?&#x2018;&#x192;đ?&#x2018;Ą+1 ). đ?&#x2018;&#x192;đ?&#x2018;Ą

In our research we use classical returns. This type of return we apply to cryptocurrencies, the values of which are presented in USD. Risk measurement supposes to introduce some mapping đ?&#x153;&#x152; , to which for each random variable R (representing return of investment asset) assigned non-negative number đ?&#x153;&#x152;(đ?&#x2018;&#x2026;) â&#x2C6;&#x2C6; [0; +â&#x2C6;&#x17E;]. The representation of đ?&#x153;&#x152;(đ?&#x2018;&#x2026;) is characterized by approach which selected for risk measurement. In reality there are very many risk measures which were introduced during consideration of risk in finance and investments. We have structured â&#x20AC;&#x153;risk measurement environmentâ&#x20AC;? into 5 approaches which are presented below. These approaches are not comprehensive set, but they present basic logical considerations adopted in modern investments. First approach which we have analyzed for risk measurement is variability approach. This approach is based on the classical point of view, which originate by H. Markowitz. In some extend, this approach may be considering as â&#x20AC;&#x153;theoretical approachâ&#x20AC;?, because it has been applied for modern portfolio theory. The simplest risk measure 180


РиСик Ń&#x201A;Đ° Đ´ĐžŃ&#x2026;Ń&#x2013;Đ´Đ˝Ń&#x2013;Ń Ń&#x201A;Ń&#x152;.â&#x20AC;Ś

Đ?. Đ&#x2018;. Đ&#x161;Đ°ĐźŃ&#x2013;Đ˝Ń Ń&#x152;киК, Đ&#x2020;. Đ&#x2019;. Đ&#x153;Ń&#x2013;Ń&#x20AC;ĐžŃ&#x2C6;ниŃ&#x2021;онкО, Đ&#x161;. Đ&#x161;. Đ&#x;Đ¸Ń Đ°Đ˝ĐľŃ&#x2020;Ń&#x152;

here is a range, which equals to difference between maximum and minimum possible values on the considered time interval [0; T]: đ??ż(đ?&#x2018;&#x2026;) = đ?&#x2018;&#x161;đ?&#x2018;&#x17D;đ?&#x2018;Ľ[0,đ?&#x2018;&#x2021;] đ?&#x2018;&#x2026; (đ?&#x2018;Ą) â&#x2C6;&#x2019; đ?&#x2018;&#x161;đ?&#x2018;&#x2013;đ?&#x2018;&#x203A;[0,đ?&#x2018;&#x2021;] đ?&#x2018;&#x2026; (đ?&#x2018;Ą). The range is important indicator from the point of view of getting a general understanding of future possibilities (it is assumed that future distribution will be the same as historical distribution). The shortcoming of range is that maximum and minimum prices were realized on peak and crisis time. These may be rare events and not relevant for periods of stability. This range also depends from time horizon, which we considered. Consequently, it is more efficient to use inter-quartile range as difference between 75 % and 25 % quantiles: đ?&#x2018;&#x201E;(đ?&#x2018;&#x2026;) = đ?&#x2018;&#x201E;75% (đ?&#x2018;&#x2026;(đ?&#x2018;Ą)) â&#x2C6;&#x2019; đ?&#x2018;&#x201E;25% (đ?&#x2018;&#x2026;(đ?&#x2018;Ą)). Of course, the best known risk measure using in this approach is standard deviation which characterizes deviation from mean value. Also, in the frameworks can be effectively used Absolute Mean Deviation (AMD). Second approach of risk measurement concerns asymmetry. In reality, deviations from the mean up and down illustrate a different significance in terms of risk. One of such approach is based on division standard deviation into pair of semi-standard deviations: upper and lower. They have following representations: 1

đ?&#x153;&#x17D; + (đ?&#x2018;&#x2026;) = â&#x2C6;&#x161;đ?&#x2018;&#x2021; â&#x2C6;&#x2122; â&#x2C6;&#x2018;đ?&#x2018;&#x2021;1(đ?&#x2018;&#x2026; (đ?&#x2018;Ą) â&#x2C6;&#x2019; đ??¸(đ?&#x2018;&#x2026;))2 , where đ?&#x2018;&#x2026;(đ?&#x2018;Ą) > đ??¸(đ?&#x2018;&#x2026;), 1

đ?&#x153;&#x17D; â&#x2C6;&#x2019; (đ?&#x2018;&#x2026;) = â&#x2C6;&#x161;đ?&#x2018;&#x2021; â&#x2C6;&#x2122; â&#x2C6;&#x2018;đ?&#x2018;&#x2021;1(đ?&#x2018;&#x2026; (đ?&#x2018;Ą) â&#x2C6;&#x2019; đ??¸(đ?&#x2018;&#x2026;))2 , where đ?&#x2018;&#x2026;(đ?&#x2018;Ą) â&#x2030;¤ đ??¸(đ?&#x2018;&#x2026;).

This pair (đ?&#x153;&#x17D; + (đ?&#x2018;&#x2026;), đ?&#x153;&#x17D; â&#x2C6;&#x2019; (đ?&#x2018;&#x2026;)) more deeply reflect deviations then standard deviation. The benefits of such measures concern with clear visibility of asymmetry when it done graphically at the plane. One of the important asymmetry indicators is skewness. Skewness reflects the expectation of the deviation from the mean to the third power: 3

3

đ??¸(đ?&#x2018;&#x2026; â&#x2C6;&#x2019; đ??¸(đ?&#x2018;&#x2026;)) đ?&#x2018;&#x2026; â&#x2C6;&#x2019; đ??¸(đ?&#x2018;&#x2026;) đ?&#x2018;&#x2020;(đ?&#x2018;&#x2026;) = đ??¸ ( ) = . đ?&#x153;&#x17D; (đ?&#x2018;&#x2026;) đ?&#x153;&#x17D; 3 (đ?&#x2018;&#x2026;) 181


Đ?Đ&#x2022;Đ&#x2122;Đ Đ&#x17E;-Đ?Đ&#x2022;ЧĐ&#x2020;ТĐ&#x161;Đ&#x2020; ТĐ&#x2022;ĐĽĐ?Đ&#x17E;Đ&#x203A;Đ&#x17E;Đ&#x201C;Đ&#x2020;Đ&#x2021; Đ&#x153;Đ&#x17E;Đ&#x201D;Đ&#x2022;Đ&#x203A;ĐŽĐ&#x2019;Đ?Đ?Đ?ĐŻ Đ&#x2019; Đ&#x2022;Đ&#x161;Đ&#x17E;Đ?Đ&#x17E;Đ&#x153;Đ&#x2020;ĐŚĐ&#x2020;

2019, â&#x201E;&#x2013; 8

Negative skewness indicates a long left tail of distribution, or the possibility of larger losses than profits. Positive skewness is desirable characteristic for risk-averse investors. The motivation of that is grounding at the expected utility theory. Typically, the third derivative of utility function of risk-averse investor is positive (see e.g. [10]) and this derivative is multiplier for skewness in Taylor expansion of expected utility. Next approach includes losses in negative situation. This approach conceptually based on interpretation of such situations and measurement of losses under their occurrence. The most used measure among this group is Value-at-Risk (VaR) [11]. This measure presents quantile of distribution function of random variable đ?&#x2018;&#x2026; which correspond for some probability (or confidence) level (typically 99 %, 95 %). The main advantage of VaR is intuitively understandable value of losses, based on reliability logic. Really, if investor forms capital for covering possible losses in 99 % than this number indicate reliability level 99 %. VaR integrally combines three crucial elements: 1) confidence level; 2) possible losses; 3) time horizon during which losses may be happened. One of the basic problems with VaR arises from the fact that it is only one point of distribution function. It concerns to the possibility of presence of long thin tail of distribution which will not take into account by VaR. Risk measure CVaR (Conditional value-at-risk) is generalization of VaR. CVaR is defined through VaR and shows average losses higher than VaR: đ??śđ?&#x2018;&#x2030;đ?&#x2018;&#x17D;đ?&#x2018;&#x2026;(đ?&#x2018;&#x2026;) = đ??¸(đ??żđ?&#x2018;&#x153;đ?&#x2018; đ?&#x2018; đ?&#x2018;&#x2019;đ?&#x2018; |đ??żđ?&#x2018;&#x153;đ?&#x2018; đ?&#x2018; đ?&#x2018;&#x2019;đ?&#x2018;  â&#x2030;Ľ đ?&#x2018;&#x2030;đ?&#x2018;&#x17D;đ?&#x2018;&#x2026;). The advantage of CVaR is coherency property which is very important for assessing the risk of investment portfolio. VaR cannot support the subadditivity property for probability distribution functions which are different from elliptical class. The subadditivity is mathematical formalization of diversification. At the framework analysis of possible essential losses, an important indicator is the ratio CVaR/VaR. This ratio can be considered as risk measure which characterize heavy tail risks. Fourth approach of risk measurement is based on sensitivity assessment. Namely, investment risk can be measured by approach based on estimation of sensitivity level of return for some index or 182


РиСик Ń&#x201A;Đ° Đ´ĐžŃ&#x2026;Ń&#x2013;Đ´Đ˝Ń&#x2013;Ń Ń&#x201A;Ń&#x152;.â&#x20AC;Ś

Đ?. Đ&#x2018;. Đ&#x161;Đ°ĐźŃ&#x2013;Đ˝Ń Ń&#x152;киК, Đ&#x2020;. Đ&#x2019;. Đ&#x153;Ń&#x2013;Ń&#x20AC;ĐžŃ&#x2C6;ниŃ&#x2021;онкО, Đ&#x161;. Đ&#x161;. Đ&#x;Đ¸Ń Đ°Đ˝ĐľŃ&#x2020;Ń&#x152;

factor. Mathematically this can be expressed by simple linear regression: đ?&#x2018;&#x2026;đ??´ = đ?&#x203A;źđ??´ + đ?&#x203A;˝đ??´ đ?&#x2018;&#x2026;đ??ź + đ?&#x153;&#x20AC;đ??´ , where đ?&#x2018;&#x2026;đ??ź is a market index return and đ?&#x153;&#x20AC;đ??´ is â&#x20AC;&#x153;ownâ&#x20AC;? return of asset A. It is supposed that đ??śđ?&#x2018;&#x153;đ?&#x2018;Ł(đ?&#x2018;&#x2026;đ??ź ; đ?&#x153;&#x20AC;đ??´ ) = 0. Such approach is very important with purpose to divide risk to so called systematic and non-systematic parts. In general, systematic risk is generated by market as a whole (more correctly, by factors which affect to the whole market). Non-systematic risk is raised from own randomness of asset`s return. This division can be good presented through applying variance operator to the abovementioned formula. Really, applying to this formula operator of variation we will receive following decomposition: đ?&#x153;&#x17D; 2 (đ?&#x2018;&#x2026;đ??´ ) = đ?&#x203A;˝đ??´ 2 đ?&#x153;&#x17D; 2 (đ?&#x2018;&#x2026;đ??ź ) + đ?&#x153;&#x17D; 2 (đ?&#x153;&#x20AC;đ??´ ). The pair of indicators (systematic risk; non-systematic risk) can be presented by percentages of risk constituents: (

đ?&#x203A;˝đ??´ 2 đ?&#x153;&#x17D; 2 (đ?&#x2018;&#x2026;đ??ź ) đ?&#x153;&#x17D; 2 (đ?&#x153;&#x20AC;đ??´ ) ; ). đ?&#x153;&#x17D; 2 (đ?&#x2018;&#x2026;đ??´ ) đ?&#x153;&#x17D; 2 (đ?&#x2018;&#x2026;đ??´ )

Our research supposes the analysis of the CRIX cryptocurrency index [12] for this approach. Last from the considered approaches includes Hurst exponent (H), which is a statistical measure applied to classify time series. Risk measuring based on this exponent is presented in [9]. The core of risk measuring by means đ??ť lies in higher predictability for a higher level of đ??ť. Thus, đ??ť = 0,5 indicates a random series, but đ??ť > 0,5 indicates some trends. Conversely, the inequality đ??ť < 0,5 characterizes antipersistant quality. So, abovementioned 5 approaches were considered to assess the risk of cryptocurrencies.

183


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

3. Data which was used in researches We used in our research data from four information resources [1316] devoted to cryptocurrencies. These resources contain significant information for carrying out statistical research in accordance with objectives of our investigation. First of all, these resources present statistical data of cryptocurrencies prices in USD. Secondly, market capitalization indicators and trading volumes can be founded there. We apply these indicators to build the sample. Thirdly, resources show prices changing (including graphically) through different time periods. It is necessary to note, that resources differ in saturation of information. The resource [13] was chosen as the base data source. The resource Investing.com contains information about different prices of more than 2000 cryptocurrencies. This resource is very useful because it contains information in one standard for traditional and alternative investment assets. The site [14] presents information about wide set of cryptocurrencies and resource [16] combines information about 119 cryptocurrencies with largest capitalization. Using these resources provided possibility to form an accurate database for our analysis. The issue of data accuracy is actual because sometimes data includes gaps. Additionally, many cryptocurrencies were launched relatively recently, and they were excluded from the sample. We introduced following criteria for sampling taking into account the focus of our research on the characteristics of cryptocurrencies as an investment asset: 1. Capitalization level. The cryptocurrencies selected for the study should have a capitalization of more than 1M USD. Sense of this criterion is based on the desire to withdraw from consideration the cryptocurrencies with low capitalization. Such low capitalize cryptocurrencies are very difficult to consider as investment asset. Moreover, essential investments can significantly change the prices of such cryptocurrencies. Besides that, many cryptocurrencies have not capitalization at all because their prices equal 0. 2. Availability of trading data from approved for our research time interval. We used 2-years’ time interval from 01.07.2017 to 30.06.2019. Cryptocurrencies which started trading after 01.07.2017 were withdraw from considering in our research. 184


Ризик та дохідність.…

А. Б. Камінський, І. В. Мірошниченко, К. К. Писанець

3. Exclusion of cryptocurrencies with highly abnormal data. Prices of some cryptocurrencies rose extremely from 0 and indicated abnormal returns. Taking into account that such abnormality indicates possible instability of assets in the future, we also withdraw their. As a result of using such criteria for the selected information resources, our sample amounted to 327 cryptocurrencies. For this sample, we calculated the values of daily classic R for the mentioned period. In addition to the considered cryptocurrencies we used values of index CRIX (CRyptocurrency IndeX), which we have applied to the sensitivity analysis. Index CRIX was elaborated by specialists from Bortkiewicz Chair of Statistics at Humboldt University (Germany) together with SKBI at Singapore Management University and CoinGecko (description of index is here [12]). Correlation analysis was applied to formed database of returns. Such analysis indicates high level of interdependency within each group of risk measures. As a consequence, we selected one risk indicator from each group. They are: 1. Inter-quantile range; 2. Skewness; 3. Value-at-Risk; 4. Beta coefficient for returns of index CRIX; 5. Hurst exponent. These 5 risk indicators formed vector for application tools of SOM. The calculations in our research were performed in the programming language R.

4. Constructing the SOM and clustering We have considered two alternatives for clustering through designing SOM. First alternative supposes to use all 5 selected indicators (model # 1). The second one excludes the Hurst exponent (model # 2). Given the same parameters of the clustering models, comparing the results with this approach may allow us to evaluate the relationship between risk and the expected profitability of cryptocurrencies. Taking into account the difference in the ranges of the input variables, it was decided to normalize the data: for each characteristic in the input data the average value is calculated and divided by the 185


Đ?Đ&#x2022;Đ&#x2122;Đ Đ&#x17E;-Đ?Đ&#x2022;ЧĐ&#x2020;ТĐ&#x161;Đ&#x2020; ТĐ&#x2022;ĐĽĐ?Đ&#x17E;Đ&#x203A;Đ&#x17E;Đ&#x201C;Đ&#x2020;Đ&#x2021; Đ&#x153;Đ&#x17E;Đ&#x201D;Đ&#x2022;Đ&#x203A;ĐŽĐ&#x2019;Đ?Đ?Đ?ĐŻ Đ&#x2019; Đ&#x2022;Đ&#x161;Đ&#x17E;Đ?Đ&#x17E;Đ&#x153;Đ&#x2020;ĐŚĐ&#x2020;

2019, â&#x201E;&#x2013; 8

standard deviation. With this approach, the characteristics are normalized as follows: đ?&#x2018;&#x2039;â&#x2C6;&#x2014; =

đ?&#x2018;&#x2039; â&#x2C6;&#x2019; đ?&#x2018;&#x2039;Ě&#x2026; , đ?&#x153;&#x17D;đ?&#x2018;&#x2039;

where đ?&#x2018;&#x2039; â&#x2C6;&#x2014; is the normalized value of characteristic; đ?&#x2018;&#x2039; is the value of the characteristic; đ?&#x2018;&#x2039;Ě&#x2026; â&#x20AC;&#x201D; the average value; đ?&#x153;&#x17D;đ?&#x2018;&#x2039; â&#x20AC;&#x201D; the standard deviation of đ?&#x2018;&#x2039;. The entire sample was divided into 80 % for training sample and 20 % for verification. But given the small sample size, in some cases it makes sense to use K-fold cross-validation. In turn, to construct a SOM it is necessary to determine the optimal dimension of the neural network. In the midst of the alternatives under consideration, we have chosen a 40 by 30 map, which is 1200 neurons. This dimension allows us to visually adequately assess the quality of neural network construction and identify some patterns of data. The optimal number of neural network training iterations was determined experimentally: after the 1500th neural network training run, the average error of the self-organization map for training and verification samples reaches its minimum. The recognition rates for these samples are approximately 99 % and 80 %, respectively. Before starting training it is necessary to initialize the weighting coefficients of neurons. We chose an approach in which the initial weights of the map neurons would be initialized by the values of the subset of the hyperplane through which the two main eigenvectors of the covariance matrix of the input values of the training sample pass. This approach helped to accelerate the learning process of the network and obtain better clustering results. The final parameter of network learning is the neighborhood function, which defines the topological zone of influence of the winning neuron. In our case, the Gaussian function was chosen since it takes into account all the neurons in the network, but with varying degrees of impact. With this approach, the learning process takes a little longer, but the quality of the clustering results may be better than with other neighborhood functions. As a result of modeling we obtained SOMs for two considered models. First model includes the entire list of input indicators. The Fig. 1 illustrates the SOM and Sammon`s projection for the model # 1. 186


Ризик та дохідність.…

А. Б. Камінський, І. В. Мірошниченко, К. К. Писанець

a)

b)

Fig. 1. Visualization of cryptocurrency clustering by model # 1: a) self-organizing map; b) Sammon's projection.

Second model was constructed without Hurst exponent. The SOM and Sammon`s projection are presented at the Fig. 2.

a)

b)

Fig. 2. Visualization of cryptocurrency clustering by model # 2: a) self-organizing map; b) Sammon's projection. 187


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

As can be seen from the simulation results, the model based on all indicators (Fig. 1) shows a certain polarity of cryptocurrencies, while the alternative model (Fig. 2) does not have such properties. This is confirmed by the projection of Sammon. At the same time, model # 1 demonstrates a higher contrast of the distribution of cryptocurrencies capitalization across clusters (see Table 1, where CAP is the capitalization of the corresponding cluster). Table 1 MEAN AND STANDARD DEVIATION OF INPUTS BY CLUSTERS Clusters

Model 1 1

Model 2

2

3

Mean CAP 19 468 341 2 284 887 859

1

2

3

63 099 457 906 751 538 7 871 438 102 514 982

RMSE 31 182 828 15 366 292 314 261 012 706 9 588 895 624 11 612 761 383 205 452 CAP

For the purpose of comparing the measures of risk and profitability of cryptocurrencies of various clusters, we consider Tables 2 (for model # 1) and 3 (for model # 2). Table 2 RISK AND PROFITABILITY MEASURES FOR MODEL # 1 CLUSTERS Cluster 1 Indicators

Cluster 2

Cluster 3

Average*

Standard deviation*

Average*

Standard deviation*

Average*

Standard deviation*

Interquantile range

0,235

1,207

-0,079

1,104

-0,080

0,770

Skew

0,197

1,342

-0,101

0,658

-0,040

0,947

VaR

-0,152

0,945

-0,033

1,382

0,104

0,702

Beta CRIX

0,050

1,241

-0,104

0,908

0,036

0,906

Hurst exponent

-1,262

0,519

1,196

0,484

-0,043

0,343

Expected Return

-0,052

0,305

0,213

1,797

-0,104

0,290

*normalized values 188


Ризик та дохідність.…

А. Б. Камінський, І. В. Мірошниченко, К. К. Писанець

Table 3 RISK AND PROFITABILITY MEASURES FOR MODEL # 2 CLUSTERS Cluster 1 Indicators

Cluster 2

Cluster 3

Average*

Standard deviation*

Average*

Standard deviation*

Average*

Standard deviation*

Interquantile range

-0,359

0,478

1,890

1,075

0,080

0,876

Skew

-0,365

0,350

0,042

0,669

2,369

1,009

VaR

0,324

0,345

-1,613

1,660

-0,184

0,948

Beta CRIX

0,181

1,069

-0,535

0,308

-0,545

0,568

Expected Return

-0,102

0,960

0,211

0,522

0,384

1,337

*normalized values

An analysis of the results enables to make findings about better visualization at the model # 1, where Hurst exponent was involving into consideration. It follows from the completion of the clusters and Sammon`s projections. We think that such results indicate the role of Hurst exponent for the estimation risk of cryptocurrencies. One of the directions of our research was focused to the verification of classical “risk-return” relationship (when higher risk is compensated by higher return). The results have shown that such classical relationship is absent between clusters of SOM. There is some divergency of correspondence between risk and return.

5. Conclusions and outlook for future research Cryptocurrencies is one of the dynamically growing segments of modern financial system. Currently, there are about 2000 types of cryptocurrencies. They perform different financial functions, one of which is investing. From this point of view, cryptocurrencies can be considered as an investment asset. Investment means that cryptocurrency can provide growth in price and it is possible to sell it more valuably. The aim of our research was clustering cryptocurrencies by risk level on the base of Kohonen self-organizing map techniques. It’s 189


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

supposed that clustering will represent investment structuring within the frameworks of the risk-return ratio. A set of risk measures has been formed that represent different approaches to measuring risk. The results of risk assessment by these measures allowed forming the vectors of cryptocurrency estimations, which became the basic for applying the Kohonen SOM methodology. As a result of study, two models based on SOM were built, one of which includes Hurst exponent, and the other without it. We have found that including into consideration Hurst exponent significantly affects to the SOM structure — the map in this case looks like more substantive. The hypothesis of the existence of classical dependency between risk and return was rejected by our research. We can explain this result with two arguments. First argument is that the change in the price of cryptocurrency depends on supply-demand factors. But the supply and demand for cryptocurrencies are not realized on an investment basis. Participants of cryptocurrencies market make demands for buying or selling dominantly out of investment logic. Second argument is that cryptocurrencies are not tangible assets for most part. They are typical examples of intangible assets [17]. It is possible to assume, that classical approaches to risk measurement are not quite adequate for such assets as cryptocurrencies. The perspectives of risk-return concordance investigations for these assets underpin the development of specific procedures of risk measurement. Moreover, it may be logical to divide the set of cryptocurrencies into two types, one of which should include cryptocurrencies with investment properties, and another should include all the others.

Список використаної літератури: 1. Gangwal S. Analyzing the Effects of Adding Bitcoin to Portfolio. International Journal of Economics and Management Engineering. 2016. Vol. 10, No. 10. P. 3519–3532. 2. Криптовалюти в Україні: технологія, ринок, регулювання. USAID. 2018. 94 с. URL: https://zakon.help/files/article/9634/Cryptocurrency_ Paper_Sept2018_ua.pdf. 3. Houben R., Snyers A. Cryptocurrencies and blockchain. Legal context and implications for financial crime, money laundering and tax evasion. European Parliament's Special Committee on Financial Crimes, Tax Evasion 190


Ризик та дохідність.…

А. Б. Камінський, І. В. Мірошниченко, К. К. Писанець

and Tax Avoidance. 2018. 101 p. URL: https://www.europarl.europa.eu/ RegData/etudes/STUD/2018/619024/IPOL_STU(2018)619024_EN.pdf. 4. Katigbak Y. Why Are There So Many Cryptocurrencies? We The Cryptos : website. 2019. URL: https://wethecryptos.net/why-are-there-somany-cryptocurrencies/ (Last accessed: 01.07.2019). 5. Cryptocurrency Market Cap Charts. Coin360 : website. 2019. Retrieved from https://coin360.com/charts (Last accessed: 01.07.2019). 6. Sudip N. The Goals of Cryptocurrency, Blockchain. Steemit : website. 2017. URL: https://steemit.com/steemit/@sudipn749/the-goals-ofcryptocurrency-blockchain (Last accessed: 01.07.2019). 7. Nakamoto S. Bitcoin: A Peer-to-Peer Electronic Cash System. Cryptography Mailing List. 2009. URL: http://www.bitcoin.org/bitcoin.pdf (Last accessed: 01.07.2019). 8. Chambers D. R., Black K. H., Lacey N. J. Alternative investments: a primer for investment professionals. CFA Institute. 2018. 183 p. URL: https://www.cfainstitute.org/-/media/documents/book/rf-publication/2018/rfv2018-n1-1.ashx. 9. Czarnecka A., Wilimowska Z. Hurst Exponent as a Risk Measurement on the Capital Market. Information Systems Architecture and Technology: Proceedings of 38th International Conference on Information Systems Architecture and Technology — ISAT 2017 (Szklarska Poręba, Poland, 2017, September 17–19). Advances in Intelligent Systems and Computing. Cham: Springer, 2018. Vol. 656. P. 355–363. DOI: 10.1007/978-3-31967229-8_32. 10. Scott R., Horvath P. On the direction of preference for moments of higher order than the variance. Journal of Finance. 1980. Vol. 35, No. 4. P. 915–919. DOI: 10.1111/j.1540-6261.1980.tb03509.x. 11. Holton G. Value-at-Risk: Theory and Practice. San Diego: Academic Press, 2003. 405 p. 12. Methodology. THE CRIX : website. URL: http://thecrix.de (Last accessed: 01.07.2019). 13. Coins. Cryptocompare.com: website. URL: https://www.cryptocompare.com/ (Last accessed: 01.07.2019). 14. Top 100 Coins by Market Capitalization. Coingecko.com: website. URL: https://www.coingecko.com (Last accessed: 01.07.2019). 15. All Cryptocurrencies. Investing.com: website. URL: https://www.investing.com/crypto/currencies (Last accessed: 01.07.2019). 16. All Cryptocurrencies. Yahoo Finance: website. URL: https://finance.yahoo.com/cryptocurrencies (Last accessed: 01.07.2019). 17. Haskel J., Westlake S. Capitalism without Capital: The Rise of the Intangible Economy. Princeton: Princeton University Press, 2018. 288 p. DOI: 10.2307/j.ctvc77hhj.

191


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

References 1. Gangwal, S. (2016). Analyzing the Effects of Adding Bitcoin to Portfolio. International Journal of Economics and Management Engineering, 10(10), 3519-3532. DOI: 10.5281/zenodo.1339806. 2. USAID. (2018, September). Kryptovaliuty v Ukraini: tekhnolohiia, rynok, rehuliuvannia. Retrieved from https://zakon.help/files/article/9634/ Cryptocurrency_Paper_Sept2018_ua.pdf [in Ukrainian]. 3. Houben, R., & Snyers, A. (2018, July). Cryptocurrencies and blockchain. Legal context and implications for financial crime, money laundering and tax evasion. European Parliament's Special Committee on Financial Crimes, Tax Evasion and Tax Avoidance. Retrieved from https://www.europarl.europa.eu/RegData/etudes/STUD/2018/619024/IPOL_ STU(2018)619024_EN.pdf. 4. Katigbak, Y. (2019). Why Are There So Many Cryptocurrencies? Retrieved from https://wethecryptos.net/why-are-there-so-many-cryptocurrencies/. 5. Coin360. (2019). Cryptocurrency Market Cap Charts. Retrieved from https://coin360.com/charts. 6. Sudip, N. (2017). The Goals of Cryptocurrency, Blockchain. Retrieved from https://steemit.com/steemit/@sudipn749/the-goals-ofcryptocurrency-blockchain. 7. Nakamoto, S. (2009). Bitcoin: A Peer-to-Peer Electronic Cash System. Cryptography Mailing List. Retrieved from https://metzdowd.com. 8. Chambers, D. R., Black, K. H., & Lacey, N. J. (2018). Alternative investments: a primer for investment professionals. CFA Institute. Retrieved from https://www.cfainstitute.org/-/media/documents/book/rf-publication/ 2018/rf-v2018-n1-1.ashx. 9. Czarnecka, A., & Wilimowska, Z. (2018). Hurst Exponent as a Risk Measurement on the Capital Market. In J. Świątek, L. Borzemski, Z. Wilimowska (Eds.), Information Systems Architecture and Technology: Proceedings of 38th International Conference on Information Systems Architecture and Technology – ISAT 2017 (Szklarska Poręba, Poland), Advances in Intelligent Systems and Computing, 656 (pp. 355-363). Cham, Switzerland: Springer. DOI: 10.1007/978-3-319-67229-8_32. 10. Scott, R., & Horvath, P. (1980). On the direction of preference for moments of higher order than the variance. Journal of Finance, 35(4), 915–919. DOI: 10.1111/j.1540-6261.1980.tb03509.x. 11. Holton, G. (2003). Value-at-Risk: Theory and Practice. San Diego, CA: Academic Press. 12. THE CRIX. (2018). Methodology. Retrieved from http://thecrix.de. 13. Cryptocompare. (2019). Coins. Retrieved from https://www.cryptocompare.com/. 14. CoinGecko. (2019). Top 100 Coins by Market Capitalization. Retrieved from https://www.coingecko.com. 192


Ризик та дохідність.…

А. Б. Камінський, І. В. Мірошниченко, К. К. Писанець

15. Investing. (2019). All Cryptocurrencies. Retrieved from https://www.investing.com/crypto/currencies. 16. Yahoo Finance. (2019). All Cryptocurrencies. Retrieved from https://finance.yahoo.com/cryptocurrencies. 17. Haskel, J., & Westlake, S. (2018). Capitalism without Capital: The Rise of the Intangible Economy. Princeton, NJ: Princeton University Press. DOI: 10.2307/j.ctvc77hhj. Стаття надійшла до редакції 10.08.2019

193


Вимоги до наукових статей, що подаються до науково-аналітичного журналу «Нейро-нечіткі технології моделювання в економіці» Вимоги до стуктури статті 1. Індекс УДК. 2. Назва статті, відомості про авторів, анотація та ключові слова. Подається трьома блоками українською, російською та англійською мовами. Після назви статті вказується ініціали та прізвища авторів (англійською мовою — ім’я та прізвища; транслітерувати імена необхідно згідно постанови Кабінету Міністрів України від 27.01.2010 №55 «Про впорядкування транслітерації українського алфавіту латиницею»). З наступного рядка вказати без скорочень науковий ступінь, вчене звання автора, посаду і місце роботи автора (повністю без скорочень і абревіатур; для англійської мови використовувати повний офіційний переклад назви організацій). З нового рядка — повну робочу адресу з поштовим індексом і назвою країни, адресу електронної пошти автора. Якщо у статті кілька авторів, то по кожному автору наводиться повна інформація з пропущеним рядком між авторами. Більше чотирьох авторів не допускається. Через рядок наводиться анотація, яка має бути структурованою, лаконічною, інформативною та містити такі аспекти: предмет, мету, метод чи методологію дослідження, результати дослідження, сферу застосування результатів, ступінь наукової новизни, висновки. Обсяг анотації — не менш як 1800 знаків (включаючи ключові слова — не менше п’яти та не більше десяти слів або словосполучень). 3. Код JEL класифікації. Навести від 1 до 5 кодів, в одному рядку, через кому, наприклад: JEL Classіfіcatіon: C12, H12. 4. Текст статті. Через рядок. У стуктурі статті необхідно виділити: — вступ (у якому необхідно висвітлити: постановку проблеми та її зв’язок із важливими науковими чи практичними 194


Вимоги до структури статті

завданнями; аналіз останніх досліджень та публікацій з обов’язковим посиланням на використані джерела; невирішені раніше частини загальної проблеми, котрим присвячується стаття); — формулювання мети і завдань дослідження; — виклад основного матеріалу дослідження з повним обґрунтуванням отриманих наукових результатів; — висновки і перспективи подальших досліджень у даному напрямку; — два переліки використаних літературних джерел. Перший перелік використаних літературних джерел подається під заголовком «Список літератури» мовою оригіналу і має містити не менше 10 джерел. Бібліографічний опис літературних джерел оформлюється згідно з ДСТУ 8302:2015 «Інформація та документація. Бібліографічне посилання. Загальні вимоги та правила складання». Другий перелік використаних літературних джерел подається під заголовком «References», що містить ті самі посилання, але у латинському алфавіті, оформлені за міжнародним бібліографічним стандартом APA-2010. Якщо наукова праця написана мовою, що використовує кирилицю, то її бібліографічний опис необхідно транслітерувати латинськими літерами. Транслітерувати власні назви, прізвища та імена необхідно згідно з постановою Кабінету Міністрів України від 27.01.2010 № 55 «Про впорядкування транслітерації українського алфавіту латиницею». Назви періодичних україно- та російськомовних видань (журналів, збірників та ін.) подаються транслітерацією, а в дужках — англійською мовою, наприклад: Finansy Ukrainy (Finance of Ukraine). Якщо джерело не англомовне, то у кінці посилання на нього необхідно зазначити мову оригіналу: [in Ukrainian], [in Russian] тощо. У кінці статті має бути примітка, що стаття подана для публікації лише до журналу «Нейро-нечіткі технології моделювання в економіці». Технічні вимоги до оформлення статті 1. Вимоги до оформлення тексту: — використовувати текстовий редактор MS Word 2003 чи вище; 195


НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

2019, № 8

— текстові файли подаються у форматі MS Word з розширенням «doc» або «docx»; — обсяг статті 0,5 — 2 друк. арк. (12 — 48 стор. формату А4 міжрядковим інтервалом 1,5 кеглем 14 гарнітури Times New Roman Cyr); 2. Вимоги до оформлення ілюстрацій: — якість ілюстрації повинна забезпечити її чітке відтворення; — рисунки та графіки у статтю вставляють або у графічному редакторі MS Word, або в одному з форматів jpeg, bmp чи tif з роздільною здатністю не менше ніж 300 dpi (подавати якісні оригінали); — всі об’єкти в рисунках, зроблених у MS Word, мають бути обов’язково згруповані. Текст статті не повинен містити рисунків і/або тексту в рамках рисунків, розташованих поверх/за текстом тощо; — ілюстрації не повинні виходити на поля; — рисунки підписують і нумерують (якщо їх більше ніж один); — підпис має бути під ілюстрацією і позначається скороченим словом «Рис.»; — схеми слід розміщувати після першого посилання на них по тексту; — оскільки друк чорно-білий, за можливості необхідно уникати застосовування фону і кольору у графіках, діаграмах тощо. 3. Вимоги до оформлення таблиць: — перед кожною таблицею необхідно подати слово «Таблиця» з її порядковим номером у статті з вирівнюванням по правій межі тексту; — у наступному рядку наводиться назва таблиці великими літерами з вирівнюванням посередині поля, за якою розміщується сама таблиця; — текст таблиці може бути дещо меншим від основного тексту. 4. Вимоги до оформлення формул: — формули набираються допоміжною програмою MS Equation 3.0 (редактор формул в MS Word); — формули вирівнюють по центру; — формули нумерують в круглих дужках праворуч сторінки наскрізною нумерацією. 196


Вимоги до структури статті

5. Посилання на використані джерела: — при посиланні в тексті на літературне джерело слід навести порядковий номер у квадратних дужках, який відповідна праця має у списку літератури; — список літератури наводять у кінці статті у порядку згадуваних джерел; — на всі наведені в списку літератури джерела мають бути посилання у тексті статті; — усі цитування у тексті або згадування про отримані іншими авторами результати мають супроводжуватись відповідним посиланням. Додатково: — усі статті проходять подвійне сліпе рецензування; — у тексті статті можуть бути внесені редакційні виправлення під час опрацювання редактором та вичитки коректором; — автори статті несуть відповідальність за правильність і точність наведених у статті термінів, даних, фактів, цитат, статистичних матеріалів тощо, а також за наведення в статті даних, що не є предметом відкритої публікації; — в одному номері кожним автором може бути опубліковано тільки одну статтю.

197


ЗМІСТ

Соловйов В. М., Соловйова В. В., Тулякова А. Ш. «Visibility graphs and precursors of stock crashes». . . . . . . . . . . . . . . . . . 3 Кононова К. Ю., Кострінчук Д. О. «Геомаркетинговий підхід в задачі розміщення: порівняльний аналіз трьох алгоритмів кластеризації».. . . . . . . . . . . . . . . . . . . . . . . . 30 Григорович О. В. «Застосування багатошарових персептронів для класифікації позичальників-юридичних осіб». . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Дербенцев В. Д., Великоіваненко Г. І., Даценко Н. В. «Застосування методів машинного навчання до прогнозування часових рядів криптовалют». . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Клебан Ю. В. «Дослідження способів трансформації даних в контексті підвищення ефективності моделей кредитного скорингу». . . . . . . . . . . . . . 94 Кобець В. М., Яценко В. О. «Вплив розвитку четвертої індустріальної революції на дивергенцію і конвергенцію економічної нерівності для різних країн світу» . . . 124 Стрельченко І. І. «Моделювання процесів трансграничного поширення фінансових криз». . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Камінський А. Б., Мірошниченко І. В., Писанець К. К. «Risk and return for cryptocurrencies as alternative investment: Kohonen maps clustering» . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

198


Зміст

CONTENTS

Vladimir Soloviev, Viktoria Solovieva, Anna Tuliakova «Visibility graphs and precursors of stock crashes». . . . . . . . . . . . . . . . . . 3 Kateryna Kononova, Denis Kostrinchuk «A geomarketing approach in the placement problem: a comparative analysis of three clusterization algorithms». . . . . . . . . . . . . . . . . . . . . . 30 Olha Hryhorovych «Application of multilayer perceptrons to legal entities borrowers classification». . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Vasyl Derbentsev, Halyna Velykoivanenko, Natalia Datsenko «Machine learning approach for forecasting cryptocurrencies time series». . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Yuriy Kleban «Studying the methods of data transformation in the context of increasing the effectiveness of credit scoring models». . . . . . . . . . . . . . . 94 Vitaliy Kobets, Valeria Yatsenko «Influence of the fourth industrial revolution on divergence and convergence of economic inequality for various countries». . . . . . . . . . . 124 Inna Strelchenko «Modeling of cross-border spreading of financial crisis». . . . . . . . . . . . . 147 Andrii Kaminskyi, Ihor Miroshnychenko, Kostiantyn Pysanets «Risk and return for cryptocurrencies as alternative investment: Kohonen maps clustering» . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

199


Наукове видання

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ Науково-аналітичний журнал Заснований у 2011 р. Виходить двічі на рік

№8

Ідея обкладинки Г. Мір Алленде, М. Мейдич Художник обкладинки Т. Зябліцева Редактор Н. Підлужна Коректор І. Савлук Верстка О. Руденко Підписано до друку 06.10.19. Формат 6084/16. Папір офсет. № 1. Гарнітура Тип Таймс. Друк офсетний. Ум. друк. арк. 11,62. Обл.-вид. арк. 13,27. Наклад 100 пр. Зам. № 19-5575 Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» 03680, м. Київ, проспект Перемоги, 54/1 Тел./факс (044) 537-61-41; тел. (044) 537-61-44 E-mail: publish@kneu.kiev.ua

200

Profile for Yurii Kleban

Нейро-нечіткі технології моделювання в економіці  

Науково-аналітичний журнал

Нейро-нечіткі технології моделювання в економіці  

Науково-аналітичний журнал

Profile for kyura
Advertisement

Recommendations could not be loaded

Recommendations could not be loaded

Recommendations could not be loaded

Recommendations could not be loaded