Issuu on Google+

Faculteit Wetenschappen Vakgroep Fysica en Sterrenkunde Voorzitter: Prof. Dr. Dirk Ryckbosch

Simulatie van informatie-entropie in financi¨ ele markten op basis van moleculaire dynamica door Pieter Van Nuffel

Promotor: Prof. Dr. Jan Ryckebusch

Masterproef ingediend tot het behalen van de academische graad van Master in de Fysica en Sterrenkunde Academiejaar 2010–2011


Faculteit Wetenschappen Vakgroep Fysica en Sterrenkunde Voorzitter: Prof. Dr. Dirk Ryckbosch

Simulatie van informatie-entropie in financi¨ ele markten op basis van moleculaire dynamica door Pieter Van Nuffel

Promotor: Prof. Dr. Jan Ryckebusch

Masterproef ingediend tot het behalen van de academische graad van Master in de Fysica en Sterrenkunde Academiejaar 2010–2011


Dankwoord

Wanneer je gefascineerd raakt door interessante theorie¨en, dan worden die je doorgaans aangereikt door interessante mensen. Het was een regenachtige zaterdag in 2005 toen ik voor het eerst met het concept ‘econofysica’ in aanraking kwam, tijdens een lezing van prof. dr. Jan Ryckebusch. Die paste in een gevarieerde lezingenreeks georganiseerd aan de UGent ter ere van het wonderjaar waarin ene Albert Einstein honderd jaar eerder een ware revolutie had ontketend in de natuurkunde. En het moet gezegd, die lezingen maakten stuk voor stuk een meeslepende indruk op mij. Na de presentatie over de fysica van financi¨ele markten, stond mijn besluit vast: ik zou natuurkunde studeren. Vooralsnog de beste beslissing van mijn leven. Daarom wil ik Jan Ryckebusch driemaal bedanken. Ten eerste: voor die lezing. Ten tweede: als lesgever, om me anders te leren denken over concepten als temperatuur, fasetransities en kritisch gedrag. Ten derde: als promotor, voor de positieve raad en de aangename samenwerking. Dankuwel Jan. Simon Standaert verdient hier tevens een vermelding, want in de prille beginfase van mijn onderzoek werd ik door hem op weg geholpen doorheen de computercode. Ook ben ik dankbaar voor de computationele hulp die me werd aangeboden door de immer behulpzame Maarten Van Halst en Lesley De Cruz. Verder ben ik evenzeer de makers van de vrije software waarop ik beroep heb gedaan, bijzonder erkentelijk.

i


Uiteraard mag ik mijn persoonlijke entourage niet vergeten, want ook zij hebben -op een of andere manier- geholpen vorm te geven aan mijn denken. Bedankt zus, voor de hulp en de vele discussies. Mijn vrienden, mijn medestudenten en de redactie van Schamper dank ik voor de bemoedigende woorden. En voor de moeite om alles na te lezen, heeft Michael Houbraken nog een fles wijn van me te goed. Ik zie deze masterproef niet als het eindpunt van mijn wetenschappelijke ontplooiing, want na het indienen ervan zal mijn nieuwsgierigheid naar hoe de natuur in elkaar zit, niet verdwenen zijn. Toch kan je een thesis in zekere zin beschouwen als het sluitstuk van een eerste fase in een mensenleven. Dan komt plots het besef dat het mijn ouders waren, die er als mecenassen voor gezorgd hebben dat ik me al die tijd zorgeloos op het studeren kon focussen. En toegegeven, dan komt daarenboven het besef dat zij al die tijd nog eens mijn asociaal gedrag moesten gedogen. Aan hen ben ik bijgevolg meer dank verschuldigd dan aan wie ook op deze planeet.

Pieter Van Nuffel, juli 2011

ii


Samenvatting In mijn masterproef onderzoek ik de entropie-evolutie van een systeem dat zich niet in evenwicht bevindt. Dat gebeurt aan de hand van simulaties van een vloeistof met behulp van moleculaire dynamica. Deze modelleringstechniek heeft het voordeel dat de evolutie van het systeem in functie van de tijd kan gevolgd worden en dat deze tijdens de simulatie uit haar evenwichtstoestand kan gebracht worden. De onderliggende bedoeling is om het robuust gedrag van financi¨ele markten te modelleren, met een focus op causale mechanismen en statistische wetten. Empirisch blijken de distributies van aandelenprijzen namelijk niet gaussisch verdeeld te zijn (in tegenstelling tot wat door klassieke economische modellen en het centraal-limiet-theorema wordt voorspeld), maar leptokurtosisch. Met de vorm van dergelijke distributie is een lagere informatie-entropie geassocieerd dan met een gaussiche distributie. Deze leptokurtosische distributies worden tevens teruggevonden in de niet-evenwichtssimulatie. Door beroep te doen op het shannoniaans concept van informatie-entropie, kan verder de theoretische uitdrukking voor de entropie van een ideaal gas herafgeleid worden. Deze entropie, die enkel temperatuursafhankelijk is, wordt met grote nauwkeurigheid teruggevonden uit de snelheidsdistributies van de deeltjes in de simulatie. Deze ideaal gas-entropie kan gebruikt worden als basis voor een methode om de entropie van een vloeistof te berekenen, waarin de aanwezige correlaties voor een entropieverlaging zullen zorgen.

iii


Inhoudsopgave Dankwoord

i

Samenvatting

iii

Inhoudsopgave

v

Lijst van afkortingen en symbolen 1 Econofysica 1.1 De effici¨ente markt-hypothese . 1.2 Return . . . . . . . . . . . . . . . 1.3 Geometrische brownse beweging . 1.4 Empirische data: S&P 500-index 1.5 Waarschijnlijkheidsdistributie . . 1.6 Machtswetten . . . . . . . . . . . 1.7 De tekortkomingen van de EMH 1.8 Naar een vloeistofmodel . . . . .

vi

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

1 2 3 3 5 7 8 10 11

2 Moleculaire dynamica 2.1 Benaderingen . . . . . . . . . . . . . 2.2 Integratie-algoritme . . . . . . . . . 2.3 Systeemeenheden . . . . . . . . . . . 2.4 Lennard-Jones-potentiaal . . . . . . 2.5 Het canonisch ensemble . . . . . . . 2.6 Programma . . . . . . . . . . . . . . 2.6.1 Initialisatie . . . . . . . . . . 2.6.2 Evolutie naar evenwicht . . . 2.6.3 Productiefase . . . . . . . . . 2.7 Correlatiefuncties . . . . . . . . . . . 2.7.1 Radiale distributiefunctie . . 2.7.2 Snelheidsautocorrelatiefunctie 2.7.3 Besluit . . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

12 12 14 15 15 16 17 17 17 18 19 20 21 22

. . . . . . . .

iv


3 Niet-evenwichts moleculaire dynamica 3.1 Zelfgeorganiseerde kritikaliteit . . . . . . . 3.2 Softcore potentiaal . . . . . . . . . . . . . 3.3 Invloed van 位 op de temperatuursevolutie 3.4 Vette staarten . . . . . . . . . . . . . . . . 3.5 Kurtosis . . . . . . . . . . . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

4 Entropie en informatie 4.1 Boltzmanndistributie . . . . . . . . . . . . . . . . . . 4.2 Entropie van een ideaal gas . . . . . . . . . . . . . . 4.3 Informatie-entropie . . . . . . . . . . . . . . . . . . . 4.3.1 Entropie ` a la Shannon . . . . . . . . . . . . . 4.3.2 Entropie van de Maxwell-snelheidsdistributie 4.3.3 Configurationele entropie . . . . . . . . . . . 4.4 Entropie in de simulatie . . . . . . . . . . . . . . . . 4.5 Interactie-entropie . . . . . . . . . . . . . . . . . . . 4.6 Entropie in NEMD . . . . . . . . . . . . . . . . . . . 4.6.1 Lokale entropie . . . . . . . . . . . . . . . . . 4.6.2 Tijdsevolutie van de entropie . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

23 23 24 25 27 29

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

31 32 32 34 34 35 37 39 42 46 46 48

5 Informatie-entropie in financi篓 ele markten: discussie 5.1 Informatie-entropie uit returns . . . . . . . . . . . . . 5.1.1 Entropie en leptokurtosis . . . . . . . . . . . . 5.1.2 Entropiefluctuaties . . . . . . . . . . . . . . . . 5.2 Dissipatie van informatie . . . . . . . . . . . . . . . . . 5.2.1 Bullwhip effect . . . . . . . . . . . . . . . . . . 5.3 Beperkingen . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Mapping van stapgroottes op returns . . . . . . 5.3.2 Negatieve entropie-probleem . . . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

50 50 52 52 54 55 56 56 57

6 Conclusies 6.1 Informatie-entropie van leptokurtosische distributies . . . . . . . . . . . . . . . . 6.2 Informatie-entropie van een ideaal gas . . . . . . . . . . . . . . . . . . . . . . . .

59 59 60

A Bepaling van de machtswetexponent

61

B Structuur van de broncode B.1 Subroutine voor berekening translationele entropie Str . . . . . . . . . . . . . . . B.2 Subroutine voor berekening lokale entropie . . . . . . . . . . . . . . . . . . . . . .

63 63 64

Lijst van referenties

67

Lijst van figuren

70

Lijst van tabellen

71

v


Gebruikte afkortingen en symbolen CLT EMH GBB h H H I k LJ MD MLE N NEMD pj PDF P (∆x) RDF R(t) SDV S(t) S˜ Str Spos (U = 0) Sint (U ) T∗ U Y (t) β γ2 ζ λ λdB

Centraal-limiet-theorema Effici¨ente markt-hypothese Geometrische brownse beweging Constante van Planck (≈ 6.626 · 10−34 J · s) Hamiltoniaan Informatie-entropie Zelfinformatie Constante van Boltzmann ( ≈ 1.38 · 10−23 J/K) Lennard-Jones (potentiaal) Moleculaire dynamica Maximum likelihood estimation Aantal deeltjes in de simulatie Niet-evenwichts moleculaire dynamica Probabiliteit dat systeem zich in toestand j bevindt Probabiliteitsdistributiefunctie Distributie van de verplaatsingen op ´e´en tijdstap Radiale distributiefunctie Return van een aandeel of een index Stochastische differentiaalvergelijking (Een niet nader bepaalde) stochastische variabele Gereduceerde entropie per deeltje NSk Entropie geassocieerd met de translationele vrijheidsgraden Entropie geassocieerd met de positionele vrijheidsgraden in afwezigheid van interacties Entropie geassocieerd met de positionele vrijheidsgraden in aanwezigheid van interacties Temperatuur (in gereduceerde eenheden) Interactiepotentiaal Waarde van een aandeel of een index (kT )−1 Kurtosis Normeringsfactor Herschalingsfactor in het niet-evenwichtsprotocol h , voor een deeltje in een ideaal gas) De Broglie-golflengte ( √3mkT

λth

h Thermische golflengte ( √2πmkT , voor een deeltje in een ideaal gas)

µn σ τ Ω

ne moment van een distributie Standaardafwijking Gereduceerd tijdsinterval tussen twee herschalingen in het niet-evenwichtsprotocol Aantal mogelijke microtoestanden vi


vii


Hoofdstuk 1

Econofysica De term ‘econofysica’, bedacht door E. Stanley in 1995, omschrijft het multidisciplinair onderzoeksveld dat gebruik maakt van methoden uit de statistische fysica in het domein van de economie. Statistische fysica probeert het gedrag van complexe systemen bestaande uit veel interagerende deeltjes te voorspellen. Financi¨ele markten kunnen in zekere zin ook beschouwd worden als complexe systemen waarin vele spelers met elkaar in interactie treden. Die interacties kunnen in beide systemen een collectief emergent gedrag tot gevolg hebben: fasetransities of crashes. Bovendien is een financi¨ele markt een complex adaptief systeem dat zich voortdurend aanpast aan de nieuwe informatie die de markt binnenkomt. Het is dus een open systeem dat zich nooit in evenwicht bevindt. Deze ‘niet-evenwichts-kijk’ op markten staat in schril contrast met heel wat traditionele modellen die ontwikkeld zijn in de context van de zogenaamde effici¨ente markt-hypothese (sectie 1.1). Opvallend is dat die economische modellen gebaseerd zijn op de dynamica van een ´ander fysisch fenomeen: de brownse beweging. Dit geeft aanleiding tot gaussische distributies (sectie 1.3). Eerder dan van modellen, hebben natuurkundigen de gewoonte om te vertrekken van empirische gegevens. Daarom wordt de voorspelling dat de distributie van prijsveranderingen gaussisch zal zijn, getoetst aan de ‘empirische’ distributies van re¨ele financi¨ele data (sectie 1.5). Centraal in de distributie vindt men dan weliswaar dat gaussisch gedrag terug, maar in de staarten observeert men een machtswet (sectie 1.6,[Man63]). In klassieke economische modellen wordt dat niet-gaussisch gedrag in de staarten doorgaans genegeerd, terwijl het net die machtswet is die fysici zo intrigeert. Machtswetten zijn immers alomtegenwoordig in de natuur en worden in diverse systemen waargenomen. Denk aan de machtswet van Gutenberg-Richter die de distributie van de 1


HOOFDSTUK 1. ECONOFYSICA

2

intensiteit van aardbevingen beschrijft, of aan de Pareto-verdeling die de verdeling van rijkdom of de frequentie van woorden in een tekst typeert [New05]. Ook fasetransities worden gekarakteriseerd door het divergeren van een correlatielengte volgens een machtswet. De machtsfunctie komt tevoorschijn tijdens het kritisch moment waarop de componenten van het systeem zich op een coherente manier gaan gedragen. Opvallend is dat de kritische exponent van die machtswet een universele constante is, die enkel afhangt van de dimensie van het syteem en van de aard van de interactie tussen de componenten, maar verder onafhankelijk is van het soort systeem dat bestudeerd wordt [MC05]. Om die redenen wordt verwacht dat het machtsverband een emergent gevolg is van de onderliggende dynamische structuur van het systeem [Bou00]. De ‘vette staarten’ accentueren de niet-lineaire mechanismen die gegenereerd worden door de sterke onderlinge afhankelijkheid van de interagerende entiteiten. Daarom dringt een bottom up-benadering van complexe systemen –hier in het bijzonder van economische systemen– zich op.

1.1

De effici¨ ente markt-hypothese

Volgens de efficient market hypothesis (EMH) is een markt effici¨ent als alle beschikbare informatie instantaan verwerkt wordt en alle prijzen zich ogenblikkelijk aan de nieuwe informatie aanpassen. De marktprijs op een gegeven moment reflecteert dus de verwachtingen van alle rationele spelers, gebaseerd op ´alle beschikbare informatie in de markt [Fam70]. Daaruit volgt dat de nieuwe prijs enkel nog afhankelijk zal zijn van de nieuwe informatie die de markt binnenkomt. Aangezien die nieuwe informatie als een toevalsvariabele wordt gezien (nieuws is per definitie onvoorspelbaar), zal ook de nieuwe prijs die zich instelt nadat alle investeerders hun verwachtingen hebben berekend, willekeurig zijn [Bei07]. Dit paradigma werd geformuleerd in de jaren 60, maar heeft eigenlijk al haar wortels in het werk van Louis Bachelier in 1900. Bachelier stelde in zijn Th´eorie de la sp´eculation [Bac00] dat prijsfluctuaties kunnen beschreven worden door een stochastisch proces, meerbepaald door een ongecorreleerde random walk. Random walks hebben de Markoveigenschap, wat inhoudt dat het verleden irrelevant is om de toekomst te voorspellen wanneer men het heden kent. De verwachtingswaarde E van de prijs Yt+1 op tijdstip t + 1 zal dus gerelateerd zijn aan de gekende prijzen uit het verleden door de relatie E{Yt+1 |Y0 , Y1 , ..., Yt } = Yt .

(1.1)


HOOFDSTUK 1. ECONOFYSICA

3

Dit impliceert dat het onmogelijk is om toekomstige prijsveranderingen te voorspellen door het analyseren van tijdreeksen van prijsveranderingen. Prijsveranderingen worden bepaald door de willekeur van ���goed’ of ‘slecht’ nieuws dat de markt binnenkomt. Omdat een economie in een ge¨ındustrialiseerde wereld eerder de tendens heeft om te groeien, moet er echter een lichte bias naar ‘goed nieuws’ bestaan. Daarom kan aan het basismodel van de random walk een driftterm toegevoegd worden die de gemiddelde tendens in rekening brengt. Dit wordt beschreven in sectie 1.3. Op dit model is de meteen-Nobelprijs-onderscheiden Black-Scholes-theorie voor het berekenen van optieprijzen gebaseerd [BS73].

1.2

Return

We stellen ons eerst de vraag wat de meest geschikte variabele is om de tijdsevolutie van een indexprijs Y (t) te onderzoeken. Een logische definitie voor de return van een investering zou er een zijn die het het percentage opbrengst binnen een periode ∆t weergeeft, Y (t + ∆t) − Y (t) . (1.2) Rp (t) = Y (t) Een andere definitie van de return R(t) bestaat erin het verschil te nemen tussen de natuurlijke logaritmen van de opeenvolgende prijzen, Rln (t) = ln

Y (t + ∆t) . Y (t)

(1.3)

Voor hoogfrequente data, met kleine ∆t, herleidt deze definitie zich tot de vorige,   Y (t + ∆t) − Y (t) Y (t + ∆t) − Y (t) Rln (t) = ln 1 + ≈ = Rp (t). (1.4) Y (t) Y (t) Het voordeel van de procentuele definitie van de return Rp is dat deze verdwijnt als de prijs tijdens de eerste tijdstap p procent stijgt en tijdens de volgende tijdstap p procent daalt (Rp = 0, terwijl Rln = ln(1 + p) + ln(1 − p) 6= 0 als p 6= 0). Het voordeel van de logaritmische definitie van de return Rln is dat deze verdwijnt als de prijs eerst een factor f groter wordt en daarna f keer verkleint (Rln = 0, terwijl Rp = f + f1 − 2 6= 0 als f 6= 1).

1.3

Geometrische brownse beweging

De beweging van stuifmeelkorrels in een vloeistof volgt een grillig en willekeurig patroon, zag de botanicus Robert Brown in zijn microscoop. In 1905 veronderstelde Einstein


HOOFDSTUK 1. ECONOFYSICA

4

een random walk-model met stappen van dezelfde grootte, waartussen geen correlaties bestaan, om deze brownse beweging te verklaren als een stochastisch proces. Op dezelfde manier kan ook de schijnbaar willekeurige schommeling van indexprijzen onderhevig zijn aan een stochastisch proces. Algemeen wordt de tijdsevolutie van een stochastische variabele S(t) beschreven door een stochastische differentiaalvergelijking (SDV), waarin een van de termen dat stochastisch proces voorstelt. Deze SDV kan bijvoorbeeld de karakteristieke vorm dS(t) = ÂľS(t)dt + ĎƒS(t)dz(t). (1.5) aannemen. In dat geval spreekt men van een geometrische brownse beweging (GBB). In het standaardmodel voor aandelenprijzen is de variabele S(t) dan de indexprijs1 die elke infinitesimale tijdstap dt bepaald wordt door vergelijking (1.5). De tweede term is de diffusieterm waarin dz(t) het stochastisch proces voorstelt. In het GBB-model is dit √ dus het Wiener-proces dz =  dt, waarbij  getrokken wordt uit een normale verdeling, met gemiddelde 0 en standaardafwijking 1. De constante Âľ wordt de driftco¨effici¨ent genoemd en stelt in het financieel GBB-model de verwachte return (1.2) per tijdseenheid voor. De grootte van de fluctuaties daarop wordt bepaald door de standaardafwijking Ďƒ, ook de volatiliteit genoemd. Belangrijk is dat het GBB-model de veronderstelling2 maakt dat deze Ďƒ onafhankelijk zal zijn van de tijd t en van de prijs S(t). Ten gevolge van de stochastische term kunnen we niet zomaar dS S = d ln S stellen [Voi05]. Het lemma van ItËœ o laat evenwel toe om de differentiaal van een functie f (S(t), t) te berekenen wanneer de SDV van S(t) gekend is, df (S(t), t) = (

∂f ∂f 1 ∂2f ∂f + ÂľS + (ĎƒS)2 2 )dt + ĎƒS dz. ∂t ∂S 2 ∂S ∂S

(1.6)

Dit volgt uit een Taylorexpansie van df (S(t), t) en substitutie van (1.5). Wanneer we daarin f (S(t), t) = f (S(t)) = ln S(t) stellen, dan vinden we de elegante vergelijking d ln S(t) = (Âľ −

Ďƒ2 )dt + Ďƒdz(t), 2

(1.7)

met als oplossing   Ďƒ2 S(t) = exp (Âľ − )t + Ďƒz(t) S(t = 0). 2 1

(1.8)

In het oorspronkelijke random walk -model van Bachelier werd de nieuwe prijs berekend door een additieve ruisterm op te tellen bij de vorige prijs, waardoor prijzen in principe negatief konden worden. GBB daarentegen, een multiplicatief random walk -model, bevat een multiplicatieve ruis S(t)dz(t). Daardoor zullen nu de logaritmen van de prijs (dus de returns) aan een additieve ruis onderworpen zijn (vergelijking 1.7) en wordt het negatieve prijzen-probleem uit Bacheliers model vermeden. 2 Al kan dit standaard-GBB-model uitgebreid worden met een Ďƒ(t, S(t)) of met een stochastische volatiliteit die bepaald wordt door een a ´nder GBB-proces (zoals GARCH-modellen, [MS99]).


HOOFDSTUK 1. ECONOFYSICA

5

S(t)

We zien dat de indexprijzen een log-normaal proces volgen. Hun logaritme, ln S(t) volgt 2 dus een gaussische verdeling met verwachtingswaarde ln S0 + (µ − σ2 )t.

1036 1033 1030 1027 1024 1021 1018 1015 1012 109 106 103 100 10-3 10-6 0

µ =0.0045, σ =0.07 µ =0.0045, σ =0.07 µ =0.0055, σ =0.07 µ =0.0045, σ =0.09

2000

4000

6000

8000 Tijd t

10000 12000 14000 16000

Figuur 1.1: De tijdsevolutie van de stochastische variabele S(t) voor verschillende waarden van µ en σ. De gele lijn volgt een SDV met een grotere driftterm µ en bijgevolg een sterker stijgende trend. De groene lijn volgt een SDV met een hogere diffusieterm σ en vertoont bijgevolg sterkere fluctuaties en een minder sterk stijgende trend.

Voorbeelden van enkele GBB-processen zijn te zien in figuur 1.1. De tijdsevolutie van S(t) vertoont fluctuaties van de orde σ, maar volgt gemiddeld een trend die afhangt van 2 µ − σ2 . Ook de waarde van de return zal een gemiddelde trend volgen. Hierbij wordt het belangrijk om een onderscheid te maken tussen beide definities. We vinden namelijk als 2 verwachtingswaarde voor Rln (t) = d ln S(t) een trend (µ − σ2 ) en voor Rp (t) = dS(t) S(t) een trend µ.

1.4

Empirische data: S&P 500-index

De S&P 500-index is een beursindex van de Verenigde Staten die een betrouwbaar beeld geeft van de ontwikkelingen op de aandelenmarkt. De 500 grootste Amerikaanse bedrij-


HOOFDSTUK 1. ECONOFYSICA

6

0.25

Returns |R(t)|

0.20 0.15 0.10 0.05 0.00 1950

1960

1970

1980

Tijd t

1990

2000

2010

Figuur 1.2: De absolute waarde van de returns van de S&P 500-index van 3 januari 1950 tot 8 april 2011. De piek in 1987 is de handtekening van de beurscrash op Black Monday.

ven zijn erin opgenomen met een gewicht dat afhankelijk is van hun marktkapitalisatie. De index wordt samengesteld door de kredietbeoordelaar Standard & Poor’s. Op basis van de intraday gegevens van de S&P 500, die vrij beschikbaar zijn op [yah], worden de indexprijzen Y (t) per dag geanalyseerd. De gegevens lopen over een periode van 3 januari 1950 tot en met 8 april 2011. Deze grote hoeveelheid data maakt de S&P 500-index geschikt om te onderzoeken of het GBB-model in overeenstemming is met de empirische observaties. Om de tijdsevolutie van een indexprijs Y (t) te karakteriseren, werd in sectie 1.2 de (t) ≈ Y (t+∆t)−Y gedefinieerd. Het tijdsvenster ∆t is in dit return R(t, ∆t) = ln Y (t+∆t) Y (t) Y (t) geval ´e´en beursdag. In figuur 1.2 is het tijdsverloop van de absolute waarde van de S&P 500-returns te zien. Die zijn meestal klein (van de orde 1 procent), al worden er ook een aantal returns geobserveerd die uitzonderlijk hoog zijn (tot 22.6 procent). Zo is er op maandag 19 oktober 1987 een duidelijke piek te zien. Die dag, ‘Black Monday’, crashten de beurzen wereldwijd. Het af en toe opduiken van dergelijke extreem hoge returns en de grote variantie in de returns is typerend voor een onderliggend niet-gaussisch proces. Laten we deze returns daarom eens vergelijken met de returns uit het model van geometrisch brownse beweging (w´el een gaussisch proces). Als we de standaardafwijking van de fluctuaties in de returns berekenen, dan kunnen we een waarde voor de drift µ en de diffusie σ bepalen. Dit resulteert in µ = 0.000378 en σ = 0.00967. Hiermee kan


HOOFDSTUK 1. ECONOFYSICA

7

een GBB-simulatie uitgevoerd worden die geassocieerd is met de robuuste gegevens van de S&P 500-index. Uit figuur 1.3 wordt duidelijk dat de GBB-returns steeds kleiner blijven dan 0.05, terwijl die van de re¨ele data af en toe veel extremere waarden kunnen aannemen.

Figuur 1.3: De S&P 500 absolute returns (boven) vergeleken met de absolute returns van het GBBmodel (onder) waarin µ = 0.003778 en σ = 0.00967 voor 15416 simulatiestappen.

1.5

Waarschijnlijkheidsdistributie

De effici¨ente markt-hypothese impliceert dat de distributies van prijsveranderingen gaussisch moeten zijn. Het centraal-limiet-theorema (CLT) stelt immers dat de distributie P (xn ) van de som van n onderling onafhankelijke en gelijk verdeelde stochastische variabelen xi met eindige variantie, een normaalverdeling zal volgen in de limiet n → ∞. We kunnen dat nagaan dat door de returns die bekomen worden uit een GBBsimulatie3 te normaliseren met hun standaardafwijking en ze te rangschikken in een PDF. Deze PDF is geplot in figuur 1.4 voor een GBB-proces met µ = 0.003778 en σ = 0.00967. 3

De term dz(t) in formule 1.5 van het GBB-model vereist gaussisch verdeelde pseudo-randomgetallen. Voor figuur 1.3 werden deze gegenereerd met de Box-Muller-methode. Deze methode schiet echter tekort om de normaaldistributie ook in de buurt van R ≈ 0 te genereren. Daarom werd hier gebruik gemaakt van de gaussische data uit de maxwelldistributies die in de MD-simulatie gegenereerd werden (fig. 4.2).


HOOFDSTUK 1. ECONOFYSICA

8

Ter vergelijking toont de figuur tevens de distributie P ( R σ ) van de S&P 500-returns, genormaliseerd met hun standaardafwijking σ. We zien dat zeer kleine fluctuaties frequenter voorkomen dan voorspeld door de gaussische GBB-distributies, terwijl gemiddelde fluctuaties minder frequent voorkomen. Extreem hoge returns lijken dan weer veel frequenter voor te komen. Black monday blijkt zelfs een 21σ-event te zijn. De kans dat zo’n gebeurtenis zich ooit voordoet onder de assumpties van de EMH is verwaarloosbaar klein. Het verbaast dan ook niet dat na de beurscrash van 1987 de effici¨ente markt-hypothese in vraag gesteld werd.

100

GBB-model S&P500

P(R/σ)

10-1

10-2

10-3 20

15

10

5

Return R/σ

0

5

10

15

Figuur 1.4: De probabiliteitsdistributie van de genormaliseerde returns van de S&P 500-index wordt vergeleken met die van het GBB-model op log-lineaire schaal. Het ge¨ısoleerde event bij −21.2σ is de return op Black Monday.

1.6

Machtswetten

We onderzoeken nu de waarschijnlijkheid dat de PDF van de returns p(R0 ) een waarde aanneemt die groter dan of gelijk is aan R, Z ∞ Pc (R) = p(R0 )dR0 . (1.9) R


HOOFDSTUK 1. ECONOFYSICA

9

Deze cumulatieve distributiefunctie (CDF) Pc (R) bezit meer gegevens in haar staarten en zal minder afhankelijk zijn van de gekozen bin-groottes. Daarom is ze beter geschikt om een machtswet te observeren [New05]. Laten we eens veronderstellen dat de CDF van de S&P 500-returns aan een machtswet Pc (R > Rmin ) = C · R−α

(1.10)

gehoorzaamt, vanaf Rmin = 0.015. Met behulp van een maximum likelihood methode (beschreven in appendix A) kunnen we de exponent α bepalen. Op basis van een fit aan np = 2585 punten in de staart van de CDF, vinden we de waarde α = 3.315 ± 0.046. Dit is in overeenstemming met de resultaten van [GPA+ 99] waarin α bepaald werd volgens een andere methode (beschreven in [Hil75]): voor CDF’s van returns met tijdsvensters ∆t < 4 dagen wordt telkens een exponent α ≈ 3 teruggevonden.

101

CDF Pc (R)

100

10-1

10-2

10-3

10-4 -3 10

10-2

Returns R

10-1

Figuur 1.5: Aan de cumulatieve distributiefunctie van de positieve returns wordt een machtswetstaart gefit met α = 3.3146 en C = 1.235 · 10−7 (op log-log-schaal).

Als de CDF asymptotisch een machtswet volgt, zal ook de PDF asymptotisch een machtswet volgen. Integratie van een machtswet p(R0 ) = C 0 · R0−β levert immers een


HOOFDSTUK 1. ECONOFYSICA

10

nieuwe machtswet: Pc (R) = C 0

Z

R

R0−β dR0 =

C0 R−(β−1) . β−1

(1.11)

De machtswet-exponent β in de staart van de PDF van de returns is dus gerelateerd aan die van de CDF door β = α + 1 ≈ 4.3. Machtswetten hebben de schaalinvariante eigenschap P (cR) ∼ P (R). In tegenstelling tot normaalverdelingen, bezitten ze geen karakteristieke schaal: het is bijvoorbeeld niet mogelijk om een maximale grootte voor een return te defini¨eren. Daarom kunnen machtswetten contra-intu¨ıtief zijn. Wanneer men fenomenen waarvan de distributie een machtswet volgt, probeert te modelleren met gaussische distributies kan dit bijgevolg leiden tot een verkeerde inschatting van de realiteit [Tal08].

1.7

De tekortkomingen van de EMH

Hoewel het GBB-model een eerste benadering levert om het robuust gedrag van de data van financi¨ele markten te modelleren, vertoont het enkele tekortkomingen. De hypothese dat markten effici¨ent zijn en dat alle informatie ogenblikkelijk in de prijs verwerkt zit, is van toepassing op een ge¨ıdealiseerd systeem. Re¨ele markten zijn slechts benaderend effici¨ent. Met het voorgaande in gedachten, bakenen we aan de hand van de empirische data de limieten van de EMH af. Enerzijds blijkt bij het testen van de efficient market hypothesis dat tijdscorrelaties tussen prijsveranderingen inderdaad verwaarloosbaar zijn. In [LGC+ 99] wordt bijvoorbeeld aangetoond dat de autocorrelatiefunctie van de returns exponentieel naar nul vervalt binnen korte tijd (∼ exp(− τt ) met τ ≈ 4 minuten). Dit is in overeenstemming met de idee dat in een effici¨ente markt de mogelijkheid van arbitrage dergelijke correlaties snel wegfiltert en dat toekomstige aandelenprijzen niet voorspeld kunnen worden op basis van hun verleden. Anderzijds wijzen empirische observaties er echter ook op dat het mogelijk is om op grotere tijdschaal hogere orde-correlaties terug te vinden [MS99]. Zonder dergelijke ‘lange dracht’-correlaties zouden de extreme fluctuaties moeilijk te verklaren zijn. Beurscrashes zouden dan enkel kunnen optreden ten gevolge van gebeurtenissen van buitenaf (rampen), niet door de dynamica van het systeem zelf. Verder blijkt de volatiliteit in re¨ele data tijdsafhankelijk te zijn –in tegenstelling tot de veronderstellingen die gemaakt werden in sectie 1.3– en treden er fenomenen als volatiliteitsclustering op [MS99]. De empirische return-distributies van de S&P 500 komen niet volledig overeen met het veralgemeend GBB-model. De zeldzame ‘uitschieters’ die zich in de staarten van de


HOOFDSTUK 1. ECONOFYSICA

11

distributie bevinden, worden niet gereproduceerd, terwijl het net deze zeldzame gebeurtenissen zijn die een grote impact kunnen hebben. Dit wijst erop dat het gebruik van dit GBB-model kan leiden tot het onderschatten van risico’s.

1.8

Naar een vloeistofmodel

De 61-jarige tijdreeks van de dagelijkse S&P 500-indexprijzen (alsook andere indexprijzen [GPA+ 99]) toont dat extreme prijsvariaties veel frequenter blijken voor te komen dan verwacht vanuit het GBB-paradigma. Vanuit de geometrisch brownse beweging zijn de ‘vette staarten’ die we in de return-distributies hebben waargenomen immers moeilijk te begrijpen. De bedoeling is om een simulatiemodel te vinden dat dergelijke fenomenen vanuit hun onderliggende ‘universele’ dynamica tracht te verklaren. Daarvoor wordt een vloeistofmodel vooropgesteld. In een vloeistof bewegen de deeltjes niet onafhankelijk van elkaar (in tegenstelling tot een ideaal gas). Er bestaat geen lange dracht-orde (in tegenstelling tot een vaste stof), maar er zijn wel sterke korte dracht-correlaties aanwezig [Ryc10]. We insinueren dat economische modellen die gebaseerd zijn op de dynamica van de brownse beweging en waarin prijsveranderingen gezien worden als onafhankelijke random-variabelen, kunnen verbeterd worden door ze te baseren op een systeem waarin opeenvolgende toestanden niet langer ongecorreleerd zijn. Zulk vloeistofmodel wordt gesimuleerd met de techniek van moleculaire dynamica (MD), die in hoofdstuk 2 uiteengezet wordt. Hoewel de opeenvolgende stappen in die evenwichts-MD-simulatie gecorreleerd zijn, zal de distributie van de stapgroottes van de deeltjes nog steeds een gaussische vorm hebben. We werken immers nog altijd in het evenwichtsformalisme, terwijl we geponeerd hebbend dat markten zich niet in evenwicht bevinden. Daarom zullen we in hoofdstuk 3 een methode introduceren om de simulatie uit evenwicht te drijven, met de bedoeling om ook die andere robuuste eigenschap van markten – ‘vette staarten’ in de distributie van prijsveranderingen– te genereren. Een vloeistofmodel waarin dergelijke niet-gaussische distributies opduiken, zou een meer accurate beschrijving kunnen geven van de geobserveerde dynamische eigenschappen van financi¨ele markten.


Hoofdstuk 2

Moleculaire dynamica Thermodynamische grootheden kunnen voorspeld worden door uit te middelen over alle mogelijke microtoestanden waarin een veeldeeltjessysteem zich kan bevinden. Zoiets voor re¨ele systemen op een computer simuleren is echter onbegonnen werk. Gelukkig kunnen we die uitmiddeling over de mogelijke microtoestanden relateren aan een uitmiddeling over tijd, in de veronderstelling dat elke microtoestand even waarschijnlijk wordt als het systeem maar lang genoeg gevolgd wordt. Dit ergodisch principe rechtvaardigt de benadering om uit te middelen over een beperkte set configuraties. De methode van moleculaire dynamica laat ons toe om die configuraties ´e´en voor ´e´en uit elkaar te genereren door numeriek alle bewegingsvergelijkingen te integreren. Het N -deeltjessysteem volgt dan een pad in de faseruimte waarvan de positionele co¨ordinaten r~i bepaald worden door de oplossing van deze bewegingsvergelijkingen: F~i d2 r~i = dt2 mi

∀i = 1, ..., N.

(2.1)

Hierin is mi de massa van deeltje i. De kracht F~i die op elk deeltje inwerkt, wordt teruggevonden als de som van de interacties met alle andere deeltjes in het systeem: F~i =

N X

F (|~ri − ~rj |)~eij ,

(2.2)

j=1,j6=i

met ~eij de eenheidsvector die gericht is volgens ~rj − ~ri .

2.1

Benaderingen

Moleculaire dynamica is dus de simulatietechniek waarin de tijdsevolutie van een groot aantal deeltjes bepaald wordt door na elke stap de differentiaalvergelijkingen (2.1) nu12


HOOFDSTUK 2. MOLECULAIRE DYNAMICA

13

meriek op te lossen. Deze oplossingen zullen benaderend zijn, omwille van de volgende redenen [Thi99]: • We beperken ons tot een klassieke beschrijving: kwantumeffecten worden genegeerd. Het verwaarlozen van interferentie-effecten tussen de de Broglie-golven van de deeltjes is pas gerechtvaardigd als λdB  l,

(2.3)

1

V 3 h waarin l = ( N ) de gemiddelde separatie tussen de deeltjes voorstelt en λdB = √3mkT hun de Broglie-golflengte is [Ryc10]. In het geval van Argon-atomen bij kamertemperatuur (≈ 2.7 · 1020 atomen per cm3 ) vinden we bijvoorbeeld dat

l ≈ 1.55 · 10−9 m,

λdB ≈ 2.35 · 10−11 m.

(2.4)

Onder zulke normale omstandigheden (geen te hoge dichtheid, geen te lage temperatuur) bevinden we ons dus in het klassiek regime en kunnen we het golfkarakter van de deeltjes gerust buiten beschouwing laten. • De interactiepotentiaal is niet exact gekend, enkel in geparametriseerde vorm. De interactie tussen twee deeltjes in een ideale vloeistof kan bijvoorbeeld benaderd worden door de fenomenologische Lennard-Jones-potentiaal (2.10). • We doen beroep op de veronderstelling dat alle mogelijke toestanden even waarschijnlijk zullen zijn (het ergodisch principe). Een uitmiddeling van een fysische grootheid O over alle mogelijke configuraties hOi zal bijgevolg equivalent zijn aan ¯ over de tijd, een uitmiddeling O 1 T →∞ T

¯ = lim hOi = O

Z

T

Odt.

(2.5)

0

• De computationele kost is N 2 -afhankelijk. Typische simulaties draaien daarom slechts met N ∼ 103 deeltjes. Er kan dus enkel een zeer klein deel van een re¨eel systeem (met N ∼ 1023 ) gesimuleerd worden. Dit laat zich voelen in de verhoogde oppervlakte-bulkverhouding. Beschouwen we bijvoorbeeld een 10x10x10-volume, dan zitten er van de 1000 deeltjes 488 op het oppervlak, een verhouding die veel te hoog is in vergelijking met de werkelijkheid. Om dit probleem te omzeilen kunnen we ons simulatiesysteem omringen met oneindig veel equivalente replica’s ervan. We passen periodieke randvoorwaarden toe zodat deeltjes die aan het oppervlak verdwijnen, langs de andere zijde van het simulatievolume opnieuw verschijnen.


HOOFDSTUK 2. MOLECULAIRE DYNAMICA

14

De kracht F~ij die op deeltje i inwerkt ten gevolge van deeltje j, is dan de som van de krachten tussen deeltje i en alle kopie¨en van deeltje j. Omdat de krachten doorgaans een eindige dracht hebben, kunnen we de berekeningen echter vereenvoudigen met behulp van de minimum image convention: de interactie tussen twee deeltjes wordt bepaald door het eerste deeltje en door de meest nabije kopie van het tweede deeltje. • In een simulatie zijn ruimte en tijd niet continu aangezien de bewegingsvergelijkingen enkel kunnen opgelost worden voor een eindige tijdstap ∆t. Er zullen dus steeds afwijkingen van de orde (∆t)n optreden (met n = 2 voor het hieronder beschreven snelheids-Verlet-algoritme). In een typische simulatie is ∆t van de grootteorde 0.001 in systeemeenheden. Zoals wordt uitgelegd wordt in sectie 2.3, komt dat voor een vloeistof in de realiteit overeenkomt met 10−17 seconden.

2.2

Integratie-algoritme

Om de differentiaalvergelijkingen (2.1) op te lossen wordt beroep gedaan op het snelheidsVerlet-algoritme. Met behulp van de Taylor-ontwikkeling vinden we benaderend telkens de nieuwe positie r~i , snelheid v~i en versnelling a~i van deeltje i : 1 r~i (t + ∆t) = r~i (t) + v~i (t)∆t + a~i (t)∆t2 2 1 v~i (t + ∆t) = v~i (t) + a~i (t)∆t + b~i (t)∆t2 2 a~i (t + ∆t) = a~i (t) + b~i (t)∆t,

(2.6) (2.7) (2.8)

met b~i = ddta~i de jerk van deeltje i. Bij het snelheids-Verlet-algoritme wordt de snelheid berekend uit: v~i (t + ∆t) = v~i (t) +

a~i (t) + a~i (t + ∆t) ∆t, 2

(2.9)

wat als voordeel heeft dat snelheden en posities op dezelfde ogenblikken kunnen bepaald worden. De positie wordt bij elke simulatiestap berekend uit formule (2.7). De verF~i wordt daarin telkens bepaald aan de hand van vergelijking (2.2). Op snelling a~i = m i welbepaalde tijdstappen wordt r~i (t + ∆t) − r~i (t) bijgehouden om er later de distributie van de stapgroottes uit te kunnen bepalen (sectie 3.4). De cumulatieve fout van het snelheids-Verlet-algoritme schaalt volgens (∆t)2 . Zoals blijkt uit figuur 2.2 belet dit symplectisch integratieschema het optreden van een energiedrift [Thi99].


HOOFDSTUK 2. MOLECULAIRE DYNAMICA

2.3

15

Systeemeenheden

Om de computationele berekeningen te vereenvoudigen, wordt er gewerkt met gereduceerde eenheden, waarbij telkens gedeeld wordt door de karakteristieke schaal. De interactiepotentiaal wordt vaak gemodelleerd door een Lennard-Jones-potentiaal: Ď&#x192; Ď&#x192; ULJ (r) = 4[( )12 â&#x2C6;&#x2019; ( )6 ]. r r

(2.10)

De grootheden  en Ď&#x192; bepalen dan respectievelijk de energie- en de lengteschaal van de interactie. Omdat in het geval van Argon-atomen de LJ-potentiaal de empirisch verkregen potentiaal uitermate goed benadert (fig. 2.1), kiezen we de parameters voor Argon als systeemeenheden: Ar = 119.8K kB Ď&#x192;Ar = 3.405 ¡ 10â&#x2C6;&#x2019;10 m mAr = 6.633517 ¡ 10

â&#x2C6;&#x2019;26

(2.11) (2.12) kg

(2.13)

De energie wordt dan gemeten in functie van Ar (E â&#x2C6;&#x2014; = E ), lengtes in functie van Ď&#x192;Ar Ar q q 2 mAr Ď&#x192;Ar r ( râ&#x2C6;&#x2014; = Ď&#x192;Ar ) en bijgevolg tijd in functie van (tâ&#x2C6;&#x2014; = t m ArĎ&#x192;2 ) en temperatuur in Ar Ar Ar

(T â&#x2C6;&#x2014;

kB Ar T ).

functie van eenheden 119.8K = In hoofdstuk 4 zal de entropie S doorgaans uitgedrukt worden als de dimensieloze gereduceerde entropie per deeltje, SË&#x153; = NSk .

2.4

Lennard-Jones-potentiaal

Wanneer we de LJ-potentiaal (2.10) bekijken, dan vinden we volgende eigenschappen: â&#x20AC;˘ een korte dracht: zoals te zien in figuur 2.1 verdwijnt de potentiaal nagenoeg voor r > 3, zodat enkel interacties in rekening gebracht moeten worden voor deeltjes die zich dicht bij elkaar bevinden. In de simulatie is het daarom computationeel voordelig om een lijst bij te houden van deeltjes die zich binnen een bepaalde radius van elkaar bevinden en die lijst slechts om een bepaald aantal tijdstappen te actualiseren. â&#x20AC;˘ attractief voor r > 1, door de vanderwaals-interacties. â&#x20AC;˘ harde kern waarin een sterk repulsieve kracht heerst, te wijten aan het eindig volume dat elk atoom inneemt. De potentiaal divergeert voor r â&#x2020;&#x2019; 0, zodat op het


HOOFDSTUK 2. MOLECULAIRE DYNAMICA

16

Figuur 2.1: De fenemenologische LJ-potentiaal komt overeen met de empirische potentiaalcurve voor twee Argon-atomen in functie van hun interatomaire afstand R = r · 3.405˚ A. [wik]

moment dat de elektronenwolken van twee atomen atomen beginnen te overlappen, er een oneindig hoge kinetische energie nodig zou zijn om die potentiaalbarri`ere te overwinnen.

2.5

Het canonisch ensemble

Er wordt gewerkt in het canonisch (T, V, N )-ensemble waarin temperatuur T , aantal deeltjes N en volume V van het systeem initieel worden ingegeven en constant worden gehouden doorheen de tijd. Een ensemble is de verzameling van alle mogelijke microtoestanden {x1 , ..., pN } die aanleiding geven tot eenzelfde macrotoestand. Deze macrotoestand wordt enkel bepaald door externe parameters die vast gehouden worden. De microtoestanden worden vertegenwoordigd door punten in een 6N -dimensionale faseruimte. Als de deeltjes geen interne vrijheidsgraden bezitten, wordt de microtoestand immers enkel bepaald door de ruimtelijke posities ~xj en door de co¨ordinaten in de momentumruimte p~j (j = 1, ..., N ). Om de gemiddelde waarde van een bepaalde observabele O te bepalen, moeten we deze uitmiddelen over het deel van de faseruimte dat door het ensemble wordt beschreven.


HOOFDSTUK 2. MOLECULAIRE DYNAMICA Dit ensemblegemiddelde wordt dus gedefinieerd door: Z 1 hOi = O(~xi , p~i )Ď&#x2C6;(~xi , p~i )d3 ~x1 ...d3 ~xN d3 p~1 ...d3 p~N , Z

17

(2.14)

met normering Z Z=

Ď&#x2C6;(~xi , p~i )d3 ~x1 ...d3 ~xN d3 p~1 ...d3 p~N .

(2.15)

De distributie Ď&#x2C6;(~xi , p~i ) bepaalt het gewicht dat aan elk punt in de faseruimte wordt gegeven. De vorm ervan is afhankelijk van het ensemble. Voor het microcanonisch (E, V, N )-ensemble is dit bijvoorbeeld gewoon de deltafunctie Ď&#x2C6;EN V (~xi , p~i ) = δ(H(~xi , p~i ) â&#x2C6;&#x2019; E) die behoud van energie verzekert. In het canonisch ensemble is deze gelijk aan de boltzmannfactor Ď&#x2C6;T N V (x~i , p~i ) = exp(â&#x2C6;&#x2019;βH(x~i , p~i )), zoals wordt aangetoond in sectie 4.1.

2.6

Programma

2.6.1

Initialisatie

Het aantal deeltjes N , de dichtheid Ď , de gewenste temperatuur T en het aantal tijdstappen worden als parameters ingegeven. Initieel worden de deeltjes op een rooster gezet. In het geval van Argon-atomen is een FCC-rooster namelijk de meest stabiele configuratie. Omdat elke eenheidscel dan vier atomen bevat, wordt het deeltjesaantal doorgaans N = 4M 3 = 256, 500, 864, ... gekozen. De initi¨ele snelheden worden verdeeld volgens een Maxwell-Boltzmann-distributie. Dit gebeurt door elke snelheidscomponent uit een Gaussische distributie met gemiddelde 0 en standaardafwijking 1 teqtrekken en kT daarna deze dimensieloze getallen te schalen met een standaardafwijking m . Aanq Ar gezien snelheid uitgedrukt wordt in functie van mAr wordt dit in systeemeenheden q Tâ&#x2C6;&#x2014; vjâ&#x2C6;&#x2014; = vj0 m ~tot berekend en wordt Np~tot ele â&#x2C6;&#x2014; . Daarna wordt de totale impuls p mi van de initi¨ snelheidsvector van elk deeltje afgetrokken, zodat de totale impuls van het systeem terug nul wordt.

2.6.2

Evolutie naar evenwicht

We laten het systeem thermaliseren. De bewegingsvergelijkingen worden ge¨Ĺntegreerd met behulp van het snelheids-Verlet-algoritme. De tijd die het systeem nodig heeft om evenwicht te bereiken is afhankelijk van de initi¨ele condities. Deze relaxatietijd zal groter zijn dan de tijdscorrelaties in het systeem. Wanneer het systeem in evenwicht is, zal de temperatuur fluctueren rond een evenwichtswaarde die in het algemeen zal afwijken van


HOOFDSTUK 2. MOLECULAIRE DYNAMICA

18

de initieel gewenste temperatuur TD . Daarom wordt de snelheid tijdens deze fase na welbepaalde tijdsintervallen (bijvoorbeeld twintig simulatiestappen) herschaald met een factor s (N − 1)3kB TD . (2.16) λ= PN 2 i=1 mi vi P 2 Hierin is N i=1 mi vi de totale kinetische energie van N deeltjes, uitgemiddeld over die twintig tijdstappen. Wanneer λ naar 1 convergeert (of T naar TD , volgens het equipartitietheorema) en wanneer de fluctuaties tussen de opeenvolgende λ‘s verwaarloosbaar worden (dan is T ongeveer constant) wordt evenwicht verondersteld en kan de productiefase van start gaan.

2.6.3

Productiefase

Eens evenwicht bereikt is, wordt de tijd terug op nul gezet en worden de thermodynamische grootheden en correlatiefuncties berekend. Als het systeem n0 thermalisatiestappen nodig heeft om tot evenwicht te komen, wordt het ensemblegemiddelde van een statische fysische grootheid O bepaald uit n integratiestappen, volgens ¯= O

n X 1 Oν . n − n0 ν>n

(2.17)

0

Kinetische energie De kinetische energie Ek van het systeem wordt op elke tijdstap bepaald uit: N

Ek (t) =

1X mi vi2 (t). 2

(2.18)

i=1

Temperatuur Met behulp van het equipartitietheorema, vindt men dan de temperatuur T : PN mi vi2 (t) T (t) = i=1 . 3k(N − 1)

(2.19)

Potenti¨ ele energie De potenti¨ele energie Ep van het systeem wordt bepaald door de interactiepotentiaal U tussen alle deeltjesparen op te tellen. Ep (t) =

N X i<j=1

U (|~ri − ~rj |).

(2.20)


HOOFDSTUK 2. MOLECULAIRE DYNAMICA

19

Figuur 2.2: De tijdsevolutie van de potenti¨ele energie Epot , kinetische energie Ekin en hun som Etot , voor een simulatie met 256 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7.

Hierin is |~ri − ~rj | de afstand tussen beide deeltjes (volgens de minimale beeldconventie, zoals uitgelegd in sectie 2.1) Het Verlet-algoritme heeft de eigenschap dat het de totale energie constant houdt, daarom zal Ep (t) + Ek (t) opgeslagen worden ter controle. Het behoud van energie en de temperatuurfluctuaties zijn voor een typische simulatie te zien in figuur 2.2.

2.7

Correlatiefuncties

Het random walk -model negeert het effect van de interacties tussen de deeltjes, waardoor opeenvolgende stappen ongecorreleerd zijn. Het schiet dus tekort om de sterke correlaties ten gevolge van de korte dracht-interacties in een vloeistof te verklaren. Om inzicht in dergelijke correlaties te krijgen, kunnen we correlatiefuncties introduceren. Daarmee kunnen we bovendien nagaan of het systeem zich in een vaste, gasvormige of vloeistoffase bevindt.


HOOFDSTUK 2. MOLECULAIRE DYNAMICA

2.7.1

20

Radiale distributiefunctie

De radiale distributiefunctie (RDF) geeft een beeld van de ruimtelijke correlaties in het systeem. Deze wordt gedefinieerd als [Ryc10]: R R R P  2 dr~3 dr~4 ... dr~N exp(−β i<j U (|~ri − ~rj |) V (2) R R R P g (r) = N (N − 1) R . (2.21) N dr~1 dr~2 dr~3 ... dr~N exp(−β i<j U (|~ri − ~rj |) en geeft de kans om op een afstand r van een referentiedeeltje een ander deeltje te vinden. Het aantal moleculen in een bolschil tussen r en r + ∆r wordt dan gegeven door: N (2) g (r)4πr2 ∆r. V Als we dit integreren over het volledige simulatievolume, vinden we uiteraard Z N g (2) (r)4πr2 ∆r = N − 1. V

(2.22)

(2.23)

In de praktijk zal een histogram voor elk interval [r, r + ∆r] het aantal deeltjesparen n(r) bijhouden die zich op een afstand ∆r van elkaar bevinden. De maximale afstand tussen twee deeltjes is de helft van de lengte van het simulatievolume, zodat voor een histogram dat I dergelijke intervallen bevat, de grootte van elk interval gegeven wordt door: ∆r = boxsize 2I . Wanneer alles in het histogram opgeteld wordt, dan vinden we boxsize/2

X

n(r) =

r

N (N − 1) . 2

(2.24)

Dit is het equivalent van (2.23). We kunnen de radiale distributiefunctie dus uit het histogram berekenen volgens: g (2) (r) =

2V n(r) . N 2 4πr2 ∆r

(2.25)

Dit is ge¨ıllustreerd in fig. 2.3. In de vaste fase zijn de ruimtelijke correlaties duidelijk het grootst: de RDF vertoont duidelijke pieken die een indicatie zijn voor het verwachte aantal deeltjes op afstand r van het referentiedeeltje. In de gasfase daarentegen verdwijnen de ruimtelijke correlaties al voor r > 2.5. Ten gevolge van de harde pit van de LJ-potentiaal is de waarschijnlijkheid dat een deeltje zich bevindt op een afstand r < 1 nul. In fig. 2.3 is te zien dat g (2) (r) inderdaad verdwijnt voor r < 1. Op grote afstand dooft de oscillerende radiale afhankelijkheid van g (2) (r) uit en nadert deze naar 1.


HOOFDSTUK 2. MOLECULAIRE DYNAMICA

21

Figuur 2.3: De radiale distributiefunctie voor Ar bij T ∗ = 0.7, ρ∗ = 0.5 (gasvormig), bij T ∗ = 0.4, ρ∗ = 0.5 (vloeibaar) en T ∗ = 0.7, ρ∗ = 1 (vast). De intermoleculaire afstand r is uitgedrukt in functie van σAr .

2.7.2

Snelheidsautocorrelatiefunctie

De autocorrelatiefunctie geeft een beeld van de tijdscorrelaties in het systeem. Een velocity autocorrelation function (VAF) wordt algemeen berekend uit het scalair product van de snelheidsvector op een bepaalde tijdstap met de snelheidsvector op een vorige tijdstap. Voor een systeem in evenwicht kunnen we veronderstellen dat deze VAF invariant is onder tijdstranslaties en zich herleidt tot: V (t) =

N 1 X ~vi (τ ) · ~vi (τ + t) N v02 i

∀τ ∈ R,

(2.26)

waarin de normeringsfactor v02 gedefinieerd is als v02 =

N 1 X ~vi (0) · ~vi (0). N

(2.27)

i

Zoals te zien in fig. 2.4 nadert de VAF gestaag naar nul bij lage dichtheid. In dat geval zijn er weinig botsingen en ‘vergeet’ het deeltje niet snel zijn initi¨ele beweging. Voor grote dichtheid en hoge temperatuur zal de frequentie van botsingen met andere deeltjes vergroten. Door die botsingen wordt de richting van de snelheidsvector sneller verstoord, zodat de VAF veel sneller naar nul zal naderen. Hoe hoger de dichtheid, hoe frequenter de botsingen en hoe moeilijker de richting en grootte van de snelheidsvector behouden blijft.


HOOFDSTUK 2. MOLECULAIRE DYNAMICA

22

Bij zeer hoge dichtheid is te zien dat de VAF zelfs negatief kan worden: de snelheden worden negatief gecorreleerd doordat het deeltje verplicht is om in tegenovergestelde richting te bewegen op het moment dat het botst met zijn dichtste naburen.

Figuur 2.4: De snelheidsautocorrelatiefunctie voor τ = 0 (zonder convolutie) uit een simulatie met 846 deeltjes bij T ∗ = 0.7 en verschillende dichtheden.

2.7.3

Besluit

In hoofdstuk 1 werd opgemerkt dat de returns in het GBB-model ongecorreleerd zijn, terwijl financi¨ele tijdreeksen w´el een korte correlatietijd kennen [LGC+ 99]. In bovenstaande evenwichts-MD-simulatie werden ook korte tijdscorrelaties teruggevonden in de snelheidsautocorrelatiefunctie van een vloeistof (figuur 2.4). Wat de tijdscorrelaties betreft, weerspiegelt dit model van een vloeistof dus beter de realiteit dan het GBB-model. Verder bleek echter dat de return-distributies van financi¨ele tijdreeksen niet-gaussisch zijn. In de context van evenwichts-moleculaire dynamica is het onmogelijk om deze nietgaussische distributies te genereren. Daarom zullen we in het volgende hoofdstuk een aanvaardbare methode voorstellen om het systeem uit evenwicht te dwingen.


Hoofdstuk 3

Niet-evenwichts moleculaire dynamica Tot zover zijn we erin geslaagd om een systeem te simuleren dat dezelfde eigenschappen vertoont als die van een vloeistof. In zulk systeem dat zich in evenwicht bevindt en waarin normale diffusie geldt, zorgt het CLT ervoor dat de distributie van de stapgroottes een normaalverdeling zal volgen. Om de vette staarten in de probabiliteitsdistributies van de returns uit hoofdstuk 1 te genereren en een link te kunnen leggen1 met financi¨ele markten, zullen we dus niet-evenwichtsomstandigheden moeten introduceren. We zullen daarvoor beroep doen op niet-evenwichts moleculaire dynamica (NEMD).

3.1

Zelfgeorganiseerde kritikaliteit

Een complex systeem wordt gekenmerkt door een grote mate van onderlinge afhankelijkheid tussen de entiteiten waaruit het is opgebouwd. Daardoor is de dynamica ervan onderworpen aan positieve, versterkende feedbacklussen die er voor zorgen dat de voorwaarden voor het CLT niet langer geldig zijn. Deze correlaties in het systeem verhinderen dus de convergentie naar een normaalverdeling en kunnen tot gevolg hebben dat er vette staarten worden gegenereerd. Om de gedachte te vestigen, grijpen we eerst terug naar het befaamde sandpilemodel van Per Bak, C. Tang en K. Wiesenfeld waarin een zandberg gemodelleerd wordt als een cellulaire automaat [MC05]. Elke extra zandkorrel die op de zandberg terecht komt, speelt de rol van een externe schok. Afhankelijk van de hellingsgraad kan er helemaal niets gebeuren of kan deze externe verstoring juist aanleiding geven tot lawines 1

Dit impliceert dus een mapping van de stapgroottes â&#x2C6;&#x2020;x(t) op de returns R(t), zie sectie 5.3.1.

23


HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA

24

die zich doorheen het ganse systeem voortzetten. De grootte van die lawines blijkt niet gaussisch verdeeld te zijn, maar een distributie te vertonen die in haar staarten een machtswet volgt. De respons van het systeem op de initi¨ele perturbatie is dus onafhankelijk van de details ervan. De belangrijkste voorwaarde is het herhaaldelijk toebrengen van een exogene schok op welbepaalde tijdstappen, waartussen het systeem tijd heeft om te relaxeren volgens haar interne dynamica. Tijdens die relaxatiefase is het systeem in een zelfgeorganiseerde kritische toestand. Kritisch, omdat de correlatielengte divergeert en er een machtswet wordt waargenomen. Zelfgeorganiseerd, omdat daarvoor geen finetuning van de relevante parameters vereist is (het kritisch punt is een attractor). Dit fenomeen van zelfgeorganiseerde kritikaliteit lijkt een vrij universeel concept te zijn waarmee het robuust gedrag van heel wat niet-evenwichtssystemen met een groot aantal vrijheidsgraden kan begrepen worden. Meer en meer worden ook financi¨ele markten bestudeerd als complexe systemen die zich in een zelfgeorganiseerde kritische toestand bevinden [BM11]. Op een gelijkaardige manier zullen we daarom externe schokken aanbrengen in de MD-simulatie. In [SRC10] wordt een methode voorgesteld waarin het systeem uit evenwicht gedreven wordt door op welbepaalde periodieke tijdstappen de radiale afstand in de potentiaal te veranderen. Dit komt in feite neer op het herschalen van de grootte van de deeltjes met een factor λ. De facto wordt in de potentiaal r → λr gezet, na elk tijdsinterval τ . De parameters λ en τ worden ingegeven tijdens de start van de simulatie en blijven constant. Deze voorwaarden van een constante discontinue input tonen inderdaad sterke gelijkenissen met de voorwaarden om een systeem in een zelfgeorganiseerde kritische toestand te brengen. Doordat het systeem ‘traag gedreven’ wordt –de injectering van potenti¨ele energie gebeurt slechts op welbepaalde tijdstappen– heeft het immers de tijd om te relaxeren. Tijdens die niet-evenwichtsfase verwachten we dan ook schaalinvariant gedrag. Als de distributie van de stapgroottes P (∆x) daadwerkelijk zal voldoen aan een machtswet in zijn staarten, dan verwachten we dat ook zeer grote stapgroottes ∆x kunnen opduiken.

3.2

Softcore potentiaal

Wanneer een deeltje evenwel een zeer grote afstand ∆x kan afleggen in ´e´en tijdstap, kan het –tengevolge van de eindige tijdsresolutie die inherent is aan een simulatie– mogelijk binnendringen in de harde kern van de LJ-potentiaal van andere deeltjes. Daardoor verkrijgt het een onfysische hoeveelheid potenti¨ele energie en bijgevolg een n´og hogere snelheid. Dat kan op zijn beurt aanleiding geven tot een kettingreactie waardoor de


HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA

25

simulatie onstabiel en oncontroleerbaar wordt [SRC10]. Het probleem zit in het korte dracht-stuk van de LJ-potentiaal, zodat we deze harde kern-potentiaal moeten aanpassen. Een goed alternatief is volgende softcore (SC) potentiaal [Fra07]   (r − RA )2 H − UA exp − USC (r) = . (3.1) 2 1 + exp ∆(r − Rr ) 2δA De parameters RA , Rr , ∆ en δA werden zo gekozen opdat het lange dracht-stuk zou overeenkomen met dat van de LJ-potentiaal (tabel 3.1). De SC-potentiaal bezit dan ook ongeveer dezelfde eigenschappen als de LJ-potentiaal, op de divergentie voor r → 0 na. Verder vertonen de VAF en de RDF van een SC-potentiaal kwalitatief hetzelfde gedrag als de VAF en de RDF voor een LJ-potentiaal. De hardheidsparameter H bepaalt de hoogte van potentiaalbarri`ere en dus de ‘hardheid’ van de potentiaal, hoe moeilijk het is om binnen te dringen. In figuur 3.1 is een SC-potentiaal gefit met H = 20. Daaruit blijkt dat we het effect van de herschaling (voor λ < 1) kunnen interpreteren als een effectieve vergroting van het ruimtelijk volume dat een deeltje inneemt. H

RA

UA

RR

2 2δA

20

1

1

0.79

39.4

0.062

Tabel 3.1: Gefitte parameters van de SC-potentiaal in systeemeenheden[Sta10]

3.3

Invloed van λ op de temperatuursevolutie

Wanneer we de radiale afstand telkens veranderen volgens een multiplicatief proces (r → λr), dan wordt de effectieve schalingsfactor na M herschalingen λ(t = M τ ) = [λ(t = 0)]M .

(3.2)

De extra potenti¨ele energie die door de schaalvergroting in het systeem wordt binnengebracht, wordt in de relaxatiefase gedissipeerd in kinetische energie. Dit heeft telkens een temperatuurstijging tot gevolg. Het viriaaltheorema leert immers dat N

3 1X N kT = − ~ri · F~i . 2 2

(3.3)

i=1

Omdat F~ij = −F~ji , valt de viriaalterm in het rechterlid met behulp van formule (2.2) te herschrijven als N N N N 1 X 1 X 1X 1X ~ ~ ~ − ~ri · Fij = − ~rij · Fij = − ~rij · Fij = − rij Fij . 2 4 2 2 i,j=1

i,j=1

i<j

i<j

(3.4)


HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA

26

Figuur 3.1: Het effect van de herschaling op een softcore potentiaal met H = 20, in gereduceerde simulatie-eenheden: hoe kleiner de factor λ waarmee de lengteschaal vermenigvuldigd wordt, hoe groter het effectieve volume van elk deeltje

Hierin is rij = |~ri − ~rj | en Fij = −

dU (rij ) . drij

(3.5)

Na de herschaling U (rij ) → U (λrij ), zal Fij → Fij0 . Bijgevolg verandert de viriaal en bereikt het systeem een nieuwe temperatuur N

3 1X N kT 0 = − r~i · Fi0~(λ). 2 2

(3.6)

i=1

0

(r) (λ) (r) of dUSC invullen, dan blijkt TT(λ=1) steeds een dalende Wanneer we daarin dULJ dr dr functie van λ te zijn. Daaruit begrijpen we dat een effectieve schaalvergroting van de deeltjes (λ < 1) inderdaad een temperatuurstijging tot gevolg heeft.

Zoals blijkt uit figuur 3.2 (in het rood) zal de temperatuur na enkele herschalingen al snel stijgen naar zeer grote waarden. Een mogelijke oplossing voor dit probleem bestaat erin om de temperatuur terug naar haar beginwaarde te brengen, telkens ze een bepaalde maximumwaarde overschrijdt. Dit gebeurt door de snelheden te herschalen volgens dezelfde procedure als in vergelijking (2.16).


HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA

27

Figuur 3.2: Het effect van het niet-evenwichts-protocol op de gereduceerde temperatuur T ∗ van tien 1 opeenvolgende herschalingen met λ(t=0) = 1.15, elke τ = 1000 stappen, bij ρ∗ = 0.1. Met ) neemt de temperatuur minder een steeds kleiner wordende herschaling λ1 → λ1 + ( 1−λ λ snel toe (in het blauw) dan met herschalingen waarin λ constant blijft (in het rood).

Een andere oplossing bestaat erin om de lengteschaal van de potentiaal op een meer gestage manier te laten veranderen. In plaats van een constante schaalfactor λ(t) = λ(t = 0), kunnen we deze bijvoorbeeld na elke stap verkleinen volgens λ1 → λ1 + ( 1−λ λ ). Daardoor verandert de lengteschaal nu op een additieve manier r → r + ∆r met ∆r ≈ 1 − λ. Zoals blijkt uit figuur 3.2 (in het blauw) zal de temperatuur daardoor elke tijdstap gelijkmatig stijgen. Deze methode heeft dus als voordeel dat de temperatuur in de simulatie beter onder controle blijft. In wat volgt zullen we daarom deze manier van herschaling gebruiken in plaats van de herschaling r → λr die in [SRC10] vooropgesteld werd.

3.4

Vette staarten

In [SRC10] wordt aangetoond dat herschalingen met constante λ niet-gaussische verplaatsingsdistributies kunnen genereren. Hier wordt onderzocht of de nieuwe methode


HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA

100

28

Equilibrium-MD NEMD Gaussian

P(∆x/σ)

10-1

10-2

10-3 6

4

2

0

∆x/σ

2

4

6

Figuur 3.3: In een simulatie die elke τ = 1000 stappen uit evenwicht gebracht wordt met N = 4000 1 en initieel λ(t=0) = 1.15, verschijnen vette staarten in de distributie van de stapgroottes ∆x P ( σ ).

waarbij de herschaling additief gebeurt, eveneens aanleiding geeft tot dergelijke vette staarten in de distributies van de stapgroottes. De netto verplaatsingen ∆x(t) = x(t + ∆t) − x(t)zijn niet enkel afhankelijk van de niet-evenwichtsomstandigheden, maar ook van de dichtheid en de temperatuur in het systeem. Om verschillende distributies P (∆x) te kunnen vergelijken met elkaar en met een normaalverdeling zullen we de stapgroottes delen door de standaardafwijking σ van de distributie. Omdat we een driedimensionaal systeem simuleren, worden ook P (∆y) en P (∆z) berekend. Uitgemiddeld over al∆y ∆z le ensembles zorgt de symmetrie van het probleem ervoor dat P ( ∆x σ ) = P ( σ ) = P ( σ ). Om de hoeveelheid statistiek te verhogen worden de distributies uit de drie richtingen dan ook opgeteld, maar voor de eenvoud nog steeds P ( ∆x σ ) genoemd. De standaardafwijking wordt daarin evenwel berekend uit v u N u 1 X t σ= (∆xi − ∆x)2 + (∆yi − ∆x)2 + (∆yi − ∆x)2 , (3.7) 3N i=1

PN

1 met ∆x = 3N i=1 (∆xi + ∆yi + ∆zi ). In figuur 3.3 is dan te zien dat de stapdistributie ∆x P ( σ ) breder uitgesmeerd wordt in haar staarten en scherper gepiekt wordt wanneer


HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA

29

het systeem uit evenwicht gebracht wordt. Hierin herkennen we de niet-gaussische distributies van de returns uit financi¨ele tijdsreeksen (figuur 1.4). De leptokurtosische curve in figuur 3.3 werd gesimuleerd in NEMD met een specifieke herschalingsparameter λ((t = 0)) = 1/1.15. Dit is echter geen toevalstreffer: ook voor andere waarden van λ (en τ ) werden dergelijke vette staarten teruggevonden. Ze zijn dus een robuuste eigenschap in NEMD en er komt geen finetuning aan te pas.

3.5

Kurtosis

Begrippen als ‘gepiektheid, ‘vette staarten’ of ‘het optreden van extreme waarden’ zijn nogal kwalitatieve omschrijvingen. Daarom gaan we op zoek naar een geschikte grootheid om dergelijke niet-gaussische eigenschappen van een probabiliteitsdistributie op een meer kwantitatieve manier te karakteriseren. Die vinden we bijvoorbeeld in de kurtosis.

Figuur 3.4: Voor leptokurtosische distributies daalt de kans op extreme evenementen zeer traag

Beschouw de PDF P (x) van een random-variabele x. Zoals de standaardafwijking σ en de scheefheid gebaseerd zijn op de verwachtingswaarde van de tweede en de derde macht van (x − x ¯), zo wordt de kurtosis berekend uit de verwachtingswaarde van de vierde macht daarvan: h(x − x ¯)4 i − 3. (3.8) γ2 = σ4 Hierin is x ¯ = µ1 het gemiddelde van de distributie. Analoog kunnen we het ne moment R voorstellen door µn = xn P (x)dx. Na uitwerking vinden we γ2 =

µ4 − 4µ1 µ3 + 6µ2 µ21 − 3µ41 − 3. σ4

(3.9)


HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA

30

De normering met de vierde macht van σ maakt de kurtosis dimensieloos. De term −3 werd ingevoerd omdat voor een gaussische distributie gecentreerd rond nul (µ1 = 0) geldt dat σµ44 = 3, zodat de kurtosis van een gaussische distributie verdwijnt. Algemeen worden zulke distributies met kurtosis gelijk aan nul, mesokurtosisch genoemd. Distributies met een positieve kurtosis daarentegen zijn scherper gepiekt rond het gemiddelde en hebben vettere staarten (zie fig. 3.4). Daardoor vergroot de kans op evenementen die ofwel dicht bij het gemiddelde liggen ofwel zeer extreme waarden hebben. Zulke distributies dragen de naam leptokurtosisch. In figuur 3.5 is te zien dat voor de distributie van de verplaatsingen op ´e´en tijdstap de kurtosis op bepaalde tijdstappen de hoogte inschiet. Op dat moment is het systeem ver uit evenwicht en worden de staarten van de distributies breder. Dit wijkt af van het gaussisch gedrag γ2 ≈ 0 dat teruggevonden wordt in evenwichtssimulaties. 5

4

mul SC add SC equilibrium LJ

kurtosis

3

2

1

0

10

2000

4000

6000

steps

8000

10000

12000

Figuur 3.5: De tijdsevolutie van de kurtosis voor een systeem in evenwicht (groen) verschilt met die voor een systeem dat uit evenwicht gebracht werd door een multiplicatieve herschaling 1 (blauw) en een additieve herschaling (rood) met λ(t=0) = 1.15, τ = 500. De pieken met γ2 > 3 verschijnen pas nadat de temperatuur terug op haar beginwaarde gezet werd, iets wat langer duurt voor de additieve herschaling omdat de temperatuur volgens die methode minder snel divergeert.

We kunnen de kurtosis dus gebruiken als een maat die aangeeft in hoeverre zeldzame gebeurtenissen een rol spelen. In de volgende hoofdstukken zullen we argumenteren dat, behalve cumulanten als σ of γ2 , ook de informatie-entropie H kan gebruikt worden om een PDF op een kwantitatieve manier te karakteriseren.


Hoofdstuk 4

Entropie en informatie Op de grafzerk van Ludwig Boltzmann (1844-1906) staat een formule gegraveerd die het aantal mogelijke microtoestanden Ω waarin een systeem zich kan bevinden, koppelt aan een welbepaalde macroscopische grootheid, genaamd entropie (S), S = k ln Ω,

(4.1)

waarin de boltzmannconstante k ≈ 1.38 · 10−23 J/K. De grootheid S was al eerder gekend uit de tweede hoofdwet van de thermodynamica die stelt dat de entropie van een ge¨ısoleerd systeem nooit zal dalen, wat wil zeggen dat het aantal microtoestanden horende bij een welbepaalde macrotoestand gemaximaliseerd wordt. Hierdoor worden twee intu¨ıtieve interpretaties van entropie met elkaar gekoppeld: een maat voor wanorde en een maat voor onzekerheid. Of nog: de interpretatie van entropie als beschrijving van irreversibiliteit en haar probabilistische interpretatie. Bovenstaande formule is enkel geldig in evenwichtsomstandigheden. De probabilistische interpretatie van entropie komt nog beter tot uiting in haar meer algemene vorm, de Gibbs-entropie: X S = −k pj ln(pj ), (4.2) j

waarin gesommeerd wordt over alle mogelijke microtoestanden en pj de probabiliteit is dat het systeem zich in toestand j bevindt. Wanneer elke toestand even waarschijnlijk wordt (pj = Ω1 ) herleidt deze zich tot formule (4.1). Om de entropie te kunnen berekenen van een systeem waarin die evenwichtstoestand op bepaalde tijdstappen verstoord wordt, zullen we in dit proefschrift vertrekken van de uitdrukking (4.2). De Gibbs-entropie S wordt bepaald door pj , dus gaan we eerst op zoek naar de de distributie die de probabiliteit bepaalt dat het systeem zich in een toestand j bevindt. 31


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

4.1

32

Boltzmanndistributie

Beschouw daartoe een systeem bestaande uit een subsysteem en een reservoir [MC05]. Beiden kunnen energie met elkaar uitwisselen, maar de totale energie blijft constant. In evenwicht hebben het subsysteem en het reservoir een gemeenschappelijke temperatuur T . We gaan nu op zoek naar de probabiliteit pj dat het subsysteem een energie Ej heeft. Als het subsysteem zich in een toestand zou bevinden met een energie Ej , dan kan het reservoir zich in elke microtoestand bevinden die overeenkomt met een constante energie ER = Etot − Ej . Volgens het ergodisch principe zijn deze microtoestanden allen even waarschijnlijk. Bijgevolg is de probabiliteit dat het subsysteem een energie Ej heeft evenredig met het aantal microtoestanden ΩR (Etot −Ej ) die het reservoir kan aannemen, consistent met die energie: pj ∝ ΩR (Etot − Ej ). (4.3) Omdat het reservoir veel groter is dan het subsysteem, zal Etot >> Ej , en kunnen we het aantal toegelaten microtoestanden expanderen in machten van Ej . Omdat deze een exponenti¨ele functie is van de energie en bijgevolg veel te snel varieert, zullen we ln(pj ) ontwikkelen in plaats van pj . ln[ΩR (Etot − Ej )] = ln[ΩR (Etot )] − Ej

∂ ln(ΩR ) + ... ∂Er

(4.4)

De energie van het ganse systeem ligt vast, zodat de eerste term een constante zal zijn. De partieel afgeleide in de tweede term is niets anders dan de definitie van de inverse temperatuur βR . Het subsysteem en het reservoir zijn op dezelfde temperatuur zodat β = βR . De gezochte probabiliteit dat het subsysteem een energie Ej heeft, wordt dus – na normalisatie– gegeven door 1 exp(−βEj ) . pj = P j exp(−βEj )

4.2

(4.5)

Entropie van een ideaal gas

We kunnen de entropie van een re¨eel gas opsplitsen in een ideaal gas-bijdrage Str die enkel te wijten is aan de translationele vrijheidsgraden in het systeem en in een bijdrage afkomstig van de interactie tussen de deeltjes Sint . S = Str (~ p1 , p~2 , ...~ pN ) + Sint (~r1 , ~r2 , ...~rN ) 1

(4.6)

De boltzmannfactor kan ook eenvoudig afgeleid worden met behulp van Lagrange-multiplicatoren P P door de entropie te maximaliseren onder de voorwaarden i pi = 1 en i pi Ei = cte .


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

33

Om te beginnen, negeren we interacties en focussen we ons op de contributie Str die enkel geassocieerd is met de kinetische energie van het systeem. We vertrekken opnieuw van de Gibbs-entropie, waarin de waarschijnlijkheid pj dat het systeem een energie Ej heeft, gegeven wordt door (4.5). In het geval van een klassiek ideaal gas, wordt dit X Str = −k pj ln(pj ), (4.7) j

met

P p2i exp(−β N i 2m ) pj = = . (4.8) Z Aangezien de gasdeeltjes niet onderscheidbaar zijn, wordt de N -deeltjes-partitiefunctie bij benadering 1 [Z1 (T, V )]N , (4.9) Z(T, V, N ) ≈ N! waarin de ´e´en-deeltjes-partitiefunctie van de translationele vrijheidsgraden, gelijk is aan: Z ∞ 4πp2 dp βp2 V Z1tr (T, V ) = exp(− ) = 3, (4.10) 3 h 2m λ 0 ptr j

met de thermische golflengte gedefinieerd als λ= √

h 2πmkT

zodat

(4.11) N

ptr j

X p2 N !λ3N i = exp(−β ). VN 2m

(4.12)

i

We bedenken dat als we de impuls van deeltje 1 en deeltje 2 verwisselen, dit aanleiding geeft tot dezelfde pj . We kunnen de sommatie over alle microtoestanden dus vervangen door een integratie over alle vrijheidsgraden op voorwaarde dat we delen door N ! als correctie voor het feit dat de deeltjes niet onderscheidbaar zijn. Aangezien enkel de impulsvrijheidsgraden een rol spelen in pj , wordt de entropie dan: " # Z N N X X N !λ3N p2i N !λ3N p2i VN 3 3 3 Sideaal = −k 3N d p~1 d p~2 ...d p~N exp(−β ) ln exp(−β ) , h N! VN 2m VN 2m i

Sideaal

λ 3N = −k( ) h

Z

i

" # N N 2 3N 2 X X N !λ p p i i d3 p~1 d3 p~2 ...d3 p~N exp(−β ) ln( )−β ) , 2m VN 2m i

i

of na N integraties: 3N λ 3N N !λ3N 3N Sideaal = k( ) (2πmkT ) 2 [− ln( )+ ]. h VN 2

(4.13)


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

34

Met behulp van Stirlings formule en formule (4.11) wordt dit: V 5 Sideaal = ln( )+ . S˜ideaal = 3 Nk Nλ 2

(4.14)

Dit levert dezelfde formule als welke Otto Sackur (en onafhankelijk van hem de 17jarige Hugo Tetrode) bekwam op basis van thermodynamische beschouwingen [Sac13]. Uitgaande van Gibbs’ probabilistische definitie van entropie– die algemeen geldig is, ook voor een systeem uit evenwicht– wordt dus de correcte uitdrukking voor de entropie van een ideaal mono-atomisch gas bekomen. We willen nagaan of deze wetmatigheid ook teruggevonden wordt via de MD-simulatie. We ontbreken echter nog het inzicht hoe de onderliggende distributies aanleiding geven tot deze entropie. Daarvoor zullen we eerst teruggrijpen naar de betekenis van entropie in de context van informatietheorie.

4.3

Informatie-entropie

4.3.1

Entropie ` a la Shannon

Gibbs’ definitie van de entropie (4.2) is gebaseerd op de probabiliteit dat het systeem zich in een bepaalde microtoestand bevindt, dus op onze kennis (of onwetendheid) over die microtoestand. In die zin is entropie eerder een beschrijving van de informatie die we hebben over het thermodynamisch systeem dan een eigenschap van het systeem zelf. In de context van informatietheorie ontstaat informatie als een gebeurtenis plaatsvindt waarvan vooraf onzeker was of deze daadwerkelijk zou gebeuren. De ‘zelfinformatie’ I is dan de hoeveelheid informatie die kennis over de uitkomst van een gebeurtenis toevoegt aan onze totale kennis. De functionele vorm hiervan kan afgeleid worden uit de axioma’s van de informatietheorie en blijkt logaritmisch afhankelijk van de probabiliteit p [Sha48]. Veronderstellen we immers: • informatie is een niet-negatieve grootheid , I(p) ≥ 0, • een gebeurtenis die zich voordoet met probabiliteit p = 1 zal geen informatie opleveren, I(1) = 0, • als twee ongecorreleerde gebeurtenissen zich voordoen (zodat hun gezamenlijke probabiliteit het product is van hun individuele probabiliteiten) zal de informatie bekomen door ze beide te observeren de som zijn van de informatie geassocieerd met de afzonderlijke gebeurtenissen, I(p1 ∗ p2 ) = I(p1 ) + I(p2 ), • de maat voor informatie is een continue en monotone functie van de probabiliteit ervan,


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

35

dan volgt daaruit dat I(pa ) = aI(p) voor elke re¨ele a en zien we in dat I(p) inderdaad een logaritmische functie moet zijn. Bovendien zal de informatie van een geobserveerde gebeurtenis groter worden wanneer de waarschijnlijkheid p waarmee die gebeurtenis zich voordoet kleiner wordt. Bij een uitkomst j met probabiliteit pj hoort dus een zelfinformatie −log2 (pj ). Wanneer deze zelfinformatie uitgemiddeld wordt door ze te wegen met de waarschijnlijkheid pj dat de uitkomst j zich ook effectief voordoet, bekomen we de verwachtingswaarde van de zelfinformatie: H=−

X

pj log2 (pj ).

(4.15)

j

Deze grootheid is maximaal (H = log2 n) als alle n toestanden even waarschijnlijk zijn en minimaal (H = 0) als we a priori weten in welke toestand het systeem zich bevindt. We zouden H dus kunnen interpreteren als ‘onzekerheid’. Naar analogie met de statistische mechanica verkoos Claude Shannon echter de naam ‘entropie’. H wordt doorgaans uitgedrukt in bits, waarbij iedere bit het aantal mogelijke toestanden verdubbelt. Daarom maakt de definitie gebruik van de binaire logaritme, met grondtal 2. Shannons definitie van entropie kan echter evengoed geschreven worden in natuurlijke logaritmen door over 1 bit). te gaan van binaire eenheden naar logaritmische eenheden (1 nat = ln2 De aanwezigheid van de boltzmannconstante k is dan nog het enige verschil tussen de definities (4.2) en (4.15). Deze staat er echter omwille van historische redenen (om ervoor te zorgen dat de statistische definitie van entropie dimensioneel overeenstemt met de thermodynamische definitie van Clausius S = Q/T ) en kan dus evengoed opgeslorpt worden in een gereduceerde entropie2 S ∗ = S/k. Op basis van deze equivalentie zullen we H en S voortaan beide bestempelen als de ‘informatie-entropie’ van het systeem. We interpreteren deze als een maat voor onze onwetendheid over het systeem, of anders gezegd, als de vrijheid die het systeem heeft om zich een toestand te ‘kiezen’, gegeven de informatie die we over het systeem hebben.

4.3.2

Entropie van de Maxwell-snelheidsdistributie

Uit het voorgaande volgt dat we de informatie-entropie kunnen zien als een statistische eigenschap van een discrete waarschijnlijkheidsdistributie. We kunnen dit veralgemenen voor een continue waarschijnlijkheidsdistributie door de sommatie in de Shannon-entropie (4.15) te vervangen door een integraal.3 Om de gedachte te vestigen, berekenen we eerst 2

[BN08] houdt een pleidooi om de term entropie te vervangen door ‘ontbrekende informatie’ en herformuleert de statistische mechanica door temperatuur en energie in dezelfde eenheden kT uit te drukken. 3 Bemerk evenwel de discussie in sectie 5.3.2 die met deze overgang gepaard gaat.


HOOFDSTUK 4. ENTROPIE EN INFORMATIE de informatie-entropie geassocieerd met een gaussische distributie, p(x) = Z H = − p(x) ln p(x)dx Z Z √ x2 = p(x) ln 2πσ 2 dx + p(x) 2 dx 2σ √ 1 = ln 2πσ 2 + 2 √ = ln( 2πeσ).

36 √ 1 2πσ 2

2

x 4 exp(− 2σ 2 ).

(4.16)

We kunnen deze redenering uitbreiden naar een n-dimensionale randomvector xi met distributie 1 1X p(x1 , ...xn ) = p exp(− aij xi xj ), 2 (2π)n |cij | waarin aij de inverse van de covariantiematrix cij is en |cij | de determinant ervan. De informatie-entropie van deze n-dimensionale gaussische distributie wordt dan:   (4.17) H = ln (2πe)n/2 |cij |1/2 . In de afwezigheid van correlaties tussen de verschillende componenten, zal cij = δij σ 2 en wordt dit: n (4.18) H = ln(2πe) + n ln σ. 2

E´ en deeltje in een warmtebad De impulsvector van een deeltje dat in contact staat met een warmtebad volgt een waarschijnlijkheidsdistributie die evenredig is met de boltzmannfactor (4.5). Voor een p2 niet-interagerend deeltje met enkel kinetische energie E = 2m , wordt dit p2x + p2y + p2z 1 exp(− ). (4.19) 2mkT (2πmkT )3/2 R De normeringsconstante werd daarin bepaald uit P [1] (~ p)d~ p = 1. De impulsvector van een deeltje dat beweegt in drie dimensies en in contact staat met een warmtebad, volgt dus een driedimensionale gaussische distributie met standaard√ afwijking σ = mkT . Volgens (4.18) is de hiermee geassocieerde informatie-entropie: √ S 3 H = = ln 2πe + 3 ln mkT . (4.20) k 2 P [1] (~ p) =

4

Zoals aangetoond door [Sha48] is dit de distributie die de Shannon-entropie maximaliseert bij de R R randvoorwaarden p(x)dx = 1 en p(x)x2 dx = σ 2 .


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

37

N deeltjes Beschouw nu N niet-interagerende deeltjes in een volume V . We brengen wederom enP p2i kel de impulsvrijheidsgraden in rekening zodat E = N i=1 2m . De faseruimte komt nu overeen met een 3N -dimensionale vector p~i . De hiermee geassocieerde probabiliteitsdistributie P (~ pi ) wordt P [N ] (~ p1 , ...~ pN ) = P [1] (~ p1 )P [1] (~ p2 )...P [1] (~ pN ).

(4.21)

waarin P [1] (~ pi ) telkens de driedimensionale gaussische distributie (4.19) is. Met behulp van vergelijking (4.18), vinden we dan de informatie-entropie voor een systeem van N deeltjes die vrij bewegen in een driedimensionale ruimte. Z Str = − P [N ] (~ p1 , ...~ pN ) ln[P [N ] (~ p1 , ...~ pN )]d~ p1 ...d~ pN (4.22) k 3N 3N = ln 2πe + ln mkT . (4.23) 2 2 Of, met behulp van formule (4.11): Str 3 h3 S˜tr = = + ln 3 . Nk 2 λ

(4.24)

Dit is de informatie-entropie die enkel te wijten is aan de impulsvrijheidsgraden. In sectie 4.14 werd de veronderstelling gemaakt dat de entropie van een ideaal gas enkel haar oorsprong vindt in de translationele vrijheidsgraden, geassocieerd met de kinetische energie van het systeem. Vergelijking met (4.14) toont dat die redenering niet volledig was. De entropie van een ideaal gas bevat namelijk nog een extra term ln heV 3 N . We zullen nu aantonen dat deze term gerelateerd is aan de positionele vrijheidsgraden in het systeem en overeenkomt met de informatie-entropie van een uniforme distributie.

4.3.3

Configurationele entropie

E´ en deeltje Om de microtoestand volledig te karakteriseren kunnen we de faseruimte opdelen in zesdimensionale cellen. Het lijkt er dan op dat als we de cellen maar klein genoeg kiezen, een eindig volume aanleiding zal geven tot een oneindig aantal mogelijke toestanden. Volgens het onzekerheidsprincipe van Heisenberg5 is zulke continue beschrijving van 5

Merk op dat we hier gebruik maken van de oorspronkelijke formulering uit Heisenbergs artikel 3 [Hei27] en dat deze een factor 16π 3 verschilt van σx σy σz σpx σpy σpz ≥ ~8 , die bekomen wordt uit de Robertson–Schr¨ odinger-relatie en de kwantummechanische commutatieregels.


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

38

de faseruimte echter onmogelijk. Ze legt immers een fundamentele limiet op aan het minimaal volume van elke cel, ∆x∆y∆z∆px ∆py ∆pz ∼ = h3 .

(4.25)

Omdat de natuur kwantummechanisch is en de faseruimte bijgevolg granulair, heeft een deeltje dus ‘slechts’ de keuze tussen hV3 mogelijke microtoestanden. Er bestaat bovendien geen enkele reden waarom een bepaalde ingenomen positie waarschijnlijker zou zijn dan 3 een andere, zodat pi = hV uniform verdeeld is. De informatie-entropie geassocieerd met de positie van ´e´en deeltje is dan volgens (4.15) S1k(~r) = ln hV3 . N deeltjes In afwezigheid van interacties factoriseert de probabiliteitsdistributie van N deeltjes opnieuw in de afzonderlijke distributies van elk deeltje. Voorgaande redenering, heden toegepast op een deeltje dat beweegt in een 6N-dimensionale faseruimte, leert: P (~r1 , ..., ~rN ) = P (~r1 )...P (~rN ) =

h3N . VN

(4.26)

Er treedt echter nog een complicatie op waarmee we rekening moeten houden: de deeltjes in de simulatie zijn niet onderscheidbaar. Daarom zal het verwisselen van de faseruimteco¨ordinaten van twee deeltjes aanleiding zal geven tot dezelfde toestand. Omdat het aantal toestanden die N niet onderscheidbare deeltjes kunnen bezetten N ! keer kleiner is dan het aantal toestanden die N onderscheidbare deeltjes kunnen innemen, vinden we voor de uniforme distributie van de positionele vrijheidsgraden: P (~r1 , ..., ~rN ) =

h3N N ! . VN

(4.27)

De bijdrage van de positionele vrijheidsgraden aan de entropie, wordt dan: S(~r1 , ..., ~rN ) 1 V eV S˜pos (U = 0) = = ln 3 = ln 3 . Nk N h N! h N

(4.28)

Deze is enkel geldig in afwezigheid van interacties (U = 0). Optellen van (4.24) en (4.28) levert dan de correcte uitdrukking voor de entropie van een ideaal gas (4.14), V 5 S˜ideaal = S˜tr + S˜pos (U = 0) = ln( )+ . 3 Nλ 2

(4.29)


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

4.4

39

Entropie in de simulatie

We ontwikkelen een methode om de translationele bijdrage aan de entropie Str te bepalen in de simulatie. Naar analogie met vergelijking (4.22) kunnen we Str trachten te berekenen door te sommeren over alle impulswaarden die de deeltjes in het simulatiesysteem kunnen aannemen. Aangezien we m∗i = 1, ∀i = 1...N gekozen hebben in de simulatie, kunnen we de probabiliteit pj associ¨eren met de snelheidsverdeling P (vx,y,z ) van de deeltjes. Omdat we voor het translationeel gedeelte, de interacties tussen deeltjes buiten beschouwing laten, bewegen ze onafhankelijk van elkaar. De probabiliteitsdistributie factoriseert dan in het product van N identieke termen: X X X X Str P (vz ) ln[P (vz )]). P (vy ) ln[P (vy )]+ P (vx ) ln[P (vx )]+ =− pj ln(pj ) = −N ( k v v v j

x

y

z

(4.30) In de simulatie worden tijdens elke tijdstap de snelheidscomponenten van de deeltjes in een histogram gerangschikt. Om alles op ´e´en te normeren, wordt er achteraf gedeeld door het aantal deeltjes N . Elke bin b bevat dan de probabiliteit Pb = NNb dat de snelheidscomponent zich in het bijhorende snelheidsinterval bevindt. Om over te gaan van een histogram naar een kansdistributie met oppervlakte ´e´en, wordt die waarde gedeeld ∗ . Daarna wordt P∆b ln P∆b elke tijdstap over alle door de breedte van de bins ∆ = ∆vx,y,z bins opgeteld en vermenigvuldigd met ∆.6 In figuur 4.1 worden de kansdistributies op drie verschillende tijdstappen vergeleken met de gaussische maxwelldistributie bij T ∗ = 0.7. In figuur 4.2 is de hieruit berekende waarde S˜tr (t) op elke tijdstap gevisualiseerd. Het is duidelijk dat de entropie in de simulatie fluctueert rond een gemiddelde waarde. Wanneer we S˜tr (t) uitmiddelen over alle tijdstappen dan bekomen we de gemiddelde entropie, gerelateerd aan de translationele vrijheidsgraden. Als we uit tien simulaties telkens deze entropie bepalen, dan vinden we S˜tr = 3.7344 ± 0.0167, een significante overeenkomst met de theoretische waarde uit vergelijking (4.23), S˜tr = 3.7218. Bovenstaande analyse ondersteunt dus dat men met grote nauwkeurigheid de entropie kan bepalen uit een probabiliteitsdistributie. De verdeling van ´e´en snelheidscomponent j = x, y, z convergeert naar een gaussische distributie die de vorm r vj∗2 1 exp(− ) (4.31) p(vj ) = 2πT ∗ 2T ∗ krijgt wanneer haar parameters uitgedrukt worden in systeemeenheden, met m∗ = 1. De variantie daarvan wordt dus volledig bepaald door de gereduceerde temperatuur T ∗ in het systeem (figuur 4.3). Bijgevolg zal de entropie van de translationele vrijheidsgraden 6

De structuur van de relevante broncode is toegevoegd in bijlage B.1.


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

40

Figuur 4.1: De gereduceerde snelheidscomponent vx∗ van 4000 deeltjes werd gerangschikt in 50 bins. P (vx ) geeft de waarschijnlijkheid dat een deeltje een snelheidscomponent heeft in het interval [vx∗ , vx∗ + ∆vx∗ ]. Drie verschillende gesimuleerde histogrammen P (vx ) zijn te zien tijdens drie verschillende tijdstappen en deze volgen de maxwelldistributie (in het zwart).

Figuur 4.2: De tijdsevolutie van S˜tr in een simulatie met 4000 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7. ˜ [N ] (px )] + S[P ˜ [N ] (py )] + S[P ˜ [N ] (pz )] wordt elke tijdstap berekend uit histogramS˜tr = S[P men zoals in fig. 4.1 en fluctueert rond de theoretische waarde S˜tr = 3.722.


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

41

0.7

T ∗ =0.5 T ∗ =0.7 T ∗ =0.9

0.6

P(vx )

0.5 0.4 0.3 0.2 0.1 0.0 4

3

2

1

1

0

vx∗

2

3

4

Figuur 4.3: De gereduceerde snelheidshistogrammen (waarvan er enkele zijn geplot op verschillende tijdstappen in de simulatie) convergeren naar een maxwelldistributie waarvan de variantie stijgt met de temperatuur T ∗ .

enkel temperatuursafhankelijk zijn en dus niet afhangen van de dichtheid of van de potenti¨ele energie in het systeem. Tabel 4.1 bevestigt dat deze voorspelde waarde telkens kan gereproduceerd worden voor verschillende waarden van de temperatuur.

T∗ S˜tr -uit vergelijking (4.24) S˜tr -uit de simulatie

0.5

0.7

0.9

1.1

3.217 3.233

3.722 3.734

4.099 4.094

4.400 4.400

Tabel 4.1: De temperatuursafhankelijkheid van S˜tr voor een simulatie met 4000 deeltjes en ρ∗ = 0.5. S˜tr volgt de theoretische afhankelijkheid uit onze redenering in sectie 4.3.2.


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

4.5

42

Interactie-entropie

Tot nog toe hebben we steeds een hamiltoniaan beschouwd voor N niet-interagerende deeltjes die vrij bewegen in een volume V . We gaan nu op zoek naar de bijdrage tot de entropie die te wijten is aan de interacties en we vertrekken van de hamiltoniaan H=

N X pi 2 X + U (i, j). 2m i

(4.32)

i<j

De potenti¨ele energie inwerkend op ´e´en deeltje is afhankelijk van de positieco¨ordinaten van alle andere deeltjes. Daarom kunnen we de probabiliteitsdistributie niet langer factoriseren in de distributies horende bij ´e´en deeltje. Volgens vergelijking (4.5) wordt de configurationele probabiliteitsdistributie nu: P h3N N ! exp −β i<j U (i, j) P (~r1 , ..., ~rN ) = . (4.33) VN ζ 3N

De redenering uit sectie 4.3.3 vereist namelijk dat de factor h V NN ! expliciet voorop wordt geplaatst. De normeringsfactor ζ werd hierin gedefinieerd als Z X 1 d~r1 ...d~rN exp −β ζ= N U (i, j), (4.34) V i<j

zodat deze convergeert naar ´e´en in de afwezigheid van interacties U = 0 en de uniforme distributie van de positionele vrijheidsgraden (4.27) inderdaad teruggevonden wordt. De configurationele distributie gehoorzaamt dus aan volgende normalisatieconditie: Z 1 (4.35) d~r1 ...d~rN 3N P (r~1 , ..., ~rN ) = 1 h N! en de daaraan gerelateerde entropie wordt: P P  3N  h3N N ! exp −β i<j U (i, j) h N ! exp −β i<j U (i, j) S(~r1 , ..., ~rN ) = −k d~r1 ...d~rN 3N ln , h N! V N ζ VN ζ P Z X V Nζ 1 exp −β i<j U (i, j) S(~r1 , ..., ~rN ) = ln 3N − d~r1 ...d~rN N [−β U (i, j)]. k h N! V ζ Z

1

i<j

In de tweede term herkennen we het ensemblegemiddelde (2.14) van de potenti¨ele energie ¯ = hEp (t)i, U S(~r1 , ..., ~rN ) V Nζ ¯. = ln 3N + βU (4.36) k h N!


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

43

We vinden dus de interactie-entropie door bij de entropie geassocieerd met de positionele vrijheidsgraden in afwezigheid van interacties, een correctieterm op te tellen. 1 ¯ ). S˜pos (U ) = S˜pos (U = 0) + (ln(ζ) + β U N

(4.37)

¯ kan berekend worden via een MD-gemiddelde. Voor de factor ζ hebben De grootheid U we een benadering nodig. Laten we ζ daarom berekenen met behulp van een perturbatie-expansie. Daavoor gaan we over op de hulpfunctie van Mayer [GT07]: λ(i, j) = exp(−βU (i, j)) − 1. We passen daarop volgende reeksontwikkeling toe: Y i<j

(1 + λ(i, j)) = 1 +

X k<l

λ(k, l) +

X

λ(k, l)λ(n, m) + ...

(4.38)

k<l,n<m

De eerste term daarin is de ideaal gas-bijdrage, terwijl de tweede de interactie tussen twee nabije deeltjes voorstelt. De derde term wordt maar relevant wanneer drie deeltjes zich in elkaars nabijheid bevinden. Voor een hogere dichtheid en sterke interacties moeten steeds meer hogere orde-termen in rekening gebracht worden. Voor lage dichtheid convergeert deze expansie snel genoeg, zodat we ze kunnen afbreken na de tweede term: Z Y 1 d~r1 ..., d~rN exp −βU (i, j) (4.39) ζ = N V i<j Z X 1 ≈ 1+ N d~r1 ...d~rN λ(k, l). (4.40) V k<l

De som in bovenstaande vergelijking telt N (N2−1) termen, zijnde het aantal manieren waarop twee deeltjes aan elkaar gelinkt kunnen worden. Deze termen zijn allen gelijk want ze verschillen enkel maar in de manier waarop hun integratievariabelen gelabeld zijn. We vinden dus: Z V N −2 N (N − 1) ζ = 1+ d~r1 d~r2 λ(1, 2) (4.41) VN 2 Z N (N − 1) d~r1 d~r2 (−1 + exp −βU (~r1 , ~r2 )) (4.42) = 1+ 2V 2 Z N (N − 1) = 1+ d~r12 (−1 + exp −βU (~r12 )), (4.43) 2V waarbij in de laatste stap werd overgegaan op relatieve co¨ordinaten door ´e´en van beide deeltjes als oorsprong te kiezen. De eerste term in de integraal zorgt ervoor dat de integraal convergeert. Wanneer de interacties verwaarloosbaar worden, nadert ζ naar 1.


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

44

˜ ∗ ) bij T ∗ = 0.7 in een Figuur 4.4: De dichtheidsafhankelijkheid van de gereduceerde entropie S(ρ simulatie met 4000 deeltjes waarvan de interactie gemodelleerd werd met een LJ-potentiaal. Het ideaal gas-deel S˜ideaal ervan wordt tevens vergeleken met de theoretische waarde van Sackur en Tetrode S˜th (daarin zijn de foutenvlaggen onzichtbaar klein) .

Interactie-entropie in de MD-simulatie De totale gereduceerde entropie van het syteem wordt, na het in rekening brengen van interacties S = S˜pos (U ) + S˜tr Nk V 1 5 ¯ ) = S˜ideaal + 1 (ln ζ + β U ¯ ). = ln( ) + + (ln ζ + β U N λ3 2 N N

S˜ =

(4.44) (4.45)

Deze gemiddelde entropie wordt nu berekend in de MD-simulatie uit enerzijds het tijdsgemiddelde van de potenti¨ele energie en uit anderzijds de snelheidsdistributies van de deeltjes (zoals in sectie 4.4). Door telkens een nieuwe simulatie uit te voeren bij een ande-


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

45

11 10 9 8

SË&#x153;

7 6 5 4 3 20.0

SË&#x153; ideaal SË&#x153; 0.2

0.4

f

0.6

0.8

1.0

Ë&#x153; in een simulatie met N = 2048 Figuur 4.5: Het effect van de interactie op de gereduceerde entropie S: â&#x2C6;&#x2014; â&#x2C6;&#x2014; deeltjes (T = 0.7, Ď = 0.5) waarvan de interactie gemodelleerd werd met een gereduceerde LJ-potentiaal, neemt SË&#x153; toe als die interacties zwakker gemaakt worden met een factor f .

re dichtheid Ď â&#x2C6;&#x2014; , kan de dichtheidsafhankelijkheid van de entropie gecontroleerd worden (figuur 4.4). We zien dat bij hogere dichtheid de toenemende interacties in het systeem ervoor zorgen dat de totale entropie van het systeem verlaagt. Dit blijkt ook uit vergelijking (4.45), waarin de laatste term negatief is. Het verwaarlozen van correlaties in het systeem had dus een overschatting van de entropie tot gevolg. Voor zeer lage dichtheid verdwijnt de interactie-entropie en convergeert de totale entropie van het systeem naar de entropie van een ideaal gas. In het vaste stof-regime ( Ď â&#x2C6;&#x2014; & 0.8) zal de dichtheidsexpansie niet meer convergeren en gaat de benadering in vergelijking (4.40) niet meer op. De figuur toont dus enkel een goede schatting van de entropie bij niet al te hoge dichtheden. Verder dient bemerkt te worden dat de correctieterm ln Îś/N een contributie geeft die ervoor zorgt dat SË&#x153; niet langer een intensieve grootheid is, wat een tekortkoming is van de hier vooropgestelde methode om interacties in rekening te brengen. Wanneer de interacties zwakker gemaakt worden door de interactiesterkte te herschalen met een factor f â&#x2C6;&#x2C6; [0, 1]: Ď&#x192; Ď&#x192; ULJ (r) = f ¡ 4[( )12 â&#x2C6;&#x2019; ( )6 ], r r dan zal de entropie tevens convergeren naar haar waarde voor een ideaal gas (fig. 4.5).


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

0.5

20

Energy fluctuations

0.5

0.4

0.4

0.3

15

0.3

15

0.2

0.2

0.0

y∗

10

0.1

∆Ep

y∗

0.1 10

0.0

0.1 0.2

5

0.3

0.1 0.2

5

0.3

0.4 00

5

10

x∗

15

20

0.5

0.4 00

5

10

x∗

15

Figuur 4.6: De ruimtelijke distributie van de veranderingen in potenti¨ele energie voor een LJ-potentiaal in evenwichtsomstandigheden (links) en voor een SC-potentiaal op het moment dat het systeem uit evenwicht gebracht wordt (rechts). Een typische projectie op het xy-vlak waarin |zi | < 0.5 ∀i, wordt getoond voor een simulatie met ρ∗ = 0.5, T ∗ = 0.7 en N = 4000.

4.6

Entropie in NEMD

Wanneer het systeem een exogene schok ondervindt door het herschalen van de lengteschaal in de interactiepotentiaal, zal dat zijn invloed hebben op de interacties tussen de deeltjes. Het effect op de potenti¨ele energie wordt ge¨ıllustreerd in figuur 4.6. Daarin is een dwarsdoornede te zien van de simulatiebox waarin voor ieder deeltje de verandering van de potenti¨ele energie in vergelijking met de vorige tijdstap gevisualiseerd is, X ∆Ep (~ri ) = U (~rij (t + ∆t)) − U (~rij (t)). (4.46) j6=i

De potenti¨ele energiefluctuaties worden duidelijk veel groter op het moment dat het systeem uit evenwicht gebracht wordt.

4.6.1

∆Ep

Energy fluctuations

20

46

Lokale entropie

De herschaling introduceerde in bepaalde gebieden van het simulatiesysteem dus een potenti¨ele energiestijging die veel groter is dan haar gemiddelde waarde. We gaan nu na wat het effect daarvan is op de entropie. In tegenstelling tot potenti¨ele energie is entropie een eigenschap die niet kan worden toegeschreven aan ´e´en deeltje, maar enkel aan een

20

0.5


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

Equilibirum Entropy S˜tr

47

10

25

9 8

20

7

y∗

5

S˜tr

6

15

4

10

3 2

5

1 00

5

10

x∗

15

20

25

0

Figuur 4.7: De ruimtelijke verdeling van de entropie verbonden met de translationele vrijheidsgraden S˜tr voor een systeem in evenwicht (links) en voor een systeem dat uit evenwicht gebracht 1 = 1.15, τ = 500 ) (rechts). Deze wordt getoond als een projectie op werd volgens ( λ(t=0) het xy-vlak tijdens een typische tijdstap in een simulatie met 8788 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7.

distributie of een systeem van deeltjes. Om de ruimtelijke entropiefluctuaties te kunnen berekenen, zal dus een manier van coarse-graining vereist zijn. Daarom wordt ons simulatiesysteem opgedeeld in n×n subsystemen van hetzelfde volume. Om genoeg data over te houden en om die subsystemen eenvoudig te kunnen visualiseren wordt de z-dimensie onveranderd gelaten. Uit de snelheden van alle deeltjes die in een bepaald subsysteem bewegen, wordt dan een Maxwell-Boltzmann-distributie gegenereerd7 . Daaruit wordt telkens de entropie Str bepaald die correspondeert met de snelheidsverdeling van de deeltjes in het subvolume. Ter verduidelijking zijn de groottes van die entropiewaarden afgebeeld in figuur 4.7 voor een typische dwarsdoorsnede. In de evenwichtssimulatie zien we dat de entropie overal in de buurt ligt van de gemiddelde waarde S˜tr ≈ 3.7. Op het moment dat het systeem uit evenwicht gebracht is, merken we op dat de verschillen tussen de lokale entropiewaarden sterk toenemen Dit is een gevolg van het feit dat de temperatuur T ∗ niet langer als een globale eigenschap van het systeem kan beschouwd wordt, maar zich ten gevolge van de herschaling als een lokale variabele gedraagt. De fluctuaties in de temperatuur bepalen de fluctuaties op de variantie van de snelheidsverdelingen en bijgevolg ook de fluctuaties in Str . 7

De relevante pseudocode is terug te vinden in bijlage B.2.


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

Equilibirum Entropy S˜pos

48

10

25

9 8

20

7

y∗

5

S˜pos

6

15

4

10

3 2

5

1 00

5

10

x∗

15

20

25

0

Figuur 4.8: De ruimtelijke verdeling van de entropie verbonden met de positionele vrijheidsgraden S˜pos voor een systeem in evenwicht (links) en voor een systeem dat uit evenwicht gebracht 1 = 1.15, τ = 500 )(rechts). Deze wordt getoond als een projectie op werd volgens ( λ(t=0) het xy-vlak tijdens een typische tijdstap in een simulatie met 8788 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7.

Verder wordt in elk subvolume tevens de gemiddelde potenti¨ele energie berekend. Daaruit wordt de entropie die gerelateerd is aan de positionele vrijheidsgraden Spos in elk subsysteem teruggevonden. Dit wordt gevisualiseerd in figuur 4.8. Uit beide figuren 4.7 en 4.8 kunnen we besluiten dat de ruimtelijke fluctuaties in de totale entropie sterk toenemen op het moment dat het systeem in een nietevenwichtstoestand wordt gebracht. De herschaling had immers het injecteren van potenti¨ele energie op verschillende plaatsen tot gevolg, die tijdens de relaxatiefase wordt omgezet in kinetische energie.

4.6.2

Tijdsevolutie van de entropie

Laten we daarom de tijdsevolutie van de entropiebijdragen Spos en Str in het volledige systeem onderzoeken. Uit de tweede term van vergelijking (4.45) blijkt dat de ¯ in het systotale entropie in het systeem afhankelijk is van de potenti¨ele energie U teem. Na de herschaling is deze term niet langer negatief. De injectie van potenti¨ele energie zal er dus voor zorgen dat de totale entropie S sterk zal toenemen in nietevenwichtsomstandigheden. Zoals te zien is in figuur 4.9 is dat het gevolg van de interacties in het systeem, want de entropie van een ideaal gas varieert veel minder. Ter


HOOFDSTUK 4. ENTROPIE EN INFORMATIE

49

60

S˜ tr S˜ pos S˜ ideaal S˜

50

entropy

40 30 20 10 00

1000

2000

steps t ∗

3000

4000

5000

Figuur 4.9: De evolutie van de entropie S˜ = S˜pos + S˜tr voor een systeem dat herhaaldelijk uit evenwicht gebracht wordt ( λ1 = 1.15, τ = 500 ) in een simulatie met 8788 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7.

verduidelijking wordt het relatief belang van de positionele S˜pos en de translationele S˜tr vrijheidsgraden in de totale entropie S˜ in het niet-evenwichtssysteem getoond.


Hoofdstuk 5

Informatie-entropie in financi¨ ele markten: discussie Eerst wordt de informatie-entropie die geassocieerd is met de PDF van de prijsfluctuaties in economische data onderzocht. Vervolgens wordt ingegaan op de aard van informatiestromen in niet-evenwichtsomstandigheden. Daarna worden eventuele beperkingen van het hier ontwikkeld informatie-entropie-paradigma bediscussieerd.

5.1

Informatie-entropie uit returns

In sectie 1.4 hebben we de standaardafwijking van de returns van de S&P 500-index berekend: σ = 0.00967. We delen de waarde van de returns nu door deze σ en geven de genormaliseerde returns weer in de probabiliteitsdistributie 5.1. Daaruit kunnen we nu ook de informatie-entropie van de distributie berekenen. We vinden SS&P 500 = 1.276 We vinden dus een beduidend lagere waarde in vergelijking met de informatie-entropie van √ een gaussiaan met standaardafwijking 1, ln( 2πe) = 1.419. Dit is geen toevallige waarde die inherent is aan de S&P 500-index, maar een robuuste eigenschap die een gevolg is van het feit dat markten niet-evenwichtssystemen zijn. Ook de informatie-entropie¨en van de Japanse beursindex Nikkei 225: SN IK = 1.305 en van de Duitse DAX SDAX = 1.311 bevinden zich immers lager dan de gaussiaanse informatie-entropie1 . Dat wil zeggen dat hun onzekerheid lager is, m.a.w dat de fluctuaties in indexprijzen minder aan het random walk -model voldoen dan de EMH ons laat geloven. Ter vergelijking wordt ook de informatie-entropie van de leptokurtosische distributie P ( ∆x σ ) die gegenereerd werd in de NEMD-simulatie (figuur 3.3), berekend. We vinden SN EM D = 1.297 < 1.419. 1

Hiervoor werd tevens gebruik gemaakt van de intraday gegevens die beschikbaar zijn op [yah].

50


¨ MARKTEN: DISCUSSIE 51 HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE

Probabiliteit P(R/σ)

100

DAX Nikkei 225 S&P 500

10-1

10-2

10-3

15

20

10

5

Returns R(t)/σ

5

0

15

10

Figuur 5.1: De probabiliteitsdistributies van de genormaliseerde returns van de S&P 500-index, de Nikkei225-index en de DAX-index, vergeleken met een gaussische distributie op log-lineaire schaal.

100

S&P500 DAX Nikkei 255 Gaussian

P(R/σ)

10-1

10-2

10-3 4

2

0

Return R/σ

2

4

Figuur 5.2: Het centraal stuk van bovenstaande PDF (enkel voor |R| < 5 en met bredere bins) toont duidelijker dat de empirische return-distributies afwijken van een mesokurtosische distributie.


¨ MARKTEN: DISCUSSIE 52 HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE

5.1.1

Entropie en leptokurtosis 0.40 0.35 0.30

−plnp

0.25

0.20 0.15

0.10 0.05 0.000.0

0.2

0.4

p

0.6

0.8

1.0

Figuur 5.3: De contributie van ´e´en term in de som die de entropie bepaalt, wordt gevisualiseerd als functie van de probabiliteit p

De functie −p ln p levert kleine waarden voor zeer kleine en voor zeer grote probabiliteiten p. Daartussen vertoont ze een maximum. Voor leptokurtosische distributies zijn die tussenliggende waarden minder frequent, waardoor ze minder entropie bijdragen in vergelijking met een mesokurtosische distributie. De entropiebijdrage van de extreme (lage p) en gemiddelde waarden (hoge p) is sowieso klein. Daaruit wordt duidelijk dat voor de informatie-entropie H van leptokurtosische distributies steeds zal gelden dat H < 1.419. Dit is in overeenstemming met de teruggevonden empirische waarden.

5.1.2

Entropiefluctuaties

Nu we de grootte van de empirische informatie-entropie berekend hebben, onderzoeken we ook de fluctuaties daarop. Daartoe werd de S&P 500-data opgedeeld in J subintervallen van telkens evenveel beursdagen. Van elk subinterval werd herhaaldelijk de informatie-entropie van de distributie Pj ( R σ ) berekend. Hierin is R de waarde van een e return in het j tijdsinterval, met j = 1, ..., J. Ter vergelijking werden MD-simulaties (in evenwicht) uitgevoerd waarbij op bepaalde tijdstappen j de verplaatsingsdistributies Pj ( ∆x σ ) werden bijgehouden. Daaruit werd eveneens de informatie-entropie berekend. Er werd voor gezorgd dat het aantal dataR punten in Pj ( ∆x σ ) telkens overeenkomt met het aantal datapunten in Pj ( σ ) zodat een zinvolle vergelijking mogelijk is.


¨ MARKTEN: DISCUSSIE 53 HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE

Figuur 5.4: De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken met de tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap, met tijdsvensters ∆t = 3082 (links) en ∆t = 3082 (rechts).

Figuur 5.5: De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken met de tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap, met tijdsvenster ∆t = 670.

In figuren 5.4, 5.5 en 5.6 is telkens de tijdsevolutie van de informatie-entropie SS&P 500 en SM D van beide distributies afgebeeld, voor J = 5, 10, 23, 46 en 67. Hieruit valt op te merken dat de entropie van de returns veel meer fluctueert dan de entropie van de


¨ MARKTEN: DISCUSSIE 54 HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE

Figuur 5.6: De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken met de tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap, met tijdsvensters ∆t = 335 (links) en ∆t = 230 (rechts).

verplaatsingen in een MD-simulatie in evenwichtsomstandigheden. Deze wilde fluctuaties zijn niet in overeenstemming met het beeld van een markt die in evenwicht is (zie sectie 5.2.1). In figuur 5.4 (met J = 46 en J = 67) zijn de entropiefluctuaties duidelijker waar te nemen dan in de figuur 5.6 (met J = 5 en J = 10). Merk evenwel op dat het aantal datapunten waaruit S berekend werd, zijnde 15410 J , navenant daalt (en daarmee ook de nauwkeurigheid op S).

5.2

Dissipatie van informatie

Om te onderzoeken hoe informatie zich verspreidt in financi¨ele markten ten gevolge van nieuws dat binnenkomt, stellen we ons de meer algemene vraag hoe na een exogene shock informatie in een systeem wordt gedissipeerd. Wanneer we roeren in een emmer water, wordt energie aan het systeem toegevoegd op grote schaal, die later gedissipeerd wordt op steeds kleinere schalen. Dit is vooralsnog een onopgelost fysisch probleem. Op dezelfde manier kan informatie toegevoegd worden aan een economisch systeem die daarna gedissipeerd wordt op steeds kleinere schalen. De gelijkenissen in de fluctuaties bij dit fenomeen en bij dat van turbulentie worden onderzocht in [MS97]. Een karakteristiek kenmerk van een niet-evenwichtssysteem is de manier waarop het energie (of informatie) absorbeert wanneer het gevoed wordt door een externe kracht (of door ‘nieuws’). De factor die er in de MD-simulatie voor zorgde dat het systeem uit evenwicht gebracht werd, is de exogene shock die gepaard ging met de herschaling van de lengteschaal in de potenti¨ele energie. De verhoogde potenti¨ele energie gaf aanleiding


¨ MARKTEN: DISCUSSIE 55 HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE tot meer interacties en werd geleidelijk omgezet in een verhoogde kinetische energie. De verhoogde entropie die hiermee gepaard gaat kan ge¨ınterpreteerd worden als een informatiestroom in het systeem. Op die manier kunnen we de exogene shock in de MDsimulatie associ¨eren met het beschikbaar worden van nieuwe informatie in een financi¨ele markt. We kunnen nu ook de verschillende bijdragen van de entropie in de MD-simulatie proberen te mappen naar een economisch model voor een markt. In haar meest eenvoudige vorm kunnen we een markt zien als een systeem waarin informatie zich verspreidt en uitgewisseld wordt. Die informatie is daarin een algemene benaming voor producten, diensten, opties etc. Essentieel zijn er twee contributies: de beweging van informatie en de uitwisseling van informatie. De informatie-entropie die geassocieerd is met de translationele vrijheidsgraden in het systeem, Str , zouden we dan kunnen interpreteren als de verplaatsing van informatie door de agent in het systeem. De informatie-entropie die geassocieerd is met de positionele vrijheidsgraden, Sint , kunnen we dan zien als de uitwisseling van informatie tussen verschillende die agents.2

5.2.1

Bullwhip effect

Ook in eenvoudige economische modellen kan de interactie van enerzijds een welbepaalde dynamische structuur en anderzijds menselijk gedrag, aanleiding geven tot grote fluctuaties. Veronderstel bijvoorbeeld een productieketen, waarin verschillende spelers een bepaald product aan elkaar leveren. Wanneer er plots een een exogene shock ontstaat in de vraag aan het einde van de productieketen, wordt de voorspelling van het aantal te leveren producten elke stap in de keten iets bemoeilijkt. Dit effect zet zich ‘als een zweepbeweging’ door naar het begin van de productieketen (het ‘bullwhip-effect’ [HL04]). Dit kan ertoe leiden dan een voorraadtekort snel verschuift naar een voorraadoverschot. De informatie wordt immers steeds te laat ontvangen om zo’n overschot of tekort te verwerken. De ultieme oorzaak van deze wilde oscillaties is niet de exogene shock, maar wel de feedback-structuur van het systeem en de neiging van de spelers om te overreageren op nieuwe informatie (gekend als Anchoring and adjustment in de psychologische literatuur). De dynamica wordt dus op een endogene manier gecre¨eerd en het grillig individueel gedrag op microniveau heeft emergente consequenties: de wilde fluctuaties op macroniveau. 2

De agents hoeven daarbij geen fysieke personen te zijn, ze kunnen ook organisaties representeren (bijvoorbeeld een groep personen die een pensioenfonds beheert).


¨ MARKTEN: DISCUSSIE 56 HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE Volgens de traditionele economische theorie zouden dergelijke fluctuaties niet voorkomen. Elke speler heeft immers op elk moment de nodige informatie om de meest rationele beslissing te nemen, tijdsvertragingen in acht genomen. Het systeem zou ogenblikkelijk van de ene evenwichtstoestand naar de andere overgaan [Bei07].

5.3 5.3.1

Beperkingen Mapping van stapgroottes op returns

In een financi¨ele tijdreeks fluctueert de prijsvariabele als functie van de tijd. In de MDsimulatie fluctueert de plaats van een deeltje als functie van de tijd. Het zijn telkens de grootheden die de netto verandering van de prijs en de plaats beschrijven, namelijk de return R(t) en de verplaatsing ∆x, die we met elkaar vergeleken hebben. Het gebruik van die relatieve grootheden is de meest natuurlijke keuze. Ze voldoen bijvoorbeeld aan de additieregel: ∆xi (t, ∆t) + ∆xi (t + ∆t, ∆t) = ∆xi (t, 2∆t), (5.1) met ∆xi (t, 2∆t) ≡ xi (t + 2∆t) − xi (t) de netto verplaatsing van deeltje i over twee tijdstappen. Dezelfde eigenschap is van toepassing op de returns Rln van een indexprijs Y (t) (waarbij we gebruik maken van de logaritmische definitie 1.3), R(t + ∆t, ∆t) + R(t, ∆t) = ln Y (t + 2∆t) − ln Y (t) = R(t, 2∆t).

(5.2)

Om beide relatieve grootheden op een zinvolle manier met elkaar te relateren, werden ze gedeeld door hun standaardafwijking, R(t + ∆t, ∆t) ∆xi (t, ∆t) ↔ . σ(t, ∆t) σR (∆t)

(5.3)

waarin de standaardafwijking σ(t, ∆t) berekend wordt uit de stapgroottes van alle deeltjes tijdens [t, t + ∆], terwijl σR (∆t) de standaardafwijking is van alle returns met tijdsvenster ∆t over het volledige tijdsinterval. Deze normering heeft echter tot gevolg dat voorgaande additieregel niet langer opgaat voor elke tijdschaal (zoals in [Sta10] expliciet wordt aangetoond) en dat we geen rechtstreekse mapping kunnen maken tussen de waarde van de returns en de lengte-eenheden in de MD-simulatie. In [Sta10] wordt evenwel geargumenteerd dat de absolute variabelen (de waarde van de indexprijs Y (t) en de positie xi (t)) toch met elkaar gelinkt kunnen worden door het uitvoeren van een lokale co¨ ordinatentransformatie.


¨ MARKTEN: DISCUSSIE 57 HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE

5.3.2

Negatieve entropie-probleem

In dit proefschrift werd de informatie-entropie steeds berekend uit het histogram van een randomvariabele. Dat gebeurde door de distributie op te delen in n bins met breedte ∆ en de waarschijnlijkheid pb te berekenen dat de variabele zich in de be bin bevindt. Als we uit deze discrete distributie de informatie-entropie zouden berekenen door −pb ln pb te sommeren over alle bins, dan zou deze afhankelijk worden van de gekozen bin-grootte ∆. Om de bekomen waarde van de informatie-entropie onafhankelijk te maken van ∆, werd overgegaan op een kansdistributie f (xb ) die in de be bin de waarde f (xb ) = p∆b aanneemt. Daarvoor moeten we echter een prijs betalen: • Deze fb is nu niet langer beperkt tot het probabiliteitsinterval [0, 1]. Dit heeft tot gevolg dat de informatie-entropie bekomen uit −f (xb ) ln f (xb ) negatief kan worden. Dat is een ongewenste eigenschap als we onze probabilistische interpretatie van informatie-entropie willen behouden. • Waar oorspronkelijk een waarschijnlijkheid pb geassocieerd was met de oppervlakte van een bin, is f (xb ) nu enkel geassocieerd met de functiewaarde van een bin. Wanneer we de informatie-entropie S van de volledige distributie optellen, moeten we de entropiewaarde van elke functiewaarde dus vermenigvuldigen met de volledige P breedte ∆ van de bin: S = b ∆f (xb ) ln f (xb ). Met andere woorden: we berekenen S uit ons histogram alsof dat histogram een continue kansdistributie f (x) zou R R zijn, met oppervlakte f (x)dx = 1 en informatie-entropie H = f (x) ln f (x)dx. De entropie werd dus berekend naar analogie met formule 4.17 voor een continue randomvariabele. Hierin duikt het probleem van de negatieve informatie-entropie op. Shannon breidde in [Sha48] zijn definitie van entropie namelijk stilzwijgend uit naar differenti¨ele entropie door simpelweg de sommatie in de discrete entropie te vervangen door een integraal. En deze veralgemening is niet zomaar geldig. De differenti¨ele informatie-entropie H van een continue probabiliteitsdistributie f (x) kunnen we immers herschrijven als Z n Z fb X H = − f (x) ln f (x)dx. = − f (x) ln f (x)dx. (5.4) b=1

ib

Hierin is fb − ib = ∆ de breedte van de bins. De gebinde probabiliteiten zijn echter te schrijven als Z fb pb = f (x)dx ≈ f (xb )∆. ib

(5.5)


¨ MARKTEN: DISCUSSIE 58 HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE Op dezelfde manier kunnen we de b-de term in de sommatie van 5.4 benaderen door f (xb )∆ ln f (xb ). We vinden dan dat de continue informatie-entropie in termen van pb gelijk is aan H ≈ − = − = −

n X b=1 n X b=1 n X

∆f (xb ) ln f (xb ) pb ln

pb ∆

pb ln pb + ln ∆.

(5.6) (5.7) (5.8)

b=1

Als de breedte van de bins infinitesimaal klein wordt, ∆ → 0, vinden we de gelijkheid H=−

n X

pb ln pb + ln ∆ = S

(5.9)

b=1

De tweede term divergeert dan, ln ∆ → −∞, zodat de differenti¨ele entropie H negatief kan worden. Ze kan dus geen geldige veralgemening zijn van de discrete informatieentropie (de eerste term in het rechterlid). In dit proefschrift vormt dit echter geen probleem, om twee redenen: • Er werd telkens gebruik gemaakt van de continue definitie (5.4) zodat de vergelijking tussen de theoretische H en de gesimuleerde informatie-entropie S consistent is (beiden komen overeen in de limiet ∆ → 0). • De entropie van een gaussiche distributie wordt enkel negatief voor σ<√

1 ≈ 0.24. 2πe

(5.10)

Omdat de distributies in dit proefschrift telkens genormaliseerd werden3 met hun standaardafwijking, zal σ = 1. Voor een normaalverdeling levert dat een positieve continue informatie-entropie (H ≈ 1.4). Ook voor de leptokurtosische distributies bleef H > 0.

3

In sectie 4.4 gebeurde deze normalisatie impliciet doordat de snelheidsvariabele in dimensieloze eenheden werd uitgedrukt en T ∗ -die de rol van σ speelt- voor een vloeistof nooit kleiner dan 0.24 gekozen werd.


Hoofdstuk 6

Conclusies In het standaard GBB-model wordt de evolutie van beursdata op mathematische wijze beschreven vanuit de veronderstelling dat de returns van prijsveranderingen een brownse beweging volgen. De probleemstelling in dit proefschrift vertrok van de observatie dat de hieruit gesimuleerde return-distributie niet goed overeenstemt met de distributie van re¨ele returns. Op basis van de S&P 500-index werd bijvoorbeeld aangetoond dat de kans op z´e´er grote returns niet snel verdwijnt: in plaats van op gaussische manier naar nul te convergeren, gehoorzaamt de empirische distributie aan een machtswet met exponent α ≈ 4.3 voor R > 0.015. De aanwezigheid van deze ‘vette staarten’ is een universeel terugkomende observatie. Om dit emergent fenomeen beter te begrijpen, werd het formalisme van een vloeistofmodel in een MD-simulatie vooropgesteld. Het systeem werd uit evenwicht gedwongen door op bepaalde simulatiestappen de dichtheid te herschalen. Ondanks de extra potenti¨ele energie die daardoor het systeem werd binnengebracht, bleef de temperatuurstijging onder controle. Na meerdere herschalingen werd opgemerkt dat de distributie van de stapgroottes eveneens vette staarten ging vertonen. Door de mapping van relatieve verplaatsingen in een anomaal vloeistofmodel op de relatieve prijsveranderingen in beursdata, werden dergelijke ‘leptokurtosische’ distributies dus kwalitatief gereproduceerd.

6.1

Informatie-entropie van leptokurtosische distributies

Informatie-entropie bleek verder een geschikte grootheid te zijn om die leptokurtosische distributies te onderzoeken. Zo werd een beduidend lagere informatie-entropie teruggevonden dan de informatie-entropie die door Shannon werd toegeschreven aan een normaalverdeling en die dus geassocieerd is met de distributies in het GBB-model:

59


HOOFDSTUK 6. CONCLUSIES

60

100

Equilibrium-MD NEMD Gaussian

P(∆x/σ)

10-1

10-2

10-3 6

4

2

0

∆x/σ

2

4

6

Figuur 6.1: De distributies van de returns van indexprijzen (links) en de distributie van de verplaatsingen van de deeltjes die in een MD-simulatie uit evenwicht gedreven werden (rechts).

H < 1.419. In de simulatie werd tijdens de niet-evenwichtsperioden eveneens een lagere informatie-entropie teruggevonden. Dat is weliswaar nog geen voldoende voorwaarde om NEMD als een geldig model te zien voor de onderliggende dynamica van financi¨ele tijdreeksen, het is toch een indicatie dat financi¨ele markten zich niet in een evenwichtstoestand bevinden.

6.2

Informatie-entropie van een ideaal gas

Daarnaast werd ook gepoogd om een marktmodel te associ¨eren met de entropie in de MD-simulatie. Zo kan de entropie S˜tr die gekoppeld is aan de beweging van de deeltjes, ge¨ınterpreteerd worden als ‘de beweging van informatie’, terwijl de entropie S˜pos die een gevolg is van de interacties tussen de deeltjes kan beschouwd worden als ‘de uitwisseling van informatie’. De entropie van een ideaal gas, die gekend is uit de formule van Sackur en Tetrode, werd daarbij gebruikt als aanknopingspunt. Deze ideaal gas-entropie werd teruggevonden met behulp van concepten uit de informatietheorie. Daarbij werd ondervonden dat S˜ideaal niet enkel een gevolg is van de translationele vrijheidsgraden, maar dat er ook rekening dient gehouden te worden met een configurationele contributie die geassocieerd is met de ononderscheidbaarheid van de deeltjes en met Heisenbergs onzekerheidsbeginsel. Verder werd een methode voorgesteld om interacties in rekening te brengen. Deze methode had de wenselijke eigenschap dat de interactie-entropie convergeerde naar de configurationele contributie van een ideaal gas wanneer de interacties op nul gezet werden of wanneer de simulaties bij zeer lage dichtheid uitgevoerd werden.


Bijlage A

Bepaling van de machtswetexponent De maximum-likelihood estimation (MLE) is een betrouwbare methode om de parameters van een statisch model aan een empirische dataset te fitten. Hier wordt beroep gedaan op deze methode om de exponent van aan machtswet terug te vinden [New05]. Beschouw daartoe de machtswetdistributie  −α x α−1 −α (A.1) p(x) = CR = np xmin xmin waarbij de constante C berekend werd uit de normalisatievoorwaarde Z ∞ np = x−α dx,

(A.2)

xmin

met np het aantal datapunten waaraan de machtswet gefit wordt. We hebben dus een set van np waarden xi . De probabiliteit dat deze onafhankelijke en identiek verdeelde random-variabelen gegenereerd werden uit de machtswetdistributie p(x) is:   np np Y Y α−1 xi −α (A.3) P (x|α) = p(xi ) = np xmin xmin i=1

i=1

Om nu de waarde van α te vinden die het best overeenkomt met de gegevens, moeten we op zoek gaan naar de probabiliteit P (α|x) voor een welbepaalde α, gegeven onze geobserveerde waarden xi . Deze is gerelateerd aan P (x|α) door het theorema van Bayes, P (α|x) = P (x|α)

P (α) P (x)

(A.4)

P (x) wordt bepaald door de set gegevens waarvan we vertrekken en deze liggen vast. Verder wordt P (α) verondersteld een uniforme distributie te zijn, dus een constante 61


HOOFDSTUK A. BEPALING VAN DE MACHTSWETEXPONENT

62

onafhankelijk van α. A priori (zonder de set geobserveerde waarden xi in beschouwing te nemen) is elke waarde van α immers even waarschijnlijk. We vinden dus P (α|x) ∼ P (x|α)

(A.5)

De a posteriori waarschijnlijkheid P (α|x) wordt de likelihood genoemd. De MLEmethode bestaat erin om deze te maximaliseren. Equivalent daarmee is maximalisatie van de logaritme (een monotone stijgende functie) ervan. Met behulp van de evenredigheidsrelatie A.5, vinden we voor de log likelihood L1 : np X L = P (x|α) = [ln(α − 1) + ln np − ln xmin − α ln i=1

Door

∂L ∂α

x xmin

].

(A.6)

= 0 te stellen np

X np x − ln = 0, α−1 xmin

(A.7)

i=1

vinden we de meest waarschijnlijke waarde voor de machtswetexponent α = 1 + np

" np X i=1

ln

x xmin

#−1 .

(A.8)

In [New05] wordt aangetoond dat de standaardfout op deze verwachte α gegeven wordt door " np #−1 X x α−1 √ σ = np ln = √ . (A.9) xmin np i=1

1

De evenredigheidsconstante in A.5 laten we buiten beschouwing omdat die in de logaritme verschijnt als een additieve constante die sowieso zal wegvallen in de maximalisatie.


Bijlage B

Structuur van de broncode In dit proefschrift werd de informatie-entropie van een continue randomvariabele meermaals berekend. Daarom wordt de structuur van het algoritme in de MD-simulatie hieronder geschetst in pseudocode. Voor de bepaling van de informatie-entropie die geassocieerd is met de distributies van prijsindexen, werd een analoge methode gebruikt.

B.1

Subroutine voor berekening translationele entropie Str

for alle tijdstappen t in de simulatie do for alle deeltjes i ≤ N in het systeem do for alle bins b in het snelheidshistogram do if snelheidscomponent vx van deeltje i correspondeert met b∆vx then pb ← pb + 1 {tel event op} end if {idem voor andere snelheidscomponenten vy en vz } end for end for for alle bins b in het snelheidshistogram do pb ← pb /N {normaliseer aantal events pb binnen b∆vx met aantal deeltjes N } pb ← pb /∆vx {normaliseer aantal events pb met breedte van de bin ∆vx }

tel entropiebijdrage −∆vx pb ln pb op {idem voor histogrammen van vy en vz } end for

bereken Str (t) = som van entropie uit de drie snelheidshistogrammen end for

63


HOOFDSTUK B. STRUCTUUR VAN DE BRONCODE

B.2

64

Subroutine voor berekening lokale entropie

for alle deeltjes i ≤ N in het systeem do for alle subvolumes in de x-richting do if x-co¨ ordinaat positie deeltje i correspondeert met x-co¨ordinaat subvolume then for alle subvolumes in de y-richting do if y-co¨ ordinaat positie deeltje i correspondeert met y-co¨ordinaat subvolume then

tel potenti¨ele energie U (x, y) van deeltje i op in subvolume (x,y) tel deeltje i op bij aantal deeltjes Ns in subvolume (x,y) sla de drie snelheidscomponenten van deeltje i op in subvolume (x,y) end if end for end if end for end for for alle subvolumes in de x-richting do for alle subvolumes in de y-richting do for alle deeltjes in subvolume (x,y) do for alle bins b in het snelheidshistogram do if snelheidscomponent vx van deeltje correspondeert met b∆vx then pb ← pb + 1 {tel event op} end if {idem voor andere snelheidscomponenten vy en vz } end for end for for alle bins b het snelheidshistogram do pb ← pb /Ns {normaliseer aantal events pb binnen b∆vx met aantal deeltjes Ns } pb ← pb /∆vx {normaliseer aantal events pb met breedte van de bin ∆vx }

tel entropiebijdrage −∆vx pb ln pb op {idem voor histogrammen van vy en vz } end for

bereken Str = som van entropie uit de drie snelheidshistogrammen bereken Spos = ln heV 3 N + interactie-entropie uit U (x, y) in subvolume end for end for


Bibliografie [Bac00]

´ L. Bachelier. Th´eorie de la sp´eculation. Annales scientifiques de l’Ecole Normale Sup´erieure, 3(17):21–86, 1900.

[Bei07]

E. D. Beinhocker. The origin of wealth. Random House Business Books, 2007.

[BM11]

H.R. Fiebig B. Dupoyet and D.P. Musgrove. Replicating financial market dynamics with a simple self-organized critical lattice model. Physica A: Statistical Mechanics and its Applications, 390(18–19):3120–3135, 2011.

[BN08]

A. Ben-Naim. A Farewell to Entropy: Statistical Thermodynamics Based on Information. World Scientific Pub Co Inc, 2008.

[Bou00]

J-P. Bouchaud. Power-laws in economics and finance: some ideas from physics. Science & Finance (CFM) working paper archive 500023, Science & Finance, Capital Fund Management, 2000.

[BS73]

F. Black and M. Scholes. The pricing of options and corporate liabilities. Journal of Political Economy, 81(3):pp. 637–654, 1973.

[Fam70]

E. F. Fama. Efficient capital markets: a review of theory and empirical work. Journal of Finance, 25:383–417, 1970.

[Fra07]

G. Franzese. Differences between discontinuous and continuous soft-core attractive potentials: the appearance of density anomaly. Journal of Molecular Liquids, (136):267–273, 2007.

[GPA+ 99] P. Gopikrishnan, V. Plerou, L.A. Nunes Amaral, M. Meyer, and E. H. Stanley. Scaling of the distribution of fluctuations of financial market indices. Phys. Rev. E, 60(5):5305–5316, Nov 1999.

65


BIBLIOGRAFIE

66

[GT07]

H. Gould and J. Tobochnik. Statistical and Thermal Physics: With Computer Applications, chapter 8: Classical Gases and Liquids. Princeton University Press, 2007.

[Hei27]

W. Heisenberg. Uber den anschauclichen inhalt der quantentheoretischen kinematik und mechanik http://osulibrary.oregonstate.edu/ specialcollections/coll/pauling/bond/papers/corr155.1-04.html. Zeitschrift f¨ ur Physik, 43:172–198, 1927.

[Hil75]

B. M. Hill. A simple general approach to inference about the tail of a distribution. Annals of Statistics, 3:1163–1174, 1975.

[HL04]

D. Helbing and S. L¨ ammer. Supply and production networks: From the bullwhip effect to business cycles. Technical Report cond-mat/0411486, Nov 2004.

[Jay57]

E. T. Jaynes. Information theory and statistical mechanics. Phys. Rev., 106(4):620–630, May 1957.

[LGC+ 99] Y. Liu, P. Gopikrishnan, P. Cizeau, M. Meyer, C-K. Peng, and H. E. Stanley. Statistical properties of the volatility of price fluctuations. Physical review E, 60(2), 1999. [Man63]

B.B. Mandelbrot. The variation of certain speculative prices. Journal of Business, 36, 1963.

[MC05]

N.R. Moloney and K. Christensen. Complexity And Criticality. Imperial College London, 2005.

[ML02]

A. C. Mackinlay and A. W. Lo. A Non-Random Walk Down Wall Street. Princeton University Press, http://press.princeton.edu/books/lo/, 2002.

[MS97]

R.N. Mantegna and H.E. Stanley. Stock market dynamics and turbulence: parallel analysis of fluctuation phenomena. Physica A, 239, 1997.

[MS99]

R.N. Mantegna and H.E. Stanley. An introduction to Econophysics: correlations and complexity in finance. Cambridge University Press, 1999.

[New05]

M.E.J. Newman. Power laws, pareto distributions and zipf’s law. Contemporary Physics, (46):323–351, 2005.

[Ryc10]

J. Ryckebusch. Statistische fysica. cursus, 2010.


BIBLIOGRAFIE

67

[Sac13]

O. Sackur. Die universelle bedeutung des sog. elementaren wirkungsquantums. Annalen der Physik, (345):78, 1913.

[Set09]

J.P. Sethna. Entropy, Order Parameters, and Complexity. Clarendon Press Oxford, http://www.physics.cornell.edu/sethna/StatMech/ EntropyOrderParametersComplexity.pdf, 2009.

[Sha48]

C. E. Shannon. A mathematical theory of communication. The Bell System Technical Journal, 27, 1948.

[Skl]

Sklogwiki. http://www.sklogwiki.org/SklogWiki/index.php/Main_Page.

[SRC10]

S. Standaert, J. Ryckebusch, and L. De Cruz. Creating the conditions of anomalous self-diffusion in a liquid with molecular dynamics. Journal of Statistical Mechanics- Theory and experiment, page P04004, 2010.

[Sta10]

S. Standaert. Connecting the dynamics of financial markets to the dynamics of non-equilibrium fluids. PhD thesis, UGent, http://inwpent5.ugent.be/papers/ phdsimon.pdf, 2010.

[Tal08]

N. N. Taleb. The Black Swan. The Impact of the Highly Improbable. Random House Inc., 2008.

[Thi99]

J.M. Thijsen. Computational Physics. Cambridge University Press, 1999.

[Voi05]

J. Voit. The Statistical Mechanics of Financial Markets. Springer, 2005.

[wik]

Wikipedia, the free encyclopedia. http://en.wikipedia.org/.

[WM04]

R. P. White and H. Meirovitch. A simulation method for calculating the absolute entropy and free energy of fluids: Application to liquid argon and water. Proc. Natl. Acad. Sci. USA, pages 9235â&#x20AC;&#x201C;9240, 2004.

[yah]

Yahoo. http://finance.yahoo.com.


Lijst van figuren 1.1

1.2 1.3

1.4

1.5

2.1

2.2 2.3

2.4

3.1

De tijdsevolutie van de stochastische variabele S(t) voor verschillende waarden van µ en σ. De gele lijn volgt een SDV met een grotere driftterm µ en bijgevolg een sterker stijgende trend. De groene lijn volgt een SDV met een hogere diffusieterm σ en vertoont bijgevolg sterkere fluctuaties en een minder sterk stijgende trend. De absolute waarde van de returns van de S&P 500-index van 3 januari 1950 tot 8 april 2011. De piek in 1987 is de handtekening van de beurscrash op Black Monday. De S&P 500 absolute returns (boven) vergeleken met de absolute returns van het GBB-model (onder) waarin µ = 0.003778 en σ = 0.00967 voor 15416 simulatiestappen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . De probabiliteitsdistributie van de genormaliseerde returns van de S&P 500-index wordt vergeleken met die van het GBB-model op log-lineaire schaal. Het ge¨ısoleerde event bij −21.2σ is de return op Black Monday. . . . . . . . . . . . . . . . . . . Aan de cumulatieve distributiefunctie van de positieve returns wordt een machtswetstaart gefit met α = 3.3146 en C = 1.235 · 10−7 (op log-log-schaal). . . . . . .

5 6

7

8 9

De fenemenologische LJ-potentiaal komt overeen met de empirische potentiaalcurve voor twee Argon-atomen in functie van hun interatomaire afstand R = r · 3.405˚ A. [wik] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . De tijdsevolutie van de potenti¨ele energie Epot , kinetische energie Ekin en hun som Etot , voor een simulatie met 256 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7. . . . . . . . . De radiale distributiefunctie voor Ar bij T ∗ = 0.7, ρ∗ = 0.5 (gasvormig), bij T ∗ = 0.4, ρ∗ = 0.5 (vloeibaar) en T ∗ = 0.7, ρ∗ = 1 (vast). De intermoleculaire afstand r is uitgedrukt in functie van σAr . . . . . . . . . . . . . . . . . . . . . . . . . . . De snelheidsautocorrelatiefunctie voor τ = 0 (zonder convolutie) uit een simulatie met 846 deeltjes bij T ∗ = 0.7 en verschillende dichtheden. . . . . . . . . . . . . .

22

Het effect van de herschaling op een softcore potentiaal met H = 20, in gereduceerde simulatie-eenheden: hoe kleiner de factor λ waarmee de lengteschaal vermenigvuldigd wordt, hoe groter het effectieve volume van elk deeltje . . . . .

26

68

16 19

21


LIJST VAN FIGUREN 3.2

3.3

3.4 3.5

4.1

4.2

4.3

4.4

4.5

Het effect van het niet-evenwichts-protocol op de gereduceerde temperatuur T ∗ 1 van tien opeenvolgende herschalingen met λ(t=0) = 1.15, elke τ = 1000 stappen, ∗ bij ρ = 0.1. Met een steeds kleiner wordende herschaling λ1 → λ1 + ( 1−λ λ ) neemt de temperatuur minder snel toe (in het blauw) dan met herschalingen waarin λ constant blijft (in het rood). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . In een simulatie die elke τ = 1000 stappen uit evenwicht gebracht wordt met 1 N = 4000 en initieel λ(t=0) = 1.15, verschijnen vette staarten in de distributie van ∆x de stapgroottes P ( σ ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Voor leptokurtosische distributies daalt de kans op extreme evenementen zeer traag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . De tijdsevolutie van de kurtosis voor een systeem in evenwicht (groen) verschilt met die voor een systeem dat uit evenwicht gebracht werd door een multiplicatieve 1 herschaling (blauw) en een additieve herschaling (rood) met λ(t=0) = 1.15, τ = 500. De pieken met γ2 > 3 verschijnen pas nadat de temperatuur terug op haar beginwaarde gezet werd, iets wat langer duurt voor de additieve herschaling omdat de temperatuur volgens die methode minder snel divergeert. . . . . . . . . . . . . . De gereduceerde snelheidscomponent vx∗ van 4000 deeltjes werd gerangschikt in 50 bins. P (vx ) geeft de waarschijnlijkheid dat een deeltje een snelheidscomponent heeft in het interval [vx∗ , vx∗ + ∆vx∗ ]. Drie verschillende gesimuleerde histogrammen P (vx ) zijn te zien tijdens drie verschillende tijdstappen en deze volgen de maxwelldistributie (in het zwart). . . . . . . . . . . . . . . . . . . . . . . . . . . . De tijdsevolutie van S˜tr in een simulatie met 4000 deeltjes bij ρ∗ = 0.5 en T ∗ = ˜ [N ] (px )] + S[P ˜ [N ] (py )] + S[P ˜ [N ] (pz )] wordt elke tijdstap berekend 0.7. S˜tr = S[P uit histogrammen zoals in fig. 4.1 en fluctueert rond de theoretische waarde S˜tr = 3.722. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . De gereduceerde snelheidshistogrammen (waarvan er enkele zijn geplot op verschillende tijdstappen in de simulatie) convergeren naar een maxwelldistributie waarvan de variantie stijgt met de temperatuur T ∗ . . . . . . . . . . . . . . . . . ˜ ∗ ) bij T ∗ = 0.7 De dichtheidsafhankelijkheid van de gereduceerde entropie S(ρ in een simulatie met 4000 deeltjes waarvan de interactie gemodelleerd werd met een LJ-potentiaal. Het ideaal gas-deel S˜ideaal ervan wordt tevens vergeleken met de theoretische waarde van Sackur en Tetrode S˜th (daarin zijn de foutenvlaggen onzichtbaar klein) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ in een simulatie met Het effect van de interactie op de gereduceerde entropie S: ∗ ∗ N = 2048 deeltjes (T = 0.7, ρ = 0.5) waarvan de interactie gemodelleerd werd met een gereduceerde LJ-potentiaal, neemt S˜ toe als die interacties zwakker gemaakt worden met een factor f . . . . . . . . . . . . . . . . . . . . . . . . . . . .

69

27

28 29

30

40

40

41

44

45


LIJST VAN FIGUREN 4.6

4.7

4.8

4.9

5.1

5.2

5.3 5.4

5.5

5.6

6.1

De ruimtelijke distributie van de veranderingen in potenti¨ele energie voor een LJpotentiaal in evenwichtsomstandigheden (links) en voor een SC-potentiaal op het moment dat het systeem uit evenwicht gebracht wordt (rechts). Een typische projectie op het xy-vlak waarin |zi | < 0.5 ∀i, wordt getoond voor een simulatie met ρ∗ = 0.5, T ∗ = 0.7 en N = 4000. . . . . . . . . . . . . . . . . . . . . . . . . De ruimtelijke verdeling van de entropie verbonden met de translationele vrijheidsgraden S˜tr voor een systeem in evenwicht (links) en voor een systeem dat uit 1 evenwicht gebracht werd volgens ( λ(t=0) = 1.15, τ = 500 ) (rechts). Deze wordt getoond als een projectie op het xy-vlak tijdens een typische tijdstap in een simulatie met 8788 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7. . . . . . . . . . . . . . . . . . . De ruimtelijke verdeling van de entropie verbonden met de positionele vrijheidsgraden S˜pos voor een systeem in evenwicht (links) en voor een systeem dat uit 1 evenwicht gebracht werd volgens ( λ(t=0) = 1.15, τ = 500 )(rechts). Deze wordt getoond als een projectie op het xy-vlak tijdens een typische tijdstap in een simulatie met 8788 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7. . . . . . . . . . . . . . . . . . . De evolutie van de entropie S˜ = S˜pos + S˜tr voor een systeem dat herhaaldelijk uit evenwicht gebracht wordt ( λ1 = 1.15, τ = 500 ) in een simulatie met 8788 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . De probabiliteitsdistributies van de genormaliseerde returns van de S&P 500index, de Nikkei225-index en de DAX-index, vergeleken met een gaussische distributie op log-lineaire schaal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Het centraal stuk van bovenstaande PDF (enkel voor |R| < 5 en met bredere bins) toont duidelijker dat de empirische return-distributies afwijken van een mesokurtosische distributie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . De contributie van ´e´en term in de som die de entropie bepaalt, wordt gevisualiseerd als functie van de probabiliteit p . . . . . . . . . . . . . . . . . . . . . . . . . . . De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken met de tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap, met tijdsvensters ∆t = 3082 (links) en ∆t = 3082 (rechts). . . . . . . . . . . . . . De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken met de tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap, met tijdsvenster ∆t = 670. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken met de tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap, met tijdsvensters ∆t = 335 (links) en ∆t = 230 (rechts). . . . . . . . . . . . . . . De distributies van de returns van indexprijzen (links) en de distributie van de verplaatsingen van de deeltjes die in een MD-simulatie uit evenwicht gedreven werden (rechts). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

70

46

47

48

49

51

51 52

53

53

54

60


Lijst van tabellen 3.1

Gefitte parameters van de SC-potentiaal in systeemeenheden[Sta10]

. . . . . . .

25

4.1

De temperatuursafhankelijkheid van S˜tr voor een simulatie met 4000 deeltjes en ρ∗ = 0.5. S˜tr volgt de theoretische afhankelijkheid uit onze redenering in sectie 4.3.2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41

71


Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica