Butlletí de la Societat Catalana de Matemàtiques

Page 1

BUTLLETÍ

El butlletí de la societat catalana de matemàtiques publica, en llengua catalana, exposicions matemàtiques de qualitat, que puguin interessar a un nombre elevat de lectors. Es donarà prioritat a aquells treballs en què destaquin la claredat d’exposició i l’interès general del tema. El butlletí està obert a tots els camps de la matemàtica i també als aspectes matemàtics de les ciències experimentals, la tecnologia, l’economia, etc., així com a altres àrees, com la història, la didàctica i la filosofia, sempre que els treballs tinguin un component matemàtic important. També tenen cabuda al butlletí aquells articles que desenvolupin un aspecte significatiu de la problemàtica de la professió matemàtica al nostre país.

DE LA SOCIETAT CATALANA DE MATEMÀTIQUES Institut d’Estudis Catalans

El butlletí publica un volum a l’any, dividit en dos números, que es trameten gratuïtament a tots els socis. El butlletí es publica també en format electrònic. L’edició electrònica del butlletí pot obtenir-se des del portal de revistes científiques en línia de l’IEC o al servidor https://scm.iec.cat. La correspondència administrativa s’ha d’adreçar a la Societat Catalana de Matemàtiques.

Editor en cap

Editora adjunta

Antoni Guillamon

Rosa Camps

Departament de Matemàtiques

Departament de Matemàtiques

Universitat Politècnica de Catalunya

Universitat Autònoma de Barcelona

í n d e x q Alessio Figalli q Carles Lladó i Josep M. Brunat Les matemàtiques dels setins ---------------------------------------------------------------

Comitè Editorial Marc Noy Departament de Matemàtiques Universitat Politècnica de Catalunya

Bartomeu Coll Dep. de Matemàtiques i Informàtica Universitat de les Illes Balears

Francesc Planas Departament de Matemàtiques Universitat Politècnica de Catalunya

Núria Fagella Dep. de Matemàtiques i Informàtica Universitat de Barcelona

Joan Saldaña Dep. d’Informàtica, Mat. Aplicada i Estadística Universitat de Girona

Armengol Gasull Departament de Matemàtiques Universitat Autònoma de Barcelona

Marta Sanz-Solé Dep. de Matemàtiques i Informàtica Universitat de Barcelona

Gábor Lugosi ICREA i Departament d’Economia Universitat Pompeu Fabra

Gil Solanes Departament de Matemàtiques Universitat Autònoma de Barcelona

De la teoria de grafs clàssica a l’anàlisi de les grans xarxes ------------

tel. 933 248 583 - fax 932 701 180 scm@iec.cat - https://scm.iec.cat

BUTLLETÍ

Carrer del Carme, 47 - 08001 Barcelona

67

q English summaries --------------------------------------------------------------------------------- 107

Vo l u m 3 8

Societat Catalana de Matemàtiques

33

q Juanjo Rué Volu m 3 8 • Núm er o 1 • A n y 2023

Carme Cascante Dep. de Matemàtiques i Informàtica Universitat de Barcelona

5

Sobre l’equació de Monge-Ampère ------------------------------------------------------

Número 1

Any 2023



BUTLLETÍ DE LA SOCIETAT CATALANA DE MATEMÀTIQUES Institut d’Estudis Catalans

Volum 38 • Número 1 • Juny 2023

BARCELONA 2023


© dels autors dels articles Editat per la Societat Catalana de Matemàtiques filial de l’Institut d’Estudis Catalans Carrer del Carme, 47 08001 Barcelona Text original revisat lingüísticament per la Unitat d’Edició del Servei Editorial de l’IEC Compost per Rosa M. Rodríguez Imprès a Ediciones Gráficas Rey, SL ISSN: 0214-316-X Dipòsit Legal: B 19272-1987

Els continguts del butlletí de la societat catalana de matemàtiques estan subjectes —llevat que s’indiqui el contrari en el text o en el material gràfic— a una llicència Reconeixement - No comercial - Sense obres derivades 3.0 Espanya de Creative Commons, el text complet de la qual es pot consultar a https://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.ca. Així, doncs, s’autoritza el públic en general a reproduir, distribuir i comunicar l’obra sempre que se’n reconegui l’autoria i l’entitat que la publica i no se’n faci un ús comercial ni cap obra derivada.


Butlletí de la Societat Catalana de Matemàtiques Vol. 38, núm. 1, 2023

Índex

Alessio Figalli Sobre l’equació de Monge-Ampère . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Carles Lladó i Josep M. Brunat Les matemàtiques dels setins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Juanjo Rué De la teoria de grafs clàssica a l’anàlisi de les grans xarxes . . . . . . . . . . . . . . . . . . . . . . . 67 English summaries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107



Butlletí de la Societat Catalana de Matemàtiques Vol. 38, núm. 1, 2023. Pàg. 5–31. DOI: 10.2436/20.2002.01.107

Sobre l’equació de Monge-Ampère Alessio Figalli

Resum: L’equació de Monge-Ampère és una equació en derivades parcials no lineal que apareix en molts problemes d’anàlisi i de geometria, com ara l’equació de curvatura de Gauss prescrita, la geometria afí, el transport òptim, etc. Aquesta equació prescriu el producte dels valors propis de la hessiana de u, en contrast amb l’equació el.líptica «model» ∆u = f , que en prescriu la suma. L’objectiu d’aquest text és, en primer lloc, oferir una visió general de la teoria clàssica i, després, analitzar alguns avenços importants recents en aquest fascinant tema. Paraules clau: Monge-Ampère, funcions convexes, regularitat el.líptica. Classificació MSC2020: 35J96, 35J60.

1

Introducció

L’equació de Monge-Ampère és una equació en derivades parcials no lineal que apareix en molts problemes d’anàlisi i de geometria, com ara l’equació de curvatura de Gauss prescrita, la geometria afí, el transport òptim, etc. En la forma clàssica, aquesta equació s’expressa com det D 2 u = f (x, u, ∇u)

en Ω,

(1)

on Ω ⊂ Rn és un conjunt obert, u : Ω → Rn és una funció convexa i f : Ω × R × Rn → R+ és coneguda. Dit d’una altra manera, l’equació de Monge-Ampère Nota editorial: Aquest article forma part del projecte Articles Mirall de l’Institut d’Estudis Catalans, dins el marc del Pla d’Enfortiment de la Llengua Catalana en el Sistema Universitari i de Recerca de Catalunya impulsat pel Departament de Recerca i Universitats de la Generalitat de Catalunya i que promou la publicació en català d’articles actuals d’alt interès científic. L’article original d’Alessio Figalli, titulat «On the Monge-Ampère equation» i publicat a la revista Astérisque (vol. 1148, p. 477–504, doi: 10.24033/ast.1092), de la Société Mathématique de France, ha estat traduït per Òscar Aznar Alemany i revisat posteriorment pels editors. La traducció s’ha fet amb motiu de la concessió del premi Abel al professor Luis Caffarelli, el mes de maig de 2023, a Oslo, en part per les seves aportacions al problema de Monge-Ampère. Hem triat aquesta revisió que va fer el professor Alessio Figalli (Medalla Fields 2018) perquè, malgrat que és d’un nivell més tècnic que el dels articles que publiquem habitualment, ajuda a conèixer aquest problema, les contribucions que s’hi han fet i l’estat actual en què es troba. Volem agrair a Alessio Figalli i a la Société Mathématique de France el permís per a la traducció de l’article al català i la seva publicació al butlletí de la societat catalana de matemàtiques, així com als professors Xavier Cabré i Xavier Ros-Oton la seva col.laboració.


Alessio Figalli

6

prescriu el producte dels valors propis de la hessiana de u, en contrast amb l’equació el.líptica «model» ∆u = f , que en prescriu la suma. Com explicarem més endavant, la convexitat de la solució u és una condició necessària perquè l’equació sigui el.líptica degenerada, i així poder esperar resultats de regularitat. L’objectiu d’aquest text és, en primer lloc, oferir una visió general de la teoria clàssica i, després, analitzar alguns avenços importants recents en aquest fascinant tema.

2

Antecedents històrics

L’equació de Monge-Ampère s’anomena així perquè primer la van formular en dues dimensions els matemàtics francesos Monge [52] i Ampère [9]. Minkowski ([50, 51]) va aconseguir els primers resultats remarcables de l’existència i la regularitat de l’equació de Monge-Ampère. Aproximant un conjunt convex fitat amb poliedres convexos amb les àrees de les cares prescrites, va demostrar l’existència d’una solució feble de «l’equació de curvatura de Gauss prescrita» (que ara s’anomena problema de Minkowski). Més tard, mitjançant poliedres convexos amb curvatures generalitzades als vèrtexs donades, Aleksandrov també va demostrar l’existència d’una solució feble en qualsevol dimensió i que les solucions en dues dimensions eren de classe C 1 [3, 4, 5]. Per a dimensions més altes i basant-se en els seus treballs anteriors, Aleksandrov ([6], i també Bakelman [10] en dues dimensions) va introduir una noció de solució generalitzada de l’equació de Monge-Ampère i va demostrar l’existència i unicitat de les solucions del problema de Dirichlet (vegeu la subsecció 3.2). La noció de solucions febles introduïda per Aleksandrov (conegudes ara com a solucions d’Aleksandrov) encara es fa servir amb freqüència i s’han dedicat molts esforços a demostrar la regularitat de les solucions d’Aleksandrov amb les hipòtesis adequades tant sobre el costat dret de l’equació com sobre les condicions de contorn. La regularitat de les solucions febles en dimensions elevades és un problema molt delicat. Per a n ≥ 3, Pogorelov va trobar una funció convexa a Rn que no és de classe C 2 , però que satisfà l’equació de Monge-Ampère, amb el costat dret de l’equació analític i positiu, a l’entorn de l’origen (vegeu (15) més endavant). Ben aviat va ser evident que el problema principal en la falta de regularitat era la presència d’un segment lineal en la gràfica de u. En efecte, Calabi ([20]) i Pogorelov ([57]) van aconseguir demostrar estimacions interiors a priori de la segona i la tercera derivades per a solucions estrictament convexes o per a solucions sense un segment lineal amb tots dos extrems a la vora. No obstant això, per a fer les computacions necessàries per a deduir aquestes estimacions a priori, calia suposar certa la regularitat C 4 . Per tant, una manera natural de demostrar l’existència de solucions suaus era aproximar el problema de Dirichlet amb problemes més fàcils que ja tenien solucions C 4 , aplicar les estimacions de Pogorelov i Calabi per aconseguir els límits a priori C 2 /C 3 i llavors prendre el límit dels problemes aproximants. Cheng i Yau ([21]) i Lions ([46]) van aplicar aquest argument amb èxit per obtenir la suavitat interior de les solucions.


Sobre l’equació de Monge-Ampère

7

Pel que fa a la regularitat de la vora, gràcies a la teoria de la regularitat desenvolupada per Ivochkina [39], Krylov [44] i Caffarelli, Nirenberg i Spruck [19], es pot utilitzar el mètode de continuïtat i les estimacions d’Evans-Krylov [28, 43] per a obtenir solucions suaus globals del problema de Dirichlet (vegeu la subsecció 3.3). En particular, les solucions d’Aleksandrov són suaus fins a la vora sempre que totes les dades conegudes siguin suaus. En totes les situacions anteriors se suposa que f és positiva i prou suau. Quan f se suposa, només, acotada superiorment i inferiorment per una constant positiva, Caffarelli va demostrar la regularitat C 1,α de les solucions estrictament convexes [14]. A més, quan f és contínua (en concret C 0,α ), usant arguments de pertorbació, Caffarelli va demostrar les estimacions interiors W 2,p per a qualsevol p > 1 (en concret, estimacions interiors C 2,α ) [13]. Com s’explica a la subsecció 3.5, aquests resultats es poden aplicar a obtenir la regularitat tant en el problema de Minkowski com en el problema de transport òptim. Per descomptat, només són algunes de les possibles aplicacions de la teoria de la regularitat per a Monge-Ampère. Per exemple, com es descriu a l’article de revisió [64, seccions 5 i 6], les equacions de Monge-Ampère tenen un paper clau en la geometria afí, com ara en l’estudi de les esferes afins i de les superfícies maximals afins.

3

Teoria clàssica

Aquesta secció inclou una breu visió general d’alguns resultats rellevants de l’equació de Monge-Ampère. Abans de tractar el concepte de les solucions febles i la seva regularitat, primer discutim la convexitat de les solucions i el concepte «el.lipticitat degenerada» associat a aquesta equació. 3.1

L’el.lipticitat degenerada de l’equació de Monge-Ampère

Suposem que u : Ω → R és una solució suau de (1) amb f = f (x) > 0 suau. Un mètode estàndard per a demostrar la regularitat de les solucions d’equacions diferencials parcials no lineals consisteix a diferenciar l’equació de la qual u és solució per a obtenir una equació de segon ordre lineal per a les primeres derivades. Més en concret, fixem una direcció e ∈ Sn−1 i diferenciem (1) en la direcció e. Aleshores, utilitzant la fórmula d dε

det(A + εB) = det(A) tr(A−1 B) ε=0

∀A, B ∈ Rn×n amb A invertible,

obtenim l’equació det(D 2 u)uij ∂ij ue = fe ij

en Ω.

(2)

2

Aquí u denota la matriu inversa de ui,j := (D u)ij , els subíndexs denoten les derivades parcials (per tant, ue := ∂e u), i sumem els índexs repetits. Com que det D 2 u = f > 0, l’equació anterior es pot reescriure així: aij ∂ij ue =

fe f

en Ω,

on aij := uij .

(3)


Alessio Figalli

8

Per tant, per obtenir estimacions de regularitat de ue , voldríem que la matriu aij fos una matriu definida positiva per a aplicar la teoria de la regularitat el.líptica per a equacions lineals. Però, perquè la matriu aij = uij sigui definida positiva, cal que D 2 u sigui definida positiva, que és exactament la condició de convexitat de u.1 També observem que, sense cap límit a priori de D 2 u, la matriu aij podria tenir valors propis arbitràriament petits i per això es diu que (1) és «el.líptica degenerada». Fixem-nos que, si es pot demostrar que c0 Id ≤ D 2 u ≤ C0 Id

dins de Ω

(4)

per a algunes constants positives c0 , C0 > 0, llavors C0−1 Id ≤ (aij )1≤i,j≤n ≤ c0−1 Id i l’equació linealitzada (3) esdevé uniformement el.líptica. Per això, demostrar (4) és un dels passos clau per a la regularitat de les solucions de (1). En relació amb aquest fet, observem que, sota la condició f (x) ≥ λ > 0, el producte dels valors propis de D 2 u (que són positius) és fitat inferiorment. Per tant, si es pot demostrar que |D 2 u| ≤ C, és fàcil arribar a la conclusió que (4) és vàlida (vegeu més detalls a [31, observació 1.1]). En conclusió, el pas clau per a la suavitat de les solucions consisteix a demostrar que D 2 u és acotada. 3.2

Solucions d’Aleksandrov

En l’estudi del problema de Minkowski, Aleksandrov va introduir la noció de solució feble de l’equació de Monge-Ampère que li permetia donar un sentit a la curvatura de Gauss dels conjunts convexos no suaus. Vegem aquest concepte fonamental. Donat un domini convex obert Ω, la subdiferencial d’una funció convexa u : Ω → R ve donada per ∂u(x) := {p ∈ Rn : u(y) ≥ u(x) + p · (y − x) ∀y ∈ Ω}. Llavors es defineix la mesura de Monge-Ampère de u com µu (E) := |∂u(E)|

per a cada conjunt de Borel E ⊂ Ω,

on ∂u(E) :=

[

∂u(x)

x∈E

1 És clar que la teoria seria similar si suposéssim que u fos còncava. La diferència real apareix si la hessiana de u és indefinida, ja que (3) esdevé hiperbòlica (i llavors s’anomena equació de Monge-Ampère hiperbòlica). Aquest problema també és molt interessant, però la teoria per a aquest tipus d’equació és del tot diferent de la de l’equació de Monge-Ampère clàssica i queda fora de l’abast d’aquest article.


Sobre l’equació de Monge-Ampère

9

i | · | denota la mesura de Lebesgue. Es pot demostrar que µu és una mesura de Borel (vegeu [31, teorema 2.3]). Cal destacar que, si u ∈ C 2 (Ω), la fórmula del canvi de variable dona lloc a Z |∂u(E)| = |∇u(E)| = det D 2 u(x) dx per a tot conjunt de Borel E ⊂ Ω, E

i, per tant, µu = det D 2 u(x) dx (vegeu [31, exemple 2.2]). Aquest argument genera la definició següent: Definició 3.1 (Solucions d’Aleksandrov). Donat un conjunt obert i convex Ω i una funció f : Ω×R×Rn → R+ , una funció convexa u : Ω → R s’anomena solució d’Aleksandrov de l’equació de Monge-Ampère det D 2 u = f (x, u, ∇u)

en Ω

si µu = f (x, u, ∇u) dx com a mesures de Borel, és a dir, Z µu (A) = f (x, u, ∇u) dx ∀A ⊂ Ω Borel. A

Fixem-nos que, com que les funcions convexes són localment Lipschitz, són diferenciables gairebé pertot. Per tant, f (x, u, ∇u) és definida gairebé pertot i la definició anterior té sentit. Per a simplificar la presentació, discutirem només el cas f = f (x), però tots els arguments es poden estendre al cas f = f (x, u, ∇u) amb la condició que ∂u f ≥ 0 (fet necessari per a assegurar que el principi del màxim sigui vàlid; vegeu [35, capítol 17]). De fet, inclús quan interessa resoldre l’equació de Monge-Ampère amb el costat dret suau, per a demostrar l’existència de solucions és útil tenir en compte també les mesures de Borel com a costat dret de l’equació. Per tant, donada una mesura de Borel no negativa ν dins de Ω, podem dir que u és una solució d’Aleksandrov de det D 2 u = ν si µu = ν. Una propietat fonamental de la mesura de Monge-Ampère és que és estable en condicions de convergència uniforme (vegeu [31, proposició 2.6]): Proposició 3.2. Sigui uk : Ω → R una successió de funcions convexes que convergeixen uniformement i localment a u. Aleshores les mesures de MongeAmpère associades µuk convergeixen feblement∗ a µu , és a dir, Z Z ϕ dµuk → ϕ dµu ∀ϕ ∈ Cc (Ω). Ω

Una altra propietat crucial d’aquesta definició és la validesa del principi de comparació (vegeu [31, teorema 2.10]):


10

Alessio Figalli

Proposició 3.3. Suposem que U ⊂ Ω és un conjunt obert i fitat i que u, v : Ω → R són dues funcions convexes que satisfan ( µu ≤ µv en U, u≥v

sobre ∂U.

Aleshores, u≥v

en U.

Una conseqüència directa d’aquest resultat és la unicitat i l’estabilitat de les solucions (vegeu [31, corol.laris 2.11 i 2.12]): Corol.lari 3.4. Sigui Ω un conjunt obert i fitat i sigui νk : Ω → R una família de mesures de Borel no negatives que satisfan supk νk (Ω) < ∞. Aleshores, per a qualsevol k existeix com a molt una funció convexa uk : Ω → R que soluciona el problema de Dirichlet ( µuk = νk en Ω, uk = 0

sobre ∂Ω.

A més a més, si νk *∗ ν∞ i les solucions uk existeixen, llavors uk → u∞ localment de manera uniforme, on u∞ és l’única solució de ( µu∞ = ν∞ en Ω, u∞ = 0

sobre ∂Ω.

Finalment, aprofitant aquests resultats, es pot demostrar l’existència de solucions (vegeu [31, teorema 2.13]): Teorema 3.5. Sigui Ω un conjunt obert, convex i fitat i sigui ν una mesura de Borel no negativa amb ν(Ω) < ∞. Aleshores existeix una única funció convexa u : Ω → R que soluciona el problema de Dirichlet ( µu = ν en Ω, (5) u=0 sobre ∂Ω. Idea de la demostració. Com que la unicitat és conseqüència del corol.lari 3.4, només cal demostrar-ne l’existència. Gràcies a l’estabilitat del corol.lari 3.4, com que qualsevol mesura finita pot ser aproximada en la topologia feble* per una suma discreta de de Pdeltes N Dirac, només cal resoldre el problema de Dirichlet (5) quan ν = i=1 αi δxi amb xi ∈ Ω i αi > 0. Per a demostrar l’existència d’una solució s’utilitza l’anomenat mètode de Perron: es defineix S[ν] := {v : Ω → R convexa : v ∂Ω = 0, µv ≥ ν en Ω}, i es demostra que aquest conjunt no és buit i que és tancat en prendre màxims (és a dir, v1 , v2 ∈ S[ν] ⇒ max{v1 , v2 } ∈ S[ν]). Gràcies a aquestes propietats,


Sobre l’equació de Monge-Ampère

11

s’obté que u := supv∈S[ν] v encara és un element de S[ν] i aleshores aprofita la maximalitat de u per a deduir que µu = ν. Vegeu [31, demostració del teorema 2.13] per a més detalls. 2 De fet, si Ω és estrictament convex, un argument similar combinat amb l’existència de barreres adequades permet demostrar l’existència de solucions per a qualsevol condició de contorn contínua (vegeu, per exemple, [31, teorema 2.14]): Teorema 3.6. Sigui Ω un conjunt obert, estrictament convex i fitat, sigui ν una mesura de Borel no negativa amb ν(Ω) < ∞ i sigui g : ∂Ω → R una funció contínua. Aleshores existeix una única funció convexa u : Ω → R que soluciona el problema de Dirichlet ( µu = ν en Ω, (6) u=g sobre ∂Ω. 3.3

Existència de solucions suaus i regularitat global

Com s’ha vist a la secció anterior, la unicitat de les solucions del problema de Dirichlet és vàlida fins i tot al nivell de les solucions febles. Per tant, la qüestió principal és l’existència. L’existència de solucions suaus de l’equació de Monge-Ampère es remunta als treballs de Pogorelov [57]. S’obté mitjançant el popular mètode de continuïtat que ara descrivim breument (vegeu [35, capítol 17] i [31, secció 3.1] per a una explicació més detallada). Suposem que Ω és un domini uniformement convex suau,2 i considerem una funció ū : Ω → R uniformement convexa suau que s’anul.la sobre ∂Ω. Llavors, si definim f¯ := det D 2 ū, tenim que f¯ > 0 en Ω i ū és solució de ( det D 2 ū = f¯ en Ω, ū = 0 Suposem ara que volem resoldre ( det D 2 u = f u=0

sobre ∂Ω.

en Ω, sobre ∂Ω,

(7)

per a una f : Ω → R donada amb f > 0. Definim {ft := (1 − t)f¯ + t f }t∈[0,1] , i considerem la família 1-paramètrica de problemes ( det D 2 ut = ft en Ω, (8) ut = 0 sobre ∂Ω. 2 Diem que un domini és uniformement convex si existeix un radi R tal que Ω ⊂ BR (x0 + Rνx0 )

per a tot x0 ∈ ∂Ω,

on νx0 és la normal interior de Ω en x0 . Observem que, per a un domini suau, això equival a demanar que la segona forma fonamental de ∂Ω sigui definida positiva uniformement.


Alessio Figalli

12

El mètode de continuïtat consisteix a demostrar que el conjunt de t ∈ [0, 1] tal que (8) és resoluble de manera suau és obert i tancat alhora. Com que el problema té solució per a t = 0 (perquè ū n’és una solució), ha d’existir una solució suau de (7). Més precisament, suposant que Ω és un domini uniformement convex de classe C 2,α per a alguna α ∈ (0, 1), se’n desprèn que la funció f¯ = det D 2 ū pertany a C 0,α (Ω). Per tant, suposant que f ∈ C 0,α (Ω), podem considerar un conjunt de funcions C := {v : Ω → R funcions convexes de classe C 2,α (Ω), v = 0 sobre ∂Ω}, i definir l’aplicació no lineal F : C × [0, 1] → C 0,α (Ω) (v, t) , det D 2 v − ft . L’objectiu és demostrar que el conjunt T := {t ∈ [0, 1] : existeix una ut ∈ C tal que F (ut , t) = 0} no és buit i que és obert i tancat alhora en [0, 1]. Ara explicarem els passos principals d’aquest argument. • Es deriva que no és buit del fet que F (ū, 0) = 0; per tant, 0 ∈ T . • Es deriva que és obert del teorema de la funció implícita en espais de Banach (vegeu [35, teorema 17.6]). En efecte, la diferencial de Fréchet de F respecte a v ve donada per l’operador de Monge-Ampère linealitzat (compareu-ho amb (2)) Du F (v, t)[h] = det(D 2 u)uij hij ,

h = 0 sobre ∂Ω,

(9)

on definim hij := ∂ij h, uij com la inversa de uij := ∂ij u i sumem els índexs repetits. Fixeu-vos que, si una funció v està acotada a C 2,α i det D 2 v està acotada inferiorment, aleshores el valor propi més petit de D 2 v està fitat inferiorment per una constant positiva i l’operador linealitzat esdevé el.líptic uniforme amb coeficients C 0,α (compareu-ho amb la subsecció 3.1). Per tant, la teoria clàssica de Schauder assegura la invertibilitat de Du F (ut , t) sempre que ut sigui solució F (ut , t) = 0 (vegeu, per exemple, [35, capítol 6]). • Es demostra que és tancat mitjançant estimacions a priori globals. En concret, el següent límit a priori fonamental és vàlid (vegeu [31, teorema 3.2]):3 Teorema 3.7. Sigui Ω un domini uniformement convex de classe C 3 i sigui u ∈ C 4 (Ω) una solució de (7) amb f ∈ C 2 (Ω) i 0 < λ ≤ f ≤ 1/λ. Aleshores existeix una constant C que depèn només de Ω, λ, ||f ||C 2 (Ω) tal que ||D 2 u||C 0 (Ω) ≤ C. 3 La condició que u ∈ C 4 (Ω) del teorema 3.7 no és essencial, ja que només és necessària per a justificar els càlculs de la demostració.


Sobre l’equació de Monge-Ampère

13

Com s’ha vist a la subsecció 3.1, quan se satisfà una fita uniforme de D 2 u dins de Ω, l’equació de Monge-Ampère esdevé uniformement el.líptica i la teoria de la regularitat el.líptica clàssica proporciona estimacions C 2,α per a solucions de F (ut , t) = 0, fet que demostra que T és tancat, tal com es volia provar. Gràcies a aquest argument es pot confirmar la validesa del següent resultat d’existència: Teorema 3.8. Sigui Ω un domini uniformement convex de classe C 3 . Aleshores, per a qualsevol f ∈ C 2 (Ω) amb 0 < λ ≤ f ≤ 1/λ, existeix una única solució u ∈ C 2,α (Ω) de (7). Tenint en compte que la unicitat és vàlida també al nivell de les solucions d’Aleksandrov, això demostra la regularitat C 2,α (per a qualsevol α < 1) de les solucions d’Aleksandrov en dominis uniformement convexos C 3 amb un costat dret de l’equació de classe C 2 . És interessant destacar que la condició de regularitat C 3 a la vora és necessària, tal com demostra Wang a [67]. 3.4

Teoria de la regularitat de Caffarelli

Estudiem ara la regularitat de les solucions d’Aleksandrov amb condicions de suavitat més febles en el costat dret de l’equació. Als anys noranta Caffarelli va desenvolupar una teoria de la regularitat per a solucions d’Aleksandrov que demostrava que les solucions estrictament convexes de (1) són C 1,γ localment sempre que λ ≤ f ≤ 1/λ per a alguna λ > 0 [12, 14, 15]. Destaquem que, per a solucions febles, la convexitat estricta no va implícita amb la positivitat de f (excepte per a n = 2) i és, de fet, necessària per a la regularitat. Vegeu la subsecció 4.1 més endavant. El resultat següent es demostra a [14]: Teorema 3.9. Sigui u : Ω → R una solució d’Aleksandrov estrictament convexa 1,γ de µu = f dx amb 0 < λ ≤ f ≤ 1/λ. Aleshores, u ∈ Cloc (Ω) per a alguna γ = γ(n, λ) > 0. Per explicar la idea de la demostració d’aquest teorema, fixem-nos en aquesta propietat simple de les solucions de l’equació de Monge-Ampère (que és una altra manifestació de la seva el.lipticitat degenerada): si A : Rn → Rn és una transformació afí amb det A = 1,4 i u és una solució de l’equació de MongeAmpère amb f al costat dret, aleshores u ◦ A és una solució de l’equació de Monge-Ampère amb f ◦ A al costat dret. Aquesta invariància afí crea obstruccions importants per a obtenir una teoria de la regularitat local. En efecte, per exemple, les funcions uε (x1 , x2 ) =

ε x12 x2 + 2 +1 2 2ε

són solucions de det D 2 uε = 1 dins del conjunt convex {uε < 0}. Per tant, tret que el conjunt de nivell {uε = 0} sigui prou «rodó», no hi ha cap esperança 4 Donada una transformació afí Ax := Mx + v, per abús de notació escrivim det A en comptes de det M.


Alessio Figalli

14

d’aconseguir estimacions a priori de u. La intuïció de Caffarelli el va portar a utilitzar l’anomenat lema de John [42]: Lema 3.10. Sigui K ⊂ Rn un conjunt convex, fitat i amb interior no buit. Aleshores existeix un el.lipsoide E que satisfà E ⊂ K ⊂ nE,

(10)

on nE denota la dilatació de E per un factor n respecte al seu centre. Diem que un conjunt convex K és normalitzat si B1 ⊂ K ⊂ nB1 . Llavors el lema 3.10 afirma que per a cada conjunt obert, convex i fitat K existeix una transformació afí A : Rn → Rn tal que A(K) és normalitzada. Fixem-nos que, si u és estrictament convexa, donat un punt x ∈ Ω i p ∈ ∂u(x), es pot escollir t > 0 prou petita tal que el conjunt convex S(x, p, t) := {z ∈ Ω : u(z) − u(x) − p · (z − x) < t}

(11)

està contingut estrictament dins de Ω, és a dir, S(x, p, t) ⊂ Ω. Llavors, si substituïm u(z) per ux (z) := u(z) − u(x) − p · (z − x) − t, tenim que λ dx ≤ µux ≤

1 dx λ

en S(x, p, t),

ux = 0

sobre ∂(S(x, p, t)).

A més, si A : Rn → Rn normalitza S(x, p, t), aleshores v := (det A)2/n ux ◦ A−1 és solució de λ dx ≤ µ −v ≤

1 dx λ

en A(S(x, p, t)),

v =0

sobre ∂(A(S(x, p, t))). (12)

Gràcies a aquest raonament, n’hi ha prou de demostrar el resultat quan u és una solució dins d’un conjunt convex normalitzat. Dit d’una altra manera, el teorema 3.9 és una conseqüència directa del resultat següent: Teorema 3.11. Sigui Ω un conjunt convex normalitzat i u una solució de µu = f dx

en Ω,

u=0

sobre ∂Ω,

amb 0 < λ ≤ f ≤ 1/λ. Aleshores, u és estrictament convexa dins de Ω i u ∈ 1,γ Cloc (Ω), per a alguna γ = γ(n, λ) > 0. Un pas clau en la demostració d’aquest teorema és demostrar que les solucions de (7) en dominis normalitzats tenen un mòdul universal de convexitat estricta. Un ingredient fonamental per a demostrar-ho és l’important resultat següent de Caffarelli [12] (vegeu també [31, teorema 4.10]):


Sobre l’equació de Monge-Ampère

15

Proposició 3.12. Sigui u una solució de λ dx ≤ µu ≤

1 dx λ

dins d’un conjunt convex Ω, x ∈ Ω i p ∈ ∂u(x). Suposem que `(z) := u(x) + p · (z − x). Si el conjunt convex W := {z ∈ Ω : u(z) = `(z)} conté més d’un punt, aleshores no pot tenir punts extremals dins de Ω. Aquest enunciat afirma que, si una solució coincideix amb un dels seus plans de suport en més d’un punt (és a dir, no és estrictament convexa), llavors el conjunt de contacte ha de creuar el domini. En particular, això no és possible si u ∂Ω = 0 (perquè llavors es deduiria que u ≡ 0 per la convexitat de u), fet que demostra que les solucions de (12) són estrictament convexes. Idea de la demostració del teorema 3.11. Com s’ha vist, la proposició 3.12 implica que u és estrictament convexa. A més, per compacticitat es pot demostrar que el mòdul de convexitat estricta de u és universal (vegeu [31, secció 4.2.2]). Apliquem, doncs, aquesta informació a totes les escales. Més precisament, donat qualsevol punt x ∈ Ω, p ∈ ∂u(x) i t > 0 petit, considerem ux (z) := u(z) − u(x) − p · (z − x) − t. Aleshores, si A : Rn → Rn normalitza S(x, p, t), la funció v := (det A)2/n ux ◦ A−1 té les mateixes propietats de convexitat estricta que u. Utilitzant aquest fet en tots els punts x i per a tot valor de t petit, un argument d’iteració curós demostra la validesa del teorema 3.11 (vegeu la demostració de [31, teorema 4.20] per a més detalls). 2 Observem que el teorema 3.8 és insatisfactori des del punt de vista de les equacions en derivades parcials: en efecte, requereix la regularitat C 2 de f per a demostrar la regularitat C 2,α de la solució, mentre que la teoria de la regularitat el.líptica suggereix que f ∈ C 0,α hauria de ser suficient. Això és cert, com va demostrar Caffarelli a [13] (de nou, només cal considerar conjunts convexos normalitzats): Teorema 3.13. Sigui Ω un conjunt convex normalitzat i sigui u una solució de µu = f dx 0,α

en Ω,

u=0

sobre ∂Ω, 2,α

amb 0 < λ ≤ f ≤ 1/λ i f ∈ Cloc (Ω). Aleshores, u ∈ Cloc (Ω). La demostració d’aquest teorema es basa en la propietat que, sota la hipòtesi que f és quasi constant (per exemple, molt propera a 1), u és molt propera a una solució de µv = dx. Com que aquesta última funció és suau (segons el teorema 3.8), un argument d’iteració permet demostrar que la norma C 2,α de u es manté acotada (vegeu també [31, teorema 4.42]). Seguint aquesta línia de raonament també es pot demostrar el teorema següent ([13]):


Alessio Figalli

16

Teorema 3.14. Sigui Ω un conjunt convex normalitzat i sigui u una solució de µu = f dx

u=0

en Ω,

sobre ∂Ω.

Aleshores, per a cada p > 1 existeix una constant positiva δ(p) tal que, si 2,p ||f − 1||∞ ≤ δ(p), llavors u ∈ Wloc (Ω). Com que qualsevol funció contínua és arbitràriament propera a una constant a escales petites, s’obté el següent: Corol.lari 3.15. Sigui Ω un conjunt convex normalitzat i sigui u una solució de µu = f dx

u=0

en Ω,

sobre ∂Ω,

2,p

amb f > 0 contínua. Aleshores u ∈ Wloc (Ω) per a qualsevol p < 1. Observació 3.16. Com s’observa a [30], aplicant les idees introduïdes a [24, 26], es pot trobar una estimació explícita per a δ(p) en funció de p en el teorema 3.14, més concretament, δ(p) ' e−Cp per a alguna constant dimensional C > 0. 3.5

Algunes aplicacions

Tot seguit descrivim breument dues aplicacions de la teoria de la regularitat desenvolupada abans. 3.5.1 El problema de Minkowski Un problema clàssic en geometria convexa és prescriure una quantitat geomètrica (l’àrea superficial, la curvatura de Gauss, etc.) i trobar condicions necessàries i suficients que assegurin que tal quantitat ve d’un domini convex. En aquest apartat analitzem breument el problema de la «curvatura de Gauss prescrita». Suposem que K ⊂ Rn és un domini obert, convex i fitat que conté l’origen i parametritzem ∂K en coordenades polars així: ∂K = {ρ(x)x : x ∈ Sn−1 , ρ : Sn−1 → R+ }. Llavors, associem a qualsevol punt z ∈ ∂K l’aplicació normal NK (z) := {y ∈ Sn−1 : K ⊂ {y : hy, w − zi ≤ 0}}. Geomètricament, l’aplicació normal troba les normals de tots els hiperplans de suport a z i es pot pensar en NK com un anàleg de l’aplicació subdiferencial. Per acabar, considerem l’aplicació de Gauss (multivaluada) GK : Sn−1 → Sn−1 definida per GK (x) := NK (ρ(x)x), i definim la mesura de curvatura de Gauss µK (E) := H n−1 (GK (E)) ∀E ⊂ Sn−1 Borel, on H n−1 denota la mesura de Hausdorff de dimensió (n − 1) a Sn−1 .


Sobre l’equació de Monge-Ampère

17

Pel que fa a la mesura de Monge-Ampère, es pot demostrar que µK és una mesura de Borel. Llavors ens fem la pregunta següent: Donada una mesura de Borel ν a Sn−1 , podem trobar un conjunt obert, convex i fitat K que contingui l’origen i tal que µK = ν? A [2, 3], Aleksandrov va trobar les condicions necessàries i suficients per a assegurar l’existència d’una solució d’aquest problema. Pel que fa a l’existència de les solucions d’Aleksandrov de l’equació de Monge-Ampère, l’existència de K es demostra primer quan ν és una suma discreta de deltes de Dirac i llavors s’obté el cas general per aproximació. La demostració original d’existència d’Aleksandrov quan ν és discreta es basa en un argument topològic que es fonamenta en el teorema d’invariància del domini [2] (vegeu també [5]). Gràcies a la teoria de la regularitat desenvolupada per Caffarelli, s’obté el resultat de regularitat següent: Teorema 3.17. Sigui K ⊂ Rn un domini obert, convex i fitat que conté l’origen, i suposem que µK = f dH n−1 per a alguna f : Sn−1 → R, amb 0 < λ ≤ f ≤ 1/λ. Aleshores ∂K és estrictament convexa i de classe C 1,γ . Si, a més, f ∈ C 0,α per a alguna α ∈ (0, 1), aleshores ∂K ∈ C 2,α . Idea de la demostració. Com que K és convex, es pot parametritzar localment la vora com la gràfica d’una funció convexa u : Ω ⊂ Rn−1 → R. És un fet clàssic que la curvatura de Gauss de la gràfica d’una funció v : Ω ⊂ Rn−1 → R de classe C 2 ve donada per det D 2 v n+1

(1 + |∇v|2 ) 2

.

Llavors, suposant que µK = f dH n−1 , un argument d’aproximació basat en la proposició 3.2 resulta en la validesa de l’equació n+1

µu = f (x)(1 + |∇u|2 ) 2 dx, on ∇u existeix en quasi tots els punts, ja que u és localment Lipschitz (perquè és convexa). En particular, µu és fitada localment. Si s’apliquen la proposició 3.12 i el teorema 3.9, es dedueix que ∂K és estrictament convexa i de classe C 1,γ . Per acabar, la regularitat C 2,α quan f ∈ C 0,α es deriva del teorema 3.13. 2 Observació 3.18. La teoria de la regularitat per a Monge-Ampère té un paper crucial en moltes altres variants del problema de Minkowski. Per exemple, apareix en la demostració de l’existència i la unicitat de dominis convexos amb mesures harmòniques prescrites [40]. 3.5.2 El problema del transport òptim Suposem que µ i ν denoten dues mesures de probabilitat en Rn . El problema del transport òptim (amb cost quadràtic) consisteix a trobar la manera «òptima» de transportar µ a ν tenint


Alessio Figalli

18

en compte que el cost de transportar un punt des de x fins a y és |x − y|2 . Per tant, de manera natural, això porta a minimitzar Z |S(x) − x|2 dµ(x) Rn

sobre totes les aplicacions S que «transporten µ a ν». En termes matemàtics, això es correspon a dir que S# µ = ν, és a dir, per a cada funció de Borel fitada ϕ : Rn → R, Z Z ϕ(y) dν(y) = ϕ(S(x)) dµ(x). Rn

Rn

Segons un teorema clàssic de Brenier [11] (vegeu també [22, 49, 58]), l’existència i la unicitat d’aplicacions òptimes és vàlida sempre que µ sigui absolutament contínua. A més, aquesta aplicació ve donada pel gradient d’una funció convexa. Això es resumeix en el teorema següent: Teorema 3.19. Siguin µ, ν mesures de probabilitat en Rn amb µ = f dx i ν = g dy. Aleshores: • Existeix una aplicació de transport òptim única T que és µ-quasi pertot (µ-q. p.) • Existeix una funció convexa semicontínua inferior u : Rn → R ∪ {+∞} tal que T = ∇u que és µ-q. p. i det(D 2 u) =

f g ◦ ∇u

µ-q. p.

Aquest teorema demostra que les aplicacions de transport òptim solucionen una equació de Monge-Ampère en un sentit feble, que generalment s’anomena sentit de Brenier. Mentre que per a les solucions d’Aleksandrov es pot aplicar la teoria de la regularitat desenvolupada en les seccions anteriors, Caffarelli va observar a [15] que fins i tot per a densitats suaus no es pot esperar cap resultat de regularitat general per a les solucions de Brenier sense algunes condicions geomètriques sobre el suport de la mesura objectiu. En efecte, suposem que n = 2 i que X = B1 és la bola unitat centrada a l’origen i que Y = (B1+ + e1 ) ∪ (B1− − e1 ) és la unió de dues semiboles, on B1+ := (B1 ∩ {x1 > 0}),

B1− := (B1 ∩ {x1 < 0}),

1 i (e1 , e2 ) denota la base canònica de R2 . Aleshores, si f = |X| 1X i g = |Y1 | 1Y , l’aplicació de transport òptim ve donada per ( x + e1 si x1 > 0, T (x) := x − e1 si x1 < 0,

que es correspon al gradient de la funció convexa u(x) = |x|2 /2 + |x1 |.


Sobre l’equació de Monge-Ampère

19

Per tant, si es busca un resultat de regularitat de u, com a mínim hem de suposar que Y és connex. No obstant això, partint de la construcció anterior i considerant una seqüència de dominis Yε als quals s’afegeix una tira petita d’amplada ε > 0 per a unir (B1+ + e1 ) ∪ (B1− − e1 ), també es pot demostrar que, per a ε > 0 prou petita, l’aplicació òptima encara serà discontínua (vegeu [15, 29]). Per tant, la connectivitat no és suficient per a assegurar la regularitat. Com va demostrar Caffarelli [15, 17], la convexitat de Y és la condició correcta per a assegurar que una solució de Brenier és també una solució d’Aleksandrov i que, llavors, la teoria de la regularitat general de les seccions anteriors és aplicable (vegeu també [27, 65]): Teorema 3.20. Suposem que X, Y ⊂ Rn són dos conjunts oberts i fitats i que f , g : Rn → R són dues densitats de probabilitat que són zero fora de X, Y i estan fitades superiorment i inferiorment per una constant positiva en X, Y , respectivament. Denotem amb T = ∇u : X → Y l’aplicació de transport òptim obtinguda del teorema 3.19, i suposem que Y és convex. Aleshores existeix una 0,γ γ > 0 tal que T ∈ Cloc (X). A més, si f ∈ C k,α (X̄) i g ∈ C k,α (Ȳ ) per a algun enter k ≥ 0 i algun α ∈ (0, 1), i si tant X com Y són suaus i uniformement convexos, aleshores T : X → Y és un difeomorfisme global de classe C k+1,α . Com es mostra, per exemple, a [34], la convexitat de l’objectiu és necessària per a la continuïtat de l’aplicació de transport òptim. I encara pitjor, com s’ha vist recentment a [41], fins i tot amb densitats constants es pot construir una aplicació de transport òptim discontínua des d’un domini convex suau fins a una petita deformació Lipschitz del mateix domini. De manera natural, tot això motiva la pregunta següent: Què es pot dir quan s’elimina la condició de convexitat de l’objectiu? Com s’explica a [25, 33] (vegeu també [29] per a una descripció més precisa del conjunt singular en dues dimensions i [36] per a una demostració variacional recent del resultat de [33]), sempre es pot demostrar que l’aplicació de transport òptim és suau fora d’un conjunt tancat de mesura zero.

4

Desenvolupaments recents I: regularitat interior

A [66] Wang va mostrar que, per a qualsevol p > 1, existeix una funció f que 2,p satisfà 0 < λ(p) ≤ f ≤ 1/λ(p) tal que u 6∈ Wloc . Aquest contraexemple constata que els resultats de Caffarelli són més o menys òptims. Ara bé, una pregunta important que quedava sense resoldre era si les solucions estrictament con2,1 vexes de µu = f dx amb 0 < λ ≤ f ≤ 1/λ podrien ser com a mínim Wloc , o 2,1+ε 2,1 fins i tot Wloc per a algun ε = ε(n, λ) > 0. El tema de la regularitat Wloc ha estat resolt fa poc per De Philippis i Figalli a [24]. Seguint les idees que s’hi 2,1+ε introdueixen, el resultat s’ha redefinit com a u ∈ Wloc per a algun ε > 0 (vegeu [26, 63]). Teorema 4.1. Sigui Ω un conjunt convex normalitzat i u una solució de µu = f dx

en Ω,

u=0

sobre ∂Ω, 2,1+ε

amb 0 < λ ≤ f ≤ 1/λ. Aleshores existeix ε = ε(n, λ) > 0 tal que u ∈ Wloc

(Ω).


20

Alessio Figalli

De nou, com a la subsecció 3.4, el resultat anterior és vàlid per a solucions estrictament convexes de µu = f dx amb 0 < λ ≤ f ≤ 1/λ. Idea de la demostració. Donat x ∈ Ω i t > 0 petit, considerem la família {S(x, ∇u(x), t)}x∈Ω,t>0 definida a (11). Prenent St (x) := S(x, ∇u(x), t) com la «bola centrada de radi t centrada a x», qualsevol subdomini Ω0 ⊂⊂ Ω dotat d’aquesta família de «boles» és un espai de tipus homogeni en el sentit de Coifman i Weiss; vegeu [1, 18, 37]. En particular, el teorema de Stein implica que, si Z M(D 2 u)(x) := sup −

S(x,∇u(x),t)

t>0

|D 2 u| ∈ L1loc (Ω),

R aleshores |D 2 u| ∈ L log Lloc , és a dir, Ω0 |D 2 u| log(2 + |D 2 u|) ≤ C(Ω0 ) per a qualsevol Ω0 ⊂⊂ Ω. L’estimació clau de [24] consisteix a demostrar que ||M(D 2 u)||L1 (Ω) ≤ C ||D 2 u||L1 (Ω) , loc

loc

per a alguna constant C = C(n, λ). Un cop demostrada aquesta estimació, es deriva de la convexitat de u que la norma L1loc de D 2 u és fitada localment (vegeu [31, equació (4.74)]), i, per tant,5 |D 2 u| log(2 + |D 2 u|) ∈ L1loc (Ω).

(13)

Segons aquesta estimació a priori i un argument d’aproximació amb solucions suaus, com es veu a [24], és fàcil deduir que D 2 u és una funció L1 i 2,1 aleshores u ∈ Wloc . 2,1+ε Tot seguit expliquem com, de fet, aquest argument implica que u ∈ Wloc . 2 Tenint en compte (13), la mesura del conjunt en què |D u| és gran disminueix de manera quantitativa: Z 1 C |{|D 2 u| ≥ M}| ≤ , |D 2 u| log(2 + |D 2 u|) ≤ 2 M log M |{|D u|≥M}| M log M per a qualsevol M gran. En particular, si s’escull primer un M prou gran i després una ε > 0 prou petita, deduïm (una versió localitzada de) la fita |{|D 2 u| ≥ M}| ≤

1 M 1+2ε

|{|D 2 u| ≥ 1}|.

Si s’aplica aquesta estimació a totes les escales (compareu amb la idea de la demostració del teorema 3.11) conjuntament amb un lema de recobriment, s’obté 1 |{|D 2 u| ≥ M k }| ≤ (1+2ε)k |{|D 2 u| ≥ 1}| ∀k ≥ 1, M i se’n deriva la integrabilitat L1+ε local de |D 2 u| (vegeu, per exemple, [31, apartat 4.8.4] per a més detalls). 2 5 Aquí, la frase «Com que u és convexa, la norma L1loc de D 2 u és fitada localment» pot ser 2,1

confusa. En efecte, sembla que s’afirmi que la regularitat Wloc de u és trivial perquè la integral 2 de |D 2 u| és finita R localment. No és el cas, perquè, per a una funció convexa, D u pot ser una mesura i llavors E |D 2 u| denota la integral de la mesura |D 2 u| sobre el conjunt E. Per tant, per R 2,1 a demostrar que u ∈ Wloc , no és suficient demostrar que |D 2 u| és finita localment, sinó que cal demostrar que |D 2 u| és absolutament contínua respecte a la mesura de Lebesgue.


Sobre l’equació de Monge-Ampère

21

4.0.1 Una aplicació: les equacions semigeostròfiques Les equacions semigeostròfiques són un model simple utilitzat en meteorologia per a descriure fluxos atmosfèrics a gran escala i es pot derivar de les equacions d’Euler 3D, amb l’aproximació de Boussinesq i la hidroestàtica, subjectes a una força de Coriolis forta [23]. Com que per a fluxos atmosfèrics a gran escala la força de Coriolis domina el terme d’advecció, el flux és principalment bidimensional. Per això, l’estudi de les equacions semigeostròfiques en 2D i 3D és molt similar i, per simplificar l’exposició, ens centrarem en el cas periòdic bidimensional. El sistema semigeostròfic es pot escriure així:  ⊥   ∂t ∇pt + (ut · ∇)∇pt + ∇ pt + ut = 0, ∇ · ut = 0,   p = p̄,

(14)

0

on ut : R2 → R2 i pt : R2 → R són funcions periòdiques que es corresponen amb la velocitat i la pressió, respectivament, i ∇⊥ pt és la rotació antihorària d’angle π /2 de ∇p. Com es mostra a [23], les consideracions energètiques demostren que és natural suposar que pt és (−1)-convex, és a dir, la funció Pt (x) := pt (x) + |x|2 /2 és convexa a R2 . Sigui Pt∗ la conjugada convexa de Pt , és a dir, Pt∗ (y) := sup {y · x − Pt (x)}. x∈R2

Aleshores, suposant que 0 < λ ≤ det(D 2 P0∗ ) ≤ 1/λ, es pot demostrar que 0 < λ ≤ det(D 2 Pt∗ ) ≤ 1/λ

∀t > 0

en el sentit d’Aleksandrov (vegeu [7] per a més detalls). A causa del teore2,1+ε ma 4.1, això implica que Pt∗ ∈ Wloc , que és un dels ingredients clau per a demostrar l’existència global de solucions distribucionals de (14) en el tor bidimensional [7] i en dominis tridimensionals [8]. Observació 4.2. Des d’un punt de vista físic, la fita inferior de det(D 2 P0∗ ) no és natural i seria molt útil si la regularitat W 2,1 de les solucions de µu ≤ λ1 dx fos certa, com a mínim en dues dimensions. Malauradament, és falsa, com mostra Mooney a [55]. D’altra banda, es podria voler demostrar l’existència global de solucions suaus de (14) quan el conjunt de dades inicials és suau. Tenint en compte el resultat anàleg per a l’equació d’Euler incompressible bidimensional, una possible estratègia per a demostrar aquest resultat seria demostrar que les solucions estrictament convexes de µu = f dx amb f ∈ C 0,α tals que 0 < λ ≤ f ≤ 1/λ satisfan ||D 2 u||C 0,α ≤ C(n, λ, α)||f ||C 0,α (és a dir, el control és lineal respecte a la norma de f ). Com es veu a [32], això és fals i l’existència global de les solucions suaus és un problema encara obert.


Alessio Figalli

22

4.1

Sobre la convexitat estricta de les solucions febles

Com s’ha mencionat, la convexitat estricta no és només una condició tècnica, sinó que és necessària per a aconseguir la regularitat. En efecte, com va descobrir Pogorelov, existeixen solucions d’Aleksandrov de l’equació de MongeAmpère amb costats drets positius suaus que no són C 2 . Per exemple, la funció u(x1 , x 0 ) := |x 0 |2−2/n (1 + x12 ),

(x1 , x 0 ) ∈ R × Rn−1 ,

n ≥ 3,

(15)

és C 1,1−2/n i és solució de det D 2 u = cn (1 + x12 )n−2 (1 − x12 ) > 0 dins de B1/2 . A més, la fita 0 < λ ≤ det D 2 u ≤ 1/λ no és suficient per a la regularitat C 1 : la funció u(x1 , x 0 ) := |x 0 | + |x 0 |n/2 (1 + x12 ),

(x1 , x 0 ) ∈ Rn ,

n ≥ 3,

només és Lipschitz i compleix 0 < λ ≤ det D 2 u ≤ 1/λ en una petita regió convexa en un entorn de l’origen.6 Aleksandrov va mostrar a [4] que, a diferència del que veiem en els contraexemples anteriors, totes les solucions bidimensionals de µu ≥ λ dx > 0 són estrictament convexes. A [16], Caffarelli va generalitzar aquests exemples a solucions que degeneren al llarg dels subespais, i va demostrar que les solucions es poden degenerar només en subespais de dimensions inferiors a n/2. Com que no es pot esperar regularitat C 1 per a solucions no estrictament convexes, és normal preguntar-nos si podem obtenir estimacions d’integrabilitat per a les segones derivades. En la secció anterior hem demostrat que les solucions estrictament convexes 2,1+ε de 0 < λ dx ≤ µu ≤ λ1 dx són Wloc per a algun ε = ε(n, λ) > 0. Si anomenem Σ el «conjunt singular» de punts en què u no és estrictament convexa, és a dir, Σ := {x ∈ Ω : ∃z ∈ Ω \ {x} i p ∈ ∂u(x) s.t.

u(z) = u(x) + hp, z − xi},

6 De fet, per a n ≥ 3, fins i tot es pot construir una solució d’Aleksandrov de det D 2 u = 1 que sigui Lipschitz en una bola petita Bρ (0). Per comprovar-ho, suposem que η > 0 i definim vη (x) := η(|x 0 | + |x 0 |n/2 (1 + x12 )). Aleshores, si η > 0 és prou gran, se’n deriva que det D 2 vη ≥ 1 dins de Bρ (0) per a algun valor ρ > 0 petit. Suposem que wη : Bρ (0) → R és l’envolupant convexa de vη ∂Bρ (0) . És un fet clàssic que det D 2 wη = 0 en el sentit d’Aleksandrov (vegeu, per exemple, [56]). A més, com que vη ≥ 0, se’n deriva que wη ≥ 0. Per acabar, com que vη (x1 , 0) = 0 per a x1 = ±ρ, tenim que wη (x1 , 0) = 0 per a |x1 | ≤ ρ. Suposem ara que u és la solució d’Aleksandrov de ( det D 2 u = 1 en Bρ , u = vη sobre ∂Bρ , donada pel teorema 3.6. Aleshores, segons la proposició 3.3, tenim que vη ≤ u ≤ wη dins de Bρ . Això implica en particular que u(x1 , 0) = 0 per a |x1 | ≤ ρ, que, combinat amb u(x1 , x 0 ) ≥ vη (x1 , x 0 ) ≥ η|x 0 |, demostra que u només és Lipschitz.


Sobre l’equació de Monge-Ampère

23

llavors ens podríem preguntar si les segones derivades de u es poden concentrar a Σ. Recentment Mooney ha descartat aquesta possibilitat [53] mostrant que la mesura de Hausdorff de dimensió (n − 1) de Σ s’anul.la. D’aquest fet, Mooney va deduir la regularitat W 2,1 de les solucions sense cap condició de convexitat estricta. De fet, en un article posterior [54], va poder reforçar aquest resultat amb una petita millora de la integralitat logarítmica i va demostrar que era un resultat òptim. Teorema 4.3. Sigui Ω ⊂ Rn un conjunt obert i u : Ω → R una funció convexa que satisfaci µu = f dx per a alguna 0 < λ ≤ f ≤ 1/λ. Aleshores, H n−1 (Σ) = 0 2,1 i u ∈ Wloc (Ω). A més, existeix una η = η(n) > 0 tal que Z |D 2 u| log(2 + |D 2 u|)η dx < ∞ ∀Ω0 ⊂⊂ Ω. Ω0

D’altra banda, si M > 0 és prou gran, es pot construir una solució u amb f ≡ 1 tal que Z |D 2 u| log(2 + |D 2 u|)M dx = +∞ per a algun Ω0 ⊂⊂ Ω. Ω0

5

Desenvolupaments recents II: regularitat de la vora

La teoria de la regularitat interior per a les solucions d’Aleksandrov es fonamenta en diferents propietats geomètriques de seccions S(x, p, y) de u que estan contingudes estrictament dins de Ω (vegeu (11)). En particular, es pot 1 demostrar que, si u és una solució estrictament convexa de λ dx ≤ µu ≤ λ dx i St (x) := S(x, ∇u(x), t) està continguda compactament dins de Ω, llavors St (x) és comparable a un el.lipsoide de volum t n/2 (vegeu, per exemple, [31, lema 4.6]). Per a desenvolupar una teoria de regularitat de la vora, és vital entendre la geometria de les seccions St (x) quan x ∈ ∂Ω. Savin ho ha fet recentment a [59, 60, 61] amb la introducció de noves tècniques per a obtenir versions globals de tots els resultats de regularitat anteriors amb condicions de regularitat adequades per a les condicions de contorn. Vegem-ne els resultats principals. Suposem que 0 ∈ ∂Ω, que Ω ⊂ Rn és un conjunt obert, convex i fitat que satisfà Bρ (ρen ) ⊂ Ω ⊂ B1/ρ (0) ∩ {xn > 0} (16) per a alguna ρ > 0, i que u : Ω → R satisfà µu = f dx

en Ω

(17)

per a alguna 0 < λ ≤ f ≤ 1/λ. Estenem u fent que valgui +∞ en Rn \ Ω (si cal, restant una funció lineal), suposem que `(x) ≡ 0 és el pla tangent a u a l’origen, és a dir, u ≥ 0,

u(0) = 0,

i u(x) 6≥ εxn

∀ε > 0.

(18)


Alessio Figalli

24

El primer resultat de [59] mostra que, si u ≈ |x|2 al llarg de ∂Ω ∩ {xn ≤ ρ}, llavors les seccions St (0) := {x ∈ Ω : u(x) < t} són comparables a semiel.lipsoides per a t petites. Més precisament, el següent és vàlid: Teorema 5.1. Suposem que Ω ⊂ Rn és un conjunt obert, convex i fitat que satisfà (16) i que u : Ω → R és una funció convexa que satisfà (17) per a alguna 0 < λ ≤ f ≤ 1/λ. Suposem que es compleix (18) i que β|x|2 ≤ u(x) ≤

1 |x|2 β

sobre ∂Ω ∩ {xn ≤ ρ}

(19)

per a alguna β > 0. Aleshores, per a qualsevol t > 0 petit, existeix un ellipsoide Et de volum t n/2 tal que 1 Et ∩ Ω ⊂ St (0) ⊂ (KEt ) ∩ Ω, K . on K > 1 només √ depèn de n, λ, ρ i β. A més, l’el lipsoide Et és comparable a una bola de radi t, llevat d’una possible translació en la direcció xn de mida |log t|. En concret, existeix una transformació lineal At : Rn → Rn de la forma At (x) = x − τ xn ,

τ = (τ1 , . . . , τn−1 , 0) ∈ Rn ,

i |τ| ≤ K|log t|,

tal que Et = At (B√t (0)). L’última part d’aquest resultat dona informació sobre el comportament de les segones derivades a prop de l’origen. En efecte, heurísticament, aquest resultat afirma que dins de St (0) les segones derivades tangencials estan acotades uniformement per dalt i per sota, mentre que les segones derivades mixtes estan acotades per |log t|. Això és molt interessant, ja que µu només està acotada per dalt i per sota i perquè tant les dades de la vora com la vora només són C 1,1 . Com a conseqüència del teorema 5.1 i de les estimacions interiors demostrades a la subsecció 3.4, a [60, 61] Savin va obtenir les estimacions C 2,α i W 2,p globals següents. Teorema 5.2. Suposem que Ω ⊂ Rn és un conjunt obert, uniformement convex i fitat, que u : Ω → R és una funció convexa que satisfà (17) per a alguna 0 < λ ≤ f ≤ 1/λ i suposem que tant u ∂Ω com ∂Ω són de classe C 1,1 . Suposem també que u se separa quadràticament a ∂Ω del seu pla tangent, és a dir, u(z) − u(x) ≥ h∇u(x), z − xi + β|z − x|2

∀x, z ∈ ∂Ω

per a alguna β > 0. Aleshores: • Existeix ε > 0 tal que u ∈ W 2,1+ε (Ω). • Per a qualsevol p > 1, si ||f − 1||L∞ (Ω) ≤ e−Cp , aleshores u ∈ W 2,p (Ω). • Suposem que f ∈ C 0,α (Ω) i que tant u ∂Ω com ∂Ω són de classe C 2,α . Aleshores u ∈ C 2,α (Ω). Com es veu a [59], la condició que u se separa quadràticament a ∂Ω del seu pla tangent es verifica, per exemple, sempre que ∂Ω i u ∂Ω són de classe C 3 amb Ω uniformement convex.


Sobre l’equació de Monge-Ampère

6

25

Desenvolupaments recents III: suavitat de la primera funció pròpia

Sigui Ω un conjunt uniformement convex suau. En l’article [48], P.-L. Lions va investigar l’existència i la unicitat del primer valor propi per a l’operador de Monge-Ampère, és a dir, l’existència d’una funció convexa no trivial ψ1 ∈ C 1,1 (Ω) ∩ C ∞ (Ω) i una constant positiva λ1 tals que (det D 2 ψ1 )1/n = −λ1 ψ1

en Ω,

ψ1 = 0

sobre ∂Ω.

(20)

Com es mostra a [48], la parella (λ1 , ψ1 ) és essencialment única. Més precisament, si ψ : Ω → R és una funció convexa no trivial i λ és una constant positiva tal que (det D 2 ψ)1/n = −λψ en Ω, ψ = 0 sobre ∂Ω, aleshores λ = λ1 i ψ = θψ1 per a una constant positiva θ. Fent servir la fórmula algebraica 1 (det A)1/n = inf tr(AB) : B simètrica definida positiva, det B ≥ n , n

(21)

es pot demostrar que 1 λ1 = inf λ1 (aij ) : aij ∈ C(Ω), aij simètrica definida positiva, det(aij ) ≥ n , n on λ1 (aij ) és el primer valor propi de l’operador el.líptic lineal aij ∂ij . A més, utilitzant de nou (21), es pot aproximar l’equació de Monge-Ampère amb les equacions de Hamilton-Jacobi-Bellman de la forma n A ψ := inf aij ∂ij ψ : aij ∈ C(Ω), aij simètrica definida positiva, det(aij ) ≥

1 1 , tr(a ) ≤ , ij nn

i deduir una interpretació estocàstica interessant per a λ1 (vegeu [47, 48] per a més detalls). Com s’ha vist a la subsecció 3.2, molts resultats per a l’equació µu = f (x) dx es poden estendre al cas general µu = f (x, u, ∇u) dx sempre que ∂u f ≥ 0, ja que això assegura la validesa del principi del màxim. Una conseqüència interessant del resultat de Lions és la validesa del principi del màxim també quan f decreix lleugerament respecte a u. Més precisament, l’equació µu = F (x, u) dx té una solució única sempre que ∂u (F (x, u)1/n ) > −λ1 (vegeu [48, corol.lari 2]). Fixem-nos que, en vista de la regularitat C 1,1 de ψ1 , a prop de la vora de Ω es pot escriure |ψ1 (x)| = g(x) d∂Ω (x), on g : Ω → R és una funció


Alessio Figalli

26

Lipschitz estrictament positiva i d∂Ω (x) = dist(x, ∂Ω) denota la funció distància a la vora. En altres paraules, ψ1 resol l’equació de Monge-Ampère de la forma det D 2 ψ1 (x) = G(x) d∂Ω (x)n

en Ω,

ψ1 = 0

sobre ∂Ω,

(22)

on G(x) ≥ c0 > 0 és Lipschitz. Com que el costat dret de l’equació s’anul.la a ∂Ω, (22) és degenerada a prop de la vora i ha estat un problema durant més de 30 anys saber si ψ1 és suau fins a la vora. La solució només l’han aconseguit recentment, primer Hong, Huang i Wang en dues dimensions [38] i després Savin [62] i Le i Savin [45] en dimensions arbitràries. Més precisament, considerem la classe general d’equacions de MongeAmpère µu = f dx

en Ω,

u=0

sobre ∂Ω,

f (x) = G(x) d∂Ω (x)s ,

(23)

on s > 0 i G és una funció contínua estrictament positiva. A [62] Savin va demostrar l’estimació de regularitat C 2 a la vora que enunciem a continuació: Teorema 6.1. Suposem que Ω ⊂ Rn és un conjunt obert, convex i fitat que satisfà (16) i que u : Ω → R és una funció convexa que satisfà (23). Suposem que (18) i (19) se satisfan i que u ∂Ω∩Bρ (0) és de classe C 2 per a alguna ρ > 0. Aleshores u és C 2 a 0. Més precisament, existeixen un vector τ perpendicular a en , un polinomi quadràtic Q : Rn−1 → R i una constant a > 0 tals que 2+s 2+s u(x + τxn ) = Q0 (x 0 ) + axn + o(|x 0 |2 + xn ) ∀x = (x 0 , xn ) ∈ Bρ (0).

Com a conseqüència d’aquest resultat, com que (20) és de forma (23) amb s = n, Savin va obtenir la regularitat C 2 global de la primera funció pròpia: Corol.lari 6.2. Sigui Ω ⊂ Rn un conjunt uniformement convex de classe C 2 i sigui ψ1 la primera funció pròpia (vegeu (20)). Aleshores ψ1 ∈ C 2 (Ω). Mitjançant un enfocament pertorbatiu basat en el teorema 6.1, Le i Savin van millorar la regularitat C 2 de la vora a C 2,β . Més precisament, van demostrar l’estimació puntual següent: Teorema 6.3. Suposem que Ω ⊂ Rn és un conjunt obert, convex i fitat que satisfà (16) i que u : Ω → R és una funció convexa que satisfà (23). Suposem que 2 (18) i (19) se satisfan i que u ∂Ω∩Bρ (0) és de classe C 2,β per a alguna β ∈ 0, 2+s β(2+s)

i ρ > 0. Suposem també que G ∈ C 0,γ (Ω ∩ Bρ (0)) per a alguna γ ≥ 2 . Aleshores u és C 2,β a 0. Més precisament, existeixen un vector τ perpendicular a en , un polinomi quadràtic Q : Rn−1 → R i una constant a > 0 tals que 2+s 2+s 1+β/2 u(x + τxn ) = Q0 (x 0 ) + axn + O(|x 0 |2 + xn )

∀x = (x 0 , xn ) ∈ Bρ (0).


Sobre l’equació de Monge-Ampère

27

Com a conseqüència d’aquest resultat, s’obté la regularitat C 2,β global de la 2 . primera funció pròpia per a qualsevol β < 2+n Destaquem que normalment, quan es treballa amb equacions el.líptiques, un cop s’obté la regularitat C 2,β , s’arriba a la regularitat superior fàcilment amb les estimacions de Schauder, tot i que no en aquest cas a causa de l’elevada degeneració de l’equació. La idea clau de [45] consisteix a fer tant una transformació hodògrafa com una transformada de Legendre parcial per a deduir que (una transformació adequada de) la primera funció pròpia satisfà una equació de tipus Grushin degenerada amb coeficients de Hölder. Quan això s’aconsegueix, Le i Savin arriben a la suavitat global de ψ1 aplicant estimacions de Schauder als operadors de tipus Grushin. Corol.lari 6.4. Sigui Ω ⊂ Rn un conjunt uniformement convex de classe C ∞ i sigui ψ1 la primera funció pròpia (vegeu (20)). Aleshores, ψ1 ∈ C ∞ (Ω).

Agraïments L’autor dona les gràcies a Yash Jhaveri i Connor Mooney pels comentaris útils de la primera versió del manuscrit. L’autor ha rebut finançament del European Research Council a través de «Regularity and Stability in Partial Differential Equations (RSPDE)».

Referències [1] Aimar, H.; Forzani, L.; Toledano, R. «Balls and quasi-metrics: a space of homogeneous type modeling the real analysis related to the MongeAmpère equation». J. Fourier Anal. Appl., 4 (4-5) (1998), 377–381. [2] Alexandroff, A. «Application of the theorem on domain invariance to existence proofs». Izv. AN USSR, 3 (1939), 243–256. [3] Alexandroff, A. «Existence and uniqueness of a convex surface with a given integral curvature». C. R. (Doklady) Acad. Sci. URSS (N.S.), 35 (1942), 131–134. [4] Alexandroff, A. «Smoothness of the convex surface of bounded Gaussian curvature». C. R. (Doklady) Acad. Sci. URSS (N.S.), 36 (1942), 195–199. [5] Alexandrov, A. D. Convex Polyhedra. Berlín: Springer-Verlag, 2005. Traduït de l’edició russa de 1950 per N. S. Dairbekov, S. S. Kutateladze i A. B. Sossinsky. Amb comentaris i bibliografia de V. A. Zalgaller i annexos de L. A. Shor i Yu. A. Volkov. (Springer Monogr. Math.) [6] Aleksandrov, A. D. «Dirichlet’s problem for the equation Det ||zij || = ϕ(z1 , . . . , zn , z, x1 , . . . , xn ). I». Vestnik Leningrad. Univ. Ser. Mat. Meh. Astronom., 13 (1) (1958), 5–24. [En rus] [7] Ambrosio, L.; Colombo, M.; De Philippis, G.; Figalli, A. «Existence of Eulerian solutions to the semigeostrophic equations in physical space:


28

Alessio Figalli

the 2-dimensional periodic case». Comm. Partial Differential Equations, 37 (12) (2012), 2209–2227. [8] Ambrosio, L.; Colombo, M.; De Philippis, G.; Figalli, A. «A global existence result for the semigeostrophic equations in three dimensional convex domains». Discrete Contin. Dyn. Syst., 34 (4) (2014), 1251–1268. [9] Ampère, A. M. «Mémoire contenant l’application de la théorie». Journal de l’École Polytechnique (1820). [10] Bakel’man, I. Ya. «Generalized solutions of Monge-Ampère equations». Dokl. Akad. Nauk SSSR (N.S.), 114 (1957), 1143–1145. [En rus] [11] Brenier, Y. «Polar factorization and monotone rearrangement of vectorvalued functions». Comm. Pure Appl. Math., 44 (4) (1991), 375–417. [12] Caffarelli, L. A. «A localization property of viscosity solutions to the Monge-Ampère equation and their strict convexity». Ann. of Math. (2), 131 (1) (1990), 129–134. [13] Caffarelli, L. A. «Interior W 2,p estimates for solutions of the MongeAmpère equation». Ann. of Math. (2), 131 (1) (1990), 135–150. [14] Caffarelli, L. A. «Some regularity properties of solutions of Monge Ampère equation». Comm. Pure Appl. Math., 44 (8-9) (1991), 965–969. [15] Caffarelli, L. A. «The regularity of mappings with a convex potential». J. Amer. Math. Soc., 5 (1) (1992), 99–104. [16] Caffarelli, L. A. «A note on the degeneracy of convex solutions to Monge Ampère equation». Comm. Partial Differential Equations, 18 (7-8) (1993), 1213–1217. [17] Caffarelli, L. A. «Boundary regularity of maps with convex potentials. II». Ann. of Math. (2), 144 (3) (1996), 453–496. [18] Caffarelli, L. A.; Gutiérrez, C. E. «Real analysis related to the MongeAmpère equation». Trans. Amer. Math. Soc., 348 (3) (1996), 1075–1092. [19] Caffarelli, L.; Nirenberg, L.; Spruck, J. «The Dirichlet problem for nonlinear second-order elliptic equations. I. Monge-Ampère equation». Comm. Pure Appl. Math., 37 (3) (1984), 369–402. [20] Calabi, E. «Improper affine hyperspheres of convex type and a generalization of a theorem by K. Jörgens». Michigan Math. J., 5 (1958), 105–126. [21] Cheng, S. Y.; Yau, S. T. «On the regularity of the Monge-Ampère equation det(∂ 2 u/∂xi ∂sxj ) = F (x, u)». Comm. Pure Appl. Math., 30 (1) (1977), 41–68. [22] Cuesta, J. A.; Matrán, C. «Notes on the Wasserstein metric in Hilbert spaces». Ann. Probab., 17 (3) (1989), 1264–1276. [23] Cullen, M. J. P. A Mathematical Theory of Large-Scale Atmosphere/Ocean Flow. Imperial College Press, 2006. [24] De Philippis, G.; Figalli, A. «W 2,1 regularity for solutions of the MongeAmpère equation». Invent. Math., 192 (1) (2013), 55–69.


Sobre l’equació de Monge-Ampère

29

[25] De Philippis, G.; Figalli, A. «Partial regularity for optimal transport maps». Publ. Math. Inst. Hautes Études Sci., 121 (2015), 81–112. [26] De Philippis, G.; Figalli, A.; Savin, O. «A note on interior W 2,1+ estimates for the Monge-Ampère equation». Math. Ann., 357 (1) (2013), 11–22. [27] Delanoë, P. «Classical solvability in dimension two of the second boundary-value problem associated with the Monge-Ampère operator». Ann. Inst. H. Poincaré C Anal. Non Linéaire, 8 (5) (1991), 443–457. [28] Evans, L. C. «Classical solutions of fully nonlinear, convex, second-order elliptic equations». Comm. Pure Appl. Math., 35 (3) (1982), 333–363. [29] Figalli, A. «Regularity properties of optimal maps between nonconvex domains in the plane». Comm. Partial Differential Equations, 35 (3) (2010), 465–479. [30] Figalli, A. «Sobolev regularity for the Monge-Ampère equation, with application to the semigeostrophic equations». Zap. Nauchn. Sem. S.-Peterburg. Otdel. Mat. Inst. Steklov. (POMI), 411 (2013), 103–118, 242. Teoriya Predstavleniı̆, Dinamicheskie Sistemy, Kombinatornye Metody. XXII. [31] Figalli A. The Monge-Ampère Equation and its Applications. Zúric: European Mathematical Society (EMS), 2017. (Zur. Lect. Adv. Math.) [32] Figalli, A.; Jhaveri, Y.; Mooney, C. «Nonlinear bounds in Hölder spaces for the Monge-Ampère equation». J. Funct. Anal., 270 (10) (2016), 3808–3827. [33] Figalli, A.; Kim, Y.-H. «Partial regularity of Brenier solutions of the MongeAmpère equation». Discrete Contin. Dyn. Syst., 28 (2) (2010), 559–565. [34] Figalli, A.; Rifford, L.; Villani, C. «Necessary and sufficient conditions for continuity of optimal transport maps on Riemannian manifolds». Tohoku Math. J. (2), 63 (4) (2011), 855–876. [35] Gilbarg, D.; Trudinger, N. S. Elliptic Partial Differential Equations of Second Order. 2a ed. Berlín: Springer-Verlag, 1983. (Grundlehren Math. Wiss.; 224) [36] Goldman, M.; Otto, F. «A variational proof of partial regularity for optimal transportation maps». Ann. Sci. Éc. Norm. Supér. (4), 53 (5) (2020), 1209–1233. [37] Gutiérrez, C. E.; Huang, Q. «Geometric properties of the sections of solutions to the Monge-Ampère equation». Trans. Amer. Math. Soc., 352 (9) (2000), 4381–4396. [38] Hong, J.; Huang, G.; Wang, W. «Existence of global smooth solutions to Dirichlet problem for degenerate elliptic Monge-Ampère equations». Comm. Partial Differential Equations, 36 (4) (2011), 635–656. [39] Ivochkina, N. M. «Classical solvability of the Dirichlet problem for the Monge-Ampère equation». Questions in quantum field theory and statis-


30

Alessio Figalli

tical physics 4. Zap. Nauchn. Sem. Leningrad. Otdel. Mat. Inst. Steklov. (LOMI), 131 (1983), 72–79. [En rus] [40] Jerison, D. «Prescribing harmonic measure on convex domains». Invent. Math., 105 (2) (1991), 375–400. [41] Jhaveri, Y. «On the (in)stability of the identity map in optimal transportation». Calc. Var. Partial Differential Equations, 58 (3) (2019), article núm. 96, 25 p. [42] John, F: «Extremum problems with inequalities as subsidiary conditions». A: Studies and Essays Presented to R. Courant on his 60th Birthday, January 8, 1948. Nova York: Interscience Publishers, 1948, 187–204. [43] Krylov, N. V. «Boundedly inhomogeneous elliptic and parabolic equations». Izv. Akad. Nauk SSSR Ser. Mat., 46 (3) (1982), 487–523, 670. [En rus]. Traducció en anglès a: Math. USSR-Izv., 20 (3) (1983), 459–492. [44] Krylov, N. V. «Boundedly inhomogeneous elliptic and parabolic equations in a domain». Izv. Akad. Nauk SSSR Ser. Mat., 47 (1) (1983), 75–108. [En rus]. Traducció en anglès a: Math. USSR-Izv., 22 (1) (1984), 67–97. [45] Le, N. Q.; Savin, O. «Schauder estimates for degenerate Monge-Ampère equations and smoothness of the eigenfunctions». Invent. Math., 207 (1) (2017), 389–423. [46] Lions, P.-L. «Sur les équations de Monge-Ampère. I». Manuscripta Math., 41 (1-3) (1983), 1–43. [47] Lions, P.-L. «Bifurcation and optimal stochastic control». Nonlinear Anal., 7 (2) (1983), 177–207. [48] Lions, P.-L. «Two remarks on Monge-Ampère equations». Ann. Mat. Pura Appl. (4), 142 (1985), 263–275. [49] McCann, R. J. «Existence and uniqueness of monotone measure-preserving maps». Duke Math. J., 80 (2) (1995), 309–323. [50] Minkowski, H. «Allgemeine Lehrsätze über die convexen Polyeder». Gött. Nachr., 1897 (1897), 198–219. [51] Minkowski, H. «Volumen und Oberfläche». Math. Ann., 57 (4) (1903), 447–495. [52] Monge, G. «Sur le calcul intégral des équations aux differences partielles». Mémoires de l’Académie des Sciences (1784). [53] Mooney, C. «Partial regularity for singular solutions to the Monge-Ampère equation». Comm. Pure Appl. Math., 68 (6) (2015), 1066–1084. [54] Mooney, C. «W 2,1 estimate for singular solutions to the Monge-Ampère equation». Ann. Sc. Norm. Super. Pisa Cl. Sci. (5), 14 (4) (2015), 1283–1303. [55] Mooney, C. «Some counterexamples to Sobolev regularity for degenerate Monge-Ampère equations». Anal. PDE, 9 (4) (2016), 881–891. [56] Oberman, A. M.; Silvestre, L. «The Dirichlet problem for the convex envelope». Trans. Amer. Math. Soc., 363 (11) (2011), 5871–5886.


Sobre l’equació de Monge-Ampère

31

[57] Pogorelov, A. V. «The regularity of the generalized solutions of the equation det(∂ 2 u/∂x i ∂x j ) = ϕ(x 1 , x 2 , . . . , x n ) > 0». Dokl. Akad. Nauk SSSR, 200 (1971), 534–537. [En rus] [58] Rüschendorf, L.; Rachev, S. T. «A characterization of random variables with minimum L2 -distance». J. Multivariate Anal., 32 (1) (1990), 48–54. Corrigendum a: J. Multivariate Anal., 34 (1) (1990), 156. [59] Savin, O. «A localization property at the boundary for Monge-Ampère equation». A: Advances in Geometric Analysis. Somerville, MA: International Press, 2012, 45–68. (Adv. Lect. Math. (ALM); 21) [60] Savin, O. «Pointwise C 2,α estimates at the boundary for the Monge-Ampère equation». J. Amer. Math. Soc., 26 (1) (2013), 63–99. [61] Savin, O. «Global W 2,p estimates for the Monge-Ampère equation». Proc. Amer. Math. Soc., 141 (10) (2013), 3573–3578. [62] Savin, O. «A localization theorem and boundary regularity for a class of degenerate Monge-Ampere equations». J. Differential Equations, 256 (2) (2014), 327–388. [63] Schmidt, T. «W 2,1+ε estimates for the Monge-Ampère equation». Adv. Math., 240 (2013), 672–689. [64] Trudinger, N. S.; Wang, X.-J. «The Monge-Ampère equation and its geometric applications». A: Handbook of Geometric Analysis. No. 1. Somerville, MA: International Press, 2008, 467–524. (Adv. Lect. Math. (ALM); 7) [65] Urbas, J. «On the second boundary value problem for equations of MongeAmpère type». J. Reine Angew. Math., 487 (1997), 115–124. [66] Wang, X.-J. «Some counterexamples to the regularity of Monge-Ampère equations». Proc. Amer. Math. Soc., 123 (3) (1995), 841–845. [67] Wang, X.-J. «Regularity for Monge-Ampère equation near the boundary». Analysis, 16 (1) (1996), 101–107.

ETH Zürich, Department of Mathematics Rämistrasse 101, 8092 Zúric, Suïssa alessio.figalli@math.ethz.ch



Butlletí de la Societat Catalana de Matemàtiques Vol. 38, núm. 1, 2023. Pàg. 33–66. DOI: 10.2436/20.2002.01.108

Les matemàtiques dels setins Carles Lladó i Josep M. Brunat

Per això els textos i els teixits comparteixen tantes paraules: la trama del relat, el nus de l’argument, el fil de la història, el desenllaç de la narració; entortolligar-se el cervell, brodar un discurs, filar prim, ordir una intriga. Irene Vallejo L’infinit en un jonc, segona part, 44

Resum: Els setins són una classe especialment rellevant dels lligats dels teixits. Aquest article forneix un marc general que identifica un setí amb un reticle de Z2 i relaciona l’anàlisi dels setins amb resultats clàssics de teoria de nombres i de geometria. S’hi tracten els setins quadrats, els simètrics (en particular, simètrics rectangulars i simètrics rombals), i els setins concordants. També s’introdueixen els setins de Fibonacci, dels quals es caracteritzen els que són simètrics i els que són quadrats. Paraules clau: lligat, curs, setí, setí quadrat, setí simètric, reticle, algorisme d’Euclides estès, base òptima, nombres de Fibonacci, setí de Fibonacci.

Classificació MSC2020: 11Z05, 52C05, 11A05, 11B39, 11B50.

1

Introducció

Els teixits a què ens referim en aquest article són els fabricats amb els telers. Deixarem de banda, per exemple, peces fetes amb un únic fil que s’entrellaça amb ell mateix, com passa amb el ganxet i el punt de mitja. En aquest text, doncs, un teixit consta d’un conjunt de fils paral.lels i equidistants, anomenats fils de l’ordit, i d’un conjunt de fils perpendiculars als anteriors, també equidistants, dits fils de la trama o passades. De fet, els que anomenem fils de la trama són un únic fil que va passant, mitjançant la llançadora del teler, successivament i alternativa de dreta a esquerra i d’esquerra a dreta; d’aquí el nom de passada. Un punt és un encreuament d’un fil de l’ordit i un de la trama.


34

Carles Lladó i Josep M. Brunat

Un punt es diu un pren o una deixa segons que, en aquest punt, el fil de l’ordit passi per sobre o per sota, respectivament, del de la trama. El tissatge és el conjunt d’operacions en la confecció d’un teixit que tenen per objectiu entrellaçar els fils per fer-ne teles. Una part del tissatge està estretament relacionada amb els telers, l’evolució dels quals ha estat una llarga, complicada i interessant història. Però abans d’engegar el teler, o de fer-ne anar un de manual, cal decidir com s’entrellaçaran els fils. La forma en què els fils queden entrellaçats es diu lligat (o lligament). La forma tradicional de representar un lligat és mitjançant una quadrícula en la qual cada quadradet representa un punt. Les columnes il.lustren els fils de l’ordit, i les files, els fils de la trama. Un quadradet fosc representa un pren, i un de blanc, una deixa. A la figura 1 es mostren dos lligats i les seves respectives representacions per una quadrícula. En cada cas, a l’esquerra hi ha el lligat, on els fils s’han dibuixat prou amples per tal que es vegi bé si el fil de l’ordit passa per sobre o per sota del de la trama, és a dir, per remarcar si un punt és un pren o una deixa. A la dreta hi ha la representació del lligat per una quadrícula. El lligat i la representació se suposen estesos a tot el pla, tot deixant de banda el problema de les vores del teixit.

Figura 1

Tant per raons estètiques com per facilitat de fabricació, un lligat consisteix en còpies d’una peça quadrada o rectangular que es van juxtaposant en sentit de l’ordit i en el de la trama. Una peça mínima amb què, juxtaposant-la, s’obté el lligat es diu un curs del lligat. Atesa la generació del lligat a partir del curs, qualsevol punt es pot prendre com el punt inferior esquerre del curs, però és normal prendre el curs de manera que el seu punt inferior esquerre sigui un pren. Així, en el lligat de l’esquerra de la figura 1 podem identificar el seu curs com un quadrat de 2 × 2, mentre que en el lligat de la dreta el seu curs és un quadrat de 5 × 5. Tots dos es veuen a la figura 2. A la figura 3

Figura 2

hem representat dos lligats més, que cal suposar estesos a tot el pla. En ambdós hem marcat còpies del curs, nou còpies d’un curs quadrat 4 × 4 en el primer


Les matemàtiques dels setins

35

cas i quatre còpies d’un curs rectangular 8 × 4 en el segon. En tot el que segueix, però, centrarem l’atenció només en lligats de curs quadrat.

Figura 3

Naturalment, el curs cal dissenyar-lo de manera que, en juxtaposar les seves còpies, generi un lligat tal que el teixit que en resulti efectivament es «mantingui unit»; és a dir, que el conjunt de tots els fils quedin entrelligats de manera que sigui impossible de separar-los en dos subconjunts en què cada fil del primer subconjunt quedi per sobre de cada un dels fils del segon conjunt. Si es donés aquest cas, el teixit se separaria en dos. Per exemple, a l’esquerra de la figura 4 es veu un pretès curs, però a la dreta s’assenyalen els fils de l’ordit i de la trama que, entrelligats entre ells, queden per sobre i separats de la resta de fils, de manera que el pretès curs no genera un lligat.

Figura 4

Sovint, només l’experiència indicava quins cursos donaven teixits que realment «es mantinguessin units». Però, a partir dels anys vuitanta del segle passat, es publiquen resultats generals i rigorosos en aquest sentit, com els de C. Delaney [8], R. E. Griswold [15], T. C. Enns [9] i C. R. J. Clapham [5]. Comentem aquest últim tot seguit. Clapham explicita una condició necessària i suficient sobre la quantitat de prens a cada fil de l’ordit i a cada fil de la trama del curs per tal de garantir que un curs generi un lligat. Com que ens restringirem a cursos quadrats, enunciem la condició de Clapham per a aquesta mena de cursos. El mòdul d’un curs quadrat és el nombre de fils de l’ordit i de la trama del curs. Proposició 1. Donat un curs quadrat de mòdul m, considerem el nombre de prens a cada fil de l’ordit del curs, i siguin o1 ≥ o2 ≥ · · · ≥ om aquests nombres ordenats de major a menor. Anàlogament per als fils de la trama, siguin t1 ≤ t2 ≤ · · · ≤ tm els nombres corresponents ordenats de menor a major. Aleshores el curs genera un lligat si i només si per a cada r , s ∈ {1, . . . , m}, es compleix r X i=1

ti +

s X

(m − oj ) ≥ r s,

j=1

i es compleix la igualtat per a r = s = m.

(1)


36

Carles Lladó i Josep M. Brunat

En un segon article [6], Clapham associa a cada curs un cert graf dirigit bipartit i mostra que la seva condició equival al fet que el graf dirigit sigui fortament connex, la qual cosa li permet obtenir condicions suficients sobre el nombre de prens en el curs en cada fil de l’ordit i de la trama per garantir un lligat. Un curs fonamental és un curs quadrat tal que en cada fil de l’ordit del curs hi ha exactament un pren, la qual cosa comporta que en cada fil de la trama del curs hi hagi també un únic pren. Si el curs té mòdul m, aleshores el curs conté exactament m prens. La figura 5 mostra un curs fonamental de mòdul 8.

Figura 5

Els cursos fonamentals compleixen la condició de Clapham: tenim ti = oi = 1 per a i ∈ {1, . . . , m}, i la desigualtat (1) de la proposició 1 esdevé r + s(m − 1) ≥ r s, que es compleix amb la desigualtat estricta si m − 1 ≥ r i val la igualtat per a r = s = m. Ara, en general, la irregularitat de la distribució dels prens en el curs no proporciona resultats estètics gaire valorats. Els setins, que definim tot seguit, tenen els prens disposats amb regularitat. Lligat de setí Un setí és un curs fonamental en el qual, a més del mòdul m, es fixa un nombre a anomenat escalonat que compleixi les condicions que 1 ≤ a ≤ m − 1 i mcd(m, a) = 1. El curs d’un setí de mòdul m i escalonat a consta de m fils de l’ordit, que numerarem 0, 1, . . . , m − 1, i m fils de la trama, també numerats 0, . . . , m − 1. La graella del curs la podem identificar amb Zm × Zm . Els prens (x, y) del curs són els que compleixen y ≡ ax (mod m), és a dir, els punts de l’aplicació Zm → Zm definida per x , ax. Aquesta aplicació és bijectiva perquè la condició mcd(m, a) = 1 implica que a és invertible a Zm . A la figura 6 hi ha el curs del setí de mòdul 8 i escalonat 3.

Figura 6

El setí de mòdul m i escalonat 1 es diu sarja directa, i el de mòdul m i escalonat m − 1 es diu sarja indirecta. En el cas m = 2, les dues sarges coincideixen i el setí es diu plana o tafetà (és el cas del curs de l’esquerra de


Les matemàtiques dels setins

37

la figura 7). Tot i que, en textos clàssics, sarges i planes es consideren sovint diferents dels setins, en el model que seguirem és natural incloure-les entre els setins, encara que són, realment, casos extrems que de vegades cal tractar a part en determinades discussions. A la figura 7 hi ha representats també el curs de la sarja directa i el de la sarja indirecta de mòdul 5.

Figura 7

Si k > 1 és un enter, quan un fil d’ordit té prens en k passades consecutives, es diu que es forma una basta d’ordit de k, i es diu que es forma una basta de trama de k quan hi ha k deixes consecutives sobre una mateixa passada. En els lligats de setí no hi ha bastes d’ordit però cada passada té una basta de trama de m − 1. Així, en la figura 6 es poden veure les bastes de 7 que es formen en cada una de les passades del setí de mòdul 8 i escalonat 3. Des del punt de vista de les característiques materials del teixit a què donen lloc els lligats de setí, les bastes massa llargues són poc adequades. A la pràctica, sovint, hom parteix del curs d’un setí, i s’afegeixen de manera creativa nous prens amb la finalitat de reduir la longitud de les bastes. Aquests nous cursos s’anomenen derivats. A la figura 8 podem veure un curs derivat del curs del setí de mòdul 8 i escalonat 3 de la figura 6 obtingut afegint un pren a la dreta i al damunt de cada pren del setí original. A la figura, els punts de gris més clar són els prens del setí original, i els punts de gris fosc, els prens afegits. Es pot veure com les bastes d’ordit són com a màxim de 2 i les de trama són com a màxim de 3.

Figura 8

Des del camp del tissatge és interessant conèixer quants setins hi ha de mòdul m fixat. Com que un setí de mòdul m queda unívocament determinat pel seu escalonat a, que és un invertible de Zm , la funció φ d’Euler definida per als enters m ≥ 1 per φ(m) = |{a ∈ {1, . . . , m} : mcd(a, m) = 1}| dona el nombre de setins de mòdul m (incloses les dues sarges). Si es coneix la factorització de m en producte de primers, aleshores es pot calcular φ(m) com segueix (vegeu, per exemple D. M. Burton [3]).


38

Carles Lladó i Josep M. Brunat

Proposició 2. Siguin 2 ≤ p1 < p2 · · · < pr nombres primers i α1 , . . . , αr enters α α positius. Si m = p1 1 · · · pr r , el nombre de setins de mòdul m és α −1 φ(m) = p1 1 · · · prαr −1 (p1 − 1) · · · (pr − 1) = m

1 1− p1

!

1 ··· 1 − pr

! .

Així, per exemple, el nombre de setins de mòdul m = 15 = 3 · 5 és de φ(15) = 2 · 4 = 8, mentre que, si m és un nombre primer, aleshores φ(m) = m − 1. Segurament, el primer de considerar els setins des d’un punt de vista matemàtic fou Édouard Lucas [24] el 1867, motivat per dos articles del mateix any de l’industrial Édouard Gand [12, 13]. Lucas insistí en el tema amb un article i un apèndix en una revista italiana d’enginyeria [25, 26]. Cal reconèixer, però, que la bibliografia relacionada amb les matemàtiques dels setins i del disseny de teixits en general no és gaire abundant. Podem esmentar l’article de S. A. Shorter de 1920 [36]. Els articles de H. J. Woods [38, 39, 40, 41] dels anys 1935 i 1936 donen molta informació, però, tal com el mateix Woods diu en el primer article de la sèrie, «illustrations rather than proofs will be given of most of the statements made». Des del punt de vista matemàtic, els treballs dels anys vuitanta del segle passat de B. Grünbaum i G. C. Shephard [16, 17, 18] són més significatius. També D. W. Crowe ([7]) té un breu article sobre el treball de Woods, en el qual comenta de passada les etapes de matematització que representen alguns textos clàssics sobre ornamentació. En tot cas, l’interès principal en aquests treballs és la simetria dels teixits obtinguts. Més recentment, V. R. Krishnamurthy et al. ([22]) han desenvolupat un marc general per al disseny i construcció de formes entrellaçades que omplen l’espai i que tenen simetria induïda pels setins. Ens ha semblat interessant fer palès un marc matemàtic general per estudiar els setins, que mena de forma natural a temes clàssics de teoria de nombres i de geometria. Els detalls de la major part del que reflectim aquí es poden trobar al llibre [23]; també hi resumim alguns resultats de [1]. L’apartat dels setins de Fibonacci és material nou. Hi ha també, de vegades en esquema, de vegades en detall, algun altre resultat suggerit per textos i articles antics de teoria de teixits. En tot cas, els setins conformen un exemple més de la ubiqüitat de les matemàtiques, exemple que ens sembla poc conegut i que amb aquestes pàgines pretenem divulgar.

2

Reticles. Bases òptimes

Des del punt de vista del model matemàtic, més útil que la tradicional representació per una quadrícula és emprar coordenades; això no és gaire usual en el context dels teixits, però un precedent ben antic, de 1870, és el de F. Cerruti [4]. Identificarem un setí amb un cert subgrup de Z2 .


Les matemàtiques dels setins

39

Si u i v són dos vectors independents de Z2 , el reticle generat per u i v és el subgrup additiu de Z2 hu, vi = {αu + βv : α, β ∈ Z}. La parella de vectors (u, v) es diu una base del reticle hu, vi. Denotem amb L(m, a) un setí de mòdul m i escalonat a. Els prens (v, r ) del curs són els que compleixen av ≡ r (mod m). En juxtaposar còpies del curs per cobrir tot el pla, els prens (v, r ) ∈ Z2 són, també, els que compleixen av ≡ r (mod m). Aleshores (v, r ) ∈ L(m, a) a av ≡ r (mod m) a r = av + βm per a algun β ∈ Z a (v, r ) = v(1, a) + β(0, m) per a algun β ∈ Z a (v, r ) ∈ h(1, a), (0, m)i. D’acord amb això, el setí de mòdul m i escalonat a és el reticle L(m, a) = h(1, a), (0, m)i. Així, la plana és el setí L(2, 1) = h(1, 1), (0, 2)i, la sarja directa de mòdul m és el setí L(m, 1) = h(1, 1), (0, m)i i la sarja indirecta de mòdul m és el setí L(m, m − 1) = h(1, m − 1), (0, m)i. Per representar L(m, a) com a reticle, prenem un pren com a origen de coordenades i, llavors, un punt de coordenades enteres (v, r ) és un pren si i només si av ≡ r (mod m). Com que |det((1, a), (0, m))| = m, el paral.lelogram de costats els dos vectors (1, a) i (0, m) amb origen a un pren té àrea m i no té prens al seu interior. A més, tots aquests paral.lelograms tessel.len el pla. La figura 9 mostra, a l’esquerra, el curs del lligat L(7, 3) i, a la dreta, part del reticle corresponent, amb els paral.lelograms d’àrea 7 amb els costats determinats pels vectors (1, 3) i (0, 7) tessel.lant el pla. Els punts foscos corresponen als prens del curs.

Figura 9

Naturalment, si u ∈ L(m, a), la translació de vector u deixa invariant L(m, a). Les juxtaposicions del curs per crear el lligat corresponen a les imatges del curs per a les translacions de vectors u = α(0, m) + β(m, 0) amb α i β enters.


Carles Lladó i Josep M. Brunat

40

Un setí L(m, a) admet moltes bases: si dos vectors x,y ∈ L(m, a) compleixen |det(x, y)| = |det((1, a), (0, m))| = m, aleshores (x, y) és també una base de L(m, a). Una qüestió natural associada a un reticle, en particular a un setí, és trobar una base amb els dos vectors tan curts com sigui possible. Es defineix, doncs, una base òptima d’un reticle L com una base (b1 , b2 ) tal que (1) kb1 k ≤ kb2 k; (2) per a tot x ∈ L \ {0}, si kxk ≤ kb2 k, aleshores kxk = kb1 k o kxk = kb2 k. El vector b1 d’una base òptima (b1 , b2 ) és el vector més curt. Notem que l’article determinat és un abús de llenguatge perquè n’hi pot haver més d’un, per exemple, els vectors b1 i −b1 tenen la mateixa norma i tots dos es poden prendre com el vector més curt. Sovint prendrem un vector més curt amb la segona component positiva. Observació. En textos clàssics de teoria de teixits es troben nombrosos intents de classificar els setins basant-se en la geometria de la distribució dels prens, en particular mitjançant paral.lelograms que tenen per vèrtexs aquests punts. Aquest és el cas, per exemple, de V. Galcerán [11] i T. Giménez [14], entre d’altres. És possible que aquests intents responguessin en el fons a la voluntat de determinar bases òptimes. Una base òptima d’un reticle L = hu, vi es pot obtenir mitjançant l’algorisme de Lagrange-Gauss, que descrivim tot seguit (els detalls es poden trobar al llibre de J. Hoffstein, J. Pipher i J. H. Silverman [19] o al text de S. D. Galbraith [10]). Per a un nombre real µ, sigui bµe l’enter més proper a µ i, si µ = z + 1/2 amb z enter, prenem bµe = z. Denotem el producte escalar de dos vectors u i v amb u · v. L’algorisme, que té una semblança amb el mètode de Gram-Schmidt per trobar una base ortonormal en un espai vectorial euclidià, és com segueix: ENTRADA SORTIDA

Una base (u, v) d’un reticle L amb kuk ≤ kvk. Una base òptima (b1 , b2 ) de L.

1) Fer b1 = u, b2 = v, h = b(b1 · b2 )/kb1 k2 e. 2) Mentre h 6= 0 fer 2.1) b2 = b2 − hb1 ; 2.2) si kb2 k < kb1 k intercanviar b1 i b2 . 3) Retornar (b1 , b2 ). Exemple. Considerem el setí L(16, 7). Les iteracions de l’algorisme de LagrangeGauss donen els valors següents: b1 = (1, 7), b1 = (−2, 2), b1 = (−2, 2),

b2 = (0, 16), b2 = (1, 7), b2 = (3, 5),

h = b112/50e = 2, h = b12/8e = 1, h = b4/8e = 0.

b2 − 2b1 = (−2, 2); b2 − b1 = (3, 5);

Una base òptima del setí L(16, 7) és, doncs, ((−2, 2), (3, 5)).


Les matemàtiques dels setins

41

Exemple. En el cas del setí L(7, 3) de la figura 9, l’algorisme de Lagrange-Gauss dona b1 = (1, 3), b1 = (−2, 1),

b2 = (0, 7), b2 = (1, 3),

h = b21/10e = 2, h = b1/5e = 0.

b2 = b2 − 2b1 = (−2, 1);

Per tant, ((−2, 1), (1, 3)) és una base òptima. La figura 10 mostra la mateixa part del setí que a la figura 9, però ara amb els paral.lelograms corresponents a la base òptima ((−2, 1), (1, 3)).

Figura 10

Observació. Si (u, v) és una base d’un reticle L amb kuk ≤ kvk i u i v són ortogonals, aleshores la base (u, v) és òptima perquè a la primera iteració de l’algorisme ja resulta h = 0. Observació. Suposem que (u, v) és una base d’un reticle L i que u és el vector més curt de L. En aplicar l’algorisme a aquesta base, cal calcular µ = (u·v)/kuk2 i h = bµe. Si h = 0, la base (u, v) és òptima; si no, el nou valor de h és h0 = bµ 0 e, on 1 µ0 = (u · (v − hu)) = µ − h. kuk2 Com que −1/2 < µ−h ≤ 1/2, tenim h0 = bµ 0 e = bµ−he = 0. Llavors, (u, v−h0 u) és una base òptima de L. Per tant, si una base de L conté el vector més curt, aleshores o bé la base ja és òptima o bé amb una etapa de l’algorisme de Lagrange-Gauss s’obté una base òptima. Sigui per aplicació de l’algorisme de Lagrange-Gauss o sigui comprovant que els vectors que es donen són ortogonals i del reticle, s’obtenen les bases òptimes de la plana i de les sarges que s’indiquen a la taula 1. lligat

reticle

base òptima

plana sarja directa m senar sarja directa m parell sarja indirecta m senar sarja indirecta m parell

L(2, 1) L(m, 1) L(m, 1) L(m, m − 1) L(m, m − 1)

((1, 1), (−1, 1)) ((1, 1), ((−m + 1)/2, (m + 1)/2)) ((1, 1), (−m/2, m/2)) ((−1, 1), ((m − 1)/2, (m + 1)/2)) ((−1, 1), (m/2, m/2))

Taula 1


42

Carles Lladó i Josep M. Brunat

Els dos setins L(m, a) i L(m, m − a) es diuen complementaris. Les següents equivalències, on cal entendre que les congruències ho són mòdul m, proven que setins complementaris són simètrics respecte als dos eixos de coordenades: (v, r ) ∈ L(m, a) a av ≡ r a (m − a)v ≡ −r a (v, −r ) ∈ L(m, m − a) a (−v, r ) ∈ L(m, m − a). Atès que l’origen de coordenades es pot prendre en qualsevol pren, els setins L(m, a) i L(m, m − a) són simètrics respecte a totes les rectes de la graella de coordenades enteres. La simetria entre L(m, a) i L(m, m − a) implica que, a l’efecte de trobar bases òptimes, podem restringir el valor a de l’escalonat a a < m/2 perquè, si ((v1 , r1 ), (v2 , r2 )) és una base i òptima de L(m, a), aleshores ((−v1 , r1 ), (−v2 , r2 )) és una base òptima de L(m, m − a).

3

Obtenció de bases per l’algorisme d’Euclides

En aquest apartat veurem que l’algorisme d’Euclides aplicat al mòdul m i a l’escalonat a d’un setí proporciona una seqüència de vectors del setí tals que cada dos de consecutius formen una base, una de les quals conté el vector més curt. Recordem que, donats dos enters m i a amb 1 ≤ a < m, l’algorisme estès d’Euclides amb entrada (m, a) comença amb els valors inicials (u0 , v0 , r0 ) = (1, 0, m),

(u1 , v1 , r1 ) = (0, 1, a),

i, per a cada enter i ≥ 1, si qi és el quocient de la divisió entera de ri−1 per ri , (ui+1 , vi+1 , ri+1 ) = (ui−1 , vi−1 , ri−1 ) − qi (ui , vi , ri ). La successió dels ri és estrictament decreixent i existeix un n tal que rn+1 = 0. Aleshores rn = mcd(m, a) i, per a tot i ∈ {0, . . . , n + 1}, es compleix ui m + vi a = ri . Per a i = n, es té la identitat de Bézout un m + vn a = mcd(m, a). La proposició que segueix explicita determinades propietats de la seqüència (ui , vi , ri ) generada per l’algorisme d’Euclides estès (els detalls es poden veure a V. A. Shoup [37, teorema 4.3]). Proposició 3. Siguin m > a > 1 enters i sigui (ui , vi , ri ), i ∈ {0, . . . , n + 1}, la seqüència generada per l’algorisme d’Euclides estès aplicat a m i a. (i) Per a tot i ∈ {2, . . . , n + 1}, si i és parell, ui > 0; si i és senar, ui < 0. (ii) Per a tot i ∈ {1, . . . , n + 1}, si i és parell, vi < 0; si i és senar, vi > 0. (iii) |ui+1 | ≥ |ui | per a tot i ∈ {1, . . . , n}. (iv) |vi+1 | ≥ |vi | per a tot i ∈ {0, . . . , n} i, si a < m/2, aleshores les desigualtats són estrictes. (v) Si rn = mcd(m, a) = 1, aleshores |un | ≤ a/2 i |un+1 | = a. (vi) Si rn = mcd(m, a) = 1, aleshores |vn | ≤ m/2 i |vn+1 | = m.


Les matemàtiques dels setins

43

Interpretem ara m i a com el mòdul i l’escalonat d’un setí L(m, a), amb la qual cosa un m + vn a = 1. Les igualtats ui m + vi a = ri impliquen avi ≡ ri (mod m), és a dir que ei = (vi , ri ) ∈ L(m, a) per a tot i ∈ {0, . . . , n + 1}. Anomenarem e0 = (v0 , r0 ),

e1 = (v1 , r1 ), . . . , en+1 = (vn+1 , rn+1 )

els vectors d’Euclides del setí L(m, a). D’acord amb l’algorisme, e0 = (0, m),

e1 = (1, a),

ei+1 = ei−1 − qi ei

(i ∈ {1, . . . , n}).

Notem que la primera parella de vectors d’Euclides (e0 , e1 ) coincideix amb la base inicial del setí i es compleix que el valor absolut del seu determinant és |det(e0 , e1 )| = |det((0, m), (1, a))| = m. Per a tot i ≥ 1 tenim, |det(ei , ei+1 )| = |det(ei , ei−1 − qi ei )| = = |det(ei−1 , ei )| = · · · = |det(e0 , e1 )| = m. Per tant, totes les parelles (ei , ei+1 ) amb i ∈ {0, . . . , n} són bases del setí. El teorema següent assegura que entre els vectors d’Euclides de L(m, a) es troba el vector més curt i, en alguns casos, dos vectors d’Euclides no necessàriament consecutius formen una base òptima (vegeu les proves a [1]). Teorema 4. Sigui L(m, a) un setí amb m > 2 i ei = (vi , ri ), i ∈ {0, . . . , n + 1}, els vectors d’Euclides de L(m, a). Sigui k = min{i : |vi | > ri }. Aleshores un dels quatre vectors ek−2 , ek−1 , ek o ek+1 és el vector més curt de L(m, a). A més, (i) Si ek−2 és el vector més curt, aleshores (ek−2 , ek−1 ) o (ek−2 , ek ) és una base òptima. (ii) Si ek+1 és el vector més curt, aleshores (ek+1 , ek ) o (ek+1 , ek−1 ) és una base òptima. La demostració de la primera part del teorema 4 es pot veure com segueix (vegeu la figura 11). Per a cada vector d’Euclides ei = (vi , ri ) de L(m, a), considerem el punt del primer quadrant ẽi = (|vi |, ri ). Connectant punts d’índexs consecutius, obtenim una poligonal amb inici a ẽ0 = (0, m) i cada vèrtex més avall (perquè els ri decreixen) i més a la dreta (perquè, d’acord amb la proposició 3, els |vi | creixen). El primer vèrtex després que la poligonal talli la bisectriu del quadrant correspon a l’índex k. El vector més curt correspon a un dels quatre punts més propers a la bisectriu.


Carles Lladó i Josep M. Brunat

44

r

ẽk−3 ẽk−2

r = |v| ẽk−1 ẽk ẽk+1

|v|

Figura 11

Sigui L(m, a) un setí. Denotem amb a0 l’enter tal que 1 ≤ a0 ≤ m − 1 i aa ≡ 1 (mod m). Els setins L(m, a) i L(m, a0 ) es diuen associats. Notem que, amb totes les congruències mòdul m, 0

(v, r ) ∈ L(m, a) a av ≡ r a v ≡ a0 r a (r , v) ∈ L(m, a0 ) a (−r , −v) ∈ L(m, a0 ), així que setins associats són simètrics respecte a la bisectriu dels quadrants primer i tercer i respecte a la bisectriu dels quadrants segon i quart. Amb la notació de la proposició 3, si m i a són el mòdul i l’escalonat d’un setí L(m, a), de la identitat de Bézout un m + vn a = mcd(m, a) = 1 s’obté a0 ≡ vn (mod m). Si n és senar, tenim vn > 0 i a0 = vn < m/2. Si n és parell, vn < 0 i m − a0 = |vn | < m/2. D’aquestes propietats de a0 se’n dedueixen d’altres que tenen relació amb determinades bases d’un setí L(m, a) que involucren a0 . Suposem que n és senar. Els dos vectors (1, a), (a0 , 1) són de L(m, a) i el seu determinant és, en valor absolut, |det((1, a), (a0 , 1))| = aa0 − 1. Per tant, ((1, a), (a0 , 1)) és una base de L(m, a) si i només si aa0 − 1 = m. Com que n és senar, a0 = vn i aa0 − 1 = avn − 1 = |un |m, i la condició aa0 − 1 = m equival a |un | = 1. Anàlogament, si n és parell, ((1, a), (m − a0 , −1)) = ((1, a), (−vn , −1)) és una base si i només si a(−vn ) + 1 = m, és a dir, si |un |m = m, i retrobem la condició |un | = 1. Els apartats següents es dediquen als setins quadrats, que són els que compleixen a0 = m − a (o, equivalentment, a2 ≡ −1 (mod m)), i als simètrics, que són els que compleixen a0 = a (o, equivalentment, a2 ≡ 1 (mod m)).

4

Setins quadrats

Definició Ja des dels articles esmentats de Gand i Lucas el 1867 i de Woods el 1906, els setins quadrats han merescut atenció especial. El motiu és, generalment, estètic: tenen una simetria que els fa visualment atractius. Formalment, un setí L(m, a) és setí quadrat si compleix alguna de les condicions equivalents següents:


Les matemàtiques dels setins

45

(a) El setí L(m, a) admet una base òptima (u, v) tal que u · v = 0 i kuk = kvk. (b) El setí L(m, a) és invariant per a girs d’angle recte centrat en un pren. (c) Per a tot (v, r ) ∈ L(m, a), es compleix (−r , v) ∈ L(m, a). Les condicions anteriors són de tipus geomètric, però es poden traduir fàcilment a la condició aritmètica següent: Proposició 5. Un setí L(m, a) és setí quadrat si i només si a2 + 1 ≡ 0 (mod m). Prova. (Totes les congruències de la prova ho són mòdul m.) Suposem que L(m, a) és quadrat. Com que (1, a) ∈ L(m, a), tenim (−a, 1) ∈ L(m, a), és a dir, a(−a) ≡ 1, o sigui a2 ≡ −1. Recíprocament, si a2 ≡ −1, aleshores mcd(m, a) = 1 i (v, r ) ∈ L(m, a) a av ≡ r a a2 v ≡ ar a v ≡ −ar a (−r , v) ∈ L(m, a),

2

i el setí L(m, a) és quadrat.

Notem que, per a un setí L(m, a) quadrat, si (u, v) és una base òptima, l’àrea del paral.lelogram determinat per u i v és alhora kuk2 i |det(u, v)| = m, així que kuk2 = kvk2 = m. A la figura 12 es veu el curs del setí quadrat de mòdul m = 13 i escalonat a = 5, amb uns quadrats remarcats no determinats per cap base del setí. En un setí quadrat L(m, a), l’existència d’aquests quadrats s’ha pres de vegades com a justificació de l’adjectiu «quadrat» aplicat a aquest setí; vegeu, per exemple, E. Gand [12], E. Lucas [24] i P. Rodón y Amigó [29].

Figura 12

Figura 13

Si un setí quadrat L(m, a) admet el vector (1, a) com a vector més curt, aleshores els quadrats com els de la dreta de la figura 12 tessel.len el pla, excepte els prens, és a dir, tessel.len totes les deixes. Per exemple, el setí quadrat L(10, 3) admet la base òptima ((1, 3), (−3, 1)), i la quadrícula del setí


46

Carles Lladó i Josep M. Brunat

es pot veure a la figura 13 amb els quadrats marcats tessel.lant totes les deixes del lligat. En general, si a > 2 és un enter i definim m = a2 + 1, aleshores, mcd(m, a) = 1 i L(m, a) és un setí quadrat que admet la base òptima ((1, a), (−a, 1)). Recíprocament, si L(m, a) és un setí quadrat que admet una base òptima ((1, x), (−x, 1)), aleshores m = |det((1, x), (−x, 1))| = 1 + x 2 i tenim |x| < m/2 i a ≡ x (mod m). Si x > 0, llavors a = x. Si x < 0, llavors a = m−|x|. Per tant, els setins quadrats que produeixen aquestes tessel.lacions corresponen als setins L(m, a) amb m = a2 + 1 i als seus complementaris. Curiosament, aquest tipus de tessel.lacions són el patró que es pot veure en determinats enrajolats modernistes, com el del bany de la casa Navàs de Reus, on es pot trobar l’enrajolat de la figura 14, que correspon al setí L(5, 3), del qual hem remarcat un curs. Les rajoles petites amb flors corresponen als prens. El complementari de L(5, 3) és L(5, 2) (que compleix 5 = 22 + 1), el qual té base òptima ((1, 2), (−2, 1)).

Figura 14

L’algorisme d’Euclides en setins quadrats L’algorisme d’Euclides, aplicat als setins quadrats, té algunes propietats addicionals curioses que permeten obtenir una base òptima. Resumim els resultats en el teorema següent, la prova del qual es pot veure a [1, 23]. Deixarem de banda la plana, de base òptima ((−1, 1), (1, 1)), i les sarges, que no són setins quadrats. També hem comentat que, a l’efecte de trobar bases òptimes de setins L(m, a), la condició a < m/2 no és restrictiva. Teorema 6. Sigui L(m, a) un setí amb 1 < a < m/2 i m ≥ 5, i siguin ei = (vi , ri ), i ∈ {0, . . . , n + 1}, els vectors d’Euclides. Aleshores L(m, a) és quadrat si i només si vn = −a. En aquest cas, es compleixen les propietats següents: (i) n és parell; (ii) |vn+1−i | = ri per a i ∈ {0, . . . , n + 1}; (iii) ken+1−i k = kei k per a i ∈ {0, . . . , n + 1}; (iv) si k = min{i : |vi | > r }, aleshores k = (n + 2)/2; (v) si k = (n + 2)/2, aleshores (ek−1 , ek ) és una base òptima.


Les matemàtiques dels setins

47

Així, per trobar una base òptima d’un setí quadrat, només cal aplicar l’algorisme d’Euclides fins a trobar un índex k tal que |vk | > rk . Llavors, (ek−1 , ek ) és una base òptima. Exemple. Considerem el setí L(65, 18). Com que 182 + 1 = 325 = 65 · 5, el setí L(65, 18) és quadrat. L’algorisme d’Euclides dona i vi qi

0 0

1 1 3

2 −3 1

3 4 1

4 −7 1

5 11 1

6 −18 3

7 65

ri ri+2

65 11

18 7

11 4

7 3

4 1

3 0

1

0

Veiem que (i) n = 6 és parell; (ii) els valors dels |vi | llegits de dreta a esquerra coincideixen amb els dels ri llegits d’esquerra a dreta; (iii) les parelles de vectors e0 = (0, 65) e2 = (−3, 11)

i i

e7 = (65, 0), e5 = (11, 3),

e1 = (1, 18) e3 = (4, 7)

i i

e6 = (−18, 1), e4 = (−7, 4),

tenen la mateixa norma; (iv) k = min{i : |vi | > r } = 4 = (n + 2)/2. Finalment, el teorema assegura que (e3 , e4 ) és una base òptima. Mòduls i escalonats de setins quadrats En els textos clàssics de teoria de teixits hi ha hagut força interès a trobar els mòduls m que admeten escalonats a tals que L(m, a) sigui quadrat. Donat un enter m ≥ 2, un enter z és un residu quadràtic mòdul m si existeix un enter a tal que a2 ≡ z (mod m). Determinar si un enter z és o no un residu quadràtic mòdul m és un tema clàssic de la teoria de nombres. Veiem que un setí de mòdul m admet un escalonat a tal que L(m, a) és quadrat si i només si −1 és un residu quadràtic mòdul m, i els escalonats són les solucions a de la congruència a2 ≡ −1 (mod m) compreses entre 1 i m − 1. Per al mòdul m = 2, només hi ha un escalonat possible, a = 1, i s’obté la plana, que és un setí quadrat. Deixarem de banda aquest cas en el que queda d’apartat, i considerarem només mòduls m > 2. Per a mòduls primers, tenim el resultat següent (la prova es pot veure, per exemple, a D. M. Burton [3, teorema 5.5]). Teorema 7. Sigui p > 2 un nombre primer. Aleshores la congruència x 2 ≡ −1 (mod p) té solució si i només si p ≡ 1 (mod 4). En aquest cas, les dues solucions són x ≡ ±((p − 1)/2)! (mod p). En termes de setins: Teorema 8. Sigui p > 2 un nombre primer. (i) Si p ≡ 3 (mod 4), aleshores no hi ha setins quadrats de mòdul p. (ii) Si p ≡ 1 (mod 4), sigui a ≡ ((p − 1)/2)! (mod p) amb 1 < a < p − 1. Aleshores hi ha exactament dos setins quadrats de mòdul p, que són els setins complementaris L(p, a) i L(p, p − a).


48

Carles Lladó i Josep M. Brunat

Considerem ara els mòduls m que són potències de primer. Si k > 1 és un enter i m = 2k , la congruència x 2 + 1 ≡ 0 (mod 2k ) no té solució: en efecte, una solució x també és solució respecte al mòdul 22 = 4. Però x 2 + 1 ≡ 0 (mod 4) no té solució. Per tant, no hi ha setins quadrats de mòdul m = 2k amb k > 1. Sigui ara un enter k > 1, un enter primer p > 2 i m = p k . Si x 2 + 1 ≡ 0 (mod p k ), aleshores x 2 + 1 ≡ 0 (mod p). Per tant, si x 2 + 1 ≡ 0 (mod p k ) té solució, també en té x 2 + 1 ≡ 0 (mod p) i ha de ser p ≡ 1 (mod 4). Queda per estudiar el cas que el mòdul és m = p k amb k ≥ 1 enter i p un primer p ≡ 1 (mod 4). El teorema 7 assegura que, en el cas k = 1, hi ha dues solucions. El lema següent, que és una versió particular de l’anomenat lema de Hensel (vegeu, per exemple, I. Niven, H. S. Zuckerman, H. L. Montgomery [27, teorema 2.23]), mostra com, disposant d’una solució mòdul p s , se’n pot trobar una altra mòdul p s+t amb t ≤ s, la qual es diu l’aixecada a p s+t de la primera. Lema 9. Siguin p > 2 un nombre primer, s ≥ t ≥ 1 enters, i a i h enters tals que a2 + 1 = hp s . (i) Existeix l’invers v de 2a mòdul p t . (ii) Sigui y ≡ −hv (mod p t ). Aleshores a + yp s és solució de x 2 + 1 ≡ 0 (mod p s+t ). Així, si p > 2 és un nombre primer amb p ≡ 1 (mod 4), i k > 1, podem calcular els dos escalonats que donen setins quadrats de mòdul p i, per aplicació del lema de Hensel, trobar dos escalonats d’un setí de mòdul p k que donin setins quadrats. I només n’hi ha dos: la congruència x12 + 1 ≡ x22 + 1 ≡ 0 (mod p k ) implica x12 − x22 = (x1 + x2 )(x1 − x2 ) ≡ 0 (mod p k ). Si p divideix els dos factors, aleshores p divideix la seva diferència 2x2 i, com que p > 2, divideix x2 . Aleshores 1 ≡ x22 + 1 ≡ 0 (mod p), la qual cosa és contradictòria. Per tant, p només divideix un dels factors i passa el mateix amb p k . Si p k divideix x1 + x2 , tenim x1 ≡ −x2 (mod p k ). Si divideix x1 − x2 , tenim x1 ≡ x2 (mod p k ). Per tant, tenim: Teorema 10. Sigui k > 1 un enter i p ≥ 2 un nombre primer. (i) Si p = 2 o p ≡ 3 (mod 4), no existeixen setins quadrats de mòdul m = p k . (ii) Si p ≡ 1 (mod 4), existeixen exactament dos setins quadrats de mòdul m = p k , els escalonats dels quals s’obtenen aixecant els dos escalonats dels setins quadrats de mòdul p. Si es coneix la factorització d’un enter m > 2 en producte de primers, els escalonats a tals que L(m, a) és quadrat es troben emprant els resultats per a quan el mòdul m és una potència de primer i el teorema xinès dels residus. El resultat és el següent. α

α

Teorema 11. Sigui m = 2α0 p1 1 · · · ps s amb 2 < p1 < · · · < ps primers diferents, α0 ≥ 0 i α1 , . . . , αs ≥ 1 enters. Existeixen setins quadrats de mòdul m si i només si α0 ∈ {0, 1} i pi ≡ 1 (mod 4) per a i ∈ {1, . . . , s}. En aquest cas, el nombre d’escalonats de setins quadrats és 2s .


Les matemàtiques dels setins

49

Una altra caracterització dels mòduls dels setins quadrats s’obté de la caracterització de Fermat dels enters positius m que són suma de dos quadrats, és a dir, que són de la forma m = x 2 + y 2 per a certs enters x i y (vegeu, per exemple, D. M. Burton [3, teorema 13.3]). Teorema 12 (Fermat). Un enter positiu m és suma de dos quadrats si i només si cada factor primer p de m tal que p ≡ 3 (mod 4) apareix amb exponent parell a la factorització de m en producte de primers. Aleshores es té: Teorema 13. Un enter positiu m > 2 és el mòdul d’un setí quadrat si i només si existeixen enters x i y tals que m = x 2 + y 2 i mcd(x, y) = 1. En aquest cas, si z és l’invers de x mòdul m i a ≡ zy (mod m), 1 < a < m − 1, el setí L(m, a) és quadrat. Prova. Si L(m, a) és un setí quadrat, sigui ((x, y), (−y, x)) una base òptima de L(m, a). Llavors, m = |det((x, y), (−y, x))| = x 2 + y 2 és suma de dos quadrats. Per a certs enters z i t tenim que a2 + 1 = zm i y = ax + tm. Aleshores m = x 2 + y 2 = x 2 + (ax + tm)2 = = (1 + a2 )x 2 + tm(tm + 2ax) = = zmx 2 + tm(tm + ax + ax) = = m(zx + ta)x + tmy. Simplificant m, obtenim 1 = (zx +ta)x +ty, la qual cosa implica mcd(x, y) = 1. Recíprocament, suposem que existeixen els enters x i y tals que m = x 2 + 2 y i mcd(x, y) = 1. Aleshores mcd(m, x) = mcd(m, y) = 1 i mcd(m, a) = 1. A més, a2 + 1 ≡ z2 y 2 + 1 ≡ z2 (m − x 2 ) + 1 ≡ z2 m − z2 x 2 + 1 ≡ 0 i L(m, a) és un setí quadrat.

5

(mod m),

2

Setins simètrics

Definició Per motius similars als dels setins quadrats, els setins simètrics també han merescut força interès. Un setí L(m, a) és setí simètric si compleix les condicions equivalents següents: (a) Si (x, y) ∈ L(m, a), aleshores (y, x) ∈ L(m, a), és a dir, si el reticle L(m,a) és simètric respecte a la bisectriu del primer i tercer quadrants. (b) Si (x, y) ∈ L(m, a), aleshores (−y, −x) ∈ L(m, a), és a dir, si el reticle L(m, a) és simètric respecte a la bisectriu del segon i quart quadrants.


Carles Lladó i Josep M. Brunat

50

La traducció a una condició aritmètica és immediata: Proposició 14. Un setí L(m, a) és setí simètric si i només si a2 ≡ 1 (mod m). Prova. Si L(m, a) és simètric, com que (1, a) ∈ L(m, a), resulta que (a, 1) ∈ L(m, a), això és, a2 ≡ 1 (mod m). Recíprocament, si L(m, a) és un setí tal que a2 ≡ 1 (mod m), aleshores és simètric: si (x, y) ∈ L(m, a), tenim ax ≡ y (mod m) i x ≡ a2 x ≡ ay (mod m), és a dir, (y, x) ∈ L(m, a). 2 La condició a2 ≡ 1 (mod m) és equivalent a la condició a0 = a, així que un setí simètric es pot definir també com un setí igual al seu associat. Les sarges, per exemple, són setins simètrics. Una base (u, v) d’un setí és rectangular si u · v = 0. Evidentment, una base rectangular és òptima. Un setí rectangular és un setí que admet una base rectangular. Segons la taula 1, la sarja directa de mòdul m parell, per exemple, admet la base rectangular ((1, 1), (−m/2, m/2)), i la sarja indirecta de mòdul m parell admet la base rectangular ((−1, 1), (m/2, m/2)). Una base (u, v) d’un setí és rombal si kuk = kvk. Un setí rombal és un setí que admet una base rombal. Per exemple, l’aplicació de l’algorisme de LagrangeGauss a L(24, 5) dona la base rombal òptima ((1, 5), (5, 1)). Ara, mentre que una base rectangular és automàticament òptima, no passa el mateix amb una base rombal. Per exemple, una sarja indirecta de mòdul m senar admet la base òptima ((−1, 1), (m − 1)/2, (m + 1)/2)), que no és ni rombal ni rectangular. Però, per simetria, el vector((m + 1)/2, (m − 1)/2) també és del setí i, com que m−1 m+1 m+1 m−1 det , , , = m, 2 2 2 2 la parella ((m − 1)/2, (m + 1)/2)), ((m + 1)/2, (m − 1)/2)) és una base, evidentment rombal. L’algorisme d’Euclides en setins simètrics També per a setins simètrics l’algorisme d’Euclides té propietats addicionals. Les resumim tot seguit (vegeu [1, 23]). Proposició 15. Sigui L(m, a) un setí amb a < m/2 i siguin ei = (vi , ri ), i ∈ {0, . . . , n + 1}, els vectors d’Euclides. Llavors, el setí L(m, a) és simètric si i només si vn = a. En aquest cas, es compleixen les propietats següents: (i) n és senar; (ii) |vn+1−i | = ri per a i ∈ {0, . . . , n + 1}; (iii) |vj | = rj per a j = (n + 1)/2; (iv) ken+1−i k = kei k; (v) si k = min{i : |vi | > ri }, aleshores k = (n + 3)/2; (vi) si k = (n + 3)/2 i ek−2 és el vector més curt, aleshores (ek−2 , ek ) és una base rombal òptima.


Les matemàtiques dels setins

51

Exemple. El setí L(30, 11) és simètric perquè 112 = 121 = 30 · 4 + 1 ≡ 1 (mod 30). L’algorisme d’Euclides dona i vi qi

0 0

1 1 2

2 −2 1

3 3 2

4 −8 1

5 11 2

6 −30

ri ri+2

30 8

11 3

8 2

3 1

2 0

1

0

Obtenim, doncs, els vectors d’Euclides e0 = (0, 30), e4 = (−8, 2),

e1 = (1, 11), e5 = (11, 1),

e2 = (−2, 8), e6 = (−30, 0).

e3 = (3, 3),

Veiem que (i) n = 5 és senar; (ii) la seqüència dels |vi | llegida de dreta a esquerra coincideix amb la dels ri llegida d’esquerra a dreta; (iii) per a j = (n + 1)/2 = 3 tenim |v3 | = r3 = 3; (iv) les parelles de vectors e0 i e6 ,

e1 i e5 ,

e2 i e4 ,

tenen la mateixa norma; (v) el primer índex k tal que |vk | > rk és k = 4 = (n + 3)/2; (vi) en aquest cas el vector més curt és e3 = (3, 3) i l’algorisme no dona una base òptima. Aplicant una etapa de l’algorisme de Lagrange-Gauss a la base (e2 , e3 ) s’obté la base òptima ((3, 3), (−5, 5)), que és rectangular. Setins simètrics rombals i rectangulars B. Grünbaum i G. C. Shephard ([16]) afirmen que tot setí simètric és rectangular o rombal i donen un esquema de la demostració. El resultat que descrivim en aquest subapartat dona condicions aritmètiques per decidir una cosa o l’altra, i per trobar bases òptimes i rombals (vegeu [1]). Associat a un setí simètric L(m, a), definim els paràmetres i vectors següents: (a) d1 = mcd(a + 1, m), (b) m1 = m/d1 ,

d1 = (d1 , d1 ).

m1 = (−m1 , m1 ).

(c) Si m1 és parell i a2 − 1 ≡ 0 (mod 2m),

w1 = (d1 /2, d1 /2).

(d) Si m1 és parell i a2 − 1 6≡ 0 (mod 2m),

o si m1 és senar,

x1 = (d1 + m1 )/2,

u1 = (d1 − x1 , x1 ),

v1 = (x1 , d − x1 ).

Es pot demostrar que d1 , m1 ∈ L(m, a) i que, en les condicions de (c), es compleix w1 ∈ L(m, a) i, en les de (d), es compleix u1 , v1 ∈ L(m, a). A més, es pot veure fàcilment que l’únic setí simètric amb m1 = d1 és la sarja directa de mòdul m = 4. Deixem de banda, doncs, la plana i les sarges. El teorema següent classifica els setins simètrics en rectangulars i rombals i dona en cada cas una base òptima i, en el cas dels rombals, també una base rombal.


52

Carles Lladó i Josep M. Brunat

Teorema 16. Sigui L(m, a) un setí simètric amb m ≥ 5 i 1 < a < m − 1. (i) Si m és parell i a2 − 1 ≡ 0 (mod 2m), llavors el setí és rectangular. En aquest cas, d1 és parell i d1 /2 6= m1 . A més, una base rectangular òptima és (w1 , m1 ) si d1 /2 < m1 o (m1 , w1 ) si m1 < d1 /2. (ii) Si m és parell i a2 − 1 6≡ 0 (mod 2m), o si m és senar, llavors (u1 , v1 ) és una base rombal de L(m, a). En aquest cas, (d1 , u1 ) i (m1 , u1 ) també són bases, els tres vectors d1 , m1 i u1 tenen normes diferents i, si e és el de menor norma dels tres, es dona exactament una de les tres situacions següents: (ii.1) e = d1 , 3d21 < m12 , i (d1 , u1 ) és una base òptima. (ii.2) e = m1 , 3m12 < d21 , i (m1 , u1 ) és una base òptima. (ii.3) e = u1 , m12 < 3d21 , d21 < 3m12 , i (u1 , v1 ) és una base rombal òptima. Observació. La condició a2 − 1 ≡ 0 (mod m) de setí simètric es pot escriure (a + 1)(a − 1) ≡ 0 (mod m). A partir de d1 = mcd(m, a + 1) hem definit d1 , m1 , w1 , u1 i v1 . Però, prenent d2 = mcd(m, a − 1), es pot refer tota la discussió per obtenir resultats similars amb m2 = m/d2 , m2 = (m2 , m2 ), w2 = (−d2 /2, d2 /2), x2 = (d2 + m2 )/2, u2 = (x2 , m2 − x2 ) i v2 = (m2 − x2 , x2 ). Mòduls i escalonats de setins simètrics Com en el cas dels setins quadrats, trobar les parelles (m, a) tals que L(m, a) sigui simètric ha estat un focus d’interès. En termes de teoria de nombres, es tracta de trobar les parelles (m, a) tals que el residu quadràtic de a mòdul m sigui 1. Naturalment, (m, 1) i (m, −1), que corresponen a les sarges, són solució. L’interès és saber si n’hi ha d’altres. La discussió segueix el mateix patró que en el cas dels setins quadrats: estudiant primer el cas de mòdul potència de primer i després via el teorema xinès dels residus, s’obté el cas general. Enunciem els resultats directament en termes de setins. Per a mòduls 2, 3 i 4, només les sarges són setins simètrics. Considerarem, doncs, m ≥ 5. Per a potències de primer, tenim: Proposició 17. Siguin p un nombre primer, k ≥ 1 un enter i m = p k . (i) Si p > 2, els únics setins simètrics de mòdul m són les sarges. (ii) Si p = 2 i k ≥ 3, aleshores hi ha quatre setins simètrics de mòdul m, que són les dues sarges i els d’escalonat 2k−1 − 1 i 2k−1 + 1. Si es disposa de la factorització de m en producte de primers, les solucions per a cada potència de primer es combinen via el teorema xinès dels residus per obtenir la solució per a m. El nombre de solucions depèn només del nombre de factors primers diferents de 2 i de l’exponent del 2 a la factorització.


Les matemàtiques dels setins

53

Teorema 18. Siguin 2 < p1 < · · · < pr nombres primers, α0 ≥ 0 i α1 , . . . , αr α α enters positius. Si m = 2α0 p1 1 · · · pr r , el nombre de setins simètrics de mòdul m és (i) 2α0 si α0 ∈ {0, 1}; (ii) 2r +1 si α0 = 2; (iii) 2r +2 si α0 ≥ 3.

6

Setins concordants

Entre 1906 i 1907, el badaloní Pau Rodón, que aleshores era el director de Cataluña Textil, una revista de gran difusió en el món tèxtil espanyol i sudamericà, publicà una sèrie de set articles [29, 30, 31, 32, 33, 34, 35] amb el títol genèric «Estudio científico de los rasos regulares». Els «rasos regulares» són els setins. Des del punt de vista matemàtic, els articles no resisteixen l’anàlisi més benevolent. Definicions de vegades massa particulars i restrictives, regles que inicialment s’anuncien com a necessàries i suficients, però que al final s’expliciten com una condició suficient i, fins i tot, alguna regla errònia, com la dels setins quadrats. A més, totes les regles estan basades simplement en uns quants exemples particulars, amb nombres concrets, que després generalitza sense més contemplacions. Però, tot i això, des del punt de vista històric, els articles són interessants perquè presenten els tipus de setins que es consideraven més rellevants. S’hi tracten els setins quadrats, els simètrics i els simètrics rombals i rectangulars, que són els que hem comentat fins aquí. Com que també s’hi tracten els setins concordants, en donarem ara una notícia breu. La idea intuïtiva d’un setí concordant directe (resp. indirecte) és que té tots els prens situats en rectes de pendent 1 (resp. de pendent −1). Formalment, un setí L(m, a) és concordant directe (resp. concordant indirecte) si existeix un enter p amb 0 < p < m tal que, per a tot pren (x, y), el punt (x + p, y + p) (resp. (x − p, y + p)) també és un pren. Notem que aquesta condició és equivalent al fet que (p, p) ∈ L(m, a) (resp. (−p, p) ∈ L(m, a)). En tots dos casos, el menor p amb la propietat corresponent es diu el pas. La figura 15 mostra quatre cursos de setins. El primer, L(9, 4), és concordant directe de pas 3, però no concordant indirecte; el segon, L(9, 2), no és concordant directe, però és concordant indirecte de pas 3; el tercer, L(8, 3), és alhora concordant directe de pas 4 i concordant indirecte de pas 2; finalment, L(7, 3) no és concordant ni directe ni indirecte.

Figura 15


54

Carles Lladó i Josep M. Brunat

La caracterització dels setins concordants en termes del mòdul i l’escalonat és senzilla i és la següent. Proposició 19. Siguin L(m, a) un setí, d1 = mcd(m, a + 1) i d2 = mcd(m, a − 1). Llavors: (i) El setí L(m, a) és concordant directe si i només si d2 > 1; en aquest cas, el seu pas és m/d2 . (ii) El setí L(m, a) és concordant indirecte si i només si d1 > 1; en aquest cas, el seu pas és m/d1 . Prova. (i) Suposem que L(m, a) és concordant directe de pas p. Llavors ap ≡ p (mod m), d’on p(a−1) ≡ 0 (mod m). Si d2 = mcd(m, a−1) = 1, tindríem p ≡ 0 (mod m), la qual cosa és contradictòria perquè 1 ≤ p ≤ m − 1. Per tant, d2 > 1. Llavors, p(a − 1)/d2 ≡ 0 (mod m/d2 ) i, com que mcd((a − 1)/d2 , m/d2 ) = 1, resulta p ≡ 0 (mod m/d2 ), és a dir, p = m/d2 . Recíprocament, suposem d2 = mcd(m, a − 1) > 1. Si a − 1 = d2 k, tenim (a − 1)(m/d2 ) = d2 k(m/d2 ) = km ≡ 0 (mod m), la qual cosa implica que (m/d2 , m/d2 ) ∈ L(m, a) i que L(m, a) és concordant. Anàlogament es demostra (ii). 2 A conseqüència de la proposició anterior, veiem que, si m és un nombre primer, no hi ha setins concordants ni directes ni indirectes de mòdul m. Veurem ara que, en un setí L(m, a) concordant directe de pas p, el vector p = (p, p) sempre forma part d’una base. Proposició 20. Sigui L(m, a) un setí concordant directe de pas p, i siguin d2 = mcd(m, a − 1) i x i y enters tals que xm + y(a − 1) = d2 . Aleshores els vectors p = (p, p) i u = x(0, m) + y(1, a) formen una base de L(m, a). Prova. És clar que u ∈ L(m, a). Com que L(m, a) és concordant directe, el pas és p = m/d2 i p = (p, p) ∈ L(m, a). Només cal veure que |det(p, u)| = m. Tenim |det(p, u)| = |det(p, x(0, m) + y(1, a))| = = |x det(p, (0, m)) + y det(p, (1, a))| = = |xpm + y(pa − p)| = |p(xm + y(a − 1))| = pd2 = m.

2

Així, amb la notació de la proposició anterior, cada parella (x, y) de coeficients de la identitat de Bézout xm + y(a − 1) = d2 proporciona un vector que forma base amb p = (p, p). Per exemple, per a L(9, 4), tenim d2 = mcd(9, 3) = 3. Si prenem x = 1, y = −2, resulta u = (0, 9) − 2(1, 4) = (−2, 1), amb la qual cosa tenim la base (p, u) = ((3, 3), (−2, 1)). Si prenem x = 0 i y = 1, llavors u = (1, 4) i obtenim la base (p, u) = ((3, 3), (1, 4)). Notem que una base òptima de L(9, 4) és ((−2, 1), (1, 4)). Per posar un tercer cas, per a x = 3 i y = −8, resulta u = (−8, −5) i la base (p, u) = ((3, 3), (−8, −5)).


Les matemàtiques dels setins

55

La discussió és anàloga per als setins concordants indirectes. Només enunciem la proposició corresponent. Proposició 21. Sigui L(m, a) un setí concordant indirecte de pas p, i siguin d1 = mcd(m, a + 1) i x i y enters tals que xm + y(a + 1) = d1 . Aleshores els vectors p = (p, −p) i u = x(0, m) + y(1, a) formen una base de L(m, a). Un setí és concordant si és concordant directe i indirecte alhora. Per als setins simètrics tenim la proposició següent. Proposició 22. Tot setí simètric de mòdul m > 2 és concordant. Prova. Sigui L(m, a) un setí simètric, d1 = mcd(m, a + 1) i m1 = m/d1 . D’acord amb el que hem comentat a la pàgina 51, els vectors d1 = (d1 , d1 ) i m1 = (−m1 , m1 ) són tots dos de L(m, a). Suposant que no es tracti de la plana, aleshores d1 > 2 i m1 > 2, amb la qual cosa L(m, a) és concordant directe i concordant indirecte alhora. 2 Considerem ara setins quadrats. Atès que un setí quadrat és invariant per girs d’angle π /2 centrats a l’origen, un setí quadrat o bé és alhora concordant directe i indirecte, com L(10, 3), o no és cap de les dues coses, com L(13, 5). Proposició 23. Un setí quadrat L(m, a) és concordant si i només si m és parell. Prova. La condició a2 ≡ −1 (mod m) de setí quadrat implica que m i a tenen diferent paritat i que m i a − 1 tenen la mateixa paritat. Si m és parell, llavors m i a−1 són tots dos parells i d2 = mcd(m, a−1) > 1. Així, L(m, a) és concordant. Suposem que m és senar i que el setí L(m, a) és concordant, és a dir, que d2 = mcd(m, a − 1) > 1. Com que m i a − 1 són senars, d2 ≥ 3. Llavors, p = (m/d2 , m/d2 ) ∈ L(m, a). Tenim (amb totes les congruències mòdul m) a(m/d2 ) ≡ m/d2 i, multiplicant per a, obtenim −m/d2 ≡ a(m/d2 ) ≡ m/d2 . Per tant, 2m/d2 ≡ 0. Com que d2 ≥ 3, resulta una contradicció. Per tant, si m és senar, L(m, a) no és concordant. 2

7

Setins equivalents

En els textos clàssics, la definició de setí no sempre es correspon amb la que hem donat aquí. Per exemple, P. Rodón [29] el defineix mitjançant dos enters a i b amb mcd(a, b) = 1. Si a < b, anomena a escalonat directe i b escalonat indirecte o complementari. El que aquí hem anomenat mòdul, per a ell és m = a + b. Com que mcd(a, m) = mcd(a, a + b) = mcd(a, b), les condicions mcd(a, b) = 1 i mcd(m, a) = 1 són equivalents. Veiem, doncs, que, per a Rodón, els setins complementaris L(m, a) i L(m, m − a) són el mateix setí. En la terminologia que introduirem a continuació, es tractarà de setins equivalents, que definirem en termes geomètrics i en veurem l’equivalent aritmètic.


56

Carles Lladó i Josep M. Brunat

Una equivalència d’un setí L(m1 , a) en un setí L(m2 , b) és un moviment f del pla tal que x ∈ L(m1 , a) a f (x) ∈ L(m2 , b), és a dir, és un moviment del pla que conserva els prens. Si existeix una tal equivalència, posarem L(m1 , a) ' L(m2 , b) i direm que els dos setins són equivalents. És clar que la relació ' és d’equivalència. Si f és una equivalència d’un setí L(m1 , a) en un setí L(m2 , b) i z ∈ Z2 , aleshores z és la intersecció de dues rectes paral.leles als eixos que contenen prens de L(m1 , a); per tant, f (z) també és la intersecció de dues rectes perpendiculars que contenen prens de L(m2 , b) i tenim que f (z) ∈ Z2 . Una equivalència, doncs, conserva la graella de coordenades enteres. Els moviments del pla són les translacions, els girs, les simetries axials i les simetries lliscants (una simetria lliscant és una simetria axial seguida d’una translació definida per un vector director de la recta eix de la simetria axial). No és gaire difícil caracteritzar els moviments f del pla tals que f (Z2 ) = Z2 . Enunciem el resultat a continuació. Per flexibilitzar el llenguatge, anomenarem recta vertical una recta de vector director (0, 1), recta horitzontal una recta de vector director (1, 0), i recta diagonal una recta de vector director (1, 1) o (1, −1). També anomenarem punt enter un punt amb les dues coordenades enteres i, anàlogament, vector enter un vector amb les dues components enteres. Proposició 24. Sigui f un moviment del pla tal que f (Z2 ) = Z2 . Aleshores f és un moviment d’un dels tipus següents: (i) Una translació segons un vector enter. (ii) Un gir d’angle múltiple enter de π /2 i de centre z o z + (1/2, 1/2) per a un punt enter z. (iii) Una simetria axial respecte a una recta horitzontal o vertical tal que, per a un punt enter z, la recta passa pel punt z o pel punt z + (1/2, 1/2). (iv) Una simetria axial respecte a una recta diagonal que passa per un punt z enter. (v) Una simetria lliscant composició d’una simetria axial com les de (iii) o (iv) i d’una translació segons un vector enter en la direcció de la recta de la simetria. Amb l’ajuda d’aquesta proposició es poden caracteritzar els setins equivalents en termes del mòdul i l’escalonat. Veurem que els setins equivalents a L(m, a) són el seu complementari, el seu associat i el complementari del seu associat. Teorema 25. Dos setins L(m1 , a) i L(m2 , b) són equivalents si i només si m1 = m2 i b ∈ {a, m − a, a0 , m − a0 }.


Les matemàtiques dels setins

57

Esquema de la prova. Si f és una equivalència de L(m1 , a) en L(m2 , b) i (u, v) és una base de L(m1 , a), i F és l’aplicació ortogonal associada al moviment f , aleshores (F (u), F (v)) és una base de L(m2 , b), així que m2 = |det(F (u), F (v))| = |det(u, v)| = m1 , i veiem que setins equivalents tenen el mateix mòdul. En el que segueix, m = m1 = m2 i totes les congruències ho són mòdul m. Només ens cal demostrar, doncs, que L(m, a) ' L(m, b) si i només si b ∈ {a, m − a, a0 , m − a0 }. Suposem que b ∈ {a, m−a, a0 , m−a0 }. En els quatre casos, es pot demostrar fàcilment que l’aplicació f que donem és una equivalència de L(m, a) a L(m, b). Si b = a, la identitat és l’equivalència cercada. Si b = m − a, definim f per f ((x, y)) = (−x, y), que és la simetria respecte de l’eix d’ordenades. Llavors (x, y) ∈ L(m, a) a ax ≡ y a (m − a)(−x) ≡ y a (−x, y) ∈ L(m, m − a), i veiem que f és una equivalència. Anàlogament, si b = a0 , definim f per f ((x, y)) = (y, x), que és la simetria respecte a la recta diagonal de pendent 1, i si b = m − a0 , definim f per f ((x, y)) = (−y, x), que és el gir de centre l’origen i angle π /2. Es comprova fàcilment que es tracta d’equivalències. Recíprocament, sigui f una equivalència de L(m, a) en L(m, b). Indicarem (sense donar detalls) quin és el valor de b en funció de a dependent del tipus de moviment. Si f és una translació de vector u = (u1 , u2 ), aleshores u és un vector enter, au1 ≡ u2 (mod m) i b = a. Si f és un gir de centre c i angle α que és diferent de la identitat, d’acord amb la proposició 24 podem suposar que l’angle α compleix α ∈ {π /2, π , 3π /2}. Llavors, si α = π /2, aleshores b = m − a0 ; si α = π , aleshores b = a; si α = 3π /2, aleshores b = m − a0 . Si f és una simetria axial respecte a una recta `, llavors, si ` és vertical o horitzontal, aleshores b = m − a; si ` és diagonal, aleshores b = a0 . Finalment, considerem el cas que f és una simetria lliscant f = t ◦ s, on s és una simetria axial i t una translació en la direcció de l’eix de la simetria s. Es pot demostrar que necessàriament també s i t són equivalències. Llavors, com en el cas de la simetria axial, b ∈ {m − a, a0 }. 2 En definitiva, la classe dels setins equivalents a un setí donat està formada per ell mateix, el seu complementari, el seu associat i el complementari d’aquest associat. La classe d’equivalència de la plana té cardinal 1. Si el mòdul és m > 2, la classe d’equivalència d’un setí simètric té cardinal 2 perquè a = a0 ; la d’un setí quadrat també té cardinal 2 perquè a = m − a0 ; en tots els altres casos, la classe d’equivalència té cardinal 4. Exemple. El tercer quadrat de la figura 16 és la part del reticle L(m, a) = L(11, 4) que correspon als punts de coordenades compreses entre 0 i 11 i hi hem marcat amb les lletres A, B, C i D els quatre prens que tenen alguna coordenada 1 o 10. Els altres tres quadrats són les mateixes parts dels reticles L(m, m − a) = L(11, 7), L(m, m − a0 ) = L(11, 8) i L(m, a0 ) = L(11, 3),


Carles Lladó i Josep M. Brunat

58

i en els tres hem marcat els prens que es corresponen amb els marcats del tercer per fer més evident les simetries. És clar que L(m, m − a0 ) = L(11, 8) s’obté per un gir d’angle recte de L(m, a) = L(11, 4), que L(m, a0 ) = L(11, 3) i L(m, m − a0 ) = L(11, 8) són simètrics respecte a un costat vertical del quadrat, i el mateix passa amb L(m, a) = L(11, 4) i L(m, m − a) = L(11, 7).

D

D C

C

C

C D

D

A B

A

B A

L(m, a0 ) = L(11, 3)

A

B

L(m, m − a0 ) = L(11, 8)

L(m, a) = L(11, 4)

B

L(m, m − a) = L(11, 7)

Figura 16

8

Setins isonemals

Les equivalències d’un setí L = L(m, a) en ell mateix es diuen simetries del setí, i formen un grup S(L). Un fil de l’ordit d’un lligat s’identifica amb un conjunt Ox = {x} × R amb x enter, i un fil de la trama, amb un conjunt Ty = R × {y} amb y enter. Un fil del lligat és un dels fils Ox o Ty ; denotarem amb F el conjunt de fils. Un setí L = L(m, a) es diu isonemal si el grup S(L) de les seves simetries és transitiu sobre els fils, és a dir, si, donats dos fils F1 , F2 ∈ F , existeix una simetria f ∈ S(L) tal que f (F1 ) = F2 . El concepte de lligat isonemal s’estén a lligats generals, inclosos els que no són generats necessàriament per un curs de lligat quadrat, però la definició és lleugerament diferent perquè en el cas general s’admet una simetria consistent a intercanviar prens i deixes. Els teixits isonemals han estat estudiats per B. Grünbaum i G. C. Shephard; vegeu [16, 17, 18]. Probablement, a part del seu interès estètic, l’interès pràctic dels teixits isonemals prové del fet que, si en un nombre fixat i gran de passades un fil de l’ordit té molts més prens aïllats que un altre fil de l’ordit, el primer acabarà essent sotmès a una tensió més gran que el segon, amb perill de trencament. Per tant, un teixit isonemal té l’avantatge de ser un teixit en què tots els fils de l’ordit són sotmesos a la mateixa tensió durant tot el procés de tissatge. Bona part de l’interès en els setins simètrics i quadrats és que són els únics setins isonemals. En aquest apartat proporcionem un esquema de la prova, que comença amb el lema següent de prova fàcil que ometem. Lema 26. Sigui L un setí i F1 , F2 dos fils de L, tots dos de l’ordit o tots dos de la trama. Si p1 és un pren de F1 i p2 és un pren de F2 , aleshores la translació t de vector u = p2 − p1 és una simetria de L tal que t(F1 ) = F2 .


Les matemàtiques dels setins

59

Teorema 27. Un setí L(m, a) és isonemal si i només si és simètric o quadrat. Prova. Suposem que el setí L(m, a) és simètric o quadrat, i siguin F1 i F2 dos fils. Si tots dos fils són de l’ordit o tots dos de la trama, el lema 26 garanteix que existeix una simetria que transforma l’un en l’altre. Suposem, doncs, que F1 = Ty1 i F2 = Ox2 . Siguin p1 = (x1 , y1 ) ∈ L(m, a) i p2 = (x2 , y2 ) ∈ L(m, a) prens dels fils Ty1 i Ox2 , respectivament. La translació t de vector u = p2 − p1 aplica Ty1 en Ty2 conservant els prens. Suposem que L(m, a) és simètric. Si s és la simetria axial respecte a la recta diagonal de pendent 1 que passa per p2 , aleshores s deixa invariant el pren p2 i aplica Ty2 en Ox2 conservant els prens. Aleshores f = s ◦ t és una simetria de L(m, a) tal que f (Ty1 ) = Ox2 . Si L(m, a) és quadrat, considerem el gir g d’angle recte de centre p2 . Aquest gir també deixa invariant el pren p2 i aplica Ty2 en Ox2 conservant els prens. Per tant, f = g ◦ t és una simetria de L(m, a) tal que f (Ty1 ) = Ox2 . En tots dos casos, doncs, existeix una simetria f de L tal que f (Ty1 ) = Ox2 i, evidentment, la simetria f −1 transforma Ox2 en Ty1 . Donats dos fils, doncs, hi ha una simetria que transforma l’un en l’altre. Recíprocament, suposem que un setí L(m, a) és isonemal. Considerem els dos fils concrets O0 i T0 , és a dir, els dos eixos de coordenades. Com que el setí és isonemal, existeix una simetria f del setí tal que transforma l’un en l’altre. La simetria f és, en aquest cas, un moviment del pla que transforma un eix de coordenades en l’altre i deixa fix l’origen. Per tant, f és una simetria axial respecte a una recta que passa per l’origen i de pendent 1 o −1, o bé f és un gir de centre l’origen i d’angle π /2 o 3π /2. D’acord amb les definicions de les pàgines 44 i 49, en el primer cas es tracta d’un setí simètric i en el segon d’un setí quadrat. 2

9

Setins de Fibonacci

La successió de Fibonacci F = (fi : i ≥ 0) es defineix pels valors inicials f0 = 0, f1 = 1 i per la recurrència fi = fi−1 + fi−2 per a i ≥ 2. Els nombres de la successió F s’anomenen nombres de Fibonacci i és ben sabut √ √ que admeten l’expressió explícita següent: si φ = (1 + 5)/2 i ψ = (1 − 5)/2, aleshores √ fi = (φi − ψi )/ 5 per a tot i ≥ 0. Llevat el cas f1 = f2 = 1, cada nombre de Fibonacci és estrictament major que l’anterior. La fórmula recurrent fi+1 = fi + fi−1 indica que, per a i ≥ 2, la divisió de fi+1 per fi té quocient 1 i residu fi−1 i que fi−1 < fi+1 /2. També, per a i ≥ 4, fi+1 = fi + fi−1 = (fi−1 + fi−2 ) + fi−1 = 2fi−1 + fi−2 indica que la divisió de fi+1 per fi−1 té quocient 2 i residu fi−2 . Entre la inacabable llista de propietats dels nombres de Fibonacci, n’esmentem dues que ens faran servei. Les demostracions es poden trobar a molts llocs, per exemple a l’enciclopèdica obra de T. Koshy [21, volum 1, teorema 5.3 i teorema 10.3], dedicat als nombres de Fibonacci i de Lucas.


Carles Lladó i Josep M. Brunat

60

Proposició 28. Els nombres de Fibonacci compleixen les propietats següents. (i) (Identitat de Cassini) Per a tot enter i ≥ 1 es compleix fi−1 fi+1 −fi2 = (−1)i . (ii) Per a qualssevol enters j ≥ i ≥ 1, si d = mcd(j, i), llavors mcd(fj , fi ) = fd . Com que mcd(i + 1, i) = 1, l’apartat (ii) implica mcd(fi+1 , fi ) = f1 = 1. Com que mcd(i + 1, i − 1) = mcd(i + 1, 2) ∈ {1, 2} i f1 = f2 = 1, resulta mcd(fi+1 , fi−1 ) = 1. Així, si i ≥ 2, aleshores L(fi+1 , fi ) i L(fi+1 , fi−1 ) són setins i, atès que la suma dels dos escalonats fi + fi−1 és el mòdul fi+1 , es tracta de setins complementaris; però només L(fi+1 , fi−1 ) compleix que l’escalonat sigui menor que la meitat del mòdul. D’entre totes les parelles d’enters m > a > 0 tals que l’algorisme d’Euclides per trobar mcd(m, a) requereix n divisions, els valors més petits de m i a són m = fn+2 i a = fn+1 (vegeu D. E. Knuth [20, apartat 4.5.3, teorema F]). Aquest fet va portar a pensar que els nombres de Fibonacci donarien exemples interessants d’aplicació de l’algorisme d’Euclides estès a trobar bases de setins. Per a i ≥ 5, definim, doncs, l’i-èsim setí de Fibonacci F (i) com el setí F (i) = L(fi+1 , fi−1 ). Veurem que els setins de Fibonacci són simètrics o quadrats i que l’algorisme d’Euclides sempre en proporciona una base òptima les coordenades de la qual són, llevat del signe, també nombres de Fibonacci. En farem les demostracions perquè no són llargues i perquè no han estat publicades. Coneguts els quocients de les divisions fi+1 per fi i per fi−1 que hem esmentat més amunt, l’aplicació de l’algorisme d’Euclides per trobar els vectors d’Euclides de F (i) = L(fi+1 , fi−1 ) dona el resultat següent, fàcilment demostrable per inducció. Proposició 29. Siguin i ≥ 4 i eα , amb α ∈ {0, . . . , n + 1}, els vectors d’Euclides de F (i). Aleshores n + 1 = i − 1 i els vectors eα són: e0 = (f0 , fi+1 ), eα = ((−1)α+1 fα+1 , fi−α ) per a tot α ∈ {1, . . . , i − 2}, ei−1 = ((−1)i fi+1 , f0 ). Amb això, podem veure que F (i) és quadrat o simètric segons que i sigui parell o senar, i podem explicitar-ne una base òptima. Per a i parell, tenim: Teorema 30. Si i és parell, el setí de Fibonacci F (i) és quadrat i, si definim k = i/2, aleshores una base òptima de F (i) és (((−1)k fk , fk+1 ), ((−1)k+1 fk+1 , fk )). Prova. Per la identitat de Cassini fi2 ≡ −1 (mod fi+1 ). De fi−1 + fi = fi+1 , 2 obtenim fi−1 ≡ −fi (mod fi+1 ) i fi−1 ≡ fi2 ≡ −1 (mod fi+1 ). Per tant, F (i) és un setí quadrat. Com que L(fi+1 , fi−1 ) té n + 1 = i − 1 vectors d’Euclides, tenim n = i − 2 i, pel teorema 6, si k = (n + 2)/2 = i/2, una base òptima de F (i) és (ek−1 , ek ). Per aplicació de la proposició 29, ek−1 = ((−1)k−1 fk , fk+1 ), com volíem demostrar.

ek = ((−1)k fk+1 , fk ),

2


Les matemàtiques dels setins

61

Per a i senar, tenim: Teorema 31. Si i és senar, el setí F (i) és simètric i, si definim j = (i − 1)/2, aleshores una base òptima de F (i) és (((−1)j+1 fj+1 , fj+1 ), ((−1)j fj , fj+2 )). Prova. Per la identitat de Cassini, fi2 ≡ 1 (mod fi+1 ). De fi−1 + fi = fi+1 , 2 obtenim fi−1 ≡ −fi (mod fi+1 ) i fi−1 ≡ fi2 ≡ 1 (mod fi+1 ). Per tant, F (i) és simètric. En aquest cas, l’índex central de l’algorisme d’Euclides és j = (i − 1)/2, i |vj | = rj = fi−j = fj+1 . A més, k = min{α : |vα | > rα } = j + 1. El vector més curt de F (i) és un dels quatre ej−1 , ej , ej+1 i ej+2 . Ara, kej+2 k = kej−2 k, però ej−2 no és el vector més curt. Com que kej+1 k = kej−1 k, el vector més curt és ej−1 o ej . Tenim, 2 2 2 kej k < kej−1 k a fj+1 + fj+1 < fj2 + fj+2 2 2 2 a fj+1 − fj2 < fj+2 − fj+1

a (fj+1 + fj )(fj+1 − fj ) < (fj+2 + fj+1 )(fj+2 − fj+1 ) a (fj+1 + fj )fj−1 < (fj+2 + fj+1 )fj . Aquesta última desigualtat és òbvia, així que ej és el vector més curt. Apliquem l’algorisme de Lagrange-Gauss a la base (ej , ej−1 ). Tenim, 2 ej · ej−1 = −fj+1 fj + fj+1 = fj+1 (fj+1 − fj ) = fj+1 fj−1 = fj2 + (−1)j .

Llavors, 2

µ=

j

fj + (−1) ej · ej−1 = . 2 2 kej k 2fj+1

És clar que 0 < µ < 1/2 i, en conseqüència, h = bµe = 0. Per tant, (ej , ej−1 ) és una base òptima. Per la proposició 29, ej = ((−1)j+1 fj+1 , fj+1 ), com volíem demostrar.

ej−1 = ((−1)j fj , fj+2 ),

2

Acabem aquest últim apartat amb una qüestió natural. Considerem un setí tal que el mòdul i l’escalat siguin nombres de Fibonacci: L(fj , fi ) amb j ≥ i + 2. Per tal que es tracti efectivament d’un setí, cal que mcd(fj , fi ) = 1. Atès que, si d = mcd(j, i), es compleix mcd(fj , fi ) = fd (proposició 28(ii)) i que fd = 1 és equivalent a d ∈ {1, 2}, cal exigir mcd(j, i) ∈ {1, 2}. Suposat això, és natural preguntar-se per a quins valors de i i j el setí L(fj , fi ) és simètric o quadrat, altrament dit, esbrinar els i i j tals que fi2 ≡ 1 (mod fj ) o fi2 ≡ −1 (mod fj ). Donat un enter m ≥ 2, la successió F (m) = (fi (mod m) : i ≥ 0) és periòdica perquè només hi ha m2 parelles de residus i, per tant, en algun punt de la successió F (m) es repeteix una parella de termes consecutius, és a dir, per a cert enter p, es compleix (fi (mod m), fi+1 (mod m)) =


62

Carles Lladó i Josep M. Brunat

(fi+p (mod m), fi+p+1 (mod m)). Com que dos termes consecutius de la successió determinen tota la successió, en resulta la periodicitat. El període de la successió F (m) ha estat objecte d’estudi (vegeu la pàgina web mantinguda per M. Renault [28] i totes les seves referències). Que la successió F (m) sigui periòdica implica que totes les successions F e (m) = (fie (mod m) : i ≥ 0) amb e ≥ 0 enter també ho són, en particular les successions F e (fj ), de les quals es coneix el període i els valors dels termes que es repeteixen (vegeu [2]). Per detectar els setins simètrics i quadrats d’entre tots aquells que tenen mòdul i escalonat que són nombres de Fibonacci, interessa la successió dels quadrats, és a dir, el cas e = 2, de la qual detallem el resultat. Proposició 32. Sigui j ≥ 4 un enter i, per a i ≥ 0, sigui ρi ≡ fi2 (mod fj ) amb 0 ≤ ρi ≤ fj − 1. (i) Si j = 2t és parell, aleshores F 2 (fj ) té periodicitat j i els valors dels ρi per a i ∈ {0, . . . , j − 1} són: (i.1) ρi = fi2 si i ∈ {0, . . . , t}; 2 (i.2) ρi = fj−i si i ∈ {t + 1, . . . , j − 1}.

(ii) Si j = 2t + 1 és senar, aleshores F 2 (fj ) té periodicitat 2j i els valors dels ρi per a i ∈ {0, . . . , 2j − 1} són: (ii.1) ρi = fi2 si i ∈ {0, . . . , t + 1}; 2 (ii.2) ρi = fj − fj−i si i ∈ {t + 2, . . . , j − 1};

(ii.3) ρi = 0 si i = j; (ii.4) ρi = ρ2j−i si i ∈ {j + 1, . . . , 2j − 1}. Per exemple, per a j = 10, tenim f10 = 55 i la seqüència F 2 (55) consta de la repetició dels 10 valors 0, 1, 1, 4, 9, 25, 9, 4, 1, 1, mentre que, per a j = 11, tenim f11 = 89 i F 2 (89) consta de la repetició dels 22 valors, 0, 1, 1, 4, 9, 25, 64, 80, 85, 88, 88, 0, 88, 88, 85, 80, 64, 25, 9, 4, 1, 1. La proposició 32 permet demostrar la unicitat dels setins de Fibonacci com els únics setins definits per nombres de Fibonacci que són simètrics o quadrats. Teorema 33. Siguin j > i + 1 ≥ 3 enters amb mcd(i, j) = {1, 2} i considerem el setí L = L(fj , fi ). (i) Si j és parell, aleshores L no és quadrat i L és simètric si i només si i = j − 2. (ii) Si j és senar, aleshores L no és simètric i L és quadrat si i només si i = j − 2.


Les matemàtiques dels setins

63

Prova. Com abans, definim els ρi per ρi ≡ fi2 i 0 ≤ ρi < fj −1. La proposició 32 dona els seus valors. (i) Si j = 2t és parell, veiem que 1 < ρ3 < · · · < ρt−1 < ρt , ρt > ρt+1 > · · · > ρj−3 > ρj−2 = ρj−1 = 1, amb ρt = ft2 < fj − 1. Si 3 ≤ i ≤ j − 1, tenim ρi 6= fj − 1, és a dir que fi2 6≡ −1 (mod fj ); i ρi = 1, o sigui, fi2 ≡ 1 (mod fj ) si i només si i = j − 1 o i = j − 2. Llavors L(fj , fi ) no és quadrat i, com que i < j − 1, és simètric si i només si i = j − 2. (ii) Si j = 2t + 1 és senar, veiem que 1 < ρ3 < · · · < ρt−1 < ρt < ρt+1 , ρt+1 > ρt+2 > · · · > ρj−2 = ρj−1 > ρj = 0. 2 Ara, ρt+1 = ft+1 < fj − 1 i ρj−2 = ρj−1 = fj − 1. Llavors, ρi 6= 1, o sigui 2 fi 6≡ 1 (mod fj ) i ρi = fj − 1, o sigui fi2 ≡ −1 (mod fj ) si i només si i = j − 1 o i = j − 2. Així (fj , fi ) no és simètric i, com que i < j − 1, és quadrat si i només si i = j − 2. 2

En general, la base de qualsevol curs d’un lligat és el d’un setí. En els telers clàssics, les restriccions mecàniques no permeten teixir cursos de mòdul gaire elevat: cursos de mòdul 16 o 24 ja són considerables. Per al tissatge de cursos de mòduls més grans cal utilitzar telers amb tecnologia Jacquard. Els setins de Fibonacci, que creixen de mòdul ràpidament, poden proporcionar amb facilitat setins quadrats i simètrics de mòdul gran.

10

Cloenda

És cert que la tasca dels teòrics del tèxtil considera molts més aspectes que els tractats aquí. Per exemple, cal estudiar les fibres que permeten fer fils adequats, cal considerar la torsió, el gruix i el color dels fils, s’ha de veure com convé passar els fils pels lliços i moltes altres qüestions rellevants. Però sembla clar que el curs fonamental dels lligats de setí són a la base de la teoria de teixits. La modelització que hem exposat d’aquests lligats emprant eines aritmètiques i geomètriques ajuda a la seva millor comprensió i dona eines per trobar, estudiar i classificar els setins, per saber-ne els límits i les potencialitats, en particular dels setins quadrats i dels simètrics. Potser això permetrà obrir camins cap a noves maneres de trobar nous cursos de lligat, ja siguin fonamentals i/o derivats.


64

Carles Lladó i Josep M. Brunat

Agraïments Volem agrair a Manuel Udina els seus comentaris, que han millorat el text; a Joan Carles Lario, els seus suggeriments sobre els setins de Fibonacci; finalment, a la Casa Navàs, de Reus, el fet d’haver-nos permès utilitzar la imatge d’un detall dels seus enrajolats.

Referències [1] Brunat, J. M.; Lario, J.-C. «Satins, lattices, and extended Euclid’s algorithm». Jpn. J. Ind. Appl. Math., 39 (1) (2022), 75–96. [2] Brunat, J. M.; Lario, J.-C. «Periodicity of power Fibonacci sequences modulus a Fibonacci number». Preprint (2022). [Disponible en línia a arXiv:2204.00234] [3] Burton, D. M. Elementary Number Theory. 6a ed. Nova York: McGraw Hill, 2007. [4] Cerruti, F. «Nuovo metodo per la classificazione dei tessuti». L’Ingegneria Civile e le Arti Industrial, any v, núm. 10 (octubre 1870), 157–159. [5] Clapham, C. R. J. «When a fabric hangs together». Bull. London Math. Soc., 12 (3) (1980), 161–164. [6] Clapham, C. R. J. «The bipartite tournament associated with a fabric». Discrete Math., 57 (1-2) (1985), 195–197. [7] Crowe, D. W. «The mosaic patterns of H. J. Woods». Symmetry: unifying human understanding, I. Comput. Math. Appl. Part B, 12 (1-2) (1986), 407–411. [8] Delaney, C. «When a fabric hangs together». Thirteenth Australasian Conference on combinatorial mathematics and computing (Sydney, 1985). Ars Combin., 21A (1986), 71–79. [9] Enns, T. C. «An efficient algorithm determining when a fabric hangs together». Geom. Dedicata, 15 (3) (1984), 259–260. [10] Galbraith, S. D. Mathematics of Public Key Cryptography. Version 2.0. Octubre 2018. [Disponible en línia a https://www.math.auckland.ac.nz/ ∼sgal018/crypto-book/main.pdf] [11] Galcerán, V. Lecciones de Teoría de Tejidos. Monturas a Lizos. Terrassa: Escuela Especial de Ingenieros de Industrias Textiles de Tarrassa, 1953. [12] Gand, E. «Nouvelles méthodes de construction des satins réguliers, pairs et impairs. 1-Théorie des nombres premiers appliquée aux pointés de ces armures». Bull. Soc. Ind. Amiens (gener 1867), 57–88. [13] Gand, E. «Nouvelles méthodes de construction des satins réguliers, pairs et impairs. 2-Armures-tissu, armures-dessin, mosaïques». Bull. Soc. Ind. Amiens (juliol 1867), 257–300. [14] Giménez, T. «Algunas observaciones sobre la teoría de los rasos». Cataluña Textil, tom xi, núm. 133 (octubre 1917), 131–134.


Les matemàtiques dels setins

65

[15] Griswold, R. E. «When a fabric hangs together (or doesn’t)» (juliol, 2004). [Disponible en línia a https://www2.cs.arizona.edu/patterns/ weaving/webdocs/gre_hng1.pdf] [16] Grünbaum, B.; Shephard, G. C. «Satins and twills: an introduction to the geometry of fabrics». Math. Mag., 53 (3) (1980), 139–161. [17] Grünbaum, B.; Shephard, G. C. «A catalogue of isonemal fabrics». A: Discrete Geometry and Convexity (New York, 1982). Nova York: New York Academy of Sciences, 1985, 279–298. (Ann. New York Acad. Sci.; 440) [18] Grünbaum, B.; Shephard, G. C. «An extension to the catalogue of isonemal fabrics». Discrete Math., 60 (1986), 155–192. [19] Hoffstein, J.; Pipher, J.; Silverman, J. H. An Introduction to Mathematical Cryptography. 2a ed. Nova York: Springer, 2014. (Undergrad. Texts Math.) [20] Knuth, D. E. The Art of Computer Programming. Vol. 2. Seminumerical Algorithms. 3a ed. Reading, MA: Addison-Wesley, 1998. [21] Koshy, T. Fibonacci and Lucas Numbers with Applications. Hoboken, NJ: John Wiley & Sons, Inc., 2018 i 2019. 2 v. (Pure Appl. Math. (Hoboken)) [22] Krishnamurthy, V. R.; Akleman, E.; Subramanian, S. G.; Ebert, M.; Cui, J.; Fu, C.-A.; Starrett, C. «Geometrically interlocking space-filling tiling based on fabric weaves». IEEE Trans. Visual Comput. Graphics, 28 (10) (2022), 3391–3404. [23] Lladó, C. Teoria de teixits, un camp d’experiència per a la matemàtica. Sabadell: Fundació Bosch i Cardellach, 2022. [24] Lucas, E. Aplication de l’arithmétique a la construction de l’armure des satins réguliers. París: Gustave Retaux, Librairie-éditeur, 1867. [25] Lucas, E. «Principii fondamentali della geometria dei tessuti.» L’Ingegneria Civile e le arti industriali. Geometria Aplicata all’Industria, any vi, núm. 7 (juliol 1880). [26] Lucas, E. «Principii fondamentali della geometria dei tessuti. Appendice». L’Ingegneria Civile e le arti industriali. Geometria Aplicata all’Industria, any vi, núm. 8 (agost 1880). [27] Niven, I.; Zuckerman, H. S.; Montgomery, H. L. An Introduction to the Theory of Numbers. 5a ed. Nova York: John Wiley & Sons, Inc., 1991. [28] Renault, M. «The Fibonacci sequence modulo m». [Disponible en línia a http://webspace.ship.edu/msrenault/fibonacci/fib.htm] [29] Rodón y Amigó, P. «Estudio científico de los rasos regulares». Cataluña Textil, tom i (2) (1906), 44–46. [30] Rodón y Amigó, P. «Estudio científico de los rasos regulares (continuación)». Cataluña Textil, tom i (3) (1906), 69–70. [31] Rodón y Amigó, P. «Estudio científico de los rasos regulares (continuación)». Cataluña Textil, tom i (5) (1907), 117–121. [32] Rodón y Amigó, P. «Estudio científico de los rasos regulares (continuación)». Cataluña Textil, tom i (6) (1907), 136–138.


66

Carles Lladó i Josep M. Brunat

[33] Rodón y Amigó, P. «Estudio científico de los rasos regulares (continuación)». Cataluña Textil, tom i (10) (1907), 232–236. [34] Rodón y Amigó, P. «Estudio científico de los rasos regulares (continuación)». Cataluña Textil, tom i (12) (1907), 293–299. [35] Rodón y Amigó, P. «Estudio científico de los rasos regulares (continuación)». Cataluña Textil, tom i (14) (1907), 357–365. [36] Shorter, S. A. «The mathematical theory of the sateen arrangement». Math. Gaz., 10 (147) (1920), 92–97. [37] Shoup, V. A Computational Introduction to Number Theory and Algebra. 2a ed. Cambridge: Cambridge University Press, 2009. [38] Woods, H. J. «The geometrical basis of pattern design. Part I: Points and line symmetry in simple figures and borders». J. Textile Inst. Transactions, 26 (6) (1935), T197–T210. [39] Woods, H. J. «The geometrical basis of pattern design. Part II: Nets and sateens». J. Textile Inst. Transactions, 26 (10) (1935), T293–T308. [40] Woods, H. J. «The geometrical basis of pattern design. Part III: Geometrycal symmetry in plane patterns». J. Textile Inst. Transactions, 26 (12) (1935), T341–T357. [41] Woods, H. J. «The geometrical basis of pattern design. Part IV: Countercharge symmetry in plane patterns.» J. Textile Inst. Transactions, 27 (12) (1936), T305–T320.

Carles Lladó Jubilat de l’IES Sabadell C/ Juvenal, 1 08206 Sabadell, Catalunya cllado@xtec.cat Josep M. Brunat Jubilat del Departament de Matemàtiques Universitat Politècnica de Catalunya C/ Jordi Girona, 1–3 08034 Barcelona, Catalunya josep.m.brunat@upc.edu


Butlletí de la Societat Catalana de Matemàtiques Vol. 38, núm. 1, 2023. Pàg. 67–105. DOI: 10.2436/20.2002.01.109

De la teoria de grafs clàssica a l’anàlisi de les grans xarxes Juanjo Rué

La formulació d’un problema és més important que la seva solució. Albert Einstein

Resum: Actualment la teoria de grafs té un paper fonamental tant en les matemàtiques pures com en les seves aplicacions en moltes branques del coneixement. En aquest article recorrerem l’evolució de l’àrea de recerca partint del seu naixement i passant per les grans descobertes de la disciplina, especialment les relatives a la interacció amb la noció d’atzar. Finalment, el nostre recorregut finalitzarà discutint algunes de les tendències actuals de la teoria, que cerquen encabir la noció de discret (inherent a la teoria de grafs) dins del reialme de les matemàtiques contínues amb l’objectiu d’afrontar, entre d’altres grans reptes, l’estudi sistemàtic de les grans xarxes existents al món real. Paraules clau: teoria de grafs, mètode probabilístic, límits de grafs, grafs aleatoris, pseudoaleatorietat.

Classificació MSC2020: 05C10, 05D40, 05C35.

1

Introducció

En els darrers anys s’ha fet més que evident que un gran nombre d’estructures i fenòmens ben rellevants del món real es poden descriure mitjançant grafs (també anomenats xarxes) o, en llenguatge planer, mitjançant un conjunt (discret i finit) d’elements separables, junt amb interaccions entre parelles dels elements del conjunt. Els exemples següents poden ser paradigmàtics i prou representatius del tipus de grafs que ens trobem en el món real: La xarxa Internet: El graf per antonomàsia (pel fet de ser el més conegut i possiblement el més estudiat) és l’associat a la xarxa Internet. No només aquesta, sinó d’altres que se’n deriven de manera natural: la xarxa d’hipervincles


68

Juanjo Rué

(per exemple, de pàgines web), certes bases de dades distribuïdes, etc. La mida de la xarxa Internet no és un paràmetre menor i està en constant evolució: actualment el nombre de pàgines web s’estima que supera el bilió, de les quals aproximadament un 17 % són actives, i aproximadament 5 bilions de dispositius hi tenen accés. La xarxa Internet, a més de ser una xarxa ben gran, canvia constantment. El cervell: A més de les xarxes que apareixen en l’estudi de l’ecologia, la biologia estudia molts cops xarxes d’interacció entre, per exemple, proteïnes. Però potser l’exemple més paradigmàtic en aquest àmbit és el cervell humà, o més ben dit, el graf que defineixen les neurones del cervell i les connexions entre elles: s’estima que el cervell conté de l’ordre de 100.000 milions de neurones (1011 ) i de l’ordre de 100 trilions de connexions, les anomenades sinapsis. De nou, aquesta xarxa (a més de ser molt gran) evoluciona amb el temps segons les tasques de les diverses neurones, de la seva mort, etc. Interaccions socials: Els grafs d’interacció social (tant en el món virtual com les que apareixen en sociologia, història, economia i epidemiologia, entre d’altres) són bons exemples de grafs amb molts individus. Sense anar més lluny, el graf en què els agents que interaccionen són els éssers humans vius (i les arestes són precisament la coneixença entre dues persones) dona lloc a un graf que s’apropa cada cop més als 8.000 milions de nodes (de fet, estimacions de novembre de 2022 ja consideren que s’ha superat aquesta barrera). En particular, aquest graf evoluciona en cada moment per les dinàmiques inherents a la interacció social (per exemple, pels naixements, defuncions, etc.). Fins i tot es podria considerar una iteració més d’aquest graf: la xarxa social de tots els éssers humans vius o morts. Aquí el nombre d’agents seria, doncs, molt més elevat. Microprocessadors: Des de la creació del primer transistor després de la Segona Guerra Mundial als laboratoris Bell de l’AT&T (a Nova Jersey, Estats Units), la llei de Moore (formulada l’any 1965 [27]) va vaticinar que aproximadament cada dos anys el nombre de transistors en un microprocessador es duplicaria. La llei s’ha anat complint de manera prou ajustada fins avui dia. Aquest creixement exponencial durant els darrers setanta anys ha fet que actualment existeixin microprocessadors comercials (per exemple, de les empreses Intel o AMD) en què la integració supera els 50.000 milions de transistors per microprocessador. Les connexions entre els transistors es defineixen dinàmicament segons les tasques que el microprocessador estigui realitzant. Tenint en consideració que el transistor és l’escala binària bàsica i que els ordinadors actuals treballen a una amb un nivell de paral.lelització descomunal (si els comparem, sense anar més lluny, amb els ordinadors de fa deu anys), és clar que el nombre d’interaccions per segon entre transistors serà de l’ordre de trilions. Cristalls: La física estadística (tant des del punt de vista teòric com des del vessant més aplicat) estudia les interaccions entre un gran nombre de partícules discretes, molts cops modelant estructures físiques de tipus continu. Sense anar més lluny, un cristall es pot interpretar com una xarxa els nodes de la qual


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

69

són els àtoms i les interaccions representen la química intrínseca dels enllaços. En aquest sentit, un cristall perfecte (en què els àtoms es col.loquen de manera completament simètrica) té poc interès, i amb l’aparició d’impureses obtenim materials amb propietats interessants. Tenint en ment que estem treballant a escala atòmica i que molts cops les aplicacions industrials necessiten mides macroscòpiques, aleshores és evident que les mides de les xarxes es poden arribar a considerar en termes de múltiples del nombre d’Avogadro (6.022 × 1023 ). Tots aquests exemples tenen un gran interès per a la societat i tenen també diversos aspectes en comú. Primer: són grafs descomunals dels quals mai no podrem tenir el coneixement absolut de tots dels seus vèrtexs i de les corresponents interaccions (més sorprenent encara quan constatem que algunes d’aquestes xarxes les ha creat l’ésser humà!). I segon, no són grafs estàtics: evolucionen amb el pas del temps. Apareix, doncs, un problema natural: com podem analitzar aquests grafs tan grans des d’un punt de vista pràctic? El primer pensament per a resoldre aquesta pregunta és l’exploració directa mitjançant tècniques computacionals (per exemple, fent cerques exhaustives). Però hom es pot imaginar que la complexitat d’aquestes xarxes és tan elevada que fins i tot amb ordinadors potents no podrem donar respostes satisfàctories a preguntes tan bàsiques com si el graf és connex o si té triangles. En els darrers seixanta anys la teoria de grafs ha evolucionat de manera dramàtica (de la mà també d’una branca del coneixement amb una evolució no menys espectacular: la informàtica teòrica) i avui en dia podem dir que tenim una sèrie de tècniques (en què la probabilitat té un paper fonamental) que són útils per a resoldre, en part, aquestes qüestions. Com a culminació d’un camí que va començar fa gairebé tres-cents anys, avui dia la teoria de grafs ja és una branca madura de recerca de les matemàtiques i amb interaccions molt profundes amb altres àrees de la ciència. El nostre objectiu en aquest assaig és fer un recorregut des de la seva infància fins a la madura branca del coneixement tal com l’entenem avui. Per finalitzar aquesta introducció voldríem remarcar que per manca d’espai és impossible poder cobrir un recull històric exhaustiu de la totalitat d’aquesta disciplina, així com de les seves interaccions amb altres branques (especialment aquí s’està pensant en la informàtica teòrica i en l’optimització discreta). Ens centrarem, en aquest assaig, en un relat que ens portarà dels primers problemes de l’àrea (ja al segle xvii) al gran programa iniciat fa poc més de vint anys pel guanyador del premi Abel Lázsló Lovász i coautors (mireu, per exemple, el llibre clau en aquesta teoria [24]) i que té com a objectiu la comprensió profunda dels grafs en termes d’objectes continus.

2

L’origen: tot passejant per Königsberg

Si una branca de les matemàtiques té un origen ben definit i unívocament determinat, aquesta és la teoria de grafs. I s’inicia, com molts cops passa, amb una pregunta innocent, com moltes de les que veurem més endavant (no per


70

Juanjo Rué

innocent menys interessant, però). En aquest cas, el problema pot ubicar-se geogràficament en l’actual Kaliningrad (anteriorment anomenada Königsberg), ciutat que des de l’any 1946 pertany a Rússia arran de la Conferència de Potsdam. La ciutat de Kaliningrad creix al llarg del riu Pregolia i defineix al seu centre l’illa de Kneiphof, on es trobava la catedral de la ciutat (vegeu la figura 1 amb una antiga imatge de l’illa des de l’altre costat de la ribera).

Figura 1: Fotografia de l’any 1912 de la catedral de Königsberg i mapa antic de la ciutat.

La qüestió (més aviat, el divertiment) que es proposaven els ciutadans de la ciutat de Königsberg durant el segle xviii era la següent: la ciutat estava comunicada a través de set ponts, tal com es mostra a la figura 1. La pregunta és si era possible fer una passejada passant per tots els ponts de la ciutat (en un sentit o en un altre) i sense repetir-ne cap. La solució del problema dels ponts de Königsberg va ser proposada pel gran Leonhard Euler i amb aquesta resposta inicià la teoria de grafs. En el seu treball Solutio problematis ad geometriam situs pertinentis, de l’any 1736, el gegant matemàtic formula i resol el problema en termes abstractes, tot iniciant així una nova branca de les matemàtiques (de fet, no només de la teoria de grafs, sinó que es podria pensar que també de la topologia). Vegem-ne el plantejament i la solució i, el més important, la generalització. La primera observació rellevant és que el realment important en el problema és quines regions de la ciutat de Königsberg tenim i quines illes estan connectades per ponts. En llenguatge modern diríem que les quatre regions de la ciutat són els vèrtexs i que els ponts que les uneixen són les arestes. En general, un graf G, doncs, vindrà definit per una parella (V , A), en què V és el conjunt de vèrtexs i A són conjunts de parelles de vèrtexs (parella que en aquest model prenem no ordenada). Si aquestes es consideren amb repetició (dit d’una altra manera, diverses arestes poden unir una mateixa parella de vèrtexs), aleshores direm que el graf té arestes múltiples i que estem treballant amb un multigraf (en els multigrafs també podem acceptar arestes amb només un sol vèrtex extrem: són les arestes que anomenem llaços). Altrament, si el graf no té ni arestes múltiples ni llaços, direm que el graf és simple. En el cas del problema que


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

71

portem entre mans, el graf concret que obtenim (que, en particular, té arestes múltiples) és el que es mostra en la figura 2.

Figura 2: Diagrama de ponts simplificat i multigraf associat.

El nostre multigraf té, doncs, quatre vèrtexs i set arestes, dues parelles de les quals són múltiples. El que volem estudiar ara és l’existència d’una seqüència de vèrtexs (possiblement repetits) en el graf G, diem-ne v1 , v2 , . . . , vr , de tal manera que els vèrtexs consecutius en la seqüència estan units per arestes, que totes les arestes {vi , vi+1 } per i = 1, 2, . . . , r − 1 són diferents i que totes les arestes del graf han aparegut en el passeig. Com a comentari, el primer vèrtex (v1 ) i l’últim (vr ) poden ser iguals o diferents. Direm que un tal recorregut del graf s’anomenarà camí eulerià. Si, a més, el vèrtex inicial i el vèrtex final són el mateix, el que tindrem és un cicle eulerià o circuit eulerià. Quin criteri tenim per a decidir si un graf G conté un camí eulerià o bé un circuit eulerià, o cap d’ells? Per a respondre aquesta pregunta ens cal definir un paràmetre clau en grafs. Donat un graf G i un vèrtex v ∈ V de G, el seu grau (que denotarem indistintament amb d(v), deg(v) o gr(v)) és el nombre d’arestes adjacents amb v. Aquí l’adjacència es compta amb multiplicitat: es té consideració, per exemple, si hi ha arestes múltiples. Així, en el nostre cas tenim tres vèrtexs de grau 3 i un vèrtex de grau 5. A més a més d’aquesta definició, ens cal també una altra condició natural per a poder formular amb precisió la qüestió que estem tractant: cal que el graf sigui connex. Dit d’una altra manera, ens cal que puguem passejar d’un vèrtex v arbitrari a qualsevol altre vèrtex w a través d’una seqüència de vèrtexs adjacents per arestes. És clar que, si un graf no és connex, aleshores és impossible l’existència de cicles (ni camins) eulerians. En tot cas, si un graf no és connex, aleshores defineix una sèrie de subgrafs connexos, corresponents als seus subgrafs maximals connexos. Anomenarem cadascun d’aquests subgrafs component connexa del graf. En particular, un graf connex té només una component connexa. Amb tots aquests conceptes ja podem enunciar i demostrar el teorema següent, que inicia tota la teoria de grafs: Teorema 1 (Euler, 1736). Sigui G = (V , A) un multigraf connex. Aleshores G admet un circuit eulerià si i només si tots els vèrtexs de G tenen grau parell.


72

Juanjo Rué

Observeu que, abans de passar a demostrar aquest resultat, i si donem aquesta afirmació per bona, tenim de manera immediata la condició necessària i suficient per a assegurar l’existència (o no) de camins eulerians en grafs connexos: un multigraf admet un camí eulerià si i només si tots els vèrtexs llevat de dos tenen grau parell. Efectivament: si admet un camí eulerià, realitzemlo i mirem el primer i l’últim vèrtexs. Si ara afegim una aresta entre aquests dos (una aresta que no hi fos al principi), podrem completar el camí eulerià a un circuit eulerià fent un pas més, i el teorema d’Euler ens diu que tots els vèrtexs en el nou graf tenen grau parell. Per tant, el graf inicial complia que tots els graus eren parells llevat dels vèrtexs inicial i final en el camí eulerià. Recíprocament, si tenim un multigraf que compleix la condició de graus que indiquem i afegim una aresta entre els vèrtexs de grau senar, obtenim aleshores un nou graf amb tots els vèrtexs de grau parell. Ara podem aplicar el teorema d’Euler, construir el circuit eulerià i finalment esborrar l’aresta que hem afegit al principi per recuperar un camí eulerià en el graf original. En particular, el nostre argument ens demostra que el graf associat als ponts de Königsberg no compleix cap de les hipòtesis, ja que té quatre vèrtexs de grau senar. Vegem, ara ja, la prova del teorema. Prova. Començarem per la implicació més fàcil. Suposem que el nostre graf té un circuit eulerià. Aleshores, a l’hora de recórrer-lo segons les arestes, cada cop que entrem a un vèrtex, en el següent pas en sortirem. Com que cada vegada que s’entra a un vèrtex per una aresta se n’acaba sortint per una de diferent, en resulta que necessàriament tots els vèrtexs han de tenir grau parell. Vegem ara la implicació contrària: suposem ara que en el nostre graf tots els vèrtexs tenen grau parell i el que volem és construir un circuit eulerià. Ho farem per inducció: per a n = 2 vèrtexs és clar que els únics multigrafs que compleixen la propietat són les arestes múltiples, en què cadascun dels dos vèrtexs té grau parell. Aleshores és immediat observar que aquest graf tan simple conté cicles eulerians. Així doncs, suposem que el resultat és cert per a tot graf amb un nombre de vèrtexs inferior a n (i, per tant, assumint que tots els vèrtexs són de grau parell) i demostrem-ho per als grafs amb n vèrtexs. Triem un vèrtex arbitrari v i una aresta qualsevol adjacent amb v. Continuem ara seleccionant arestes consecutives i anem passejant pel graf fins que tornem a v. L’important és veure que no cal que ens preocupem gaire de com fem les tries locals en cada vèrtex: sabem que mai no ens quedarem atrapats, ja que cada vèrtex té grau parell. Ras i curt: si entrem a un vèrtex, hi ha com a mínim una manera de sortir-ne. Si quan retornem a v hem exhaurit totes les arestes, aleshores ja haurem acabat, tot trobant un circuit eulerià. Què passa quan això no succeeix, és a dir, quan aquest cicle no cobreix totes les arestes? Sigui Av el conjunt d’arestes visitades en el nostre cicle inicial. Considerem aleshores el graf amb els vèrtexs adjacents amb arestes encara no recorregudes i arestes A \ Av (el conjunt d’arestes no recorregudes). Cada vèrtex d’aquest graf té grau parell i té menys de n vèrtexs, però pot ser que no sigui connex. En tot cas, per la hipòtesi


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

73

d’inducció, podem trobar un circuit eulerià per a cada component connexa. Com concloem ara l’argument? Com que el graf original era connex, cadascun dels subcircuits eulerians que hem construït per inducció tenen algun vèrtex que és adjacent amb una aresta de Av . Aleshores podem construir finalment un circuit eulerià del graf inicial tot inserint al subcircuit eulerià definit per Av els subcircuits que hem trobat per inducció. Més que fer un argument més formal, dirigim el lector a la figura 3 per tal d’aclarir aquest argument.

Figura 3: Pas final en la prova del teorema d’Euler: a partir d’un subcircuit eulerià associat a les arestes Av , ampliem el circuit usant la hipòtesi d’inducció en les components connexes resultants d’eliminar les arestes de Av del graf original.

2.1

La infància de la teoria de grafs: mapes i topologia de baixa dimensió

No és nou que afirmem que Euler va ser un visionari, i l’evolució de la teoria de grafs ho demostra un cop més. Després de la seva astuta solució del problema dels ponts de Königsberg (que defineix amb precisió el naixement de la disciplina), per passar a la infància de la teoria de grafs ens hem de desplaçar al període comprès entre mitjans del segle xix i primer quart del segle xx. En aquest període comencen a emergir preguntes de tota mena: algunes amb implicacions pràctiques, algunes de tipus recreatiu, però la matemàtica convencional de l’època no podia donar resposta a cap d’elles. Ens centrarem amb més detall en dues d’aquestes preguntes, així com la seva influència posterior. L’ocasió val per a recordar diverses contribucions essencials a la teoria de grafs realitzades durant el segle xix, com són la teoria de xarxes elèctriques i el teorema matriu-arbre de Gustav Kirchhoff (que en bona part inicia la teoria espectral de grafs), la fórmula de Cayley per al nombre de grafs connexos i acíclics (deguda a Arthur Cayley) i el problema de l’existència de cicles hamiltonians en grafs (degut a William Hamilton). De tots els problemes amb un sabor de tipus discret sorgits durant el segle xix, possiblement el de més ressò i recorregut ha estat el següent. L’any 1852 el matemàtic i botànic sud-africà (però nascut a Londres) Francis Guthrie va observar que necessitava només quatre colors per a acolorir les regions del mapa dels comptats d’Anglaterra, de manera que regions adjacents no podien acolorir-se amb el mateix color. D’aquest mapa concret, Francis en va generalitzar la pregunta següent: És cert que tot mapa geogràfic pot acolorir-se amb quatre colors?


74

Juanjo Rué

L’any 1854 el problema es va plantejar públicament en la revista britànica The Athenaeum, i sis anys més tard Augustus De Morgan (que havia estat mentor del germà de Francis) el va tornar a reviure, sense èxit, a la mateixa revista. Tot i així, el problema va començar a circular en els cercles matemàtics anglesos: per exemple, per esmentar dos noms rellevants, De Morgan va enviar una carta a Sir William Hamilton, que tampoc no va ser capaç de resoldre’l (de fet, no se sap gaire bé si ni tan sols va treballar-hi: simplement se sap que no es va pronunciar en relació amb aquest tema). Durant molts anys, matemàtics i no matemàtics, experts i investigadors aficionats van intentar resoldre el problema. És a dir, demostrar que quatre colors són suficients per a donar una coloració vàlida a qualsevol mapa. El problema dels quatre colors es va fer tan famós que l’any 1878 el gran matemàtic anglès Arthur Cayley (que ja ocupava la seva càtedra Sadleirian a Cambridge) el va proposar formalment davant de la Societat Matemàtica de Londres (la prestigiosa London Mathematical Society), una de les societats matemàtiques més importants i antigues del món en aquella època.

Figura 4: Una coloració amb quatre colors de les regions del Regne Unit i la carta de De Morgan adreçada a Hamilton.

Malgrat els intents més o menys infructuosos i la introducció d’idees molt interessants (com la prova incorrecta d’Alfred Kempe, que introdueix la noció de cadena de Kempe i la idea de descàrrega), no va ser fins l’any 1976 que Kenneth Appel i Wolfgang Haken (vegeu [2] i [3]) van anunciar la prova del teorema (més de cent anys després de la seva formulació) usant tant idees importants desenvolupades en el passat (com algunes de les idees en la fallida prova de Kempe) com tècniques computacionals molt noves a l’època (estem parlant dels anys setanta del segle xx). De fet, en el seu resultat hi ha una comprovació exhaustiva de casos que és massa gran per a ser verificada a mà. Aquest fet ha obert molts cops la discussió de si una demostració assistida per ordinador (de la qual cap ésser humà no podrà mai, en una vida, comprovar tots els casos) és realment una prova. Avui en dia, malgrat que s’ha pogut simplificar el nombre de casos, el teorema dels quatre colors no s’ha pogut reduir encara a una prova «humana». Amb la formulació del teorema dels quatre colors, de fet, s’obre també la interacció de la teoria de grafs amb la topologia de dimensió baixa. En tot el


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

75

plantejament que hem fet fins ara és important notar que els objectes que s’estan considerant (mapes geogràfics) tenen una propietat de tipus geomètric molt important: els mapes estan dibuixats en el pla. Aquest fet es pot formular de manera més formal definint el que és un graf planar junt amb una immersió en el pla. Amb més precisió, donat un graf G = (V , A), direm que és planar si admet una representació gràfica en el pla on dibuixarem 1) els vèrtexs com a punts del pla, 2) les arestes com a corbes tancades que no s’autotallin i que tindran com a extrems vèrtexs del graf, i 3) parells d’arestes que no es tallen, llevat, possiblement, als vèrtexs extrems. Un graf planar no està dibuixat, doncs (és un objecte abstracte), i en general el podrem representar de diverses maneres en el pla (podrà tenir, doncs, diverses immersions en el pla). Amb això que estem dient, un graf planar immers en el pla tindrà més estructura que en un graf planar per si sol, ja que, a més dels vèrtexs i de les arestes, tindrà cares, que són cadascuna de les regions 2-dimensionals en les quals el graf dibuixat descompon el pla (incloent-hi la cara no fitada). Si el graf és finit (el nombre de vèrtexs i d’arestes és finit), aleshores el nombre de cares també ho serà. Introduïdes aquestes definicions, com associem a un mapa geogràfic un graf planar immers en el pla? Bé: si tenim el nostre mapa geogràfic preferit, el que fem és construir l’anomenat graf dual del mapa com segueix: pintem en cadascuna de les cares un vèrtex i direm que dos vèrtexs són adjacents si les cares corresponents es toquen (vegeu la figura 5). De la definició està clar que el graf dual és planar (podem dibuixar les arestes sense talls sense cap problema) i que el dibuix mateix dona lloc a una immersió vàlida. Un exemple d’aquesta construcció la trobem a la figura 5, amb el mapa de comarques de Catalunya.

Figura 5: El mapa dual de les comarques de Catalunya.

Com introduïm ara la noció de coloració? Si tenim un graf G = (V , A), definim una coloració (per vèrtexs) de G amb k colors com una funció c : V → [k]. Direm, a més, que c és pròpia si per a cada aresta vw ∈ A, c(v) ≠ c(w). Això vol dir que en una coloració pròpia els extrems de cada aresta tenen color diferent. Finalment, entre totes les coloracions pròpies d’un graf, volem prendre la que usa el menor nombre de colors. Aquest valor (el valor mínim pel qual existeix una coloració pròpia de G) és un paràmetre extremament important i


76

Juanjo Rué

extremament díficil d’estudiar: estem parlant de l’anomenat nombre cromàtic de G, que denotarem amb χ(G). En el context del teorema dels quatre colors, aquest llenguatge ens afirma que tot graf planar G (no ens preocupem de com dibuixar-lo) té nombre cromàtic χ(G) ≤ 4. Tornarem a questions relatives al nombre cromàtic més endavant, però ara ens preocuparem d’una segona qüestió relativa als grafs planars no menys important. És la següent: Quan podem assegurar que un graf simple donat és planar?

És clar que, si ens donen un graf (en el sentit abstracte del concepte) i som capaços de dibuixar-lo en el pla sense talls de les arestes, haurem demostrat que el graf és planar. Però com demostrem que un graf donat no pot dibuixar-se en el pla sense talls de les arestes? No ha de dependre del fet que tinguem talent dibuixant grafs sense talls, sinó d’alguna propietat intrínseca dels grafs que ens cal caracteritzar. Per a poder veure quines condicions ens calen, primer necessitem una eina de tipus topològic de gran importància: de nou, aquí Euler ens dona una relació màgica que ens lliga el nombre de vèrtexs i el nombre d’arestes en un graf planar. La relació fonamental és que, si G = (V , A) és un graf (simple o no), aleshores la quantitat |A| − |V | + 2 (intrínseca al graf) és igual al nombre de cares en qualsevol immersió de G en el pla. La fórmula d’Euler ens diu, doncs, que qualsevol dibuix d’un graf planar en el pla sense talls d’arestes definirà el mateix nombre de cares. Com a conseqüència d’aquesta relació clau, tindrem que els grafs planars simples no poden tenir gaires arestes. En efecte: donat un graf planar G amb |V | vèrtexs en |A| arestes, sabem que aquest definirà un nombre de cares igual c = |A| + 2 − |V |. Tenim ara dues observacions importants: la primera és que cada cara té longitud com a mínim 3, ja que no podem tenir cares de mida 1 o 2 perquè no acceptem ni llaços ni arestes dobles (recordem que estem treballant amb grafs simples). I la segona: sempre que tinguem un graf planar immers, podrem afegir més arestes en cadascuna de les cares mentre aquestes no siguin triangles, i, tot i així, mantenir la condició de planaritat. Per tant, el que estem dient és que els grafs planars simples amb més arestes són aquells totes les cares dels quals són triangles. Un exemple d’aquest argument pot trobar-se a la figura 6.

Figura 6: A partir d’un graf dibuixat, tot afegint arestes, aconseguim que totes les cares siguin triangles.


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

77

D’aquí, mitjançant doble comptatge, en aquests grafs (que anomenem, com no pot ser d’una altra manera, triangulacions) es compleix que 3c = 2|A| (cada cara és adjacent amb tres arestes, i cada aresta és adjacent amb dues cares). Finalment, substituint a la fórmula d’Euler aquesta relació, concloem que 23 |A| = |A| + 2 − |V |. Per tant, un graf planar simple amb |V | vèrtexs no pot tenir més de 3|V | − 6 arestes. A partir d’aquesta observació, vegem un parell d’exemples de grafs que no són planars. Comencem amb el graf K5 : aquest és el graf que té cinc vèrtexs i totes les arestes possibles, és a dir, un total de 52 = 10. Com que cada terna de vèrtexs de K5 defineix un triangle, concloem que, si K5 fos representable en el pla amb un dibuix sense talls d’arestes, aleshores totes les cares haurien de ser triangles. Però aleshores el nombre d’arestes de K5 hauria de ser 3 × 5 − 6 = 9, que és inferior al nombre real d’arestes que tenim, que són 10. Contradicció. Un cas un pèl més complicat és el del graf anomenat K3,3 (vegeu el graf central en la figura 7): és un graf amb sis vèrtexs repartits en dos conjunts de mida 3, V = V1 ∪ V2 , |Vi | = 3, tal que cada vèrtex de V1 està unit amb tots els vèrtexs de V2 (tenim, per tant, nou arestes en total). Es tracta d’un graf bipartit, amb nombre cromàtic igual a 2 (basta acolorir els vèrtexs de V1 amb color diferent dels de V2 , i ja tenim així la bipartició de colors). En aquest cas tenim que en una hipotètica immersió plana de K3,3 totes les cares haurien de ser de longitud 4 (no podem tenir longitud 3). Aplicant el mateix argument de doble comptatge que abans, però usant cicles de longitud 4 i no triangles, en resultaria que 4c = 2|A|, i la relació en la fórmula d’Euler és que el nombre d’arestes aquí és igual a 2|V | − 4. Finalment, això ens donaria 2 × 6 − 4 = 8 arestes, però en el graf K3,3 en realitat en tenim 3 × 3 = 9; per tant, arribem a una contradicció.

Figura 7: Els grafs K5 (esquerra) i K3,3 (centre) i el graf de Petersen (dreta). Si contraiem les arestes blaves, obtenim el graf K5 .

És clar que hi ha grafs més complicats que no són grafs planars: tots els grafs on apareix el graf K5 (o K3,3 ) com a subgraf (és a dir, com a graf resultant d’eliminar alguns dels vèrtexs i de les arestes del graf original) no podran ser planars. Però això no és suficient: per exemple, l’anomenat graf de Petersen (vegeu la figura 7) no conté ni K5 ni K3,3 com a subgraf, però sí que podem obtenir el graf K5 si fem una contracció de cinc de les arestes del graf. En aquest context, la noció bona de «contenir» un graf no és pas la de subgraf, sinó la de menor: direm que un graf G0 és un menor de G si G0 s’obté a partir de G 1) fent contracció d’algunes de les arestes de G i 2) eliminant vèrtexs i


78

Juanjo Rué

arestes del graf resultant. En la figura 8 mostrem un graf G més complicat que el de Petersen que té com a menor un graf K5 .

Figura 8: Un graf que té com a menor K5 .

El gran resultat que inicia la teoria topològica de grafs, degut al matemàtic polonès Kazimierz Kuratowski (vegeu [22]), és el que caracteritza quan un graf és planar en termes de l’existència de certs menors: Teorema 2 (Kuratowski, 1930). Un graf G és planar si i només si no conté ni K5 ni K3,3 com a menor. Per tant, el fet que un graf sigui planar ve donat per dues obstruccions minimals. . . i només dues! Val a dir, però, que l’enunciat original del teorema de Kuratowski no era en termes de menors, sinó de subdivisions. És interessant parlar de menors perquè la noció va molt més enllà d’aquest teorema. L’observació important que cal fer aquí és que la família dels grafs planars és tancada per menors: això vol dir que, si un graf és de la família, aleshores qualsevol dels seus menors també ho és. Un altre exemple és la família dels boscos (grafs sense cicles), que és tancada per menors perquè en contreure no podem crear nous cicles. En aquest cas, el menor que cal evitar és qualsevol cicle, i el menor més petit en aquest cas és el triangle. Per tant, la família dels arbres es pot definir com la família dels grafs que exclouen el triangle com a menor. Amb aquests dos exemples en ment, la gran conjectura de la teoria de menors va ser formulada per Klaus Wagner l’any 1937: la conjectura afirmava que, si tenim una família infinita de grafs, necessàriament hi ha d’haver un graf de la família que és menor d’un altre. Aquesta conjectura ha definit un dels grans programes de recerca en teoria de grafs del segle xx: en una sèrie de vint treballs molt tècnics, Neil Robertson i Paul Seymour van desenvolupar durant més de vint anys el que avui es coneix com a teoria de menors, branca que ha influït decisivament no només la teoria estructural de grafs, sinó també la informàtica teòrica i la teoria de complexitat. En aquesta sèrie de treballs, que culminen amb la prova de la conjectura de Wagner, aconsegueixen donar caracteritzacions molt precises de quin és l’aspecte d’una família de grafs tancada per menors, culminant amb un dels grans triomfs de la matemàtica contemporània amb el que es coneix com a teorema de Robertson-Seymour, i que generalitza de manera impressionant el teorema de Kuratowski:


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

79

Teorema 3 (Robertson-Seymour, 1983–2004). Una família de grafs G tancada per menors ve caracteritzada per l’exclusió d’un nombre finit de menors minimals. Per tant, la mateixa situació que es donava en els grafs planars i en els boscos (les dues famílies es caracteritzaven excloent 2 i 1 grafs, respectivament) de fet es compleix en un sentit molt més general. El lector interessat en aquesta teoria, tema central actual en la teoria de grafs i també en la teoria de matroides (en què s’està desenvolupant un programa anàleg al realitzat per a grafs), pot començar amb l’article de Lovász [23], que dona una visió molt general del monumental treball fet per Neil Robertson i Paul Seymour.

3

El naixement del pensament probabilístic en teoria de grafs

Tornem de nou al primer terç del segle xx. Fins ara la teoria de grafs consistia en un aiguabarreig de resultats sense un pal de paller gaire clar. Alguns problemes havien sorgit de la física, d’altres havien sortit de la topologia de baixa dimensió, però el temps ha demostrat que tots ells han aportat idees molt interessants i fructíferes al coneixement i que s’han explotat àmpliament per a donar lloc a matemàtiques molt profundes i interessants. Possiblement a partir dels anys trenta del segle passat, però, hi ha el naixement d’un nou paradigma en la teoria de grafs que ha marcat dramàticament el desenvolupament posterior de la teoria, no només de grafs, sinó de tota la matemàtica discreta. Va ser durant la dècada dels anys quaranta que el gran matemàtic hongarès Pál Erdős (possiblement el màxim exponent de l’escola matemàtica hongaresa d’entreguerres) va introduir un mètode sistemàtic que permetia estudiar un gran ventall de problemes en matemàtica discreta. Ho mostrarem amb un exemple.

Figura 9: Fotografia de Pál Erdős, pare del mètode probabilístic en teoria de grafs (any 1991, Cambridge).


80

Juanjo Rué

Per explicar el problema que estudiarem ens cal primer definir un nou paràmetre sobre grafs. El paràmetre que ens interessarà ara és l’anomenat coll d’un graf. Donat un graf G = (V , A), direm que el seu coll g(G) és la mida del cicle més curt contingut en G. En cas que el graf no tingui cicles (és a dir, sigui un graf acíclic), direm que el seu coll és infinit. Observeu que, si un graf té moltes arestes, és raonable que apareguin cicles curts. O, dit d’una altra manera, un nombre elevat d’arestes hauria de donar lloc de manera natural a un coll petit (i, recíprocament, poques arestes haurien de donar lloc, en la majoria dels casos, a cicles llargs). La pregunta que ens fem ara és la següent: Fixem una parella de valors enters no negatius c i g. Existeix un graf G = (V , A) que satisfaci que el seu nombre cromàtic és com a mínim c i el seu coll és com a mínim g?

Una observació important és que un nombre d’arestes elevat dona lloc a moltes restriccions per a acolorir els vèrtexs. Per tant, filosòficament, grafs amb moltes arestes haurien de tenir nombre cromàtic elevat (i coll petit, segons hem vist). En sentit contrari, grafs amb molt poques arestes haurien de tenir coll gran (s’assemblaran als arbres) i, com que hi haurà poques adjacències entre vèrtexs, intuïm que el nombre cromàtic hauria de ser petit (poques restriccions i, per tant, necessitat de l’ús de pocs colors). El que estem veient és, doncs, que els dos paràmetres que estem considerant són antagonistes: esperem que, quan un pugi, l’altre baixi, i al revés. Sembla complicat, doncs, trobar un compromís entre els dos paràmetres i trobar una densitat d’arestes adequada per la qual puguem afirmar que tant el coll com el nombre cromàtic són elevats. La resposta, però, és que sí: sempre existeix un graf que compleix aquestes dues propietats simultàniament. Teorema 4 (Erdős, 1959). Donats c i g enters no negatius, existeix un graf G tal que g(G) > g i χ(G) > c. Com podem trobar aleshores un graf que compleixi les propietats que volem? La meravellosa idea d’Erdős en el seu treball [11] (idea que ja havia usat l’any 1947 per a estudiar fites inferiors per als nombres de Ramsey; vegeu [10]) és resoldre el problema de manera existencial: a priori no sabrem construir un tal graf, però el que sabrem amb tota seguretat és la seva existència. I per demostrar-ho, el que Erdős fa és veure que, en un cert espai de probabilitat, hi ha un esdeveniment que té probabilitat positiva d’ocórrer i que codifica precisament l’existència d’un tal graf. La següent prova d’Erdős inicia l’anomenat mètode probabilístic en teoria de grafs. Prova. Per començar la prova del teorema, prendrem un valor de n prou gran, que serà el nombre de vèrtexs. Al final de la prova veurem com de gran l’hem de prendre perquè tot l’argument funcioni.


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

81

Ara construïm un graf de manera aleatòria com segueix: prenem V amb |V | = n, i cada aresta potencial del graf la triem (independentment les unes de les altres) amb probabilitat p := p(n) (més endavant farem créixer la n). Aquest objecte que obtenim és un graf aleatori. Per exemple, quantes arestes té el nostre graf? És senzill: és una suma de variables aleatòries de tipus Bernoulli amb probabilitat p, que dona lloc a una variable aleatòria binomial de tipus (n, p). Així, com a conseqüència directa, tenim que el nombre esperat n d’arestes en el nostre graf és 2 p. Què ens agradaria fer ara? Voldríem fer una tria de p que alhora donés lloc (amb una probabilitat prou alta) a un graf amb nombre cromàtic elevat i cap cicle prou curt. Vegem com fer-ho. Començarem estudiant l’existència de cicles d’una mida donada. Definim X com la variable aleatòria que compta el nombre de cicles de longitud menor o igual que g. Si denotem amb Xr la variable aleatòria que compta el nombre de cicles de longitud igual a r (per a r ≥ 3, ja que els cicles són de longitud, com a mínim, 3), tindrem que X = X3 + · · · + Xg . Estudiem ara cadascuna de les variables aleatòries Xr per separat. Si comencem mirant la seva esperança, E[Xr ], aleshores el seu valor és igual a X E[Xr ] = pr , Cr

P on la suma Cr s’estén sobre tots els cicles del graf que tinguin longitud r . Ara, cada cicle ve definit per una r -tupla (v1 , . . . , vr ) de vèrtexs diferents llevat d’ordenacions cícliques i de reflexions de la seqüència (per exemple, el cicle de mida 4 definit per la seqüència ordenada de vèrtexs (1, 2, 3, 4) és el mateix cicle que el (2, 3, 4, 1) i que el (3, 2, 1, 4)). Quantes seqüències hi ha? Bé: simplement ens cal agafar una ordenació de r elements diferents (per tant, (n)r = n . . . (n − 1) . . . (n − r + 1), i dividir-ho entre 2r (corresponent a les reflexions i les ordenacions cícliques). En conseqüència, tenim que E[Xr ] = (n)r r 2r p , i, per tant, el nombre esperat de cicles curts que esperem tenir en el nostre graf amb una llargada inferior a g serà, via la linealitat de l’esperança, E[X] =

g X r =3

g

E[Xr ] =

1 X (n)r r p . 2 r =3 r

En aquest punt, veiem que, si prenem p prou gran, podrem aconseguir fer 1 aquest valor esperat negligible. En efecte, si prenem p = nθ−1 , on θ < g , tindrem que, per a n prou gran, (n)r ≤ nr i, a més, g g g g X X X 1 X (n)r r (np)r nθr 1 θg p ≤ ≤ ≤n . 2 r =3 r 2r 2r 2r r =3 r =3 r =3

ComPque hem pres θg < 1, resulta que en aquest terme, per a g fix, la sug 1 ma r =3 2r és finita i, per tant, g 1 θg X 1 n = 0, n→∞ n 2r r =3

lim


82

Juanjo Rué

i, així, concloem que E[X] = o(n). Per què és útil ara aquesta fita? Bé, si ara usem la desigualtat de Markov, el que tenim és que n E[X] Pr X ≥ ≤ = o(1), 2 n o, dit d’una altra manera: per la tria que hem fet de p, la probabilitat que el nombre de cicles de longitud menor o igual que g sigui gran (en aquest cas, n/2) tendeix a 0. Per tant, típicament els cicles del nostre graf construït de manera aleatòria seran llargs, tot i que en pot tenir uns quants (com a màxim n/2) de curts. Anem ara al segon paràmetre. Aquesta idea que hem usat d’estimar l’esperança del nombre de cicles de longitud donada i després aplicar la desigualtat de Markov ha estat possible perquè hem estat capaços de descompondre la variable aleatòria corresponent en variables més simples, i amb això hem pogut calcular la seva esperança. Aquest principi, malauradament, no funciona quan toca estudiar el nombre cromàtic. Això és així perquè aquest paràmetre és molt més complex, ja que exhibeix un comportament local-global difícil de codificar amb el mètode probabilístic. Malgrat això, no tot és temps perdut, perquè hi ha un paràmetre en grafs molt relacionat amb el nombre cromàtic i que és sensible al tractament probabilístic: estem parlant del nombre d’independència. Donat un graf G, direm que el seu nombre d’independència (que denotarem amb α(G)) és la mida màxima d’un conjunt de vèrtexs U ⊂ V tal que cap parella de vèrtexs en U no defineix una aresta. Amb aquesta definició, aleshores és clar que per a qualsevol graf G = (V , A) es compleix que α(G) · χ(G) ≥ |V |. Com que podem acolorir el nostre graf G amb χ(G) colors, aleshores cada classe de colors defineix un conjunt independent de vèrtexs (dos vèrtexs del mateix color no poden ser adjacents). Com que cada classe de colors de vèrtexs té mida inferior a α(G), en resulta, doncs, que α(G) · χ(G) és com a mínim el nombre total de vèrtexs. Aquesta desigualtat que acabem de demostrar serà molt útil: de fet, és n equivalent al fet que χ(G) ≥ α(G) , i, per tant, trobar fites superiors per a α(G) es traduirà immediatament en fites inferiors per a χ(G). De fet, aquesta missió serà possible: de nou tornem a prendre el nostre model de graf aleatori. Aleshores, ! x n Pr(α(G) ≥ x) ≤ (1 − p)( 2 ) , x ja que, si α(G) ≥ x, aleshores hi ha un subconjunt de x vèrtexs que defineixen un conjunt independent (i aquí el que fem és aplicar la fita de la unió). Ara, fent n que x ≤ nx i que (1 − p)x ≤ e−px quan p tendeix a 0, tindrem que ! x n (1 − p)( 2 ) ≤ (nep(x−1)/2 )x . x


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

83

Si ara triem la probabilitat p com hem fet abans (és a dir: p = nθ−1 , on θg < 1) 3 i, fixada aquesta p, definim x := p log(n) = b3n1−θ log(n)c, aleshores és clar que x tendeix a infinit quan n creix i, per aquesta tria, lim (nep(x−1)/2 )x = 0.

n↔∞

Per tant, hem demostrat que Pr(α(G) ≥ b3n1−θ log(n)c) = o(1). Resumint: si prenem n prou gran de tal manera que, simultàniament, Pr X ≥ n 2 i Pr(α(G) ≥ x) són menors que 1/2, aleshores sabem que la intersecció dels esdeveniments complementaris té probabilitat estrictament més gran que 0. Un tal esdeveniment conté un graf G que, en particular, compleix que 1) té menys de n/2 cicles de longitud menor o igual que g i 2) α(G) < 3n1−θ log(n), i, per tant, compleix que χ(G) >

n 3n1−θ log(n)

=3

nθ . log(n)

Ara ja ho tenim gairebé tot: el graf G, del qual hem assegurat l’existència, no compleix exactament el que volíem, ja que encara podria tenir cicles curts. Per resoldre-ho aplicarem una altra idea important en aquesta teoria: l’alteració. A partir del graf aleatori G que hem construït, del qual sabem que té menys de n/2 de longitud menor o igual que g, construïm un nou graf G0 tot eliminant, per a cadascun dels cicles curts, un dels vèrtexs adjacents (i les corresponents arestes). Com que tenim com a màxim n/2 cicles curts, estem fent desaparèixer com a màxim n/2 vèrtexs d’un total de n, amb la qual cosa al final del procés el graf no desapareix. I amb això el graf G0 té com a mínim n/2 vèrtexs i, ara sí, no té cap cicle de longitud menor que g. Ja per acabar, com que hem eliminat una sèrie de vèrtexs, és clar que α(G0 ) ≤ α(G) i, per tant, χ(G0 ) en aquest cas, θ

n serà més gran o igual que 6 log(n) . L’argument, doncs, el finalitzem prenent n tal que aquest paràmetre sigui més gran que c, i amb això haurem acabat. 2

Una vegada vista aquesta prova, la pregunta natural és: per què el mètode probabilístic funciona tan bé en el context de la teoria de grafs, tal com hem vist en aquest exemple? La resposta que donarem és poc precisa, però mostra prou bé la filosofia subjacent quan es treballa amb el mètode probabilístic. La primera i més important observació és que atacs directes (és a dir, de trobar grafs explícits que compleixen les propietats considerades) no són eficients, i que, per tant, cal anar en la direcció de proves no constructives. La segona observació és que els grafs són objectes amb molt poca estructura, en el sentit que un graf qualsevol té molt poques limitacions i que, per altra banda, poden tenir restriccions de tipus local-global com les que hem estudiat en tractar el nombre cromàtic. Finalment, la tercera observació és que en moltes construccions no volem privilegiar cap vèrtex, o, dit d’una altra manera, volem repartir de manera uniforme les arestes. Totes aquestes observacions fan que el fet de triar les arestes a l’atzar tingui molt de sentit, ja que permet paral.lelitzar la feina i maximitzar la probabilitat (mai més ben dit) d’èxit en la nostra cerca.


Juanjo Rué

84

Per comparar-ho amb altres estructures amb una estructura algebraica més rígida, per exemple no disposem d’un model de grup finit aleatori que sigui prou satisfactori. En aquesta direcció, Misha Gromov (vegeu [19, 20]) estudia la noció de grup aleatori, tot prenent un conjunt de n generadors i un nombre determinat de relacions aleatòries de longitud prescrita. Tanmateix, els seus grups són en general infinits, i per a definir un grup finit aleatori ens calen suficients relacions per a fer-lo finit; si en triem massa, aleshores hi ha el risc que el grup esdevingui trivial. En aquest cas, doncs, la rigidesa algebraica de l’estructura juga en contra de poder emprar tècniques probabilístiques.

4

Grafs aleatoris

En la seva solució del problema de l’existència de grafs amb coll i nombre cromàtic arbitràriament gran, Erdős va introduir la idea d’emprar un paràmetre p per a mesurar la probabilitat d’incloure una aresta en un graf. Va ser, però, el matemàtic americà Edgarg Gilbert qui l’any 1959 (vegeu [17]) va introduir com a model per se (i no com una idea auxiliar) el graf aleatori amb n vèrtexs en què cada potencial aresta es tria independentment de les altres amb probabilitat p. És el que s’anomena model de Gilbert i que s’acostuma a denotar amb G(n, p). Paral.lelament al model de Gilbert, Pál Erdős i el seu col.laborador i amic Alfred Rényi van introduir un model molt similar de graf aleatori a [12], però amb un sabor molt més combinatori. G(n, m) es defineix com segueix: prenem els grafs amb n vèrtexs i m arestes, n i entre tots ells en prenem un 2) uniformement a l’atzar. Com que tenim (m tries de m arestes entre les n 2 n −1 ( ) 2 possibles, resulta que la probabilitat de triar un graf en concret és m . Aquest model és conegut com a model d’Erdős-Rényi. De fet, en un cert sentit, és asimptòticament equivalent al model de Gilbert: per a n prou gran, el nombre esperat d’arestes en el model G(n, p) és igual a p n 2 . Aleshores, prenent n m = p 2 , resulta que el graf G(n, m) i el graf G(n, p) tenen el mateix aspecte qualitatiu (vegeu l’enunciat formal d’aquest fet i la prova a [15]). Com que és molt més còmode treballar amb G(n, p) que amb G(n, m) (en el primer tenim la independència en la tria de les arestes), d’aquí endavant només treballarem amb el model G(n, p). Vegem, doncs, algunes de les característiques de p). Com ja hem G(n, n mencionat, el seu nombre d’arestes és la suma de 2 variables aleatòries independents de tipus Bernoulli amb probabilitat d’èxit igual a p (on associem l’èxit amb triar l’aresta corresponent), i d’on tenim, doncs, una distribució de tipus binomial. Estudiarem ara un paràmetre un pèl més complicat: el nombre de triangles. En aquest cas, aquesta variable aleatòria, que anomenarem X4 := X4 (n), pot escriure’s com X4 =

X 4i,j,k

Iei,j Iej,k Iei,k ,


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

85

on 4i,j,k és el triangle definit pels vèrtexs vi , vj i vk (amb arestes ei,j , ej,k i ei,k , respectivament, que uneixen vi , vj i vk seguint la notació dels índexs), i on Iei,j és la variable aleatòria indicadora d’haver triat l’aresta ei,j . Per tant, Iei,j té una distribució de Bernoulli amb paràmetre p. En general, donat un valor de n, no serem capaços de trobar la distribució de probabilitat exacta de X4 , però el que sí que podrem fer és veure’n el comportament asimptòtic. Donats tres vèrtexs vi , vj , vk del graf, definim X4i,j,k com la variable indicadora P que val 1 si tenim el triangle amb vèrtexs vi , vj , vk , i, per tant, X4 = {i,j,k}⊆[n] X4i,j,k , on la suma es pren per ternes d’índexs diferents dos a dos. A més a més, X4i,j,k és igual a Iei,j Iej,k Iei,k , on Iei,j és la variable aleatòria indicadora que mostra si l’aresta amb extrems vi i vj és en el graf (això, és clar, perquè, per assegurar que el triangle 4i,j,k és en el graf, ens cal estar segurs que les tres arestes ei,j , ej,k i ei,k hi són). Amb aquesta terminologia, l’esperança de X4 és igual, doncs, a   ! X X n 3   E[X4 ] = E Iei,j Iej,k Iei,k = E[Iei,j Iej,k Iei,k ] = p , 3 4 4 i,j,k

i,j,k

ja que les variables aleatòries indicadores són independents (l’esperança del producte es tradueix en el producte d’esperances), i perquè en la suma tenim n un total de 3 termes, corresponents a triar tres vèrtexs diferents del total de n que tenim. Vegem què passa quan n tendeix a infinit. Per una banda, n 3 és asimptòticament igual a 16 n3 , i, per tant, E[X4 ] és asimptòticament igual a 16 (np)3 . Triant p de manera que np tendeix a 0, observem que l’esperança tendeix a 0. Com que estem prenent una seqüència de variables aleatòries positives, podem concloure que, si el límit de les esperances és igual a 0, aleshores necessàriament, quan n tendeix a infinit, la variable aleatòria X4 tendirà cap a la variable aleatòria idènticament igual a 0. Resumint: per a p prou petita 1 (en aquest cas d’un ordre de magnitud inferior a n ), quan n és molt gran no observarem triangles. Què passa quan np tendeix a infinit? El que veiem aquí és que l’esperança creix cap a infinit, però d’aquí no podem assegurar que X4 sigui sempre estrictament més gran que 0: podria succeir, en principi, que Pr(X4 = 0) > 0 i, a més, que E[X4 ] tendís a infinit quan n s’anés fent gran (recordem que X4 és una variable que al final depèn de n). Per veure que això no pot passar en el nostre cas, usarem un argument de concentració: veurem que la majoria de la massa de la distribució de probabilitat de X4 està al voltant del seu valor esperat, i que, per tant, P (X4 = 0) tendirà cap a 0 quan n tendeixi a infinit. Això ho podem fer tot mirant la seva variància i aplicant la desigualtat de Txebixev. Efectivament: la variància 2 de X4 és igual a V ar[X4 ] = E[X4 ] − E[X4 ]2 . No desenvoluparem el càlcul en detall, però el petit problema que sorgeix és que les diferents variables aleatòries X4i,j,k no són independents, i, per tant, aquesta variància té dues


86

Juanjo Rué

contribucions: 1) la contribució de les variàncies de cadascuna de les variables aleatòries X4i,j,k i 2) la contribució de les correlacions entre cadascuna de les parelles X4i,j,k i X4i0 ,j 0 ,k0 (sent 4i,j,k i 4i0 ,j 0 ,k0 triangles diferents que comparteixen alguna aresta). Al final s’observa que V ar[X4 ]/E[X4 ]2 tendeix a 0 quan n tendeix a infinit, i, per tant, aplicant la desigualtat de Txebixev, tindrem que per a qualsevol tria de ε > 0 Pr(|X4 − E[X4 ]| > εE[X4 ]) ≤

V ar[X4 ] n→∞ -→ 0. ε2 E[X4 ]2

Concloem, doncs, que, si np tendeix a infinit, aleshores Pr(X4 > 0) tendeix a 1. Del que hem fet, però, queden dues preguntes per resoldre: la primera, què passa quan np tendeix a una constant diferent de 0? I la segona: quan np tendeix a infinit, podem donar amb una mica més de precisió com són les desviacions X4 − E[X4 ]? La resposta a aquestes dues preguntes la podem encapsular dins del teorema següent: Teorema 5. Considerem en el model G(n, p) la variable aleatòria X4 que compta el nombre de triangles de G(n, p). Aleshores: • Si np tendeix a 0, aleshores Pr(X4 = 0) tendeix a 1 quan n tendeix a infinit (diem que X4 = 0 asimptòticament gairebé arreu). • Si np tendeix a c ≠ 0, aleshores, quan n tendeix a infinit, X4 s’aproxima a una distribució de tipus Poisson amb paràmetre c 3 /6. • Si np tendeix a infinit, aleshores tenim un teorema de límit central per a X4 : X4 − E[X4 ] -→ N (0, 1), lim n→∞ V ar[X4 ]1/2 on la convergència aquí es considera en distribució. Una conclusió important que traiem d’aquest exemple és la següent: si considerem l’evolució del paràmetre p començant en 0 i acabant en 1, aleshores en el punt p = 1/n passem de no tenir mai triangles a tenir-ne sempre (amb el benentès que, quan agafem una probabilitat en la finestra d’aquest punt, a saber p = c/n, on c és constant, apareixen de tant en tant (no sempre) triangles seguint una distribució de Poisson). Aquest fenomen no només apareix quan estudiem l’existència d’altres subgrafs, sinó també quan estudiem altres tipus de propietats. Amb més precisió, diem que una propietat de grafs P és un subconjunt de grafs (per exemple, la propietat «contenir un triangle» l’entenem com la família de grafs que contenen un triangle). Amb això, la pregunta és: quant val, per a una propietat donada, Pr(G(n, p) ∈ P)? La resposta a aquesta pregunta és coneguda per a una classe de propietats ben àmplia i quan n tendeix a infinit. Direm que una classe de grafs P és monòtona creixent sempre que G1 i G2 són grafs tals que G1 és subgraf de G2 i G1 ∈ P, aleshores G2 ∈ P. De manera similar, podríem definir la propietat de ser monòtona decreixent. Per exemple, contenir un triangle, tenir un camí de


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

87

longitud n o ser un graf connex són propietats monòtones creixents en grafs, mentre que, per exemple, ser planar o ser bipartit és una propietat monòtona decreixent. Finalment, la propietat de tenir un nombre parell d’arestes no és ni creixent ni decreixent. El gran resultat (amb una prova gens difícil i molt astuta per altra banda!) de Béla Bollobás i Andrew Thomason (vegeu la prova a [5]) ens diu que el que hem observat en l’existència (o no) de triangles passa en totes les propietats monòtones. Amb més precisió, si P és una propietat monòtona creixent, aleshores existeix una probabilitat p ∗ per la qual lim Pr(G(n, p) ∈ P) =

n→∞

( 0,

p = o(p ∗ ),

1,

p ∗ = o(p).

Així doncs, per a propietats monòtones hi ha un salt en el comportament, i es passa de 0 a 1 quan travessem un valor de la probabilitat llindar p ∗ que només depèn de P. En el cas de la propietat de contenir triangles, per exemple, hem 1 . vist que aquest valor de p ∗ és igual a n En aquest context, possiblement el primer i més gran resultat en la teoria dels grafs aleatoris és en el segon treball d’Erdős i Rényi sobre el tema, on la propietat clau que estudien és la connectivitat (vegeu [13]). En aquest cas, la connectivitat és una propietat monòtona creixent, i, per tant, té un llindar. L’anàlisi és més complicada que en el cas dels triangles: amb una mica de feina i usant estimacions per al primer i el segon moments hom obté (vegeu, per log(n) exemple, [15]) que la funció llindar per a aquesta propietat és p ∗ = n . El resultat fonamental de la teoria no és aquest llindar per a la connectivitat, sinó l’aspecte qualitatiu del graf G(n, p) una mica abans d’arribar a l’escala del 1 llindar: al voltant de p = n . L’aspecte evolutiu del graf G(n, p) és el següent, anomenat de vegades com el naixement de la component gegant, o també fenomen de salt doble: Teorema 6 (Erdős-Rényi, 1960). En relació amn el graf G(n, p) i per a n prou gran, 1

µ

• quan p = n − n4/3 , amb µ constant positiva: la seva component connexa més gran té de mida α log(n) + o(log(n)), on α depèn de µ; 1

• quan p = n , la seva component connexa més gran té mida β n2/3 +o(n2/3 ), per a un cert valor de β; µ

1 • quan p = n + n4/3 , amb µ constant positiva: la component connexa més gran passa a tenir mida lineal γ n + o(n), on γ < 1 depèn de µ,

on totes les afirmacions es prenen amb probabilitat 1 quan n tendeix a infinit. El resultat important és, doncs, que en un lapse evolutiu molt curt (quan 1 passem d’una probabilitat lleugerament inferior a p = n a una probabilitat lleugerament superior) l’aspecte qualitatiu del graf G(n, p) canvia significativament: la component més grossa passa de ser petita (mida logarítmica), a ser primer de mida n2/3 (µ = 0) i després de mida lineal. Aquest resultat inicia


88

Juanjo Rué

l’estudi sistemàtic dels anomenats fenòmens de transició de fase en estructures discretes, i amb gran interacció amb els sistemes físics discrets. Un exemple ben representatiu d’aquests fenòmens (però no l’únic; la física estadística n’està ple!) és la transformació de l’aigua de glaç a líquid en una finestra molt estreta al voltant de la temperatura de 0 graus: una petita variació al voltant d’aquesta temperatura fa canviar de manera significativa l’aspecte qualitatiu de l’aigua, que passa d’estat sòlid a estat líquid. 4.1

Més enllà del model G(n, p)

Els models G(n, p) i G(n, m) van iniciar tota la branca dels grafs aleatoris, que s’ha mantingut activa fins avui dia. Però, malgrat que aquests models (els favorits per als que ens dediquem a la combinatòria i la matemàtica discreta) tenen interès per si mateixos i són molt simples d’analitzar (independència per a la tria d’arestes), la realitat és que, com a models reals, manquen de certs aspectes que s’observen en les grans xarxes. O, dit d’una altra manera, existeixen propietats que comparteixen moltes de les grans xarxes reals que no s’observen en aquests models. Potser la propietat més important en aquest aspecte és el fenomen d’invariància d’escala (scale-free en anglès). De manera experimental, el que s’observa en les xarxes reals (Internet, etc.) és que la distribució de graus dels vèrtexs té un decreixement que segueix una llei polinomial (el que anomenem cua pesada). En el cas del graf G(n, p), la fotografia és completament diferent: en aquesta situació la distribució de graus decreix de manera exponencial i no polinomial. Aquest fet té la conseqüència següent: el model G(n, p) és un model molt uniforme, en què el valor esperat de veïns d’un vèrtex donat sempre serà el mateix (p(n − 1), amb independència de com triem el vèrtex). Per contra, en els models invariants per canvis d’escala s’observa un fenomen ben diferent: en tenir una distribució amb cues pesades, serà molt probable que apareguin uns pocs vèrtexs amb una alta connectivitat (és a dir, amb un grau elevat). Això és precisament el que s’observa en les grans xarxes complexes: en la xarxa Internet hi ha nodes (els concentradors) que reben moltes més connexions que la resta; en les xarxes socials hi ha individus que tenen moltíssims coneguts, etc. L’existència de concentradors molt ben connectats amb d’altres fa que aquest tipus de xarxes satisfacin un fenomen de petit món: vèrtexs de grau elevat connectats entre ells faran que molts vèrtexs estiguin a poca distància. D’aquesta manera el camí més curt entre dos vèrtexs qualssevol és molt petit en relació amb la mida del sistema. Aquesta noció es va introduir a la cultura popular per l’experiment de «sis graus de separació» de Stanley Milgram als anys seixanta, en què va quedar clar que els subjectes podien lliurar un paquet a un desconegut a l’altre costat dels Estats Units, utilitzant només contactes personals i en un nombre petit de pasos. Complementàriament a l’aparició de vèrtexs amb grau elevat, el que també s’observa en les xarxes reals és un fenomen que no ocorre en el model G(n, p): l’aparició de conjunts de vèrtexs connectats dos a dos entre ells, fenomen


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

89

anomenat clusterització. Per exemple, quan hom examina xarxes socials, observa que hi ha grups de persones que es coneixen mútuament entre elles. Combinar aquestes dues propietats (existència de concentradors, existència de clusterització) és una tasca difícil. Per exemple, en el model ben paradigmàtic introduït per Duncan Watts i Steven Strogatz l’any 1998 a [35], tenim l’existència de clústers, però no de concentradors (vegeu també, per exemple, [1]). Molta recerca activa i interessant actual va en aquesta direcció, en què es combinen moltes àrees del coneixement, incloent-hi la física teòria i les matemàtiques més fonamentals.

5

La pseudoaleatorietat en teoria de grafs

Tornem al paradigma amb el qual hem iniciat el pensament probabilístic en grafs. Sabem que existeixen grafs amb nombre cromàtic i coll tan gran com desitgem, ja que al graf aleatori G(n, p) (per una tria de p adequada) aquesta afirmació és certa amb probabilitat 1. Ara bé, trobar-ne un d’explícit pot ser una tasca descoratjadora: dins del mar immens de grafs amb n vèrtexs (recordem que n és gran), és com intentar buscar una agulla en un paller. Com podem fer-ho de manera efectiva? Una estratègia que podria tenir sentit és intentar identificar grafs que, malgrat ser ben deterministes, es comportin tal com si fossin grafs aleatoris. Si és així, hom esperarà que un tal graf determinista sigui ben regular, i que puguem tenir un bon control dels paràmetres, tal com passava en el model G(n, p). Aquesta noció, la de modelar objectes no aleatoris deterministes com si ho fossin, és un paradigma de gran importància en matemàtiques, com per exemple en la generació de números aleatoris. Aquesta és la noció de pseudoaleatori que descriurem tot seguit. En el nostre context cal trobar la noció correcta del que entenem per graf pseudoaleatori. Començarem amb la terminologia introduïda per Andrew Thomasson l’any 1987 a [34]. Sigui G = (V , A) un graf amb n vèrtexs. Prenem p ∈ [0, 1] i ε un paràmetre (que pot dependre, per exemple, de n; típicament no ho farà). Direm ara que G és (p, ε1 )-embolicat (de l’anglès jumbled) si per a tot subconjunt de vèrtexs U ⊆ V es compleix que ! |U | e(U) − p < ε1 |U |, 2 on e(U ) és el nombre d’arestes que tenen els dos extrems en U . Aquesta definició ens diu el següent: si pensem en el model G(n, p), i prenem U ⊆ V, |U| aleshores e(U ) és una variable aleatòria que té esperança igual a p 2 . De fet, e(U ) és una suma de |U2 | variables aleatòries independents de tipus Bernoulli. Aplicant la desigualtat de Chernoff per a la suma de variables indicadores independents (vegeu, per exemple, [7]), podem concloure fàcilment que, amb √ probabilitat tendint a 1, G(n, p) és un graf (p, O( np))-embolicat. Quines propietats esperem que es compleixin en el model G(n, p) i que voldríem que es traduïssin en grafs deterministes? En tenim unes quantes, de


90

Juanjo Rué

fet. Per exemple, per a un graf donat H amb v(H) vèrtexs i e(H) arestes, el nombre esperat de subgrafs de G(n, p) iguals a H és CH nv(H) p e(H) (1 + o(1)), on CH és una constant que només depèn de H (el càlcul es fa igual que en el cas dels triangles; aquí la constant CH depèn del nombre d’automorfismes de H). Bé, doncs en el cas pseudoaleatori, el que estaríem demanant és el següent: sigui G = (V , A) un graf amb n vèrtexs i H el subgraf que volem estudiar. Tot denotant amb cH (G) el nombre de subgrafs de G iguals a H, voldríem que existissin uns valors ε2,H > 0 i p > 0 per als quals |cH (G) − CH nv(H) p e(H) | < ε2,H nv(H) .

(S2)

Dit d’una altra manera, perquè el nostre graf G s’assembli al graf aleatori G(n, p), caldrà que per a tot graf H més petit, el nombre cH (G) sigui aproximadament igual a CH nv(H) p e(H) . En particular, aquesta condició hauria de ser certa si prenem com a subgraf H el cicle de longitud 4, que té quatre vèrtexs i quatre arestes. Si el denotem amb C4 , el que voldríem és que |cC4 (G) − CH4 (np)4 | < ε2,C4 n4 ,

(S3)

per a un cert paràmetre ε2,C4 . Aquestes possibles nocions que hem donat de pseudoaleatorietat poden resultar complicades de comprovar, ja que ens caldria verificar quantes còpies de subgrafs tenim, o comprovar quantes arestes tenim entre parelles de conjunts de vèrtexs. Si volem donar una noció més local, podem intentar usar el cograu de parelles de vèrtexs, definit com el nombre de vèrtexs adjacents a dos vèrtexs donats. Amb més precisió, si tenim u, v ∈ V per a un graf G = (V , A) i denotem amb cogr(u, v) el seu cograu, en el model G(n, p) tindrem que, per a una parella qualsevol de vèrtexs u, v, E[cogr(u, v)] = p 2 n(1 + o(1)). Si volem relaxar aquesta condició en el cas determinista, el que desitjarem és que de mitjana no hi hagi gaire desviació respecte a p 2 n, o, dit d’una altra manera, voldríem que X |cogr(u, v) − p 2 n| < ε4 n3 , V u,v∈( 2 ) on p i ε4 són paràmetres positius. Comprovar aquesta propietat, per a un graf donat, és molt més senzill, perquè només requereix investigar per a cada cada parella de vèrtexs el nombre de veïns comuns. Presentades totes aquestes possibles definicions de graf pseudoaleatori, quina és la bona definició? Bé: ho són totes: en un treball molt pioner de Fan Chung, Ron Graham i Richard M. Wilson de l’any 1989 (vegeu [8]), els autors demostren que totes aquestes condicions (i, de fet, alguna més que no mencionem aquí) són totes (essencialment) equivalents, i només hi ha una dependència polinomial entre les diferents εi . Possiblement el més rellevant d’aquest teorema és que la condició (S3) és igual de forta que la condició (S2): el control del nombre de cicles de longitud 4 (que a priori sembla una condició molt més dèbil) dona lloc a tota la resta de les condicions, i, per tant, el


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

91

nombre de còpies C4 en un graf determina si aquest s’assembla poc o molt al G(n, p). Finalment, en la terminologia de l’àrea, es diu que una seqüència de grafs {Gn }n≥1 amb Gn = (Vn , An ) i limn |Vn | = ∞ és quasialeatòria si compleix (per a εi fixades) una de les propietats esmentades, i, per tant, totes elles. Si és així, les condicions poden escriure’s en termes de la notació o petita. Per exemple, la condició (S3) aquí s’escriuria com cC4 (Gn ) = CH4 (np)4 (1 + o(1)). 5.1

El lema de regularitat de Szemerédi i conseqüències

Una de les aplicacions més importants d’aquesta dicotomia que existeix entre l’aleatorietat i el determinisme és una de les tècniques més potents i eficaces de la combinatòria: estem parlant del lema de regularitat de Szemerédi. Aquest lema, de natura tècnica, va ser desenvolupat per Endre Szemerédi en el curs de la seva prova de l’anomenada conjectura d’Erdős-Turán per a progressions aritmètiques (vegeu [32]), resultat cabdal de la teoria combinatòria de nombres que afirma que tot conjunt de mesura positiva en els enters positius conté progressions aritmètiques de longitud tan llarga com vulguem. Szemerédi, de fet, en la seva resolució de la conjectura (vegeu la figura 10, on es mostra el diagrama de flux de la prova), va desenvolupar una sèrie de tècniques per a grafs bipartits que van ser generalitzades a [33] per a grafs generals, en el mode que entenem avui en dia el lema de regularitat.

Figura 10: Esquema de l’estructura de la prova del teorema de Szemerédi, extreta de [33]. Les afirmacions F1 − F2 − F3 són el germen del futur lema de regularitat.

Per a formular i entendre aquest resultat, ens cal introduir algunes definicions que segueixen l’esperit de la noció de quasialeatorietat. Considerem ara dos conjunts de vèrtexs disjunts V1 i V2 i el graf G = (V , A) amb vèrtexs V = V1 ∪ V2 , en què les arestes tenen un extrem en V1 i un altre en V2 . Les arestes, a més, les triem independentment amb probabilitat p. El graf que definim és molt


Juanjo Rué

92

semblant al G(n, p), amb la diferència que ara el que obtenim és un graf bipartit. Si ara considerem la variable aleatòria X que compta el nombre d’arestes, aleshores, per la linealitat de l’esperança, és clar que E[X] = p|V1 ||V2 |. Dit d’una altra manera, E[X] p= . |V1 ||V2 | En aquest model, tenim, doncs, que per a tota parella de subconjunts W1 ⊆ V1 i W2 ⊆ V2 e(W1 , W2 ) d(W1 , W2 ) := = p, |W1 ||W2 | on e(W1 , W2 ) = |{w1 w2 ∈ A : w1 ∈ W1 , w2 ∈ W2 }| és el nombre d’arestes que tenen un extrem en un vèrtex de W1 i l’altre en un vèrtex de W2 , i d(W1 , W2 ) és la densitat d’arestes entre W1 i W2 . Com podem traduir aquesta condició al cas determinista? Fixem ara un paràmetre ε (associat a l’error que volem permetre) i considerem un graf G determinista, amb una partició dels vèrtexs com abans: V = V1 ∪ V2 . Direm que G és ε-regular si per a qualsevol subconjunt de vèrtexs W1 ⊆ V1 i W2 ⊆ V2 prou grans, és a dir, |Wi | ≥ ε|Vi | per a i = 1, 2, aleshores tenim que |d(W1 , W2 ) − d(V1 , V2 )| < ε. Estem dient, doncs, que la ε-regularitat fa que un graf determinista sigui molt regular, amb propietats similars a les del graf aleatori bipartit. Observem que en la definició de ε-regular no ens preocupem si tenim arestes definides per dos vèrtexs de V1 (o de V2 ). Això no importa: l’important aquí són només les arestes amb extrems en els dos conjunts mencionats. Ara podem ampliar aquesta noció a grafs més generals que els bipartits. De nou fixem un paràmetre de tolerància ε > 0. Donat un graf G = (V , A), direm que admet una partició ε-regular si podem trobar una partició del conjunt de vèrtexs V = V0 ∪ · · · ∪ Vr tal que: 1. |V0 | < ε|V |. 2. |V1 | = · · · = |Vr |. 3. Totes les parelles {Vi , Vj }, i ≠ j, defineixen un graf ε-regular excepte εr 2 d’elles. El que ens està dient aquesta definició és que en una partició ε-regular tenim un conjunt excepcional V0 que serà petit i on ficarem vèrtexs «tòxics» (que trenquin, per exemple, la condició de regularitat, o que tinguin un grau massa petit, per exemple). Després, que la resta de vèrtexs es poden agrupar en conjunts de vèrtexs que definiran, en la majoria de casos, parelles ε-regulars. En realitat, l’important en una tal partició són les arestes entre els vèrtexs de conjunts Vi i Vj diferents: en cap cas no ens preocuparem del que passa amb les arestes definides per parelles de vèrtexs dins d’un mateix conjunt Vi . Una tal descomposició sempre existeix si prenem, per exemple, cada conjunt Vi de mida 1, però és clar: una partició com aquesta té poca gràcia. El que voldríem és poder assegurar que en una tal partició els conjunts Vi són grans,


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

93

defineixen poques parelles ε-regulars però amb moltes arestes. Per a grafs prou grans aquestes particions sempre existeixen. Aquest és el contingut del lema de regularitat de Szemerédi: Lema 7 (Lema de regularitat de Szemerédi, 1978). Sigui ε > 0 i m un valor enter no negatiu. Aleshores existeix una constant M := M(ε, m) tal que tot graf amb més de m vèrtexs té una partició ε-regular amb parts V0 , . . . , Vr on m ≤ r ≤ M. Aquest lema ens diu el següent: si prenem una tolerància petita i una mida fixada m, aleshores tot graf prou gran admet una partició en una part quasialeatòria (les arestes definides per les parelles ε-regulars) i una part estructurada (tot el que no podem controlar amb la ε-regularitat). I, és clar, la part quasialeatòria té una contribució important, degut al fet que el nombre de conjunts Vi està fitat. Filosòficament, aquest lema ens diu una cosa ben profunda: essencialment afirma que tot graf prou gran es pot pensar com si l’haguéssim generat, essencialment, amb un procediment aleatori! I, per tant, malgrat estar treballant amb grafs deterministes podem usar tècniques procedents del pensament probabilístic. Tot i així, cal fer dos comentaris importants: 1. El lema de regularitat tal com l’hem formulat és efectiu quan el graf és dens, és a dir, quan té un nombre quadràtic d’arestes en termes del nombre de vèrtexs. Si el graf no és dens, el lema de regularitat no dona cap resultat que sigui interessant perquè la tolerància elimina tota la informació rellevant de la partició. En tot cas, hi ha versions més refinades (i complicades) per a grafs no densos. Vegeu, per exemple, [21]. 2. El nombre de particions que dona el lema de regularitat (la constant M del lema) és immens. Tal com es veu de la prova del lema (basada en un algorisme en què a cada pas refinem la partició anterior fins que s’arriba a una partició ε-regular; l’algorisme acaba perquè altrament s’arribaria a una contradicció), M té l’ordre de magnitud d’una torre d’exponencials d’altura O(ε−5 ) amb base m. Per tant, realment la mida dels nostres grafs ha de ser gegantina. De fet, també se sap que el lema de regularitat no millora aquesta fita: Gowers a [18] demostra que existeixen grafs en què el nombre d’elements en la partició és de l’ordre d’una torre exponencial d’altura O(ε−1/16 ) i base m. El lema de regularitat ens permet «representar» el nostre graf gegant per tal de poder-lo estudiar de manera molt senzilla. Per tant, cal entendre el lema com una preparació de la nostra estructura que ens permetrà treure’n conclusions. De fet, aquesta preparació del graf per a poder-ne dir coses més endavant típicament es dona mitjançant la prova primer d’un lema enumeratiu, que serà després el que s’emprarà per a les aplicacions. La primera aplicació del lema de regularitat de Szemerédi (més enllà de la que apareix en la prova de la conjectura d’Erdős-Turán) és el següent lema degut a Imre Ruzsa i Endre Szemerédi [29], anomenat teorema (6,3) o lema eliminador de triangles i que té com a conseqüència, per exemple, la resolució de la


Juanjo Rué

94

conjectura d’Erdős-Turán per al cas de progressions aritmètiques de longitud 3. Aquest resultat és l’anomenat teorema de Roth, resultat demostrat per Klaus Roth l’any 1953 mitjançant tècniques analítiques (vegeu [28]) i pel qual, en part, va rebre la medalla Fields l’any 1958. Lema 8 (Ruzsa-Szemerédi, 1978). Sigui ε > 0. Aleshores existeix una constant δ := δ(ε) de tal manera que tot graf en n vèrtexs que conté més de δn3 triangles pot fer-se lliure de triangles eliminant com a màxim εn2 arestes. Aquest resultat, demostrat l’any 1978, ens diu el següent: si tenim un graf molt gran amb pocs triangles (aquí per «molts» entenem δn3 triangles), aleshores, tot eliminant una petita proporció de les arestes (i, per tant, no destruint per complet el nostre graf), podem continuar tenint un graf no buit però aquest cop lliure de triangles. Hem eliminat tots els triangles sense destruir el graf. Veurem la prova, però prèviament ens caldrà demostrar el següent lema, que permet comptar triangles en ternes regulars: Lema 9 (Lema comptador de triangles). Sigui G = (V , A) un graf amb partició de vèrtexs V = X∪Y ∪Z. Suposem que d(X, Y ) = α, d(X, Z) = β, d(Y , Z) = γ. Sigui ε > 0 tal que min{α, β, γ} ≥ 2ε. Finalment, assumim que totes les parelles {X, Y }, {Y , Z} i {X, Z} són ε-regulars. Aleshores, el nombre de triangles de la forma 4xyz, on x ∈ X, y ∈ Y i z ∈ Z, és, com a mínim, (1 − 2ε)(α − ε)(β − ε)(γ − ε)|X||Y ||Z|. Prova. Fixem un vèrtex x ∈ X. Sigui N(x) el conjunt de veïns de x i grY (x), grZ (x) el nombre de veïns de x en Y i en Z, respectivament. Començarem veient que podem controlar el nombre de vèrtexs en X amb grau petit. Demostrem primer que |{x ∈ X : grY (x) < (α − ε)|Y |}| < ε|X|. Assumim el contrari, és a dir: |{x ∈ X : grY (x) < (α − ε)|Y |}| ≥ ε|X|. Per simplicitat, escrivim {x ∈ X : grY (x) < (α − ε)|Y |} = X 0 . Aleshores |X 0 | ≥ ε|X|. Per definició de parella ε-regular, |d(X 0 , Y )−d(X, Y )| < ε. Com que d(X, Y ) = α i d(X 0 , Y ) < α − ε (observeu que cada vèrtex x de X 0 contribueix en com a màxim (α − ε)|Y | arestes), concloem que d(X 0 , Y ) − d(X, Y ) < α − ε − α < −ε, que és una contradicció amb el fet que |d(X 0 , Y ) − d(X, Y )| < ε. És clar que el mateix argument funciona prenent Z en lloc de Y . Per tant, hem arribat a la conclusió que |{x ∈ X : grY (x) ≥ (α − ε)|Y |

i

grZ (x) ≥ (α − ε)|Z|}| ≥ (1 − 2ε)|X|.


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

95

Mirem ara el nombre de triangles en què apareix x. Tenim que |N(x) ∩ Y | = grY (x) ≥ (α−ε)|Y | ≥ ε|Y | i |N(x)∩Z| = grZ (x) ≥ (γ−ε)|Z| ≥ ε|Z|. (Recordeu que assumim que min{α, β, γ} ≥ 2ε.) De nou, per la condició de ε-regularitat tenim que |d(Y , Z) − d(N(x) ∩ Y , N(x) ∩ Z)| < ε =⇒ γ −

e(N(x) ∩ Y , N(x) ∩ Z) < ε. |N(x) ∩ Y ||N(x) ∩ Z|

Per tant, hem arribat a la conclusió que e(N(x) ∩ Y , N(x) ∩ Z) > (α − ε)(γ − ε)|Y ||Z|. Cadascuna de les arestes d’aquest conjunt defineix un triangle en què estem usant el vèrtex x ∈ X. Així doncs, el nombre de triangles és com a mínim el nombre de triangles en què x ∈ X satisfà la condició indicada, que és com a mínim (1 − 2ε)|X|e(N(x) ∩ Y , N(x) ∩ Z). 2 Un cop feta la prova, és bo mirar la figura 11, on apareixen tots els ingreḋients de la prova.

Figura 11: Un esquema simplificat de la prova del lema comptador de triangles.

Ja amb aquest lema podem passar a demostrar el lema eliminador de triangles. A la prova gastarem el lema comptador sobre una partició ε-regular del nostre graf. Prova del lema 8 (eliminador de triangles). Per demostrar el lema eliminador de triangles, de fet el que farem serà demostrar la implicació contrària: si ens cal eliminar com a mínim εn2 arestes de G per a obtenir un graf lliure de triangles, aleshores això és perquè hem començat a partir d’un graf amb més de δn3 triangles. Prenguem ε > 0, i definim m = 4ε . Considerem aleshores una partició ε ∪ · · · ∪ Vk . Per conveniència, fem c = |V1 | = 4 -regular de G amb parts V0 ∪ V1 4 · · · = |Vk |. Observeu ara que ε < k, i que kc < n (en aquesta darrera desigualtat no estem sumant els vèrtexs de V0 , amb |V0 | ≤ 4ε n).


Juanjo Rué

96

Començarem eliminant unes poques arestes de G: i) Totes les arestes que són adjacents amb V0 (internes o externes a V0 ): en tenim com a màxim |V0 |n = 4ε n2 . ii) Totes les arestes íntegrament contingudes en V1 , . . . , Vk : en tenim com a 2 c 2 màxim k 2 < kc < nk < 4ε n2 . iii) Totes les arestes definides per les parelles {Vi , Vj } (1 ≤ i < j ≤ k) que no són 4ε -regulars: recordeu que tenim com a màxim 4ε k2 parelles d’aquest tipus. Per tant, com a màxim tindrem 4ε k2 c 2 < 4ε n2 arestes.

iv) Totes les arestes entre parelles 4ε -regular {Vi , Vj }, on d = d(Vi , Vj ) < 2ε . En k aquesta situació tindrem com a màxim 2 parelles d’aquesta mena, i, per 2 tant, el nombre d’arestes estarà fitat per k2 d(Vi , Vj )|Vi ||Vj | < k2 2ε c 2 < ε 2 4n .

Resumint, sumant les contribucions des de i) fins a iv), el que haurem fet és eliminar com a màxim εn2 arestes. En aquest punt, si el graf que hem obtingut és lliure de triangles, ja hem acabat. Si no és així, això vol dir que encara queden triangles en el nostre graf, i que, per tant, ens cal eliminar unes arestes més per fer-lo lliure de triangles. Quines són les arestes que han sobresviscut? ε Bé: només les definides per parelles 4 -regulars amb una densitat superior o ε igual a 2 . Prenem, doncs, tres parelles qualssevol (per a fixar notació, suposem que per als conjunts Vi , Vj i Vk ). Observeu ara que les condicions del lema comptador de triangles se satisfan prenent ε/4 a l’enunciat en lloc de ε, a saber: ε

• d(Vi , Vj ) = α, d(Vj , Vk ) = β d(Vi , Vk ) = γ, i min{α, β, γ} ≥ 2 . • Cada parella és 4ε -regular.

Per tant, ara pel lema comptador de triangles, aquests tres conjunts de vèrtexs ε 4 defineixen com a mínim 1 − 2ε 4 c 3 triangles. Aquesta fita pot escriure’s en termes de n: com que n = |V0 | + kn, |V0 | ≤ 4ε n i k ≤ M m, 4ε := M(ε), tindrem, doncs, que 1 ε 1 ε n = |V0 | + ck =⇒ c > 1− n> 1− n, k 4 M(ε) 4 i, consegüentment, el nombre de triangles definits en aquest cas seran com a mínim 4 ε ε 1 ε 3 3 1− 1− n . 2 4 M(ε)3 4 Finalment, triant ara 4 ε ε 1 ε 3 δ= 1− 1 − 2 4 M(ε)3 4 tenim el resultat que volíem demostrar: si no eliminem tots els triangles tot eliminant εn2 arestes, aleshores estàvem partint d’un graf amb més de δn3 triangles. 2


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

97

Voldríem fer dos comentaris generals després d’haver demostrat aquest lema. El primer és que totes les dependències entre paràmetres en el lema eliminador de triangles són les que sorgeixen del lema de regularitat de Szemerédi. Ara bé, el lema eliminador de triangles pot demostrar-se independentment del lema de regularitat, donant lloc a millors dependències entre els paràmetres (vegeu el treball de Fox [14] publicat a Annals of Mathematics). El segon comentari és que el lema eliminador de triangles pot estendre’s de manera senzilla a altres subgrafs: això pot fer-se sempre, ja que podem demostrar, usant les mateixes idees que hem desenvolupat, lemes comptadors per a subgrafs qualssevol.

6

Objectes límit en grafs i grans xarxes

Per tal de parlar de límits de grafs és millor començar fent un símil de números racionals i de números reals. El que primer aprenem quan ens iniciem en l’aritmètica són els números enters positius, després els negatius i finalment els números racionals. Per a fer el salt als números reals ens cal una mica més: ens cal completar els «forats» existents entre els números racionals perquè, en particular, tota successió de Cauchy sigui convergent. La motivació és clara: volem treballar en espais on puguem assegurar l’existència de límits, o, si més no, de parcials convergents. Volem que en les estructures matemàtiques amb què treballem no tinguem forats. Aquest fenomen de pas al límit d’estructures discretes a objectes continus (com ja passa en fer el pas dels números racionals als números reals) és freqüent en matemàtiques, i en particular en matemàtica discreta: els matemàtics discrets utilitzen eines de la matemàtica contínua i, en sentit contrari, els matemàtics continus utilitzen tècniques de discretització. Un exemple ben conegut és el clàssic teorema de De Moivre-Laplace en probabilitat, que defineix el límit de variables aleatòries discretes binomials independents en termes de la llei normal (que és un objecte eminentment continu). Un altre bon exemple elemental són les sumes de Riemann, que, sota condicions tècniques, convergeixen cap a la integral. Aquesta idea de pas al límit (alguns cops per necessitat de completesa, d’altres per a donar un marc de treball prou ampli i general), com no podria ser d’una altra manera, també impregna el món dels grafs. Els objectes clau en la teoria dels grafs límits són els anomenats grafons, nom que prové de la contracció de graf i de funció. Un grafó és simplement una funció W : [0, 1]2 → [0, 1] mesurable (en el sentit de Lebesgue) i simètrica. Entenem aquí per simètrica si es compleix que W (x, y) = W (y, x). De fet, quedem-nos aquí amb aquesta idea: més endavant redefinirem què és un grafó (ja que d’aquí a una estona ens trobarem problemes tècnics que haurem de resoldre). Els grafons els dibuixarem en el pla de manera semblant als codis QR: per a cada píxel del pla li associarem un valor en l’interval [0, 1], i per representar-ho pintarem el corresponent píxel de color negre o de color blanc segons si la funció pren el valor 1 o 0. De fet, si el valor de la funció en el punt considerat


98

Juanjo Rué

és p ∈ (0, 1), el pintarem de gris, més o menys intens segons com de gran sigui aquest valor. Què són grafons? Per exemple, a cada graf G li podem associar un grafó com segueix: si els vèrtexs de G estan etiquetats amb etiquetes des d’1 fins a n, aleshores definim el seu grafó associat WG : [0, 1]2 → [0, 1] partint primer l’interval [0, 1] en n intervals d’igual longitud I1 , . . . , In i establint que el rectangle Ir × Is prendrà valor 1 o 0 segons si hi ha una aresta (o no) entre els vèrtexs r i s. Si recordem que, donat un graf G = (V , A) amb una ordenació dels vèrtexs {v1 , . . . , vn }, la matriu d’adjacència de G és una matriu simètrica, amb entrades 0 i 1 de tal manera que l’entrada en la fila i i la posició j és 1 si i només si vi i vj estan units per una aresta, el que estem fent és, primer, escriure la matriu d’adjacència del graf G i, segon, substituir la matriu per una imatge pixelada en blanc i negre: posem un color negre o blanc segons si els coeficients de la matriu són 1 o 0, respectivament. A la figura 12 mostrem un exemple explícit de la construcció del grafó associat a un graf donat per un graf bipartit amb 2n = 12 vèrtexs.

Figura 12: Un graf bipartit, la seva matriu d’adjacència i el seu grafó corresponent.

En general, podem construir una seqüència de grafs bipartits que repliquin la seva estructura (és a dir: una seqüència de grafs amb n + n vèrtexs, en què el vèrtex amb etiqueta 1 té grau n, el vèrtex amb etiqueta 2 està connectat als vèrtexs amb etiqueta n + 2, n + 3, . . . , 2n, etc.), i és natural preguntar-se quin serà el límit corresponent en termes de grafons. En aquest cas, podem pensar en termes de la convergència puntual de grafons; el límit serà el grafó amb un dibuix com el següent, que no es correspon clarament a cap grafó procedent d’un graf.

Figura 13: Límit de la seqüència de grafons definida en la figura 12.


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

99

Vegem-ne un segon exemple. Hom podria pensar que només caldria restringir-nos a funcions mesurables en [0, 1]2 que prenguin valors en {0, 1}. Però això no és així: si ara fixem p = 1/2 i considerem la seqüència de grafs G(n, p) (o una seqüència de grafs quasialeatoris amb paràmetre p = 1/2, que al final és un procediment explícit per a modelar l’objecte G(n, p)), el que veurem en l’evolució dels grafons corresponents és que cada píxel saltarà infinitament de 0 a 1. Per tant, sembla raonable pensar que el grafó límit (si existís) hauria de ser la funció constant igual a 1/2 per a tot (x, y) ∈ [0, 1]2 . Per a altres densitats p, sembla, doncs, raonable que el grafó límit hauria de ser constant igual a p per a tot (x, y) ∈ [0, 1]2 . Denotarem aquests grafons amb Wp (x, y) i els anomenarem constants. L’important d’aquest segon exemple, però, va més enllà de definir els grafons constants. Observeu que podríem tenir grafs que presentessin una combinació de comportaments i que en algunes regions la seqüència de grafs evolucioni com si fossin G(n, p) i en altres regions que evolucionin com a G(n, p 0 ). Això fa que els candidats a límits puguin ser funcions en [0, 1] molt complicades. Finalment, el següent exemple ens mostrarà un problema tècnic que cal tenir present. Considerem el graf bipartit complet amb 2n vèrtexs, en què els vèrtexs es parteixen en dos subconjunts V1 i V2 de la mateixa mida. Considerem ara, per al mateix graf, diferents maneres de posar les etiquetes en els vèrtexs, com són els etiquetaments que es mostren en la figura 14. Aleshores, quan dibuixem els grafons corresponents (vegeu la dreta de la mateixa figura), observem, doncs, un problema, ja que el mateix graf dona lloc a grafons molt diferents: per una banda, el taulell d’escacs (que si fem tendir n a infinit, hauria de tendir al grafó W1/2 ) i, per l’altra, el grafó associat al graf amb dos vèrtexs i una sola aresta.

Figura 14: Mateix graf i diferents etiquetaments donen lloc a grafons ben diferents.

Aquest exemple ens diu que cal tenir molta cura en com s’usen les etiquetes dels grafs. Resumint el que hem vist fins ara, semblen necessàries, doncs, dues coses ben importants: primer, tenir una manera de tractar com permutem les etiquetes dels vèrtexs en els grafs (i tenir, doncs, un anàleg en el cas continu), i segon, tenir present que els objectes límit poden ser molt generals.


Juanjo Rué

100

Amb aquestes idees en ment ja podem passar a definir la segona pota important en aquesta teoria: com mesurem distàncies? Per tal de poder establir una noció de convergència adequada, hem de poder quantificar aquest fet. En el cas dels grafs, tenim moltes maneres de fer-ho, però la que emprarem, que està motivada per tota la teoria de la quasialeatorietat, és la següent. Considerem un graf G = (V , A). Direm que és ε-proper al grafó Wp si per a tota parella de subconjunts de vèrtexs X, Y ∈ V (G) tenim que |d(X, Y ) − p| < ε, on, com hem definit abans, d(X, Y ) és la densitat d’arestes entre X i Y . Si en lloc de voler comparar un graf amb un grafó constant el que volem és comparar dos grafs sobre el mateix nombre de vèrtexs, el que fem és estendre aquesta noció: si ara prenem G1 = (V , E1 ) i G2 = (V , E2 ), aleshores direm que G1 i G2 són ε-propers respecte a la distància de tall si, per a tot X, Y ⊆ V tenim que |dG1 (X, Y ) − dG2 (X, Y )| < ε. En aquesta definició estem usant el subíndex Gi en el paràmetre de densitat per indicar que aquest càlcul l’estem realitzant en el graf Gi . El terme distància de tall ve motivat pel fet que un conjunt d’arestes entre dos conjunts de vèrtexs donat s’anomena tall. Si volem generalitzar aquesta noció al cas de grafons, caldrà que usem la integral de Lebesgue en [0, 1]2 , i en particular el següent operador (que té les propietats d’una norma), anomenat norma de tall: per a una funció W : [0, 1]2 → [0, 1] mesurable definim Z |W | = sup W , S,T ⊆[0,1]

S×T

on el suprem es pren sobre tots els conjunts mesurables S, T de [0, 1]. No és gaire difícil de verificar que, si G1 i G2 són dos grafs amb el mateix conjunt de vèrtexs i amb grafons associats WG1 i WG2 , aleshores és equivalent que G1 i G2 siguin ε-propers amb el fet que |WG1 − WG2 | < ε. La importància d’aquesta norma és que pot aplicar-se a qualsevol grafó, no només als procedents del grafs. Continuem tenint, però, el problema de les permutacions de vèrtexs: potser dos grafs no s’assemblen gens, però, en permutar les etiquetes, resulten molt propers. En concret, donat G1 = (V , A1 ) i G2 = (V , A2 ) sobre el mateix conjunt de n vèrtexs V , i σ ∈ Sn una permutació de mida n, definim G2σ el graf que s’obté de permutar les etiquetes dels vèrtexs de G2 segons σ (parlant clar: mantenim el dibuix del graf, però canviem les etiquetes dels vèrtexs). Aleshores, direm que G1 i G2 s’assemblen amb una tolerància ε si per a tot X, Y ∈ V tenim que inf |dG1 (X, Y ) − dG2σ (X, Y )| < ε. σ ∈Sn

Podem traduir aquesta noció de permutació al context continu com segueix. Denotem amb λ la mesura de Lebesgue. Aleshores direm que una funció α : [0, 1] →


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

101

[0, 1] preserva la mesura de Lebesgue si λ(A) = λ(α−1 (A)) per a tot conjunt mesurable A. A més a més, direm que és invertible si existeix una altra funció β : [0, 1] → [0, 1] que preserva la mesura i tal que α ◦ β = β ◦ α és la funció identitat, llevat de conjunts de mesura nul.la. Denotarem amb M[0,1] el conjunt de funcions que preserven la mesura i que són invertibles. Amb aquesta noció de funció que preserva la mesura ja podem usar la idea de la norma de tall i trobar una distància que solucioni el problema dels diferents etiquetaments en grafons. En efecte: si W és un grafó i α : [0, 1] → [0, 1] una funció que preserva la mesura, aleshores definim W α com el grafó que puntualment pren valors W α (x, y) := W (α(x), α(y)). Finalment, si W1 i W2 són grafons, definim la seva distància de tall com a δ (W1 , W2 ) :=

inf

α∈M[0,1]

|W1 − W2α | .

Amb aquesta definició, de fet, podem tractar els grafons de grafs usant la noció de similitud. Finalment, direm que una seqüència de grafons {Wn }n≥1 convergeix respecte a la distància de tall si la successió {Wn }n≥1 és de Cauchy respecte a δ . En particular, la convergència de grafons (i dels grafs corresponents) la considerarem en relació amb aquesta distància. Ja ho tenim gairebé tot per a enunciar els grans teoremes que inicien tota la teoria de grafs límits. L’únic problema que tenim és que amb aquesta noció de distància de tall és possible que dos grafons diferents tinguin distància de tall igual a 0 (i, és clar, volem que la distància sigui 0 només quan l’apliquem al mateix grafó dos cops). Per resoldre aquest problema (volem que la distància entre dos grafons sigui 0 si i només si tenim el mateix grafó) fem com és habitual: sobre l’espai de funcions prenem el quocient, tot relacionant dos grafons W1 i W2 si δ (W1 , W2 ) = 0. L’espai que n’obtenim el denotarem amb W0 i l’anomenarem espai dels grafons (i els seus elements són els grafons de veritat). Per tant, fins ara no hem tractat amb el que realment són els grafons, ja que aquests al final sorgeixen d’aplicar un quocient en un espai molt més gran. Ja tenim ara els conceptes més importants, i ja podem passar a enunciar el gran teorema que inicia la teoria. A [25], Lázsló Lovász i Balázs Szegedy demostren justament que aquest espai funcional és un bon lloc per a fer-hi anàlisi: Teorema 10 (Lovász-Szegedy, 2006). (W0 , δ ) és un espai compacte. Per tant, efectivament, l’espai W0 , junt amb la distància de tall, permet sempre trobar parcials convergents en successions de grafons. De fet, en la prova d’aquest teorema, resultat clau en tota la teoria, hi té un paper molt important el lema de regularitat de Szemerédi. Com a producte de les seves tècniques tenim diversos corol.laris. El primer és que els grafs (de fet, els grafons associats a grafs) són densos en (W0 , δ ). La prova és ben senzilla (si més no la idea): si tenim un grafó qualsevol, el que fem és aproximar-lo per grafons esgraonats. Aquests grafons es poden aproximar aleshores per grafs


Juanjo Rué

102

quasialeatoris, i d’aquesta manera tenim una seqüència de grafs els grafons dels quals s’apropen tant com vulguem al grafó inicial. Aquests són només els primers ingredients de la teoria de grafons. Cal mencionar que es pot arribar també a la construcció que hem obtingut per una altra via. No en veurem els detalls aquí, però només hem de comentar breument que es pot arribar a les mateixes conclusions usant la noció d’homomorfisme de grafs. En concret, donats dos grafs G = (V (G), A(G)) i H = (V (H), A(H)), un homomorfisme de H en G és una funció φ : V (H) → V (G) tal que, si uv ∈ A(H), aleshores φ(u)φ(v) ∈ A(G). Dit d’una altra manera, un homomorfisme envia arestes d’un graf a arestes d’un graf hoste. Tot explotant la noció de graf homomorfisme (de gran rellevància també en teoria de grafs), Christina Borgs, Jennifer T. Chayes, Lázló Lovász, Vera T. Sós i Katalin Vesztergombi demostren a [6] que la construcció que hem fet dels grafons pot fer-se de manera equivalent usant una noció de convergència en termes dels homomorfismes de grafs. Es poden trobar més detalls en l’excel.lent article escrit per Oriol Serra i aparegut fa uns anys al Butlletí de la Societat Catalana de Matemàtiques [31]. 6.1

Una mirada al futur

Tots aquests conceptes que hem vist en relació amb la noció de definir límits de grafs són només un petit exemple d’un paradigma molt més ampli que comprèn tota la matemàtica discreta actual. De fet, la frontera entre el que és discret i el que és continu és cada cop menys evident. Definir la noció de convergència d’una seqüència d’estructures discretes i l’objecte límit corresponent (no necessàriament «discret») és una qüestió crítica en les matemàtiques discretes modernes. Aquest problema s’ha estudiat intensament en els darrers anys i sorgeix en diferents escenaris. Sembla evident que tindrà un paper destacat en els propers anys. Per concloure aquest escrit descriurem breument alguns exemples importants de temes matemàtics moderns en què hi ha hagut avenços recents, a més de la teoria de grafs límit que hem vist. Un segon exemple és l’ús de tècniques analítiques complexes (discretes) per a comprendre els fenòmens de la física estadística. A partir dels treballs pioners sobre la invariància conforme d’Oded Schramn (vegeu una mostra del seu treball a [4, 30]) sobre l’anomenada evolució de Schramn-Loewner, hi ha hagut una tendència molt activa i fructífera d’investigació que combina idees sorgides de la teoria de la probabilitat, l’anàlisi complexa i la combinatòria. Aquest treball ha donat lloc en els últims anys a grans avenços en l’estudi, per exemple, dels fenòmens de percolació, fins i tot en dimensions superiors a 2. Un bon exemple de la maduressa d’aquesta línia de recerca és la recent medalla Fields atorgada a Hugo Dominil-Copin, un dels màxims exponents en aquesta àrea de recerca, en què la probabilitat ajuda de manera crucial a entendre les estructures discretes i els seus límits. Un tercer i bon exemple prové també de la física teòrica: els grafs planars amb una immersió en el pla (també anomenats mapes planars) formen una discretització natural per a les superfícies aleatòries que apareixen en el context


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

103

de gravetat quàntica 2D [9]. En els darrers temps hi ha hagut molt d’interès (i també progressos) en l’estudi dels límits d’escala dels mapes planars aleatoris, la qual cosa ha donat lloc a una molt bona comprensió (des d’un punt de vista topològic i mètric) de l’espai topologic límit que se n’obté, anomenat mapa brownià (vegeu-ne la construcció a [26]; més propietats poden trobar-se a [16]). De fet, hi ha resultats molt recents (deguts a Jason Miller, Scott Sheffield i coautors; vegeu, per exemple, la xerrada plenària de Sheffield al Congrés Internacional de Matemàtics de l’any 2022, disponible en xarxa) que connecten aquest món amb el descrit al segon exemple. Aquests fets donen perspectives encara més interessants sobre les teories d’unificació per a l’estudi dels límits d’estructures aleatòries. Aquests són tres exemples aïllats (però destacats) que mostren que moltes estructures discretes es poden aproximar mitjançant objectes continus utilitzant diferents disciplines de les matemàtiques, que cobreixen especialment la teoria de la probabilitat, l’anàlisi complexa i l’anàlisi funcional. Esperem que aquesta dualitat entre el límit de les estructures discretes (que són objectes continus) i el fet que aquests límits proporcionen informació molt interessant per a les propietats del costat discret tindrà un paper creixent en el futur en l’estudi d’estructures discretes de grans dimensions.

Agraïments L’autor agraeix a Oriol Serra i Lluís Vena la lectura d’aquest document i el fet d’haver fet suggeriments molt escaients. L’autor agraeix el suport dels projectes de recerca MTM2017-82166-P, PID2020-113082GB-I00, de la xarxa RISE-EU «RandNet» (referència 101007705) i del programa Severo Ochoa i María de Maeztu per a centres i unitats d’excel.lència en R+D (referència CEX2020001084-M).

Referències [1] Albert, R.; Barabási, A.-L. «Statistical mechanics of complex networks». Rev. Modern Phys., 74 (1) (2002), 47–97. [2] Appel, K.; Haken, W. «Every planar map is four colorable. I. Discharging». Illinois J. Math., 21 (3) (1977), 429–490. [3] Appel, K.; Haken, W.; Koch, J. «Every planar map is four colorable. II. Reducibility». Illinois J. Math., 21 (3) (1977), 491–567. [4] Benjamini, I.; Schramm, O. «Recurrence of distributional limits of finite planar graphs». Electron. J. Probab., 6 (23) (2001), 13 p. [5] Bollobás, B.; Thomason, A. «Threshold functions». Combinatorica, 7 (1) (1987), 35–38. [6] Borgs, C.; Chayes, J. T.; Lovász, L.; Sós, V. T.; Vesztergombi, K. «Convergent sequences of dense graphs. I. Subgraph frequencies, metric properties and testing». Adv. Math., 219 (6) (2008), 1801–1851.


104

Juanjo Rué

[7] Boucheron, S.; Lugosi, G.; Massart, P. Concentration Inequalities. A Nonasymptotic Theory of Independence. Amb un pròleg de Michel Ledoux. Oxford: Oxford University Press, 2013. [8] Chung, F. R. K.; Graham, R. L.; Wilson, R. M. «Quasi-random graphs». Combinatorica, 9 (4) (1989), 345–362. [9] Di Francesco, Ph. «2D Quantum Gravity, matrix models and graph combinatorics». A: Brézin, É.; Kazakov, V.; Serban, D., Wiegmann, P.; Zabrodin, A. (ed.). Applications of Random Matrices in Physics. Dordrecht: Springer, 2006, p. 33–88. (NATO Science Series II: Mathematics, Physics and Chemistry; 221) [10] Erdős, P. «Some remarks on the theory of graphs». Bull. Amer. Math. Soc., 53 (1947), 292–294. [11] Erdős, P. «Graph theory and probability». Canadian J. Math., 11 (1959), 34–38. [12] Erdős, P.; Rényi, A. «On random graphs. I». Publ. Math. Debrecen, 6 (1959), 290–297. [13] Erdős, P.; Rényi, A. «On the evolution of random graphs». Magyar Tud. Akad. Mat. Kutató Int. Közl., 5 (1960), 17–61. [14] Fox, J. «A new proof of the graph removal lemma». Ann. of Math. (2), 174 (1) (2011), 561–579. [15] Frieze, A.; Karoński, M. Introduction to Random Graphs. Cambridge: Cambridge University Press, 2016. [16] Le Gall, J.-F. «Brownian geometry». Jpn. J. Math., 14 (2) (2019), 135–174. [17] Gilbert, E. N. «Random graphs». Ann. Math. Statist., 30 (1959), 1141–1144. [18] Gowers, W. T. «Lower bounds of tower type for Szemerédi’s uniformity lemma». Geom. Funct. Anal., 7 (2) (1997), 322–337. [19] Gromov, M. «Hyperbolic groups». A: Essays in Group Theory. Nova York: Springer-Verlag, 1987, p. 75–263. (Math. Sci. Res. Inst. Publ.; 8) [20] Gromov, M. «Random walk in random groups». Geom. Funct. Anal., 13 (1) (2003), 73–146. [21] Komlós, J.; Shokoufandeh, A.; Simonovits, M.; Szemerédi, E. «The regularity lemma and its applications in graph theory». A: Theoretical Aspects of Computer Science (Tehran, 2000). Berlín: Springer-Verlag, 2002, p. 84–112. (Lecture Notes in Comput. Sci.; 2292) [22] Kuratowski, C. «Sur le problème des courbes gauches en Topologie». Fund. Math., 15 (1930), 271–283. [23] Lovász, L. «Graph minor theory». Bull. Amer. Math. Soc. (N.S.), 43 (1) (2006), 75–86. [24] Lovász, L. Large Networks and Graph Limits. Providence, RI: American Mathematical Society, 2012. (Amer. Math. Soc. Colloq. Publ.; 60) [25] Lovász, L.; Szegedy, B. «Limits of dense graph sequences». J. Combin. Theory Ser. B, 96 (6) (2006), 933–957.


De la teoria de grafs clàssica a l’anàlisi de les grans xarxes

105

[26] Marckert, J.-F.; Mokkadem, A. «Limit of normalized quadrangulations: the Brownian map». Ann. Probab., 34 (6) (2006), 2144–2202. [27] Moore, G. E. «Cramming more components onto integrated circuits». Electronics, 38 (8), (1965), 114–117. [28] Roth, K. F. «On certain sets of integers». J. London Math. Soc., 28 (1953), 104–109. [29] Ruzsa, I. Z.; Szemerédi, E. «Triple systems with no six points carrying three triangles». A: Combinatorics (Proc. Fifth Hungarian Colloq., Keszthely, 1976). Vol. II. Amsterdam-Nova York: North-Holland Publishing Co., 1978, p. 939–945. (Colloq. Math. Soc. János Bolyai; 18) [30] Schramm, O. «Conformally invariant scaling limits: an overview and a collection of problems». A: International Congress of Mathematicians. Vol. I. Zúric: European Mathematical Society (EMS), 2007, p. 513–543. [31] Serra, O. «Límits de grafs». Butlletí de la Societat Catalana de Matemàtiques, 35 (1) (2020), 57–79. [32] Szemerédi, E. «On sets of integers containing no k elements in arithmetic progression». Acta Arith., 27 (1975), 199–245. [33] Szemerédi, E. «Regular partitions of graphs». A: Problèmes combinatoires et théorie des graphes (Colloq. Internat. CNRS, Univ. Orsay, Orsay, 1976). París: Éditions du Centre National de la Recherche Scientifique (CNRS), 1978, p. 399–401. (Colloq. Internat. CNRS; 260) [34] Thomason, A. Pseudorandom graphs. A: Random Graphs ’85 (Poznań, 1985). Ann. Discrete Math., 33. Amsterdam: North-Holland Publishing Co., 1987, p. 307–331. (North-Holland Math. Stud.; 144) [35] Watts, D. J.; Strogatz, S. H. «Collective dynamics of ‘small-world’ networks». Nature, 393 (1998), 440–442.

Departament de Matemàtiques i Institut de Matemàtiques Universitat Politècnica de Catalunya i Centre de Recerca Matemàtica juan.jose.rue@upc.edu



Butlletí de la Societat Catalana de Matemàtiques Vol. 38, núm. 1, 2023. Pàg. 107–108

English summaries

Alessio Figalli On the Monge-Ampère equation The Monge-Ampère equation is a nonlinear partial differential equation arising in several problems in analysis and geometry, such as the prescribed Gaussian curvature equation, affine geometry, optimal transportation, etc. This equation prescribes the product of the eigenvalues of the Hessian of u, in contrast to the «model» elliptic equation ∆u = f , which prescribes their sum. The goal of this paper is to give a general overview of the classical theory and then discuss some important recent developments in this beautiful topic. Keywords: Monge-Ampère, convex functions, elliptic regularity. MSC2020 Subject Classification: 35J96, 35J60.

Carles Lladó and Josep M. Brunat The mathematics of satins Satins are a particularly relevant class of fabrics. This paper provides a general framework that identifies a satin with a Z2 lattice and relates the analysis of satins to classical results in number theory and geometry. Square, symmetrical (in particular rectangular symmetrical and rhombus symmetrical) and concordant satins are dealt with. Fibonacci satins are also introduced, characterizing those that are symmetrical and those that are square.


108

Keywords: fabric, design, sateeen, satin, square satin, symmetric satin, lattice, extended Euclid’s algorithm, optimal basis, Fibonacci numbers, Fibonacci satin. MSC2020 Subject Classification: 11Z05, 52C05, 11A05, 11B39, 11B50.

Juanjo Rué From classical graph theory to the analysis of large networks Graph theory currently plays a fundamental role both in pure mathematics and in its applications in many branches of knowledge. In this paper we will retrace the evolution of the research area starting from its origins, through the major discoveries in the discipline, especially those related to the interaction with the notion of randomness. Finally, our journey will conclude by discussing some of the current trends in the theory, which seek to fit the notion of discrete (inherent to graph theory) into the realm of continuous mathematics with the aim of addressing the systematic study of the large networks existing in the real world, among other major challenges. Keywords: graph theory, probabilistic method, graph limits, random graphs, pseudorandomness. MSC2020 Subject Classification: 05C10, 05D40, 05C35.


Instruccions per als autors Els articles sotmesos a publicació s’han d’enviar als editors o a qualsevol membre del comitè editorial per correu electrònic, preferentment en format PDF. Els originals han de contenir la versió anglesa del títol, un resum breu en català i en anglès, paraules clau en català i en anglès i els codis de la classificació per matèries MSC2020. Les versions definitives dels articles acceptats s’han de presentar en codi TEX, preferentment en l’estil LATEX propi del butlletí. Aquest estil es pot obtenir a les pàgines web de la Societat Catalana de Matemàtiques (SCM). Es recomana una extensió d’entre 15 i 35 pàgines. Fem notar que en aquesta publicació s’utilitza preferentment el punt per a separar decimals, en lloc de la coma recomanada per l’IEC, per a poder facilitar la comprensió de les expressions matemàtiques. Per tal d’accelerar el procés de producció, es prega als autors que segueixin les indicacions contingudes en el document d’exemple. La versió en paper del butlletí s’imprimeix en blanc i negre. Quan un article contingui figures en color i es consideri convenient, l’autor proporcionarà una versió dels gràfics substituint el color per tons de grisos i línies de gruix variable. Així mateix, modificarà els comentaris que facin referència al color de les figures. En qualsevol cas, el butlletí publicarà l’original en color en el seu format electrònic. La propietat intel.lectual dels articles és dels respectius autors. Els autors, en el moment de lliurar els articles al butlletí per a sol.licitar-ne la publicació, accepten els termes següents: — Els autors cedeixen a la SCM (filial de l’Institut d’Estudis Catalans) els drets de reproducció, comunicació pública i distribució dels articles presentats per a ser publicats al butlletí. — Els autors responen davant la SCM de l’autoria i l’originalitat dels articles presentats. — És responsabilitat dels autors l’obtenció dels permisos per a la reproducció de tot el material gràfic inclòs en els articles. — La SCM està exempta de tota responsabilitat derivada de l’eventual vulneració de drets de propietat intel.lectual per part dels autors. Cada autor rebrà una còpia en PDF d’alta qualitat de la versió digital del seu article i un exemplar imprès del número del butlletí en el qual es publiqui. La correspondència administrativa relacionada amb el butlletí s’ha d’adreçar a la SCM. Pel que fa a la protecció de dades personals, l’Institut d’Estudis Catalans (IEC) compleix el que estableix el Reglament general de protecció de dades de la Unió Europea (Reglament 2016/679, del 27 d’abril de 2016). De conformitat amb aquesta norma, s’informa que, amb l’acceptació de les normes de publicació, els autors autoritzen que les seves dades personals (nom i cognoms, dades de contacte i dades de filiació) puguin ser publicades en el corresponent volum del butlletí.


Aquestes dades seran incorporades a un tractament que és responsabilitat de l’IEC amb la finalitat de gestionar aquesta publicació. Únicament s’utilitzaran les dades dels autors per a gestionar la publicació del butlletí i no seran cedides a tercers, ni es produiran transferències a tercers països o organitzacions internacionals. Un cop publicat el butlletí, aquestes dades es conservaran com a part del registre històric d’autors. Els autors poden exercir els drets d’accés, rectificació, supressió, oposició, limitació en el tractament i portabilitat, adreçant-se per escrit a l’Institut d’Estudis Catalans (carrer del Carme, 47, 08001 Barcelona), o bé enviant un correu electrònic a l’adreça dades.personals@iec.cat, en què s’especifiqui de quina publicació es tracta.


Comitè editorial Antoni Guillamon (editor en cap) Departament de Matemàtiques Universitat Politècnica de Catalunya antoni.guillamon@upc.edu

Rosa Camps (editora adjunta) Departament de Matemàtiques Universitat Autònoma de Barcelona rosa.camps@uab.cat

Carme Cascante Dep. de Matemàtiques i Informàtica Universitat de Barcelona cascante@ub.edu

Marc Noy Departament de Matemàtiques Universitat Politècnica de Catalunya marc.noy@upc.edu

Bartomeu Coll Dep. de Matemàtiques i Informàtica Universitat de les Illes Balears tomeu.coll@uib.cat

Francesc Planas Departament de Matemàtiques Universitat Politècnica de Catalunya francesc.planas@upc.edu

Núria Fagella Dep. de Matemàtiques i Informàtica Universitat de Barcelona fagella@maia.ub.es

Joan Saldaña Dep. d’Informàtica, Mat. Aplicada i Estadística Universitat de Girona joan.saldana@udg.edu

Armengol Gasull Departament de Matemàtiques Universitat Autònoma de Barcelona armengol.gasull@uab.cat

Marta Sanz-Solé Dep. de Matemàtiques i Informàtica Universitat de Barcelona marta.sanz@ub.edu

Gábor Lugosi ICREA i Departament d’Economia Universitat Pompeu Fabra gabor.lugosi@upf.edu

Gil Solanes Departament de Matemàtiques Universitat Autònoma de Barcelona gil.solanes@uab.cat


Societat Catalana de Matemàtiques La Societat Catalana de Matemàtiques (SCM) és una societat filial de l’Institut d’Estudis Catalans, que continua les activitats de la Secció de Matemàtiques de la Societat Catalana de Ciències, que fou fundada per l’Institut l’any 1931. Les finalitats de la SCM són: el conreu de les ciències matemàtiques, l’extensió del seu coneixement en la societat catalana, el foment del seu ensenyament i de la seva investigació teòrica i aplicada, així com la publicació de tota mena de treballs que s’adeqüin a aquests objectius. La SCM desenvolupa les seves activitats en les terres de llengua i cultura catalanes. El català és, doncs, la llengua pròpia de la SCM i la que és usada normalment en tots els seus actes i publicacions. La SCM edita les publicacions periòdiques SCM/Notícies, Butlletí de la Societat Catalana de Matemàtiques, NouBiaix (en col.laboració amb la FEEMCAT) i Reports@SCM. Els socis de la SCM reben, gratuïtament, aquestes publicacions. La SCM té convenis de reciprocitat amb diverses societats matemàtiques d’arreu del món, mitjançant els quals els socis de la SCM obtenen una reducció en la quota de soci d’aquestes societats. Així mateix, els socis de la SCM poden fer-se socis de la Societat Matemàtica Europea pagant una quota complementària. La Junta Directiva de la SCM està constituïda per les persones següents: Presidenta: Montserrat Alsina i Aubach Vicepresidents: Joan Porti i Piqué, Josep Vives i Santa-Eulàlia Secretària: Margarida Mitjana i Riera Tresorer: Albert Granados i Corsellas Vocals: Clara Mateo Campo, David Virgili Correas Delegat de l’IEC: Joaquim Bruna i Floris L’adreça de la SCM és carrer del Carme, 47, 08001 Barcelona. Telèfon: 933 248 583. Fax: 932 701 180. Correu electrònic: scm@iec.cat. Adreça web: https://scm.iec.cat.



BUTLLETÍ

El butlletí de la societat catalana de matemàtiques publica, en llengua catalana, exposicions matemàtiques de qualitat, que puguin interessar a un nombre elevat de lectors. Es donarà prioritat a aquells treballs en què destaquin la claredat d’exposició i l’interès general del tema. El butlletí està obert a tots els camps de la matemàtica i també als aspectes matemàtics de les ciències experimentals, la tecnologia, l’economia, etc., així com a altres àrees, com la història, la didàctica i la filosofia, sempre que els treballs tinguin un component matemàtic important. També tenen cabuda al butlletí aquells articles que desenvolupin un aspecte significatiu de la problemàtica de la professió matemàtica al nostre país.

DE LA SOCIETAT CATALANA DE MATEMÀTIQUES Institut d’Estudis Catalans

El butlletí publica un volum a l’any, dividit en dos números, que es trameten gratuïtament a tots els socis. El butlletí es publica també en format electrònic. L’edició electrònica del butlletí pot obtenir-se des del portal de revistes científiques en línia de l’IEC o al servidor https://scm.iec.cat. La correspondència administrativa s’ha d’adreçar a la Societat Catalana de Matemàtiques.

Editor en cap

Editora adjunta

Antoni Guillamon

Rosa Camps

Departament de Matemàtiques

Departament de Matemàtiques

Universitat Politècnica de Catalunya

Universitat Autònoma de Barcelona

í n d e x q Alessio Figalli q Carles Lladó i Josep M. Brunat Les matemàtiques dels setins ---------------------------------------------------------------

Comitè Editorial Marc Noy Departament de Matemàtiques Universitat Politècnica de Catalunya

Bartomeu Coll Dep. de Matemàtiques i Informàtica Universitat de les Illes Balears

Francesc Planas Departament de Matemàtiques Universitat Politècnica de Catalunya

Núria Fagella Dep. de Matemàtiques i Informàtica Universitat de Barcelona

Joan Saldaña Dep. d’Informàtica, Mat. Aplicada i Estadística Universitat de Girona

Armengol Gasull Departament de Matemàtiques Universitat Autònoma de Barcelona

Marta Sanz-Solé Dep. de Matemàtiques i Informàtica Universitat de Barcelona

Gábor Lugosi ICREA i Departament d’Economia Universitat Pompeu Fabra

Gil Solanes Departament de Matemàtiques Universitat Autònoma de Barcelona

De la teoria de grafs clàssica a l’anàlisi de les grans xarxes ------------

tel. 933 248 583 - fax 932 701 180 scm@iec.cat - https://scm.iec.cat

BUTLLETÍ

Carrer del Carme, 47 - 08001 Barcelona

67

q English summaries --------------------------------------------------------------------------------- 107

Vo l u m 3 8

Societat Catalana de Matemàtiques

33

q Juanjo Rué Volu m 3 8 • Núm er o 1 • A n y 2023

Carme Cascante Dep. de Matemàtiques i Informàtica Universitat de Barcelona

5

Sobre l’equació de Monge-Ampère ------------------------------------------------------

Número 1

Any 2023


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.