Transactions on large scale data and knowledge centered systems xxxix special issue on database and

Page 1


Database and Expert Systems Applications Abdelkader Hameurlain

Visit to download the full and correct content document: https://textbookfull.com/product/transactions-on-large-scale-data-and-knowledge-cent ered-systems-xxxix-special-issue-on-database-and-expert-systems-applications-abde lkader-hameurlain/

More products digital (pdf, epub, mobi) instant download maybe you interests ...

Transactions on Large Scale Data and Knowledge Centered Systems XL Abdelkader Hameurlain

https://textbookfull.com/product/transactions-on-large-scaledata-and-knowledge-centered-systems-xl-abdelkader-hameurlain/

Transactions on Large Scale Data and Knowledge Centered Systems XXXI Special Issue on Data and Security Engineering 1st Edition Abdelkader Hameurlain

https://textbookfull.com/product/transactions-on-large-scaledata-and-knowledge-centered-systems-xxxi-special-issue-on-dataand-security-engineering-1st-edition-abdelkader-hameurlain/

Transactions on Large Scale Data and Knowledge Centered Systems XXXIV Special Issue on Consistency and Inconsistency in Data Centric Applications 1st Edition Abdelkader Hameurlain

https://textbookfull.com/product/transactions-on-large-scaledata-and-knowledge-centered-systems-xxxiv-special-issue-onconsistency-and-inconsistency-in-data-centric-applications-1stedition-abdelkader-hameurlain/

Transactions on Large Scale Data and Knowledge Centered Systems XXV 1st Edition Abdelkader Hameurlain

https://textbookfull.com/product/transactions-on-large-scaledata-and-knowledge-centered-systems-xxv-1st-edition-abdelkaderhameurlain/

Transactions on Large Scale Data and Knowledge Centered Systems XXIII Selected Papers from FDSE 2014 1st Edition

https://textbookfull.com/product/transactions-on-large-scaledata-and-knowledge-centered-systems-xxiii-selected-papers-fromfdse-2014-1st-edition-abdelkader-hameurlain/

Transactions on Computational Science XXXI Special Issue on Signal Processing and Security in Distributed Systems 1st Edition Marina L. Gavrilova

https://textbookfull.com/product/transactions-on-computationalscience-xxxi-special-issue-on-signal-processing-and-security-indistributed-systems-1st-edition-marina-l-gavrilova/

Transactions on Computational Science XXXVII Special Issue on Computer Graphics Marina L. Gavrilova

https://textbookfull.com/product/transactions-on-computationalscience-xxxvii-special-issue-on-computer-graphics-marina-lgavrilova/

Transactions on Computational Science XXVI Special Issue on Cyberworlds and Cybersecurity 1st Edition

Marina L. Gavrilova

https://textbookfull.com/product/transactions-on-computationalscience-xxvi-special-issue-on-cyberworlds-and-cybersecurity-1stedition-marina-l-gavrilova/

Transactions on Computational Science XXVIII Special Issue on Cyberworlds and Cybersecurity 1st Edition

Marina L. Gavrilova

https://textbookfull.com/product/transactions-on-computationalscience-xxviii-special-issue-on-cyberworlds-andcybersecurity-1st-edition-marina-l-gavrilova/

Subline

Journal

Djamal

Transactions on Large-Scale Data- and KnowledgeCentered Systems

Special Issue on Databaseand Expert-Systems Applications

LectureNotesinComputerScience11310

CommencedPublicationin1973

FoundingandFormerSeriesEditors: GerhardGoos,JurisHartmanis,andJanvanLeeuwen

EditorialBoard

DavidHutchison

LancasterUniversity,Lancaster,UK

TakeoKanade

CarnegieMellonUniversity,Pittsburgh,PA,USA

JosefKittler UniversityofSurrey,Guildford,UK

JonM.Kleinberg

CornellUniversity,Ithaca,NY,USA

FriedemannMattern

ETHZurich,Zurich,Switzerland

JohnC.Mitchell

StanfordUniversity,Stanford,CA,USA

MoniNaor

WeizmannInstituteofScience,Rehovot,Israel

C.PanduRangan

IndianInstituteofTechnologyMadras,Chennai,India

BernhardSteffen

TUDortmundUniversity,Dortmund,Germany

DemetriTerzopoulos UniversityofCalifornia,LosAngeles,CA,USA

DougTygar UniversityofCalifornia,Berkeley,CA,USA

GerhardWeikum

MaxPlanckInstituteforInformatics,Saarbrücken,Germany

Moreinformationaboutthisseriesat http://www.springer.com/series/8637

AbdelkaderHameurlain • RolandWagner

DjamalBenslimane • ErnestoDamiani

WilliamI.Grosky(Eds.)

Transactionson

Large-Scale Data-andKnowledgeCenteredSystemsXXXIX

SpecialIssueonDatabaseandExpert-SystemsApplications

Editors-in-Chief

AbdelkaderHameurlain IRIT,PaulSabatierUniversity Toulouse,France

GuestEditors

DjamalBenslimane IUT,UniversityLyon1 VilleurbanneCedex,France

ErnestoDamiani UniversityofMilan Crema,Italy

RolandWagner FAW,UniversityofLinz Linz,Austria

WilliamI.Grosky UniversityofMichigan-Dearborn Dearborn,MI,USA

ISSN0302-9743ISSN1611-3349(electronic) LectureNotesinComputerScience

ISSN1869-1994ISSN2510-4942(electronic) TransactionsonLarge-ScaleData-andKnowledge-CenteredSystems ISBN978-3-662-58414-9ISBN978-3-662-58415-6(eBook) https://doi.org/10.1007/978-3-662-58415-6

LibraryofCongressControlNumber:2018961592

© Springer-VerlagGmbHGermany,partofSpringerNature2018 Thisworkissubjecttocopyright.AllrightsarereservedbythePublisher,whetherthewholeorpartofthe materialisconcerned,specificallytherightsoftranslation,reprinting,reuseofillustrations,recitation, broadcasting,reproductiononmicrofilmsorinanyotherphysicalway,andtransmissionorinformation storageandretrieval,electronicadaptation,computersoftware,orbysimilarordissimilarmethodologynow knownorhereafterdeveloped.

Theuseofgeneraldescriptivenames,registerednames,trademarks,servicemarks,etc.inthispublication doesnotimply,evenintheabsenceofaspecificstatement,thatsuchnamesareexemptfromtherelevant protectivelawsandregulationsandthereforefreeforgeneraluse.

Thepublisher,theauthors,andtheeditorsaresafetoassumethattheadviceandinformationinthisbookare believedtobetrueandaccurateatthedateofpublication.Neitherthepublishernortheauthorsortheeditors giveawarranty,expressorimplied,withrespecttothematerialcontainedhereinorforanyerrorsor omissionsthatmayhavebeenmade.Thepublisherremainsneutralwithregardtojurisdictionalclaimsin publishedmapsandinstitutionalaffiliations.

ThisSpringerimprintispublishedbytheregisteredcompanySpringer-VerlagGmbH,DEpartof SpringerNature

Theregisteredcompanyaddressis:HeidelbergerPlatz3,14197Berlin,Germany

Preface

The28thInternationalConferenceonDatabaseandExpertSystemsApplications DEXA2017 tookplaceinLyon,France,duringAugust28–31,2017.DEXAisan annualconference,designedforresearchersinterestedinsomeaspectsofdatabase, information,andknowledgesystems.DEXA2017attracted166submissionsfromall overtheworld.TheDEXA2017chairsaccepted37fullresearchpapersand37short researchpapersyieldinganacceptancerateof22%foreachtypeofacceptedpapers. Amongthe37fullpapers,weselected11papersfortheirqualityandaskedauthors toextendtheirpapersforapossibleinclusionintheTLDKSjournal.Finally,only sevenpaperswereacceptedandareincludedinthisvolume.

ThesuccessofthisTLDKSspecialissueofDEXA2017wouldnothavebeen possiblewithoutthehelpofGabrielaWagnerasmanageroftheDEXAorganization, andtheprofessionalandhardworkofthereviewers.Wegratefullythankthemfortheir commitmenttothisscientificevent.

Forthereadersofthisvolume,wehopeyouwill finditinteresting.Wealsohopeit willinspireyoutogreaterachievements.

September2018DjamalBenslimane

ErnestoDamiani

WilliamI.Grosky

Organization

EditorialBoard

RezaAkbariniaInria,France

BerndAmannLIP6 – UPMC,France

DagmarAuerFAW,Austria

DjamalBenslimaneLyon1University,France

StéphaneBressanNationalUniversityofSingapore,Singapore

MirelCosulschiUniversityofCraiova,Romania

TranKhanhDangHoChiMinhCityUniversityofTechnology,Vietnam

DirkDraheimTallinUniversityofTechnology,Estonia

JohannEderAlpenAdriaUniversityKlagenfurt,Austria

AnastasiosGounarisAristotleUniversityofThessaloniki,Greece

TheoHärderTechnicalUniversityofKaiserslautern,Germany

SergioIlarriUniversityofZaragoza,Spain

PetarJovanovicPolytechnicUniversityofCatalonia,BarcelonaTech, Spain

DieterKranzlmüllerLudwig-Maximilians-UniversitätMünchen,Germany

PhilippeLamarreINSALyon,France

LenkaLhotská TechnicalUniversityofPrague,CzechRepublic LiuLianUniversityofKentucky,USA

VladimirMarikTechnicalUniversityofPrague,CzechRepublic JorgeMartinezGilSoftwareCompetenceCenterHagenberg,Austria

FranckMorvanPaulSabatierUniversity,France

KjetilNørvågNorwegianUniversityofScienceandTechnology, Norway

ThemisPalpanasParisDescartesUniversity,France

TorbenBachPedersenAalborgUniversity,Denmark

GüntherPernulUniversityofRegensburg,Germany

SororSahriLIPADE,DescartesParisUniversity,France

AMinTjoaViennaUniversityofTechnology,Austria

ShaoyiYinPaulSabatierUniversity,France

AdditionalReviewers

KarimBenouaretLyon1University,France

AnneLaurentLIRMM,UniversityofMontpellier2,France

HalaSkaf-MolliNantesUniversity,France

GayoDialloBordeauxUniversity,France

AllelHadjaliENSMA,Poitiers,France

NazhaSelmaouiUniversityofNewCaledonia,Canada

ZakariaMaamarZayedUniversity,UnitedArabEmirates

RiadMokademPaulSabatierUniversity,France

IdirAmineAmaroucheUniversityofScienceandTechnologyHouari

Boumediene,Algeria

LadjelBellatrecheENSMA,Poitiers,France

RichardChbeirUPPAUniversity,France

SvenGroppeLübeckUniversity,Germany

Contents

QueryingInterlinkedDatabyBridgingRDFMoleculeTemplates.........1 KemeleM.Endris,MikhailGalkin,IoannaLytra, MohamedNadjibMami,Maria-EstherVidal, andSörenAuer

APackage-to-GroupRecommendationFramework...................43 IdirBenouaretandDominiqueLenne

StatisticalRelationCardinalityBoundsinKnowledgeBases.............67 EmirMuñozandMatthiasNickles

ETLProcessesintheEraofVariety.............................98 NabilaBerkani,LadjelBellatreche,andLaurentGuittet

eVM:AnEventVirtualMachineFramework.......................130 ElioMansour,RichardChbeir,andPhilippeArnould

InteractiveExplorationofSubspaceClustersonMulticoreProcessors......169 TheHaiPham,JesperKristensen,SonT.Mai,IraAssent,JonJacobsen, BayVo,andAnhLe

MapFIM+:MemoryAwareParallelizedFrequentItemsetMining InVeryLargeDatasets......................................200 Khanh-ChuongDuong,MostafaBamha,ArnaudGiacometti, DominiqueLi,ArnaudSoulet,andChristelVrain

AuthorIndex

QueryingInterlinkedDatabyBridging RDFMoleculeTemplates

KemeleM.Endris1(B) ,MikhailGalkin2,5 ,IoannaLytra2,4 , MohamedNadjibMami2 ,Maria-EstherVidal1,2,3 ,andSörenAuer1,2,3

1 L3SResearchCenter,UniversityofHannover,Hannover,Germany {endris,vidal,auer}@L3S.de

2 FraunhoferIAIS,SanktAugustin,Germany {galkin,lytra,mami}@iais.fraunhfofer.de

3 LeibnizInformationCentreForScienceandTechnologyUniversityLibrary(TIB), Hannover,Germany

4 UniversityofBonn,Bonn,Germany

5 ITMOUniversity,SaintPetersburg,Russia

Abstract. LinkedDatainitiativeshaveencouragedthepublicationofa largenumberofRDFdatasetscreatedbydifferentdataprovidersindependently.ThesedatasetscanbeaccessedusingdifferentWebinterfaces,e.g.,SPARQLendpoint;however,federatedqueryenginesarestill requiredinordertoprovideanintegratedviewofthesedatasets.Given thelargenumberofWebaccessibleRDFdatasets,SPARQLfederated queryenginesimplementqueryprocessingtechniquestoeffectivelyselect therelevantdatasetsthatprovidethedatarequiredtoansweraquery. Existingfederatedqueryenginesusuallyutilizecoarse-graineddescriptionmethodswheredatasetsarecharacterizedbasedontheirvocabulariesorschema,anddetailsaboutdatainthedatasetareignored, e.g.,classes,properties,orrelations.Thislackofsourcedescriptionmay leadtotheerroneousselectionofdatasourcesforaquery,andunnecessaryretrievalofdataandsourcecommunication,affectingthusthe performanceofqueryprocessingoverthefederation.Weaddressthe problemoffederatedSPARQLqueryprocessinganddeviseMULDER, aqueryengineforfederationsofRDFdatasources.MULDERdescribes datasourcesintermsofanabstractdescriptionofentitiesbelonging tothesameRDFclass,dubbedasan RDFmoleculetemplate,andutilizesthemforsourceselection,andquerydecompositionandoptimization.Weempiricallystudytheperformanceandcontinuousefficiencyof MULDERonexistingbenchmarks,andcomparewithrespecttoexisting federatedSPARQLqueryengines.Theexperimentalresultssuggestthat RDF moleculetemplates empowerMULDER,andallowforselectionof RDFdatasourcesthatnotonlyreduceexecutiontime,butalsoincrease answercompletenessandcontinuousefficiencyofMULDER.

1Introduction

Awiderangeofcommunities,e.g.,scientific,governmental,andindustrial, encouragedbytheLinkedDatainitiatives,havemadepubliclyavailabletheir c Springer-VerlagGmbHGermany,partofSpringerNature2018 A.Hameurlainetal.(Eds.):TLDKSXXXIX,LNCS11310,pp.1–42,2018. https://doi.org/10.1007/978-3-662-58415-6 1

dataasRDFdatasets;asaresult,thenumberofWebaccessibleRDFdatasets hasincreasedconsiderablyinthelasttenyears[13].Webaccessinterfaces,e.g., SPARQLendpoints[11]orLinkedDataFragment(LDF)clients[41]enablethe accessoftheseRDFdatasources.Albeitindividuallyvaluable,theintegration oftheseRDFdatasets–logicalorphysical–empowerstheirvalue,andallowsfor uncoveringunknownpatternsandcollectingrelevantinsights[23].

Federatedqueryenginesprovideaflexiblesolutiontotheproblemofquery processingoverafederationofdatasetslogicallyintegrated.Thisproblemhas beenextensivelystudiedbythedatabase[1, 8, 9, 21, 44]andsemanticwebresearch [2, 7, 15, 25, 34, 40]communities.Sincethenumberofpotentiallyrelevantdata sourcesforaquerycanbeverylarge,oneofthemajorchallengesofthesefederatedqueryenginesistheselectionoftheminimalnumberofsourcesthatcanprovidethedatarequiredtocompletelyanswerthequery.Currentapproachresort tosourcedescriptionsforidentifyingtherelevantsourcesofaquery.However, themajorityofexistingapproachesonlycollectcoarse-grainedsourcedescriptions,e.g.,vocabulariesorschemautilizedinthedatasetformodelingthedata, andignorefine-grainedcharacteristics,e.g.,classes,properties,andrelations. Nevertheless,wedeemthatfine-grainedsourcedescriptionsrepresentbuilding blocksnotonlyforeffectivelyselectingrelevantsources,butalsoforidentifying queryexecutionplansthatwillcollectthequeryanswersefficiently.Hence,we deviseMULDERanintegratedapproachforfederatedqueryprocessing,which utilizes RDFMoleculeTemplates (RDF-MTs)forafine-graineddescriptionof anRDFdataset,aswellasitsconnectionswithotherdatasets.

MULDERexploitsRDF-MTsduringsourceselection,andquerydecompositionandoptimization,andisabletoproducequeryplansthatanswerfederatedquerieseffectively.Furthermore,MULDERqueryplansbenefitthecontinuousgenerationofqueryanswers.Thispaperextendsourpreviouswork[10], wheretheconceptof RDFMoleculeTemplates isdefined;wepresentamore detaileddefinitionandcomparisonofthetechniquesimplementedinMULDER. Additionally,itisreportedamorecomprehensiveempiricalevaluationofthe performanceofMULDERinthreedifferentbenchmarks:theBerlinSPARQL Benchmark(BSBM)[6],FedBench[36];andLSLOD[19].

Ourcontributionscanbesummarizedasfollows:(1)AthoroughformalizationaccompaniedbyanimplementationforfederatedqueryprocessingemployingRDFMoleculeTemplates(RDF-MTs)forselectingrelevantsources,query decomposition,andexecution.(2)AnanalysisofdatasetcharacteristicsinafederationusingRDF-MTs.(3)Anempiricalevaluationassessingtheperformance ofMULDERintermsofqueryexecutiontimeandqueryanswercompleteness. ThereportedresultsprovideevidencethatMULDERisabletospeedupquery executionandenhanceanswercompletenesswithrespecttothestate-of-the-art. (4)AnexperimentalstudyofthecontinuousefficiencyofMULDERintermsof novelmetricsarereported,e.g., dief @t and dief @k [3];observedresultssuggestthatMULDERperformanceincreasesgraduallyandiscompetitivetothe state-of-the-artadaptivefederatedqueryengineANAPSID[2].

(a)SPARQLQuery

(b)RelevantFedBenchRDFDataSources

Fig.1. Motivatingexample.(a)SPARQLqueryoverFedBenchRDFdatasources.(b) FedBenchdatasourcesabletoexecutethequerytriplepatterns.Eachtriplepattern canbeexecutedinmorethanoneRDFdatasource.

Theremainderofthepaperisstructuredasfollows:Wedescribethebehavior ofexistingsystemswithamotivatingexampleinSubsect. 1.1 anddiscussthe preliminariesinSubsect. 1.2.Wepresenttherelatedworksandcomparethemto ourapproachinSect. 2.Weformallydefinethequerydecompositionproblemand introducetheMULDERapproachinSect. 3.InSect. 4,wepresenttheMULDER frameworkwherewegetintothedetailsoftheWebinterfacedescriptionmodel ofRDF-MTs(Subsect. 4.1),querydecompositiontechniques(Subsect. 4.2),and queryoptimizationstrategies(Subsect. 4.3)usedinMULDER.Wepresentthe resultsofourexperimentalstudyinSect. 5 andconcludewithanoutlookon futureworkinSect. 6

1.1MotivatingExample

Wemotivateourworkbycomparingtheperformanceofstate-of-the-artfederatedSPARQLqueryenginesonafederationofRDFdatasourcesfromthe FedBench benchmark.FedBench[37]isastandardbenchmarkforevaluatingfederatedqueryprocessingapproaches.ItcomprisesthreeRDFdatacollectionsof interlinkeddatasets,i.e.,the CrossDomainCollection (LinkedMDB,DBpedia, GeoNames,NYTimes,SWDF,andJamendo),the LifeScienceCollection (Drugbank,DBpedia,KEGG,andChEBI),andthesynthetic SP 2 BenchDataCollection.Althoughthesedatasetsarefromdifferentdomains,someRDFvocabularies areutilizedinmorethanonedataset.Forinstance, foaf propertiesareusedin DBpedia,GeoNames,SWDF,LinkedMDB,andNYTimes,whileRDFtriples withthe owl:sameAs propertyarepresentinalltheFedBenchdatasets.

FederatedSPARQLqueryengines,e.g.,ANAPSID[2]andFedX[40],provide aunifiedviewofthefederationofFedBenchdatasets,andsupportqueryprocessingoverthisunifiedview.Figure 1apresentsaSPARQLqueryonaFedBench federationofthreedatasources.Thequerycomprisesthreetriplepatterns: t1 canbeansweredonSWDFandGeonames;NYTimescananswer t3,while t2 canbeexecutedoverSWDF,Geonames,andNYTimesrespectively.Figure 1b reportsonthenumberofanswersof t1, t2,and t3 overSWDF,Geonames,and NYTimes.Federatedqueryenginesrelyonsourcedescriptionstoselectrelevant sourcesforaquery.Forinstance,basedonthevocabularypropertiesutilized ineachofthedatasources,ANAPSIDdecidesthatSWDF,Geonames,and NYTimesaretherelevantsources,whileFedXcontactseachofthefederation SPARQLendpointstodeterminewhere t1, t2,and t3 willbeexecuted.

Fig.2. Motivatingexample.(a)QuerydecompositionsbyFedXandANAPSID.(b) CardinalityofjoinsoftriplepatternsoverrelevantRDFdatasources.FedXdecompositionproducescompleteanswers,butatthecostofexecutiontime.ANAPSID decompositionsrunfaster,butproduceincompleteresults.

Furthermore,differentcriteriaarefollowedtodecomposethequeryintothe subqueriesthatwillbeposedovertherelevantsourcestocollectthedatarequired toanswerthequery.AspresentedinFig. 2a,FedXidentifiesthat t3 composes anexclusivegroupandcanbeexecutedoverNYTimes;while t1 isexecutedover SWDFandGeonames,and t2 onallthethreedatasets.Thus,FedXproduces acompleteanswerbyjoiningtheresultsobtainedfromexecutingthesethree subqueries.Nevertheless,FedXrequires239.4stoexecutethequery.

ANAPSIDofferstwoquerydecompositionmethods:SSGSandSSGM (Fig. 2a).ANAPSIDSSGSonlyselectsonerelevantsourcepertriplepattern; executiontimeisreducedto0.338s,butsourcesareerroneouslyselectedand thequeryexecutionproducesemptyresults.Finally,ANAPSIDSSGMbuilds astar-shapedsubquerythatincludes t2 and t3.Thestar-shapedsubqueryis executedonNYTimes,while t1 isposedoverSWDFandGeonames.Execution timeisreduced,butonly19answersareproduced,i.e.,resultsareincomplete. BasedonthevaluesofjoincardinalityreportedinFig. 2b,thedecomposition thatproducesalltheresultsrequiresthat t2 isexecutedoverNYTimesand Geonames,while t1 and t3 shouldbeonlyexecutedinGeonamesandNYTimes, respectively.However,becauseofthelackofsourcedescription,neitherFedX norANAPSIDiscapableoffindingthisdecomposition.Ontheonehand,to ensurecompleteness,FedXselectsirrelevantsourcesfor t1 and t2,negatively impactingexecutiontime.Ontheotherhand,ANAPSIDSSGSblindlyprunes therelevantsourcesfor t1 and t2,anddoesnotcollectdatafromGeonames andNYTimesrequiredtoanswerthequery.Similarly,ANAPSIDSSGMprunes Geonamesfrom t2,whileitisunabletodecideirrelevancyofGeonamesin t1 MULDERdescribessourceswithRDFmoleculetemplates(RDF-MTs),and willbeabletoselecttheRDF-MTsofthecorrectrelevantsources.Thus,MULDERwillproducecompleteanswerswithoutimpactingonexecutiontime.

1.2Background

Inthissection,wepresentbasicconceptsrequiredtounderstandthiswork.The ResourceDescriptionFramework(RDF)isagraph-baseddatamodelwhere

QueryingInterlinkedDatabyBridgingRDFMoleculeTemplates5

nodes(subjectsandobjects)areconnectedviadirectededges(predicates)1 . NodesinRDFgraphcanberesourcesorliterals,andRDFresourcesareidentifiedbyIRIs(InternationalizedResourceIdentifier)orblanknodes(anonymous resourcesorexistentialvariables).Literalsusedforstring,number,anddate values.AnRDFtripleconsistsofasubject,apredicate,andanobject.Asetof RDFtriplesarecalledRDFgraph,andacollectionofRDFgraphsformanRDF dataset.Inthispaper,weusethetermdatasetanddatasourceinterchangeably. RDFresourcescanbeservedvianativewebaccessinterfacessuchasdereferencingresourceidentifiers,andwebapplicationprogramminginterfaces(APIs) usingSPARQLendpointprotocol.

Definition1(RDFTripleandDataset [31]). LetU,B,Lbedisjointinfinite setsofURIs,blanknodes,andliterals,respectively.Atuple (s,p,o) ∈ (U ∪ B ) X (U ) X (U ∪ B ∪ L) isdenominatedanRDFtriple,wheresiscalledthe subject,pthepredicate,andotheobject.AnRDFdatasetorRDFgraphis asetofRDFtriples.When s ∈ L or p ∈ (B ∪ L),thenthetuple (s,p,o) is calledageneralizedRDFtripleandthedatasetwhereitiscontainediscalleda generalizedRDFdataset[20].

Asetoftriplesthatsharesamesubjectvaluearecalled RDFmolecules. Formally,RDFmoleculesaredefinedasfollows:

Definition2(RDFMolecule [12]). GivenanRDFgraphG,anRDF molecule M ⊆ G isasetoftriples M = {t1 ,t2 ,...,tn } inwhich subject (t1 )= subject (t2 )= = subject (tn ).

SPARQLquerylanguageisaW3CrecommendationforqueryingRDFdata. TheSPARQLquerylanguageprovidesfourqueryforms2 :ASK,SELECT,CONSTRUCT,andDESCRIBE.Inthiswork,wefocusonSPARQLSELECTqueries formallydefinedasfollows:

Definition3(SPARQLExpression(SELECTQuery) [39]). LetVbea setofvariablesdisjointfrom U ∪ B ∪ L.ASPARQLexpressionisbuiltrecursively asfollows.(1)Atriplepattern t ∈ (U ∪ V ) X (U ∪ V ) X (L ∪ U ∪ V ) isan expression.(2)IfQ1andQ2areexpressionsandRisafiltercondition,then Q1 FilterR,Q1 UnionQ2,Q1 OptQ2,Q1 ANDQ2 areexpressions.LetQbe aSPARQLexpressionand S ⊂ V afinitesetofvariables.ASPARQLSELECT queryisanexpressionoftheform SELECTSs (Q)

SPARQLlanguageisbasedonmatchinggraphpatterns;abasicgraphpattern(BGP)isasetoftriplepatternsandfilterpatterns.

Definition4(BGP). Let I bethesetofallIRIs, B bethesetofblanknodes, L bethesetofliteralsandVbethesetofvariables.ASPARQLbasicgraph pattern(BGP)expressionisdefinedrecursivelyasfollows:

1 https://www.w3.org/TR/rdf11-concepts/.

2 https://www.w3.org/TR/2013/REC-sparql11-query-20130321/

1.Atriplepatterntp ∈ (I ∪ B ∪ V) × (I ∪ V) × (I ∪ B ∪ L ∪ V) isaBGP; 2.Theexpression(P1ANDP2)isaBGP,whereP1andP2areBGPs; 3.Theexpression(PFILTERE)isaBGP,wherePisaBGPandEisa SPARQLfilterexpressionthatevaluatestoBooleanvalue.

ABGPinaSPARQLquerycontainsatleastonestar-shapedsubquery (SSQ).AnSSQisanon-emptysetoftriplepatternsthatsharethesamesubject variable(constant).

Definition5(Star-shapedSubquery(SSQ) [42]). Astar-shapedsubquery star(S,?X) onavariable(constant) ?X isdefinedas:

1. star(S,?X) isatriplepattern t = {?Xpo},and p and o aredifferentto ?X. 2. star(S,?X) istheunionoftwostars, star(S1,?X) and star(S2,?X),wheretriple patternsin S1 and S2 onlysharethevariable(constant) ?X

SPARQLqueriesareevaluatedoveranRDFdatasetbasedonmappings, whereeachmappingrepresentsapossibleanswerofaquery.

Definition6(SPARQLMappings [39]). Amappingisapartialfunction μ : V → (B ∪ L ∪ U ) fromasubsetofvariablestoRDFterms.Thedomainof amapping μ, dom(μ),isthesubsetofVforwhich μ isdefined.Twomappings μ1 , μ2 arecompatible,written μ1 ∼ μ2 ,if μ1 (x)= μ2 (x) forall x ∈ dom(μ1 ) ∩ dom(μ2 ).Further, vars(t) denotesallvariablesintriplepatternt,and μ(t) is thetriplepatternobtainedwhenreplacingall x ∈ dom(μ) ∩ vars(t) intby μ(x)

Afederatedqueryprocessingengineprovidesaunifiedaccessinterfacefor federationofRDFdatasourcesaccessibleviaWebinterfaces.Whiledistributed RDFstoragesystemshavecontrolovereachdataset,federatedqueryengines havenocontroloverdatasetsinthefederationanddataproviderscanjoinor leavethefederationatanytimeandmodifytheirdatasetsindependently.Saleem etal.[32]studyfederatedqueryengineswithWebaccessinterfaces.Basedon theirsurveyresults,theauthorsdividefederationapproachesintothreemain categories: QueryFederationoverSPARQLendpoints, QueryFederationover LinkedData(viaURIlookups),and QueryFederationontopofDistributedHash Tables ;inthiswork,wefocuson QueryFederationoverSPARQLendpoints

2RelatedWork

2.1FederatedQueryEngines

Theproblemofqueryprocessingoverfederationsofdatasourceshasbeenextensivelystudiedbythedatabaseandsemanticwebcommunities.Existingsolutions relyonaglobalorunifiedinterfacethatallowsforexecutingqueriesonafederationofautonomous,distributed,andpotentiallyheterogeneousdatasources inawaythatexecutiontimeisminimizedwhilequerycompletenessismaximized.Ingeneral,federatedqueryprocessingsystemshavethreemainchallenges: sourceselection,querydecomposition,andqueryexecution.Databasefederated

QueryingInterlinkedDatabyBridgingRDFMoleculeTemplates7 enginesemploytherelationalmodeltorepresenttheunifiedviewofthefederation[14, 17, 18, 22, 44],andthequerylanguageSQLisutilizedtoexpressqueries againstthefederationofdatasources.Semanticfederatedqueryenginesexploit thesemanticsencodedintotheRDFdatasetsofafederationtobuildacatalog ofsourcedescriptions[2, 5, 7, 15, 25, 42].Thecatalogisusedtoselectthesources fromthefederationwhereSPARQLquerieswillbeexecuted.Existingsemantic federatedqueryenginesincludeANAPSID[2],FedX[40],Avalanche[5],Lusail [1],SPLENDID[15],andSemagrow[7].Catalogscanbecollectedofflineby thefederatedqueryengine,e.g.,ANAPSID,orduringqueryrunning-time,e.g., FedX.Furthermore,heuristic-orcost-basedapproachesusethesecatalogsto performsourceselectionandquerydecomposition.ANAPSIDandFedXemploy informationabouttheRDFpropertiesinthedatasetsofafederationtodeterminetheSPARQLendpointsthatcanansweraSPARQLtriplepattern.On theotherhand,Avalanche,Lusail,SPLENDID,Odyssey,andSemagrowutilize statisticsandcostmodelstoselectaqueryrelevantdatasourcesandfinelow-cost queryplans.However,bothtypesofapproachesmayleadtoselectionofirrelevantsourcesthatwillnotcontributetothefinalanswer.MULDERcombines bothinformationaboutpropertiesineachRDFmoleculewithsharedRDFclass andinformationaboutthelinksbetweenthemusingRDFMoleculeTemplates (RDF-MTs),whicharecollectedoffline.

2.2DescribingandSelectingDataSource

Selectingtherelevantdatasourcesforagivenqueryisoneofthechallenges infederatedqueryprocessing.Identifyingtherelevantsourcesofaquerynot onlyleadstoacompleteanswerbutalsofasterexecutiontime.SPARQLfederationapproachescanbedividedintothreecategories[32]: catalog-assisted (pre-computed),catalog-free(computedon-the-fly),andhybrid(usesbothprecomputedandon-the-flymetadata) solutions.

ANAPSID[2]collectsinformationabouttheRDFpredicatesofthetriple patternsthatcanbeansweredbyanRDFdataset.Duringthesourceselection step,ANAPSIDparsestheSPARQLqueryintostar-shapedsubqueriesandidentifiestheSPARQLendpointsforeachsubquerybyutilizingpredicatemetadata. IncontrasttoANAPSID,FedX[40]doesnotrequiremetadataaboutthesources beforehand,butusestriplepattern-wiseASKqueries.HiBISCuS[34]isasource selectionmethodthatusesahybridapproachtocollectdatasetmetadata;it combinescapabilitymetadata,whichreliesonauthorityfragmentofURIsgatheredforeachendpoint,withtriple-patternwiseASKqueries.HiBISCuSdiscards irrelevantsourcesforaparticularquerybymodelingSPARQLqueriesashypergraphs.Lusail[1],likeFedX,usesacatalog-freesolutionforsourceselectionand decomposition.UnlikeFedX,Lusailtakesanadditionalsteptocheckifpairsof triplepatternscanbeevaluatedasonesubqueryoveraspecificendpoint;this knowledgeisexploitedbyLusailduringquerydecompositionandoptimization.

SPLENDID[15]reliesoninstance-levelmetadataavailableas Vocabulary ofInterlinkedDatasets (VoID)[4]fordescribingthesourcesinafederation. SPLENDIDprovidesahybridsolutionbycombiningVoIDdescriptionsfordata

sourceselectionalongwithSPARQLASKqueriessubmittedtoeachdataset atrun-timeforverification.Statisticalinformationforeachpredicateandtypes inthedatasetareorganizedasinvertedindices,whichwillbeusedfordata sourceselectionandjoinorderoptimization.Similarly,Semagrow[7]implements ahybridmethodlikeSPLENDID,pattern-wisesourceselectionmethodwhich usesVoIDdescriptions(ifavailable)andASKqueries.AlthoughVoIDallows forthedescriptionofadatasetstatistics,thisdescriptionislimitedandlacks detailsnecessaryforefficientqueryoptimization.Forinstance,thoughVoID descriptionsprovideinformationaboutlinkexistencebetweendatasetsviaa linkingproperty,itisnotclearinwhichclass(es)thispropertybelongstoo. Inaddition,VoIDdescriptionscouldbeout-of-dateifthedatasetupdatesare veryfrequent.Odyssey[25]collectsdetailedstatisticsinformationondatasets thatenablecostestimationwhichmayleadtolow-costexecutionplans.The optimizationisbasedonacostmodelusingstatisticalmethodsusedforcentralizedtriplestores,i.e.,CharacteristicsSet(CS)[29]andCharacteristicsPairs (CP)[16, 29].OdysseyidentifiesCSsandsourcesusingpredicatesofeachstarshapedsubquery.Then,itprunestonon-relevantsourcesbasedonlinksbetween star-shapedsubqueriesandbyfinding FederatedCharacteristicsPairs(FCPs). However,unexpectedchangesandmisestimatedstatisticsmayconducetopoor queryperformance.

Differentdatasourcesinafederationcouldcontainduplicateddataorcanbe replicasofadataset.DAW[33]isaduplication-awarehybridapproachfortriple patternwisesourceselection;itusestheDAWindextoidentifysourcesthat leadtoduplicatedresultsandskipthosesources.Aftermakingtriplepatternwisesourceselection,theselectedsourcesarerankedbasedonthenumberofnew triplestheyprovide;thosesourcesthatarebelowathresholdareskipped.DuplicatesaredetectedusingMin-WiseIndependentPermutations(MIPs)storedin theDAWindexforeachtriplewithinthesamepredicate.FEDRA[26]isasource selectionstrategyforsourceswithahighreplicationdegree.FEDRArelieson schema-levelfragmentdefinitionsandfragmentcontainmenttodetectreplication;itexploitsreplicationinformationtominimizedataredundancyanddata transferbyreducingthenumberofunions,i.e.,byminimizingthenumberof endpointsselected.Finally,LILAC[27]isaquerydecompositiontechniquethat tacklesdatareplicationacrossdatasourcesandSPARQLendpoints.MULDER RDF-MTsleveragesemanticsencodedinRDFsourcesandcreatelogicalpartitionswithoutanyrestrictionsonthereplicationoftheproperties.

WylotandCudré-Mauroux[43]alsoutilizethenotionofRDFmolecule templatesbutprovideonlyanintuitivedescriptionwithoutformalization.On thecontrary,weformallydefineRDF-MTs,anddevisetechniquesforexploitingRDF-MTsduringsourceselection,querydecomposition,andplanning. UnlikeFedXandLusail,MULDERcollectsRDFmoleculetemplates(RDF-MTs) beforehand,reducingthenumberofrequestssenttoadatasourceduringquery time.MULDERdescribessourcesasasetofRDF-MTs,whereeachRDF-MT describesanRDFclassanditspossibleproperties.AnRDF-MTalsocontains asetoflinksthatexistwithinthesamesourceandasetoflinkswithother

RDF-MTsindifferentdatasources.GivenaSPARQLqueryMULDERparses itintostar-shapedsubqueriesandcreatesa query-graph wherenodesarestarshapedsubqueriesandedgesarejoinvariables.UsingRDF-MTbasedsource description,foreachnodeinthe query-graph,MULDERselectstheRDF-MT(s) thatcontainallpredicatesofastar-shapedsubquery.Finally,MULDERselects asourceforastar-shapedsubqueryifitisdescribedbyaRDF-MTwithpropertiesthatappearinthetriplepatternsofthesubquery.OncetheRDF-MT(s) areselectedforthesubqueriesofaquery,MULDERusesinformationabout linksbetweenRDF-MT(s)toprunetheRDF-MT(s)andselectonlytherelevant sources;thus,speedingexecutiontimewithoutimpactingquerycompleteness.

2.3QueryDecompositionTechniques

Oncesourcesareselected,subqueriesaredecomposedintoaformthatwillbe senttoeachselectedsource.FedXintroducestheconceptofExclusiveGroups (EG)thatcombinesasetoftriplepatternsthatcanbesenttosamesource. Lusail[1]presentsalocalityawaredecompositionthatusestheconceptof Global JoinVariable andsourceinformationtodecomposequeries,similartoExclusive GroupsinFedX.Semagrow[7]followsheuristicsthatgroupmultipletriplepatternsthatcouldbesenttothesamesourceintoasinglequery.Theseheuristics utilizecarnalityestimationsofcombinedtriplepatternsthatreducethesearch spaceofSemagrowoptimizer.Thisoptimizationimpactsontheoptimization time.Ifdatasourcesareknowntomirroranothersource,thenalternativeplans arecreated,ratherthanasingleplan.Odyssey[25]combinesstar-shapedsubqueriestoasingleSPARQLquerytoaparticularendpointwheneverthesame sourceforstar-shapedsubqueriesisselected.ANAPSIDprovidestwoheuristicsforquerydecomposition[28]:SSGS(Star-ShapedGroupSingleendpoint selection)andSSGM(Star-ShapedGroupMultipleendpointselection).SSGS reducesthenumberofunionsbyselectingasourceamongrelevantsourcesthat cananswerastar-shapedsubquery.Ontheotherhand,SSGMcreatesasetof UNIONsforeachsubquerythathavemorethanoneselectedsource.Although SSGSperformsbetterintermsofexecutiontimethanSSGM,itcouldreturn incompleteresultssinceitonlyselectsonesourcepersubquery.MULDERutilizesRDF-MTsinbothsourceselectionandquerydecompositionstages,reducing,thus,technologicalgranularityandprovidingthesemanticsforenhancing federatedqueryprocessing.MULDERcombinesonlytriplepatternsinastarshapedsubqueryasasingleSPARQLquerytobesenttoasinglesource;thus, lesssourceconnectionsarerequiredandqueryexecutionisspedup.

2.4QueryOptimizationandExecution

Federatedqueryengines,suchasANAPSID[2]andFedX[40],followheuristicsbasedqueryoptimization,whileSPLENDID[15],Odyssey[25],andSemagrow [7]implementcost-basedqueryoptimizationtechniquestofindalowcostplan. ANAPSID[2]isanadaptivefederatedqueryenginecapableofdeliveringquery

resultsassoonastheyarrivefromthedatasources,i.e.,byimplementingnonblockingjoinoperators.Ontheotherhand,FedX[40]isanon-adaptivefederated queryprocessingapproach,atthelevelofqueryexecution,thatoptimizesquery executionbyintroducingexclusivegroups,i.e.,triplepatternsthatcanbeexecutedagainstonlyonesource.ThecostestimationofSemagrow[7]isbasedona costmodelovereachoperatorusingeitherstatisticsprovidedbysourcemetadata orestimatedcardinalityofsub-expressions.Thecostofoperatorsisestimated byapplyingacommunicationsoverheadfactortothecardinalityoftheresults. Thecostofcomplexexpressionsisestimatedrecursivelyusingacostmodelover statisticsaboutsub-expressionsaswellasdistinctsubjectsandobjectsappearingintheseresults.Dynamicprogrammingisusedtoenumeratedifferentplans inordertoidentifytheoptimalonewithrespecttothecostmodel.Semagrow operatesinanasynchronousandnon-blockingwaywhereoperatorssubscribe toastreamandarenotifiedwhendatabecomesavailable.Similarly,Lusail[1] optimizesqueryexecutionusingsubqueryorderingbasedoncardinalityestimationonsubqueriesandprojectionlist.Costestimationisbasedonstatistics collectedatrun-timeoneachtriplepatternduringqueryanalysis.Thegenerateddecompositionsleadtoasetofsubquerieswithminimalexecutioncost. Usingcardinalityinformationofindividualtriplepatterns,Lusailestimatesthe cardinalityofsubqueriesandprojectionlist.Inaddition,Lusailoptimizesquery executionbyparallelismviaprocessscheduling.

Odyssey[25]minimizesthenumberofsubqueriesthatareposedtoasource bycombiningsubqueriesthatcanbeevaluatedoverexactlythesamesources. First,itidentifiesanorderingofthetriplepatternswithineachstar-shapedsubqueryusingCharacteristicSetstatistics.Then,cardinalityofeachsubqueryis estimatedandadynamicprogrammingbasedalgorithmisappliedtoidentify aqueryplan.Thecostfunctionisdefinedbasedonthecardinalitiesofintermediateresultsandonhowmanyresultsneedtobetransferredfromsources duringexecution.Althoughinanidealscenario,Odysseymayidentifyefficient queryplans,collectingthesedetailedstatisticsisnearlyimpossibleinafederated scenariowheredatasetsareautonomous.

MULDERutilizestheconnectivitybetweenRDF-MTstobothprunethe RDF-MTsofaqueryandidentifytherelevantsourcesassociatedwithselected RDF-MTs.Furthermore,MULDERimplementsaheuristics-basedthatfollows aGreedystrategytoidentifyajoinorderingthesubqueries.Inconsequence, queryexecutiontimeisreducedandqueryanswercompletenessisenhanced.

3ProblemStatementandProposedSolution

3.1ProblemStatement

Inthissection,weformalizethequerydecompositionandexecutionproblems overafederationofRDFdatasources.

Definition7(QueryDecomposition). GivenabasicgraphpatternBGPof triplepatterns {t1 ,..., tn } andRDFdatasets D = {D1 ,..., Dm },adecomposition P ofBGPin D,γ (P |BGP,D ),isasetofservicegraphpatterns

Molecule Template Generator

Create RDF-MT Intra-dataset RDF-MT Linking Inter-dataset RDF-MT Linking

RDF Datasets

RDF-MT Metadata & Web Access Interfaces

Fig.3. PipelineforcreatingRDFmoleculetemplates(RDF-MTs). CreateRDF-MT: QueriesareexecutedoverRDFdatasetsforcreatingRDF-MTs. Intra-datasetRDF-MT Linking: RDF-MTsarelinkedtootherRDF-MTsinthesamedataset. Inter-dataset RDF-MTLinking: RDF-MTsareassociatedwithRDF-MTsinotherdatasets.Web interfacesarecreatedtoaccessRDF-MTs.

SGP =(SQ,SD ),where SQ isasubsetoftriplepatternsinBGPand SD isasubsetof D

Definition8(QueryExecutionoveraDecomposition). Theevaluation of γ (P |BGP,D ) in D , [[γ (P |BGP,D )]]D ,isdefinedasthejoinoftheresultsof evaluating SQ overRDFdatasets Di in SD : [[γ (P |BGP,D )]]D = JOIN(SQ,SD )∈γ (P |BGP,D ) (UNIONDi ∈SD [[SQ]]Di ) (1)

Afterwedefinedwhatadecompositionofaqueryisandhowsuchadecomposedquerycanbeevaluated,wecandefinetheproblemoffindingasuitable decompositionforaqueryandagivensetofdatasources.

Definition9(QueryDecompositionProblem). GivenaSPARQLquery Q andRDFdatasets D = {D1 ,..., Dm },theproblemofdecomposing Q in D isdefinedasfollows.ForallBGPs,BGP = {t1 ,..., tn } in Q,findaquery decomposition γ (P |BGP,D ) thatsatisfiesthefollowingconditions:

• Theevaluationof γ (P |BGP,D ) in D iscomplete,i.e.,if D ∗ representsthe unionofRDFdatasetsin D ,thentheresultsofevaluatingBGPin D ∗ and theresultsofevaluatingdecomposition γ (P |BGP,D ) in D arethesame,i.e., [[BGP]]D ∗ =[[γ (P |BGP,D )]]D (2)

• γ (P |BGP,D ) hastheminimalexecutioncost,i.e.,ifcost(γ (P |BGP,D )) representstheexecutiontimeofadecomposition P ofBGPin D ,then

γ (P |BGP,D )=argmin

γ (P |BGP,D ) cost(γ (P |BGP,D )) (3)

3.2ProposedSolution

Tosolvethequerydecomposingproblem,wedeviseMULDER,afederatedquery engineforRDFdatasetsaccessiblethroughWebaccessinterfaces,e.g.,SPARQL endpoints.TheMULDER Decomposition&SourceSelection createsaquery

db:enzymes 'Glutamine Synthetase'

rdf:type

rdfs:label

db:name

dbe:2

db:enzyme

dbd:DB00186

rdfs:label

db:drugs 'C15H10Cl2N2O2' 'Lorazepam'

rdf:type

db:possibleDTarget

db:brandedDrug

db:chemicalFormula

dm:genericDrug

rdf:type rdf:type

dis:2807 dis:3772

dis:disease 'Epilepsy' 'Insomnia'

dm:possibleDTarget

dm:possibleDTarget

dm:128

rdf:type rdfs:label

rdfs:label

dm:drugs ‘Ativan (Tablet)’

(a)TwoRDFgraphs

rdfs:label

rdfs:label

db:enzymes dis:disease

db:enzyme

db:drugs

rdfs:label

db:possibleDTarget

db:brandedDrug

db:chemicalFormula

rdfs:label

dm:drugs

dm:genericDrug dm:possibleDTarget

(b)RDFMoleculeTemplates(RDFMTs)

Fig.4. RDF-MTcreation.ThreeRDFgraphswithfourRDFmoleculesoftypes: db:drugs, db:enzymes, dm:drugs,and dis:disease,whereprefixes db isfor drugbank, dm is for dailymed,and dis isfor diseasome datasets.FourRDFMoleculeTemplates(RDFMTs)arecreatedfortheseRDFclasses.

decompositionwithservicegraphpatterns(SGPs)ofstar-shapedsubqueries builtaccordingtoRDF-MTmetadata.RDF-MTsdescribethepropertiesofthe RDFmoleculescontainedintheRDFdatasets,whereanRDFmoleculeisaset ofRDFtriplesthatsharethesamesubject.Oncethestar-shapedsubqueries areidentified,abushyplanisbuiltbytheMULDER QueryPlanning ;theplan leavescorrespondtostar-shapedsubqueries.

4MULDER:AFederatedQueryProcessingEngine

4.1RDFMoleculeTemplatesforSourceDescription

WebinterfacesprovideaccesstoRDFdatasets,andcanbedescribedinterms ofresourcesandpropertiesinthedatasets.MULDERreliesonRDF-MTsto describethesetofpropertiesthatareassociatedwithsubjectsofthesame typeinagivenRDFdataset,i.e.,thesetofpropertiesoftheRDFmolecules containedinthedataset.Inaddition,MULDERextractslinksbetweenRDFMTsfromthedatasetschemaanddiscoversunknownlinksfrominstances(intraandinter-links).Further,anRDF-MTisassociatedwithaWebaccessinterface thatallowsforaccessingtheRDFmoleculesthatrespecttheRDF-MT.Figure 3 presentsthepipelineforRDF-MTcreation.

Definition10(RDFMoleculeTemplate(RDF-MT)). AnRDFMolecule Template(RDF-MT)isa5-tuple= <WebI,C,DTP,IntraL,InterL>,where:

• WebI–isaWebserviceAPIthatprovidesaccesstoanRDFdataset G via SPARQLprotocol;

• C–isanRDFclasssuchthatthetriplepattern(?srdf:typeC)istruein G;

Intra-dataset link Inter-dataset link

rdfs:label

rdfs:label

db:enzymes

db:enzyme

db:drugs

rdfs:label

db:possibleDTarget

db:brandedDrug

db:chemicalFormula

rdfs:label

dis:disease dm:drugs

dm:genericDrug

dm:possibleDTarget

(a)RDF-MTIntra-datasetLinking

rdfs:label

db:enzymes

db:enzyme

db:possibleDTarget

db:drugs

rdfs:label

db:chemicalFormula

db:brandedDrug

rdfs:label

dis:disease dm:drugs

dm:genericDrug dm:possibleDTarget

rdfs:label

(b)RDF-MTInter-datasetLinking

Fig.5. RDF-MTlinking.(a)EachRDF-MTislinkedtootherRDF-MTsinthesame RDFdataset: db:drugs and db:enzymes.(b)EachRDF-MTislinkedtootherRDFMTsinadifferentRDFdataset: db:possibleDiseaseTarget, dm:possibleDiseaseTarget, db:brandedDrug,and dm:genericDrug.Prefix db isfor drugbank, dm isfor dailymed,and dis isfor diseasome datasets.

• DTP–isasetofpairs(p,T)suchthatpisapropertywithdomainCand rangeT,andthetriplepatterns(?sp?o),and(?srdf:typeC)aretruein G;

• IntraL–isasetofpairs(p,Cj )suchthatpisanobjectpropertywithdomain C andrangeCj ,andthetriplepatterns(?sp?o)and(?ordf:typeCj )and (?srdf:type C )aretruein G;

• InterL–isasetoftriples(p,Ck ,SW)suchthatpisanobjectpropertywith domain C andrangeCk ;SWisaWebserviceAPIthatprovidesaccesstoan RDFdataset K ,thetriplepatterns(?sp?o)and(?srdf:type C )aretruein G,andthetriplepattern(?ordf:typeCk )istruein K

Algorithm 2 identifiestheRDFMoleculeTemplatesthatdescribethesources ofafederation.Algorithm 2 firstcollectsalistofRDF-MTswiththeirintradatasetlinksforeachSPARQLendpointbycallingAlgorithm 1 (Line3–5).

Algorithm1. CollectRDFMoleculeTemplates: ws:aSPARQLendpoint

1: procedure CollectRDFMoleculeTemplates(ws)

2: MTL ← [] MTL -listofmoleculetemplates

3: CP ← getClassesWithProperties(ws) SELECTquery

4: for (Ci , Pi ) ∈ CP do Ci -classaxioms

5: Li ← Li +(pi ,Cj )|∃pi ∈ Pi , (range(pi )= Cj ) ∧ ((Cj , Pj ) ∈ CP )

6: RDF -MTi ← (Ci , Pi , Li )

7: MTL ← MTL + RDF -MTi

8: endfor

9: return MTL

10: endprocedure

db:drug_interaction

db:interactionDrug1 db:interactionDrug2

db:reference db:drugs

db:drugReference

db:target

db:target

(a)RDF-MTs

SELECT ?drug ?target ?ref ?Int WHERE { ?drug db:genericName ?name . ?drug db:target ?target . ?target db:drugReference ?ref . ?target db:proteinSequence ?ps . ?ref rdfs:label ?refLabel . ?ref foaf:page ?page . ?Int db:interactionDrug1 ?drug . ?Int db:interactionDrug2 ?intd. }

(b)SPARQLQuery

db:drugs

?drug ?Int db:drug_interaction

?ref

(c)Star-shapedSubqueries

Fig.6. Querydecomposition.(a)RDF-MTsabout db:drug interaction, db:drugs, db:target, db:reference.(b)SPARQLquerycomposedofeighttriplepatternsthat canbedecomposedintofourstar-shapedsubqueries.(c)Fourstar-shapedsubqueries associatedwithfourRDF-MTsin(a).

Algorithm 1 extractsRDF-MTsbyexecutingSPARQLqueriesagainstaWeb accessinterface ws ofanRDFdataset,i.e.,aSPARQLendpoint.First, RDF classes arecollectedwiththeircorresponding properties (Line3),i.e.,pairs (Ci , Pi ),where Ci isaclassand Pi isasetofpredicatesof Ci .Figure 4 illustrates thecreationoffourRDF-MTsfromtwogivenRDFgraphs(Fig. 4a).Then,for eachRDFclass Ci ,objectpropertiesin Pi areidentified,andthesetofintradatasetlinks(IntraL)aregenerated(Line4–8).Figure 5ashowstheresultof generatingintra-datasetlinksamongthreeRDF-MTsinthesamedataset.Then Algorithm 2 iteratesovereachRDF-MTineachWebaccessinterface(WAI) andfindsinter-datasetlinksbetweenthem(InterL)(Line6–10).Finally,RDFMTsarestoredtoafile(Line11).Figure 5bpresentsinter-datasetlinksbetween RDF-MTsfromtwoRDFgraphspresentedinFig. 4a.

Algorithm2. CreateRDFMoleculeTemplates: WI :SetofSPARQLendpoints, and WAI :hashmapofSPARQLendpointstoRDFMoleculeTemplates

1: procedure CreateMoleculeTemplates(WI )

2: WAI ←{} WAI -amapof ws and MTLs

3: for wsi ∈ WI do

4: WAI (wsi ) ← CollectRDFMoleculeTemplates(wsi ) Algorithm 1 5: endfor

6: for (wsi , [(Ci , Pi , Li )]) ∈ WAI do

7: for (wsk , [(Ck , Pk , Lk )]) ∈ WAIandwsk = wsi do 8: Li ← Li +(pi ,Ck ) suchthat ∃pi ∈ Pi ∧ range(pi )= Ck

9: endfor

10: endfor

11:saveRDFMT(WAI )

12: endprocedure

4.2MULDERSourceSelectionandQueryDecomposition Techniques

GivenaSPARQLqueryMULDERparsesthequeryintostar-shapedsubqueries andcreatea query-graph wherenodesarestar-shapedsubqueriesandedges

db:drug_interaction

(a) GraphsofJoinableSSQs

(b) BushyPlanofJoinableSSQs

Fig.7. Queryplanning.(a)Joinablegraphofstar-shapedsubqueries(SSQs)represents joinsbetweenSSQs.(b)Bushyplanofjoinablestar-shapedsubqueries(SSQs).Graph ofjoinableSSQsisutilizedbyMULDERQueryPlannertocreateabushyplanofSSQs wherejoinsbetweenSSQsaremaximized.

arejoinvariables.UsingRDF-MTbasedsourcedescription,foreachnodein the query-graph,MULDERselectsRDF-MT(s)thatcontainallpredicatesofa star-shapedsubquery.Finally,MULDERselectsasource(s)foreachstar-shaped subquery,ifthesourcecontainsanRDF-MT(s)withmatchingpropertiesina star-shapedsubquery,MULDERappliespruningusingtheactuallinksthatare knownbetweenRDF-MTs.MULDERcombinestriplepatternsinastar-shaped subqueryasasingleSPARQLquerytobesenttoasinglesource.

Figure 6 showsanexampleofquerydecompositionandsourceselection.The examplequeryinFig. 6b,containseighttriplepatterns.Thefirststepofquery decompositionistoidentifythestar-shapedsubqueries(SSQ).Inourexample, foursubquerieswhichcontaintwotriplespatternseach,areidentified,i.e., ?drug (t1 ,t2 ), ?target (t3 ,t4 ), ?ref (t5 ,t6 ),and ?Int (t7 ,t8 ).EachofSSQsarethen associatedwithRDF-MTsthatcontainpredicatesinSSQs,asshowninFig. 6c.

TheMULDERquerydecomposerissketchedinAlgorithm 3.GivenaBGP andasetofRDF-MTs(WIT),SSQsarefirstidentified(Line3).Then,RDFMTswhichcontainallpredicatesinSSQaredeterminedfromWITascandidate RDF-MTs(Line4–10).Furthermore,linkedcandidateRDF-MTswithrespect toJoinableSSQs(Line11)areidentified(Line12).Finally,candidateRDF-MTs arepruned,i.e.,candidateRDF-MTsthatcontainallpredicatesinSSQbutare notlinkedtoanyRDF-MTthatmatchesJoinableSSQareexcluded(Line13). SSQsthathavemorethanonematchingRDF-MTfromthesameWebaccess interfacewillbedecomposedasoneservicegraphpattern.However,ifmatching RDF-MTsarefromdifferentWebaccessinterfaces,thenMULDERdecomposes them;theUNIONoperatorisusedduringqueryexecutiontocollectedthedata fromeachWebaccessinterface.

4.3MULDERQueryOptimizationStrategies

Figure 7ashowsjoinablestar-shapedsubqueries(SSQ)thatshareatleastone variable,i.e., ?Int isjoinablewith ?drug viapredicate db:interactionDrug1,while ?drug isjoinablewith ?target via db:target.Furthermore, ?target isjoinable

Algorithm3. MoleculetemplatebasedSPARQLquerydecomposition: BGP : BasicGraphPattern, WIT :setofRDF-MTs

1: procedure DECOMPOSE(BGP,WIT )

2: CM ←{} CM -CandidateRDF-MTs

3: SSQs = getStarShapedSubqueries(BGP ) Subjectstars

4: for s ∈ SSQs do

5: for RDFMT ∈ WIT do

6: if predicatesIn(s) ⊆ predicatesIn(RDFMT ) then

7: CM [s].append(RDFMT )

8: endif

9: endfor

10: endfor

11: JSSQ = getJSSQs(SSQs) Query-graph ofJoinableSSQs

12: conn = connectedRDFMTs(SSQs,JSSQ,CM ) selectedRDF-MTsgraph

13: DQ = prune(SSQs,JSSQ,conn)

14: return DQ decomposedquery

15: endprocedure

with ?ref through db:drugReference property.Finally,MULDERqueryplanner generatesbushyplanscombiningSSQs(Fig. 7b).Theproblemofidentifyinga bushyplanfromconjunctivequeriesisknowntobeNP-complete[35].MULDER plannerimplementsagreedyheuristicsbasedapproachtogenerateabushyplan, wheretheleavescorrespondtoSSQs,andthenumberofjoinsbetweenSSQsis maximizedwhiletheplanheightisminimized.

4.4TheMULDERArchitecture

TheMULDERarchitectureisdepictedinFig. 8.TheMULDER QueryProcessingClient receivesaSPARQLquery,decomposesit,performssourceselection basedonRDF-MTmetadata,and,afterwards,identifiesabushyplanagainst theselectedRDFdatasets.TheMULDER QueryEngine executesthebushy planandcontactstheMULDERqueryprocessingservertoevaluateService GraphPatternsovertheWebaccessinterfaces.Further,theMULDER Query ProcessingServer receivesrequestsfromtheMULDERclienttoretrieveRDFMTmetadataaboutRDFdatasets,e.g.,metadataaboutpropertiesofRDF moleculescontainedintheseRDFdatasets.

5ExperimentalStudy

WeempiricallystudytheefficiencyandeffectivenessofMULDERquerydecompositionandsourceselectiontechniques.Weassessthequeryperformanceof MULDERutilizingRDFmoleculetemplatesandtemplatesgeneratedusingthe METIS[24]andSemEP[30]partitioningalgorithms.Furthermore,wecompare MULDERwiththefederatedqueryenginesANAPSIDandFedXforthreewellestablishedbenchmarks–BSBM,FedBench,andLSLOD.Finally,weevaluate

Fig.8. TheMULDERclient-serverarchitecture.MULDERqueryprocessingclient receivesSPARQLqueries,createsquerydecompositionswithstar-shapedsubqueries, andidentifiesandexecutesbushyplans.MULDERqueryprocessingservercollects bothRDF-MTmetadataaboutRDFdatasetsandresultsofexecutingqueriesover Webaccessinterfaces,e.g.,SPARQLendpoints.

the continuousefficiency ofMULDERcomparedtoANAPSID.Thefollowing researchquestionsareevaluated: (RQ1) DoRDF-MTscharacterizethesemanticsrepresentedwithinandbetweendatasources? (RQ2) DodifferentMULDERsourcedescriptionsimpactonqueryprocessingintermsofefficiencyand effectiveness? (RQ3) IstheeffectivenessandefficiencyofthequeryprocessingprocessimpactedbytheMULDERquerydecompositiontechnique? (RQ4) Isthecontinuousefficiencyoftheanswergenerationprocessimpactedbythe MULDERquerydecompositiontechnique?

TheMULDER3 decompositionandsourceselection,andqueryplanningcomponentsareimplementedinPython2.7.10,andintegratedintoANAPSID[2], i.e.,MULDERplansareexecutedusingANAPSIDphysicaloperators.ExperimentsareexecutedontwoDellPowerEdgeR805servers,AMDOpteron2.4GHz CPU,32cores,256GBRAM.BSBM(TheBerlinSPARQLBenchmark),FedBench,andLSLODdatasetsaredeployedononemachineasSPARQLendpoints using Virtuoso6.01.3127,whereeachdatasetresidesinadedicatedVirtuoso dockercontainer.

5.1Benchmarks

Threebenchmarksareutilizedtoassessourresearchquestions:(i)BSBM-The BerlinSPARQLBenchmark;(ii)FedBench;and(iii)LSLOD.ForeachRDF datasetofthefederationsofthesebenchmarks,theRDF-MTsarecomputed; furthermore,graphanalyticsareutilizedtodescribedthepropertiesofthese RDFdatasetsintermsoftheRDF-MTsandtheirlinks.WegeneratedallRDFMTsandtheirinterconnectionsconsideringbothintra-datasetandinter-dataset 3 https://github.com/SDM-TIB/MulderTLDKS

links,asdefinedinAlgorithms 1 and 2,respectively.Weusegraphdensity,connectedcomponents,transitivity,andaverageclusteringcoefficienttoanalyzethe mainpropertiesofthegraphthatmodelstheRDF-MTsofeachfederation.Clusteringcoefficientmeasuresthetendencyofnodeswhosharesameconnections inanetworktobecomeconnected.Iftheneighborhoodisfullyconnected,the clusteringcoefficientis 1 andavaluecloseto 0 meansthattherearenoconnectionsintheneighborhood.Averageclusteringcoefficientassignshigherscores tolowdegreenodes,whilethetransitivityratioplacesmoreweightonthehigh degreenodes.Theaverageconnectivityofagraphistheaverageoflocalnode connectivityoverallpairsofnodesofthegraph.WemodelagraphofRDF-MTs asundirectedamulti-graph(MultiGraphinnetworkx4 )wherethepredicates thatconnecteachRDF-MTsareusedaslabelsoftheedges.Amulti-graph isusedtocomputethenumberofnodes,edges,averagenumberofneighbors, connectedcomponents,andaveragenodeconnectivity.Finally,wemodelthe graphasundirectedsinglenetworkgraph,wherealinkbetweenRDF-MTsis representedasunlabellededges.Usingsinglenetworkgraphs,transitivityand averageclusteringcoefficientarecomputed.

Table1. BSBMqueriescharacteristics.XSPARQLclause–referstoANDJoinoperationbetweentriplepatternsinaBGP.

BSBM-TheBerlinSPARQLBenchmark TheBerlinSPARQLBenchmark [6]isasyntheticdatasetfocusingonane-commerceusecasewhereasetofproductsareofferedbydifferentvendorsandconsumersandreviewershaveposted reviewsabouttheseproductsonvariousreviewsites.Thedatamodelcontains

QueryingInterlinkedDatabyBridgingRDFMoleculeTemplates19

eightclasses:Product,ProductType,ProductFeature,Producer,Vendor,Offer, Review,andPerson.Thebenchmarkqueriescontainparameters(placeholders) whichareenclosedwith%characters.Duringaninstantiationofthequeries, theseparametersarereplacedwithrandomvaluesfromthebenchmarkdataset. WeuseBSBMtogenerate 12 SELECTqueries(with20instantiationseach) overagenerateddatasetcontaining 200 milliontriples5 ;characteristicsofthese queriesarepresentedinTable 1.Wepartitionedthedatasetusing rdf:type classes andcreatedeightSPARQLendpoints,onepereachclassandoneendpointwhich containsthewholedataset.

Thefirstbenchmarkforourexperiment,andthesmallestinnumberofRDFMTs,istheBerlinSPARQLBenchmark(BSBM).InBSBMbenchmark,there areonlyeightRDF-MTsandeightlinksbetweenthem.Forourexperimentwe treatedeachRDF-MTasasingledatasetbycreatingaseparateendpointfor them.Therefore,thereareintotaleightdatasetsandsinceeachdatasetcontains onlyoneRDF-MT,therearenointra-datasetlinksforthisbenchmark.Figure 9 illustratesallRDF-MTsinBSBMwhereeachcontainedinasingledataset(hence differentcolors)andtheirinter-datasetconnections6 .Inaddition,inorderto studythecharacteristicsofthegeneratedBSBMmoleculetemplategraph,we reportonagraphanalysisinTable 2.Weobservedastrongconnectionbetween RDF-MTs- 0.285 densityand 1.0 averagenodeconnectivity.Inparticular,the connectionsconcentratedonasingleRDF-MT(hence,asingledataset), Product, with 6 outof 8 linkstoorfromthisRDF-MT(hence,dataset).Ahistogramof frequenciesofRDF-MTspernumberofpropertiesdistributedfromsix(two RDF-MTs)to18(oneRDF-MT)isshowninFig. 10.

Fig.9. AnalysisofRDF-MTsofBSBM.Thegraphcomprises 8 RDF-MTsand 8 interdatasetlinks.EachdotrepresentsanRDF-MTstoredineachendpoint.Alinebetween dotscorrespondstointer-datasetlinks.ThereisonlyoneRDF-MTineachendpoint, hencenointra-datasetlinks.

5 BSBMqueriescanbefoundintheAppendix A

6 Thegraphvisualizationwasgeneratedusingtheopensourcesoftwareplatform cytoscape– http://www.cytoscape.org/

Fig.10. FrequencyofBSBMRDF-MTsper numberofproperties.Majorityofmolecule templatescontainfromfivetosevenproperties.

FedBench

Table2. FedBenchRDF-MT graphmetrics.Clusteringcoefficient(0.0)suggeststhatthere isnoconnectivityintheneighborhoodofthenetwork.

FedBench[36]isabenchmarksuiteforanalyzingboththeefficiencyandeffectivenessoffederatedqueryprocessingstrategiesfordifferentusecasesonsemantic data.Itincludesthreecollectionsofdatasets: cross-domain, life-science,and SP2 Bench collections.The cross-domain collectioniscomposedofdatasets fromdifferentdomains:DBpediahaslinkedstructureddataextractedfrom Wikipedia;Geonamesiscomposedofgeo-spacialentitiessuchascountriesand cities;Jamendoincludesmusicdatasuchasartists,records;LinkedMDBmaintainslinkedstructureddataaboutmovies,actors;theNewYorkTimesdataset containsabout10,000subjectheadingsaboutpeople,organizations,andlocations;finally,theSemanticWebDogFood(SWDF)datasetincludesdataabout SemanticWebconferences,papers,andauthors.Furthermore, Life-science collectioncontainsdatasetsfromthelife-sciencesdomain:KyotoEncyclopediaof GenesandGenomes(KEGG)haschemicalcompoundsandreactionsdatain Drug,EnzymeReactionandCompoundmodules;theChemicalEntitiesofBiologicalInterest(ChEBI)containsinformationaboutmolecularentitieson“small” chemicalcompounds,suchasatoms,molecules,ions;andDrugBankmaintains drugdatawithdrugtargetinformation.Inadditiontothesethreedatasetsin thelife-sciencescollection,asubsetofDBpediadatasetthatincludesdataabout drugsisaddedinthiscollection.Finally,SP2 Bench collectioncontainsasyntheticdatasetgeneratedbytheSP2 Benchdatagenerator[38],thatmirrorscharacteristicsobservedintheDBLPdatabase.Forourexperiments,wehaveused datasetsfromthefirsttwocollectionsfromthisbenchmark,i.e., cross-domain and life-science collections,whichcontainreal-worlddatasets.

Werun 25 FedBenchqueries7 ,includingcross-domainqueries(CD),linked dataqueries(LD),andlifesciencequeries(LS).Additionally, 10 complexqueries (C)proposedby[42]areconsidered.ThequeriesareexecutedagainsttheFedBenchdatasetsfrom cross-domain and life-science collections.ASPARQL

7 FedBenchqueriescanbefoundin http://fedbench.fluidops.net/resource/Queries

Another random document with no related content on Scribd:

Es ist von derselben Art, wenn in der Kaiserzeit die rein repräsentativen Bauten, die Triumphbogen und öffentlichen Gebäude sich häufen, wenn selbst die Zahl der Tempel sich über jedes Bedürfnis hinaus steigert. Dieselbe Gesinnung schafft das Wohnhaus zu einer prunkvollen Flucht von Räumen um, die den Reichtum des Besitzers zur Schau stellen. Der Hellenismus prägte eine klassische Form des Hauses, deren Mittelpunkt der Säulenhof, das Peristyl, war, Rom erweiterte durch sie sein altes Wohnhaus, dessen ursprünglich einziger Raum der Herdraum, das Atrium war. So wird das Bedürfnis durch bloße Repräsentationszimmer unverhältnismäßig in den Hintergrund gedrängt. Im pompejanischen Haus liegt nach der Straße zu das Atrium, jetzt bloßer Empfangsraum, dann folgt das Tablinum, das Familienzimmer, und schließlich das Peristyl (Abb. 28) als Stätte behaglicheren Verkehrs. Dieser reichere Raum ist mit Gartenanlagen geschmückt, in denen Marmortische stehen, Skulpturen und Hermen; die Säulen sind reich

Abb 29 Rom Inneres des Pantheon

geformt, die Wände mit Ornamenten und Malereien geziert, all das mit der Absicht, den größten malerischen Reichtum zu erzielen, in Durchblicken, wie denen des kretischen Palastes. An ihn erinnert auch die Freude an der Wandmalerei, deren Entwicklung die Geschichte des spätantiken Raumgefühls ist. Während die hellenistische Wanddekoration die Fläche nur durch farbige Inkrustationen, die in echtem Material gearbeitet oder in Malerei kopiert sind, gliedert und ziert oder durch Halbsäulen und Architekturornamente, stellt sich in den letzten Jahrzehnten Pompejis, d. h. um die Mitte des 1. Jahrhunderts n. Chr., die Dekoration geradezu in Gegensatz zur Wand. Schon der Impressionismus der Wandgemälde mit seinem außerordentlichen Eindruck von Raumtiefe (Abb. 27) bedingt eine Auflösung der Mauerfläche. Allein die Wand wird nun ganz aufgelöst von phantastisch gemalten, stützlos schwebenden Architekturformen, zwischen denen Durchblicke in die freie Luft sich zu öffnen scheinen. Die Dekoration scheint den Blick in unerhörte Weiten zu führen, in Gärten und Landschaft und in romantisches Märchenland, und wird ein Spiel von Phantasien, denen die weiten Räume des Hauses zu eng waren. Bei Palästen, Marktanlagen oder bei den großen römischen Bädern müssen auf diese Weise außerordentliche räumliche Wirkungen erreicht worden sein. Daß die Entwicklung des Raumgefühls in der Architektur der Zeit die entscheidende Tendenz ist, lehrt ebenso Roms religiöse Baukunst. Zuerst begnügte man sich damit, den altetruskischen Tempel, einen Wandbau mit sehr großer Vorhalle, die den Zeichendeutungen dient, äußerlich als Peripteros zu gestalten. Und wenn auch dabei die Säulenform überreich korinthisch wird und ihre Verwendung als Halbsäule sie zum bloßen Wandschmuck macht, so bleibt doch die Gliederung altertümlich einfach. Erst das Pantheon (Abb. 29) aus der Zeit Hadrians bringt die späthellenistische Steigerung aller Wirkungen. Der Gegensatz einer verhältnismäßig einfachen Front zu einem wie ohne Grenzen gedehnten Innenraum steigert dessen Wirkung ins Ungeheure. Es war oben die Rede davon, daß die Kurve des Rundbaues das Auge sich nirgendwo festklammern läßt. Aber eben dadurch hemmt er es auch nie und läßt es ins Unbegrenzte blicken. Es ist ungemein interessant, wie das Pantheon in diesem Kreis jedem Fixpunkt, der

sich etwa aus dem Eingang oder aus einem Altar für die Orientierung ergeben könnte, dadurch entgegenzuwirken sucht, daß es kleinere und größere Nischen gleicher Art in gleichen Abständen rings um den Raum verteilt. Den stärksten Eindruck von Raumfreiheit aber gibt die krönende Kuppel. Während Flachdecke und Tonnengewölbe auf geraden Wänden liegen und dadurch den Raum begrenzen, führt die Kuppel über jede Festlegung hinaus, da sie auf rundbewegten Mauern liegt und überall nur von der beweglichen Kurve begrenzt, ohne festen Abschluß ist. Die zerlegenden Kassetten sind wichtige Diener dieser Auflösung. Es handelt sich hier nicht nur um einen Fortschritt in der Wölbungstechnik — man wäre nie dazu gelangt, wenn nicht das religiöse Gefühl, unzufrieden mit den alten Vorstellungen von der Gottheit, jetzt sehnsuchtsvoll in die Weite verlangt hätte. Romantische Tendenzen, wie in den Nachschöpfungen ägyptischer Kultstätten und landschaftlich berühmter Punkte in der Villa Hadrians, sind von derselben Erregtheit. Der hellenistische Osten, der so viel dem Römer Fremdes birgt, ist nicht zufällig die Grundlage ihrer Formen, wie derer des Pantheon. Es ist dasselbe Gefühl, das den Isiskult nach Rom bringt, den Mithrasdienst und schließlich als letzte Antwort auf all dieses Gottsuchen das Christentum.

Die Steigerung dieser Erregtheit bedeutet für die Kunst eine immer größere Entfernung vom Tektonischen. Aus der Bewegung wird die Ziellosigkeit, und auf die Lösung des Bauzusammenhanges folgt die zügellose Herrschaft des Ornamentes.

Abb. 30. Baalbek. Rundtempel. Der Rundtempel von Baalbek (Abb. 30, erbaut im 2. Jahrh. n. Chr.) ist überwuchert vom Reichtum einer unsachlichen Dekoration. Alle Stilformen sind aus ihrem Zusammenhang gerissen. Korinthische Pilaster mit unreinem Kapitell rahmen die Nischen, zu ionischen Zahnschnitten im Fries gesellen sich korinthische Säulen ohne Kannelüren und korinthische Architravbalken, die nur halb aufliegen, damit nur ja auch hier die wirklichen Träger nicht zu tragen scheinen. Pilaster und Bogen dienen als Rahmen, kurzum, nirgends ist ein Bauglied durchgefühlt, immer nur ist es Dekoration vor der

runden Mauer, die sogar noch von Nischen mit Statuen unterbrochen ist. Aber selbst diese unfeste Form wird noch gelöst, die halbkreisförmig geführten, von Säulen getragenen Simse wenden sich gegen die Mauer und lösen sie vollkommen in nach außen geführte Kurven auf.

Abb. 31. Spiegel aus Boscoreale.

Die gleiche Anschauung zerstörte im Lauf dieser Jahrhunderte die klare Struktur des Gerätes. Im Boden von Schalen werden Hochreliefs angebracht, die nicht nur der Reinigung Schwierigkeiten bereiten, sondern bei der Benutzung so durch den Inhalt verdeckt

werden mußten, daß man ein Stück wie etwa die Athenaschale des Hildesheimer Silberfundes nur zum Prunkgerät zählen kann. Auch beim Gebrauchsgerät, selbst beim ärmsten Tonnapf, ist an die Stelle der Flächenbemalung, die zuletzt impressionistisch genug war, die plastische Reliefdekoration getreten. Daß jetzt das Glas, dessen Durchsichtigkeit die begrenzende Fläche vollkommen zerstört, so beliebt wird, ist ungemein bezeichnend. Und von diesen Geräten steht kaum eines mehr fest auf dem Boden; sie spitzen sich nach unten zu oder sind auf kleine Füßchen gesetzt und ebensowenig in ihren Teilen straff geschieden. Es war ganz sachgemäß gewesen, wenn die klassische Zeit die Rückseite des polierten Metallspiegels nur durch gravierte Darstellungen, oft von edelster Zeichnung, belebte und den runden Spiegel streng vom Griff schied. So blieb die spiegelnde Fläche für den Eindruck des Gerätes das Beherrschende, waren seine Teile nach ihrem Zweck gesondert. Es ist erneuter Beweis für das Überhandnehmen der Dekoration, wenn sich auf einem Spiegel der ersten römischen Kaiserzeit (Abb. 31) die Rückseite so ungehindert vordrängen darf, daß man glauben könnte, sie wäre die Hauptsache. Der Reliefkopf des Dionysos in der Mitte, ein charakteristisches Beispiel für die Freude an komplizierter Bewegung selbst dort, wo keine Handlung sie nötig macht, arbeitet ebenso der sachlichen Form entgegen wie das Rankenornament, das den Griff des Spiegels vollkommen in ein Geflecht auflöst. Daß es dadurch jedes feste Anfassen unmöglich macht und eine zierliche Fingerhaltung bedingt, ist ungemein interessant für die Einheitlichkeit einer Kultur in Leben und Kunst. Die Enden dieser Ranken führen mit weichen Linien hinüber in die eigentliche Spiegelfläche, deren Rundbegrenzung durch die nach außen gerichteten Zacken vollkommen zerfasert wird, eine Auflösung, parallel der, die die Rundform des Tempels von Baalbek zerstörte.

Gegen das Ende der antiken Welt ist die Verwirrung aufs höchste gestiegen. Nicht Klarheit ist die Tendenz, sondern Reichtum der Gefühle und des Ausdrucks. Das Bauwerk ist zerfetzt durch die Dekoration, und das Gerät duldet jede Durchbrechung seiner Flächen, bis es zum bloßen Netz wird. Die Aufgaben für Malerei und Plastik wachsen ins Unbegrenzte; überall braucht man sie, überall wirken sie zerstörend auf die Hauptaufgaben der Baukunst und

werden durch die eigene Fülle zerstört. Die Götter verlieren ihre Majestät und werden leere Allegorien oder Symbole für religiöse Ideen. Die plastischen Ideen des Polyklet und Praxiteles werden als öde Schemata wiederholt, und inbrünstig sucht man die Götter der Urzeit in ihrer Primitivität zu gestalten, als wäre deren naive Innigkeit dem wahren Wesen der Gottheit näher, ein Gefühl, das die Romantik des 19. Jahrhunderts ebenso hatte. Je weniger wertvoll und wichtig der einzelne Mensch in sich ist, um so mehr wünscht er sich verherrlicht zu sehen; das Porträt wird wichtigste Aufgabe, und mit leeren Gesten bläht sich der unbedeutende Mensch in großen Posen. Die andringenden Germanenvölker und die jungen christlichen Gemeinden finden in Kunst und Leben eine Zersetzung, deren erst jahrhundertelange Arbeit wieder Herr werden konnte.

Fünftes Kapitel.

Die frühchristliche Kunst.

Diese letzten Jahrhunderte antiker Kultur bedeuten zugleich die erste Epoche des Christentums. Es ist noch immer die Meinung nicht ausgetilgt, als hätte es in seinem Entstehen einen ganz neuen Stil, gewöhnlich als altchristlichen bezeichnet, hervorgebracht. Allein eine neue Weltanschauung kann der Kunst wohl neue Stoffe bieten, aber die Augen sind noch zu sehr in den Vorstellungen ihres Jahrhunderts befangen, um mit einem Schlage eine neue Kultur, einen neuen Geschmack zu schaffen. Es wäre so, als hätte für die Evangelien eine neue Sprache geschaffen werden sollen. Und selbst die neuen Stoffe kommen spät genug. Denn nur sehr allmählich haben die ersten christlichen Gemeinden, die in jüdischhellenistischen und römisch-hellenistischen Traditionen groß geworden waren, ihre Religion so scharf ausgeprägt, um für sie neue Formgedanken zu finden.

Man hat es lange bemerkt, daß auf Wandmalereien und Mosaiken altchristlicher Katakomben und Kirchen dieselben weinkelternden Genien und impressionistischen Porträts vorkommen wie in Pompeji, und immer mehr sieht man, daß sogar Darstellungen von heidnischer Gesinnung, nackte Najaden und Götter, sich unter die altchristlichen Kunstwerke mischen konnten, ohne daß selbst spätere Zeiten sie anstößig fanden und vertilgten; an der Kanzel von Aachen haben sie sich bis heute erhalten. Die Meinung, es hätte das Christentum aus dem Nichts heraus eine neue Kunst schaffen können, ist uns Heutigen, die wir entwicklungsgeschichtlich denken, völlig absurd.

Ist dieses Resultat gewonnen, so ist die wichtigste Frage die nach dem Kunstkreis, in dem sich der Übergang von der antiken zur christlichen Kunst vollzogen hat. Denn wir haben schon oben festgestellt, daß die spätantike Kunst keineswegs nur die römische ist, daß sich vielmehr die hellenistische Kunst in den alten Kunstzentren des Hellenismus, etwa Antiochien mit seinem Hinterlande Syrien und Alexandria mit Ägypten, rein und kräftig erhalten hat. Es galt lange Zeit als selbstverständlich, daß Rom der Ort war, an dem die christliche Kunst geboren wurde, die Hauptstadt der katholischen Kirche und das politische Zentrum für die letzten Jahrhunderte der antiken Welt. Daß es nicht zugleich das einzige Kunstzentrum war, wußte man nicht, da Gebiete außerhalb Italiens kaum durchforscht waren. So ergab sich die Kombination fast von selbst. Schließlich erkannte man doch, daß Rom erst in relativ später Zeit zur Hauptstadt der christlichen Kirche geworden ist. Die erste Metropole des Christentums war Byzanz (Konstantinopel), dessen Erhebung zur Hauptstadt des römischen Reiches im Anfang des 4. Jahrh. von Konstantin vollzogen wurde, demselben Kaiser, der für die Geschichte des Christentums so wichtig war. Allein auch in Byzanz darf man den Ursprung der christlichen Kunst nicht suchen. Die Gegenwart hat gesehen, daß bei einer Institution wie der katholischen Kirche diejenigen Kunstformen, die sie aufgenommen hat, bevor sie noch Institution war, aller späteren Ausgestaltung zugrunde liegen, und daß sie sich mit ihr auf ihrem Wege von der Lehre zur Kirche entwickelt haben. Man muß die früheste Entwicklung des Christentums beobachten, wenn man das Entstehen der christlichen Kunst erkennen will, die mit ihm emporgewachsen ist.

Das Geburtsland des Christentums ist das hellenistische Judäa. Konzentrisch breitet es sich von hier aus. Die bedeutendsten Gemeinden der Apostelgeschichte liegen noch im kleinasiatischen Gebiet. Früh tritt Ägypten hinzu, in dem die ersten Klöster gegründet werden, dann erst dringt die neue Religion nach dem Abendlande vor. Es soll damit nicht gesagt sein, daß sie hier und in Rom nicht noch neue Elemente in sich aufgenommen hat, aber sie hat vieles schon fertig mitgebracht und ist an Orten, nach denen der hellenistische Strom auf Handelswegen vom Orient aus direkt floß,

mindestens so früh gewesen wie in Rom, z. B., wie die Lazaruslegende anzudeuten scheint, in Massilia, dem heutigen Marseille. Rom war kirchlich noch nicht maßgebend, als es im Orient fast schon ein organisiertes Christentum gab. Es vergehen noch Jahrhunderte, bevor die Kirche sich in einen morgenländischen (griechisch-katholischen) und einen abendländischen Zweig spaltet, der abendländische Zweig seine Religion als die katholische proklamiert und das Mutterland der Kirche als ketzerisch verdammt.

Eine Darstellung wie die Opferung Isaaks auf der Elfenbeinpyxis des Berliner Museums (Abb. 32) zeigt klar, wie unmerklich sich der Übergang von der späthellenistischen zur christlichen Kunst vollzog. Sie entstammt wohl dem 4. Jahrh. n. Chr. und ist vielleicht alexandrinischen Ursprungs. Die hellenistischen Traditionen sind hier viel treuer bewahrt als in Rom. Das sog. Eierstab-Ornament des oberen Randes ist klassisch dorisch, und in den Gestalten sprechen noch künstlerische Formen, die in Italien längst Floskeln und Phrasen geworden, selbst verkümmert sind. Man nehme den Abraham. Seine Haltung ist vollkommen die im 3. Jahrhundert v. Chr. ausgebildete. Das eine Bein steht fest, das andere, das Spielbein, ist leicht bewegt, die Hüfte herausgebogen, und während die Bewegung der Arme nach links gerichtet ist, ist der Kopf nach rechts gewandt, der Hand Gottes zu, die sich aus den Wolken streckt. Wie hier das Gegensätzliche der Bewegung das einzelne Glied in seinem Stil ausdrucksvoller macht, wie das Gewand sich um die Glieder strafft und sie hervortreten läßt: das ist echt hellenistisch. Man vergleiche die bekannte Sophoklesstatue, und man wird sehen, daß das Christentum hier künstlerische Ausdrucksformen verwendet, die Hellas geprägt und der Hellenismus zu geläufigen Typen ausgebildet hat. Auch sonst sind antike Philosophenstatuen oft das Vorbild für christliche Heilige gewesen, und der Christus dieser Zeit ist der unbärtige, jünglinghafte Gott, wie ihn Griechenland im Apollo-Typus geschaffen hat. Aber es ist die Folge der neuen christlichen Inbrunst, daß der antike Formenreichtum sich in das Kleingerät des Kultus flüchtet, das der Priester liebevoll in die Hand nimmt, Messekelch und Patene, gemalte und kostbar gebundene Evangelienhandschriften. Dagegen wird das Gotteshaus ein reiner

Versammlungsraum. Es hat fast siebenhundert Jahre gedauert, bis die Stileinheit ganz wiederhergestellt war.

Abb. 32. Elfenbeinpyxis mit Opferung Isaaks. Berlin, Kaiser-Friedrich-Museum

Auch die Baukunst leitet ihre Kirchenformen vom hellenistischen Orient ab. Sie kennt zwei fast gegensätzliche Grundrißformen, den Zentralbau und den Langbau. Daß der christliche Zentralbau aus dem Orient stammt, war eigentlich immer feststehende Meinung, nur nahm man Byzanz als seine Heimat an, das ihn in Wirklichkeit erst aus Kleinasien übernommen zu haben scheint. Hier war er heimisch in jenem typischen Aufbau einer Kuppel über meist polygonalem Grundriß, wie die berühmte Kirche der Hagia Sophia, heute zur Moschee umgewandelt, ihn zeigt (Abb. 33). Daß ihre Erbauer im 6. Jahrhundert Anthemios von Tralles und Isidoros von Milet waren, also kleinasiatische Architekten, ist wichtig genug.

Die Kuppel der Hagia Sophia wirkt so groß, weil das architektonische Leben, das sie unter sich zusammenfaßt, sehr viel reicher ist als noch beim Pantheon. Dort ruhte die Kuppel mit ihrem

ganzen runden Rande auf der von Nischen durchbrochenen Mauer So ging von der Decke eine Begrenzung des Raumes bis zur Erde. Bei der Hagia Sophia aber ruht die Kuppel zunächst auf Zwickeln (pendentifs), Mauerdreiecken, die mit ihren Viertelbogenrändern die Last auf vier gewaltig dicke Mauerpfeiler übertragen, die in den vier Ecken eines Quadrates stehen. So ist der Unterbau nur in den vier Ecken begrenzt, und die Bögen, die sich von Pfeiler zu Pfeiler spannen, bereiten vor auf die krönende Größe der Kuppel; zwischen den Eckpfeilern aber ist der Raum offen, gestattet die Anlage von Seitenschiffen, Nischen, Galerien, Emporen, die mit ihren reichen Säulenstellungen ungemein lebhaft wirken. Und während so einerseits das raumerweiternde Prinzip der späten Antike noch fortgebildet scheint, macht sich andererseits wieder eine Neigung zur Raumbegrenzung geltend. Gerade, daß der Saal nicht ganz rund ist, sondern durch die vier Eckpfeiler eine quadratische Orientierung erhält, gibt seiner Ausdehnung Grenzpunkte, und eine noch engere Begrenzung läuft an zwei Seiten dieses Quadrates entlang, indem Säulenreihen eine Verbindung zwischen den Eckpfeilern herstellen und vom Eingang bis zu den drei Altarnischen eine Art Langschiff abgrenzen. Hier liegt eine fruchtbare Neuschöpfung des christlichen Kirchenbaues. Wir finden es oft, daß die höchste Ausprägung des einen Stilprinzips bereits die ersten Symptome des neuen enthält, wie eine allzu schnell rotierende Scheibe stillzustehen scheint. So zeigt sich hier im spätantiken Zentralbau die Ankündigung des Langbaues. Das ist eine notwendige Folge der kontinuierlichen Entwicklung, und wir werden noch ein Parallelbeispiel in der Ornamentik der Zeit kennen lernen.

Die Entwicklung der raumbegrenzenden Form ist die eigentlich stilbildende Tat der frühchristlichen Kunst. Das Herausschneiden eines Langschiffes in der Hagia Sophia bedeutet bereits einen Schritt in dieser Richtung, der die Basilika den vollen Ausdruck gegeben hat.

Abb. 33. Konstantinopel. Hagia Sophia. Inneres.

Man hat nun gerade die Basilika, für die sich auf italienischem Boden, in Ravenna und Rom besonders, die zahlreichsten Beispiele erhalten haben, für ein Gebilde abendländischer Kunst gehalten und ihren Ursprung noch in Italien gesucht, als man den Wert des Orients für die christliche Kunst längst erkannt hatte. Nachdem die alte Meinung aufgegeben war, sie wäre aus der römischen Basilika, der Markt- und Gerichtshalle, entstanden, kam die Ableitung ihrer Anlage aus dem Bau des römischen Hauses, in dem sich die Gemeinde zuerst versammelt haben soll. Aber ihr Grundtypus läßt sich im Orient in sehr früher Zeit nachweisen, in viel mannigfaltigeren Variationen der Anlage, als das Abendland sie kennt, so daß die hellenistische Ableitung auch für diesen Typus festzustehen scheint. Ob es allerdings die hellenistisch-jüdische Synagoge war, die den Grundriß hergab, mag dahingestellt sein, ist aber bei dem durch lange Zeit gewahrten Zusammenhang zwischen

Judentum und Christentum nicht unmöglich. Jedenfalls hat Rom die Basilika, auch wenn sie eine Schöpfung des Orients ist, mit der Ausdehnung der päpstlichen Macht in allen Gebieten des Okzidents heimisch und zu jener Hauptform des christlichen Gotteshauses gemacht, deren Weiterbildungen noch heute demselben Zwecke dienen.

Abb. 34. Ravenna. S. Apollinare in classe. Inneres.

Im Gegensatz zum Zentralbau ist in der Basilika dem Auge des Eintretenden durch die Säulenreihen sofort eine feste Richtung, durch die Altarnische ein bestimmtes Ziel gegeben (Abb. 34). Das Wort, daß der Zentralbau die Ruhe, der Langbau die Bewegung bedeute, ist, absolut genommen, unrichtig; fast ist das Entgegengesetzte der Fall. Für den Zentralbau könnte der Mittelpunkt unter der Kuppel ein Ruhepunkt sein, wenn er zugleich die wichtigste Stelle im Gebäude ist. Wenn aber, wie bei der Hagia Sophia, in S. Vitale in Ravenna und in anderen christlichen Zentralbauten der Altar in einer großen Wandnische steht, dem

Eingang gegenüber, fällt das Augenziel nicht mit dem räumlichen Mittelpunkt zusammen, und es entsteht eine Dissonanz, die für die noch spätantike Stilempfindung sehr charakteristisch ist. Bei der Basilika (Abb. 34) dagegen führen alle Linien des Baues nur auf den Altar hin, der so zugleich für Auge und Sinn das Ziel bedeutet. Zweck und Form sind hier in Einklang. Der ganze Bau hat nur eine Richtung, die nach der Apsis, der Altarnische an der Ostseite. Dorthin führen den Eintretenden, sobald er den zur Kirche gehörigen Vorhof, das Atrium, verlassen hat, von der Eingangshalle aus die ununterbrochen fließenden Reihen der Säulen, dorthin die horizontalen Linien der Wandteilung, die Balken der flachen Decke, die Musterung im Pflaster des Bodens. Die Seitenschiffe, hier, wie meist, eines auf jeder Seite, nehmen, durch die Säulenreihen und die Wand geführt, dieselbe Richtung auf. Und dort, wohin alle diese Linien zusammenfließen, faßt die Apsisnische, ausgeschnitten aus der Hochwand, die hier das Schiff abschließt und als Triumphbogen übrigbleibt, den Altar in sich. Die führenden Linien der Säulenreihen werden von ihr aufgenommen, und von oben her schließt die runde Wölbung den kleinen Raum unter sich zusammen. So ist jeder Bauteil aus seinem Zweck abgeleitet, aber auch jede Einzelform. Wie der Dachstuhl mit offenem Balkengerüst den Augen die Konstruktion klar aufzeigt, so tragen auch die Säulen ihre Last mit vollkommener Festigkeit des Ausdrucks. Aus spätantiken Formen abgeleitet, sind sie doch weitaus beruhigter. Es war notwendig, daß sich die Ornamente um so kräftiger gegen den Grund absetzen mußten, je schärfer die plastische Dekoration, antike Entwicklungen fortführend, den Gegensatz zwischen Licht und Schatten ausdrückte. Aus der weichen Modellierung wurden hartbegrenzte Formen, und damit näherte sich die Auffassung notwendig wieder der flächenmäßigen Bildung. So sehr im ravennatischen Kapitell des 6. Jahrhunderts (Abb. 35) der Gegensatz zwischen Licht und Schatten, Ornament und Grund verschärft ist, so ist er doch benutzt, um den Umriß des Ornamentes zu betonen, das an sich ganz flächenhaft gegeben ist. So dient es der Form des Kapitells, die es bestimmt. Denn das Kapitell trägt wirklich; es strebt nicht mehr auseinander, wie das korinthische oder gar dessen römische Nachbildungen mit ihrem wirren Schmuck. Fest haftet das Ornament

am Grunde, und wenn der scharfe Gegensatz von Licht und Schatten den tektonischen Charakter des Gebildes zerstören zu können scheint, so faßt die strenge Begrenzung an den Kanten kraftvoll den Flächenschmuck zusammen. Sie ist es, deren nach unten weisende Linien zugleich die Last in den Säulenschaft hineinführen. Und auch sie ist überlegt geteilt. Das Ende des Bogens, der die Obermauer trägt, setzt nicht unmittelbar auf das Kapitell auf. Ein allmählich schmäler werdendes Zwischenglied, der Kämpfer, führt ihn mitten hinein ins Kapitell, an dessen stärksten Punkt, wo es vollkommen der Säule aufliegt.

Wie bei jedem reinen Bedürfnisbau ist die Außenseite nur Mantel um das zweckgemäß gestaltete Innere. Sie trägt bei der Basilika (Abb. 36) keinen überflüssigen Schmuck und stellt den Grundriß

Abb 35 Ravenna S Vitale Kapitell und Kämpfer

offen zur Schau. Das Mittelschiff, die beiden Seitenschiffe und die Apsis werden auch hier vollkommen klar in ihrem Aufbau und ihrer räumlichen Lage, und die tragende Mauer ist formfest wie die tragende Säule. Die Gliederungen der Wand sind nicht mehr vorgelagerte Säulen wie beim Lysikratesdenkmal, sondern flache, arkadenartig geführte Mauervorsprünge. Wie eine empfindliche Epidermis legt sich diese feine Schicht über die Wandfläche, sie belebend und doch in so geringer Erhebung an die Wand geschmiegt, daß sie die raumbegrenzende Kraft der Wandfläche nicht hindert, sondern verstärkt. Der Glockenturm, der nicht zum Versammlungsraum gehört, sondern zu den Wohnstätten der Gemeinde, die er in das Gotteshaus ruft, wird als walzenförmiges Gerüst neben den Hauptbau gestellt und trägt einen selbständigen Teil des architektonischen Ausdruckes.

Erschien im ersten Anblick das Nebeneinander der Bauteile zusammenhanglos und wenig ausgeglichen, so zeigt sich jetzt, wie es bedingt ist; kein notwendiger Bauteil, der nicht im Außenbau ausgedrückt, keine Gliederung, die nicht durch den Grundriß begründet wäre. Was fehlt, ist die funktionelle Durchbildung der Bauglieder. Wand und Säule sind nicht als Träger ausgedrückt, und der Glockenturm ist geradezu formlos. Allein die Grundlagen für einen zweckvoll formenden Stil, wie der dorische es war, sind wieder gegeben. Und wenn auch zunächst der antike Zentralbau der Basilikaform die Herrschaft streitig macht, so ist es doch die Klarheit ihrer Anlage, der die Zukunft gehört. Der romanische Baustil in Deutschland hat aus ihr die Erfüllung aller mittelalterlichen Bauforderungen geschaffen.

Abb 36 Ravenna S Apollinare in classe Äußeres

Malerei und Plastik folgen auf dem neuen Weg. Sie gehen als freie Künste unter und werden Diener der Architektur Aber gerade sie zeigen, daß die neuen Stilformen nicht plötzlich entstehen. Der Kopf Kaiser Justinians auf dem zeremoniellen byzantinischen Stiftungs-Mosaik von S. Vitale in Ravenna (Abb. 37) ist im Grunde noch antik empfunden. Schon das Interesse am Porträt ist dafür charakteristisch, und der Stil ist der impressionistische der spätantiken Malereien. Ihm gehört dieses Mosaik so gut an wie die anderen frühchristlichen Mosaiken, wie die pastos hingestrichenen Wandmalereien in den Katakomben oder die Buchmalereien in den ältesten illustrierten Handschriften. Noch spricht bei ihm nicht der Umriß, sondern die Form, der farbige Lichter und Schatten den Ausdruck geben. Ja, es scheint, als könnte die Mosaiktechnik überhaupt nur Ausdrucksmittel einer impressionistischen Epoche sein, da sie mit ihrem Zusammensetzen aus farbigen Steinchen die Linien nur grob zu zeichnen, aber um so besser Farbenflächen zu

geben vermag. Die ältesten uns erhaltenen Mosaiken stammen jedenfalls erst aus späthellenistischer Zeit.

Abb 37 Ravenna S Vitale Kopf des Justinian vom Mosaik des Altarraumes

Indessen zeigt auch das Porträt Justinians und die anderen gleichzeitigen Werke das Nahen des neuen Stilempfindens. Das starre Enface des Gesichts bedeutet einen Schritt über die bewegten Bildungen der Antike hinaus zu linearer Auffassung. Licht und Schatten begegnen sich ohne vermittelnde Übergänge, konzentrieren sich und werden zu linienscharfen Kontrastflächen. Und wie die Formbildung der Wand, ordnet sich die Komposition der Architektur unter. In S. Apollinare nuovo wirken die zum Altar ziehenden Märtyrerfriese mit den Säulen unter ihnen zu einer Bewegung zusammen, die die Mosaiken der Apsiswand weiterführen, und deren Ziel der Altar ist. Es gibt keinen stärkeren Gegensatz als zwischen ihrer Bewegung und der zügellos frei den Altar umkreisenden des Gigantenkampfes von Pergamon.

Diesen linearen Zeichnungsstil hat das oströmische Reich im Laufe der Jahrhunderte als seinen eigenen, byzantinischen Stil entwickelt, der nach mannigfachen Wandlungen erst in dem Moment untergeht, in dem die Türken das oströmische Kaisertum und die oströmische Kultur vernichten (1453). Am Anfang seines Weges stehen diese oströmischen Mosaiken auf italienischem Boden, in

denen sich Antike und Mittelalter für einen Augenblick begegnen. Wie Byzanz als neue Hauptstadt des römischen Reiches an die Stelle der Stadt Rom trat, so hatte es auch das künstlerische Erbe der Antike und die Bildgedanken, die das alte Christentum geschaffen hatte, übernommen. Es hat sie zu feststehenden Schematen umgebildet und um so schematischer immer wiederholt, je mehr seine Kräfte schwanden. Indessen waren im westlichen Europa die Völker emporgewachsen, denen das Mittelalter die klassische Zeit ihrer Kunst bedeutet, die, während im Osten der Baum der antiken Kunst allmählich verdorrte, neuen Samen ausstreuten und neue Früchte zur Reife brachten.

Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.