Applied data science: lessons learned for the data-driven business martin braschler - Explore the co

Page 1


Visit to download the full and correct content document: https://textbookfull.com/product/applied-data-science-lessons-learned-for-the-data-dri ven-business-martin-braschler/

More products digital (pdf, epub, mobi) instant download maybe you interests ...

Chemometrics : data driven extraction for science

Second Edition Brereton

https://textbookfull.com/product/chemometrics-data-drivenextraction-for-science-second-edition-brereton/

Data Visualisation A Handbook for Data Driven Design

Andy Kirk

https://textbookfull.com/product/data-visualisation-a-handbookfor-data-driven-design-andy-kirk/

Data Visualisation: A Handbook For Data Driven Design

Andy Kirk

https://textbookfull.com/product/data-visualisation-a-handbookfor-data-driven-design-andy-kirk-2/

Product Analytics: Applied Data Science Techniques for Actionable Consumer Insights (Pearson Business Analytics Series) 1st Edition Rodrigues

https://textbookfull.com/product/product-analytics-applied-datascience-techniques-for-actionable-consumer-insights-pearsonbusiness-analytics-series-1st-edition-rodrigues/

The Data-Driven Project Manager Mario Vanhoucke

https://textbookfull.com/product/the-data-driven-project-managermario-vanhoucke/

Data Science for Business and Decision Making 1st Edition Luiz Paulo Fávero

https://textbookfull.com/product/data-science-for-business-anddecision-making-1st-edition-luiz-paulo-favero/

Data Science and Digital Business Fausto Pedro García Márquez

https://textbookfull.com/product/data-science-and-digitalbusiness-fausto-pedro-garcia-marquez/

Artificial Intelligence and Machine Learning for Business: A No-Nonsense Guide to Data Driven Technologies Steven Finlay

https://textbookfull.com/product/artificial-intelligence-andmachine-learning-for-business-a-no-nonsense-guide-to-data-driventechnologies-steven-finlay/

Data Science: The Hard Parts: Techniques for Excelling at Data Science 1 / converted Edition Daniel Vaughan

https://textbookfull.com/product/data-science-the-hard-partstechniques-for-excelling-at-data-science-1-converted-editiondaniel-vaughan/

Martin Braschler · Thilo Stadelmann

Kurt Stockinger Editors

Applied Data Science

Lessons Learned for the Data-Driven Business

AppliedDataScience

MartinBraschler • ThiloStadelmann • KurtStockinger

AppliedDataScience

Editors

MartinBraschler

Inst.ofAppliedInformationTechnology

ZHAWZurichUniversity ofAppliedSciences Winterthur,Switzerland

KurtStockinger

Inst.ofAppliedInformationTechnology

ZHAWZurichUniversity ofAppliedSciences Winterthur,Switzerland

ThiloStadelmann

Inst.ofAppliedInformationTechnology

ZHAWZurichUniversity ofAppliedSciences Winterthur,Switzerland

ISBN978-3-030-11820-4ISBN978-3-030-11821-1(eBook) https://doi.org/10.1007/978-3-030-11821-1

© SpringerNatureSwitzerlandAG2019

Thisworkissubjecttocopyright.AllrightsarereservedbythePublisher,whetherthewholeorpartofthe materialisconcerned,specificallytherightsoftranslation,reprinting,reuseofillustrations,recitation, broadcasting,reproductiononmicrofilmsorinanyotherphysicalway,andtransmissionorinformation storageandretrieval,electronicadaptation,computersoftware,orbysimilarordissimilarmethodology nowknownorhereafterdeveloped.

Theuseofgeneraldescriptivenames,registerednames,trademarks,servicemarks,etc.inthispublication doesnotimply,evenintheabsenceofaspecificstatement,thatsuchnamesareexemptfromtherelevant protectivelawsandregulationsandthereforefreeforgeneraluse.

Thepublisher,theauthorsandtheeditorsaresafetoassumethattheadviceandinformationinthis bookarebelievedtobetrueandaccurateatthedateofpublication.Neitherthepublishernortheauthorsor theeditorsgiveawarranty,expressorimplied,withrespecttothematerialcontainedhereinorforany errorsoromissionsthatmayhavebeenmade.Thepublisherremainsneutralwithregardtojurisdictional claimsinpublishedmapsandinstitutionalaffiliations.

ThisSpringerimprintispublishedbytheregisteredcompanySpringerNatureSwitzerlandAG. Theregisteredcompanyaddressis:Gewerbestrasse11,6330Cham,Switzerland

Preface

Inearly2013,thethreeeditorsofthisvolumewereinstrumentalinfoundingthe ZHAWDatalab,aDataScienceResearchInstitute(DSRI)1 atZurichUniversityof AppliedSciences.2 “Bigdata” wasbiginthepublicpress,3 butDSRIswerestillrare, especiallyinEurope.Bothforourcolleaguesandus,itwasthenaturalthingtodo: joiningforcestocreatesynergiesinternallyanddemonstratecriticalmassoutwardly toultimatelyfacilitatebetterappliedresearchprojects(forwhichselectingproject teammembersandacquiringfundingbecomesmucheasierinalargergroup).The initialideawastoformanetworkofexperts4 thatwouldengageinregularprojectbasedcollaborationswithoutmuchadministrativeoverhead.Thegoalofthatpartnershiphadbeentoperformappliedresearchprojectsbetweenacademiaand industryattheinterfaceofstructuredandunstructureddataanalysis.Thealready existingstrongpartnershipnotonlygaveusconfidenceinthevalidityofthe approach,italsomadeexplicittheveryneedthatledtothefoundationofthe ZHAWDatalab:theneedforaconcisedescriptionofwhatweweredoing.Letus explain.

1 ADSRIisauniversity-wideinitiativeintegratingresearchersfromdifferentdisciplinespredominantlyoccupiedwithawiderangeofaspectssurroundingtheanalysisofdata.

2 AsnapshotofthesebeginningsiscontainedinFig. 1.ThefoundersoftheZHAWDatalabalso publishedanearlypositionpaper(Stadelmann,Stockinger,Braschler,Cieliebak,Baudinot,Dürr andRuckstuhl, “AppliedDataScienceinEurope ChallengesforAcademiainKeepingUpwitha HighlyDemandedTopic”,ECCS2013).Seealso www.zhaw.ch/datalab

3 Thecommunitythatformedaroundthetermwasalsoveryactive,ascanbeseen,forexample,in thehistoryofmeetingsoftheSwissBigDataUserGroup(see https://www.meetup.com/swiss-bigdata/).Oneoftheeditors(K.S.)evengaveatalkatthe firstmeetupofthisgroupwhenitwasstill called “SwissHadoopUserGroup.”

4 AsimilarconcepthasbeendemonstratedbytheNetworkInstituteoftheVrijeUniversiteit Amsterdam(see http://www.networkinstitute.org/ ).

HowWeBecameDataScientists

Basically,wewereabletocapitalizeontheemergenceofthenewdatascience field atexactlytherighttime.TheZHAWSchoolofEngineeringhadbeenverysuccessfulinexecutingmanyappliedresearchprojectsformorethan10yearspriortothe inceptionoftheZHAWDatalabin2013.Mostoftheseprojectswere firmly “located” attheinterfacesofthedisciplinesthattodaymakeupdatascience.In particular,computerscientistsandstatisticiansjoinedforcesandworkedonproblemsintegratingandanalyzingstructuredandunstructureddata.Thiswasapplied datascienceatwork “parexcellence.” However,therewasno “elevatorpitch” for thekindsofproblemswewereworkingontogetherwithourcolleagues,noeasyway todescribetheideastofundingagenciesandprospectiveindustrypartners.If nothingless,theterm “datascience” deliveredaconcisedescriptionofwhatwe perceivedtobethe fieldwewereworkingin(Fig. 1).

Oneofthe firstjointactivitieswithinDatalabwastoorganizeaworkshopto performarealitycheckonthepotentialofthetopicofdatascience.5 SDS|2014,the firstSwissWorkshoponDataSciencealreadyexceededourproudestexpectationof attendeesbyafactorof2(seealsoFig. 2);sincethen,theworkshophasgrownintoa

Fig.1 FiveofthesevenfoundersoftheZHAWDatalabinoneoftheir firstboardmeetings,with twooftheeditors(K.S.andT.S.)inthebackrowandthethird(M.B.)takingthepicture.Thebottom rowshowsGeroldBaudinot(left),AndreasRuckstuhlandOliverDürr(right),whileMark Cieliebakismissing(picturecourtesyofT.S.)

5 WhileasearchconductedonLinkedInfortheterms “datascientistswitzerland” returnsmorethan 1500hitsasofearly2018,in2013itfoundonlytwopersons(thiscreditgoestoVioletaVogelof PostFinance,andDanielFaselthenofSwisscom: https://www.linkedin.com/in/violeta-vogel3a556527/, https://www.linkedin.com/in/danielfasel/ ).

Fig.2 ImpressionsfromSDS|2014,the firstSwissWorkshoponDataScience:MichaelNatusch (left)delivershisinsightintothecorevaluesofbigdatainfrontofpartsoftheaudience(right; picturescourtesyofT.S.)

seriesofconferencesthatattractsamajorityoftheSwissdatasciencecommunity. Thegrowinginterestindatascienceresultedinasignificantincreaseofapplied researchprojectsthatwereinitiatedbythemembersofDatalab.Reflectingonthe ever-growingnumberofpeopleidentifyingthemselvesasdatascientistsandprojects beingdescribedasdatascienceprojectsledustoidentifyanadditionalneed.

WhyThisBookIsRelevant

Whiledatasciencebuildsonfoundationsfromotherdisciplines,itisinherentlyan interdisciplinaryandappliedendeavor.Thegoalofdatascienceisnotonlytowork inoneofitsconstitutingsub-disciplinesperse(e.g.,machinelearningorinformation systems),buttoapplysuchmethodsandprinciplestobuilddataproductsforspeci fic usescasesthatgeneratevaluefromdata.Whileveryvaluabletextbooksexistonthe individualsubdisciplines,6 thedatascienceliteratureismissingavolumethat acknowledgestheappliedsciencecontextofdatasciencebysystematicallyshowing theconnectionbetweencertainprinciplesandmethods,ontheoneend,andtheir applicationinspecificusecases,ontheother.Oneofthemajorgoalsofthisbookis toprovidethereaderwithrelevantlessonslearnedfromapplieddatascienceprojects attheintersectionofacademiaandindustry.

HowtoReadtheBook

Thisbookisorganizedintothreeparts:PartIpaystributetotheinterdisciplinary natureofdatascienceandprovidesacommonunderstandingofdatascience terminologyforreaderswithdifferentbackgrounds.Thebookisnotareplacement forclassicaltextbooks(i.e.,itdoesnotelaborateonfundamentalsofcertainmethods

6 Seeforexample http://www.learndatasci.com/free-data-science-books/

andprinciplesdescribedelsewhere),butdefinesapplieddatascience,theworkofa datascientist,andtheresultsofdatascience,namely,dataproducts.Additionally, PartIshedslightonoverarchingtopicssuchaslegalaspectsandsocietalrisks throughwidelyapplieddatascience.Thesechaptersaregearedtowarddrawinga consistentpictureofdatascienceandarepredominantlywrittenbytheeditors themselves.Werecommendthereadertoworkthroughthe firstfourchaptersin order.

PartIIbroadensthespectrumbypresentingviewsandinsightsfromdiverse authors somefromacademia,somefromindustry,somefromSwitzerland,some fromabroad.Thesechaptersdescribeafundamentalprinciple,method,ortoolin datasciencebymeansofanalyzingspeci ficusecasesanddrawingconcretelessons learnedfromthem.Thepresentedcasestudiesaswellastheappliedmethodsand toolsrepresentthenutsandboltsofdatascience.ThechaptersinPartIIcanberead inanyorder,andthereaderisinvitedtofocusonindividualchaptersofinterest.

PartIIIisagainwrittenfromtheperspectiveoftheeditorsandsummarizesthe lessonslearnedofPartII.Thechaptercanbeviewedasametastudyindatascience acrossabroadrangeofdomains,viewpointsand fields.Moreover,thechapter providesanswerstothefollowingquestion:Whatarethemissioncriticalfactors forsuccessindifferentdatascienceundertakings?PartIIIiswritteninaconciseway tobeeasilyaccessibleevenwithouthavingreadallthedetailsofthecasestudies describedinPartII.

WhoShouldReadtheBook

Whilewritingandeditingthebook,wehadthefollowingreadersinmind: first, practicingdatascientistsinindustryandacademiawhowanttobroadentheirscope andenlargetheirknowledgebyassimilatingthecombinedexperienceoftheauthors. Second,decision-makersinbusinessesthatfacethechallengeofcreatingor implementingadata-drivenstrategyandwhowanttolearnfromsuccessstories. Third,studentsofdatasciencewhowanttounderstandboththetheoreticaland practicalaspectsofdatasciencevettedbyrealcasestudiesattheintersectionof academiaandindustry.

ThankYou

Wethankyou,thereader,fortakingthetimetolearnfromthecollectedinsights describedinthisbook.Weaseditorsareuniversitylecturersandresearchersinour primaryjob;itisanimmensepleasureandhonorforustobeabletoconveyour insights.Wearealsoverygratefulforthetrustandpatiencewereceivedfromour publisher,Springer,specificallyimpersonatedbyRalfGerstner.Wewanttothank ourcoauthorsthatcontributedexcellentworkthatisfundamentalformakingthis

bookasuccess.Finally,wethankourstudents,colleagues,andpartnersfromthe Datalab,theMasterofAdvancedStudiesinDataScienceProgram,andtheSwiss AllianceforData-IntensiveServicesforprovidingtheenvironmentinwhichthis bookproject(andsomeofthereportedusecases)could flourish.

Specifically,I(MartinBraschler)thankmyco-editorsforconsistentlyengaging andstimulatingdiscussions,VivienPetrasandtheteamoftheBerlinSchoolof LibraryandInformationScienceattheHumboldt-UniversitätzuBerlinforhosting meduringpartoftheperiodIworkedonthisbook,mycolleaguesthatIhave collaboratedwithinpastprojectsandwhohavethusinformedmyunderstandingof datasciencetopics,andlastbutnotleastmyfamily,whoprovidesformethemuch neededbalancetolifeasauniversityteacherandresearcher.

I(ThiloStadelmann)thankmyco-editorsandMichaelBrodieforhelpfuldiscussionsandvaluablelessonsincollaboration.Thankyouforyourpatienceand collegiality.Ilearnedalot.ThanksgotoGeriBaudinotforenablingtheZHAW Datalabandfurtherdevelopmentsbyhisvision,patronage,andmentorship.My final “thank-you” isbestexpressedwithaquoteadaptedfromReubenMorgan: “Freely yougaveitalltome... greatisthelove,pouredoutforall,thisismygod.”

I(KurtStockinger)thankmywifeCinthiaandmytwolittlekidsLuanaandLino fortheabilitytoworkonthebookduringcalmeveninghours afterhavingchanged diapersandreadseveralgoodnightstoriesthatdidnotcontaindatasciencetopics.

Winterthur,SwitzerlandMartinBraschler ThiloStadelmann KurtStockinger Spring2019

PartIFoundations

1IntroductiontoAppliedDataScience .....................3 ThiloStadelmann,MartinBraschler,andKurtStockinger

2DataScience ........................................17 MartinBraschler,ThiloStadelmann,andKurtStockinger

3DataScientists .......................................31 ThiloStadelmann,KurtStockinger,GundulaHeinatzBürki, andMartinBraschler

4DataProducts .......................................47 JürgMeierhofer,ThiloStadelmann,andMarkCieliebak

5LegalAspectsofAppliedDataScience .....................63 MichaelWidmerandStefanHegy

6RisksandSideEffectsofDataScienceandDataTechnology ....79 ClemensH.Cap

PartIIUseCases

7Organization ........................................99 MartinBraschler,ThiloStadelmann,andKurtStockinger

8WhatIsDataScience? .................................101 MichaelL.Brodie

9OnDevelopingDataScience

MichaelL.Brodie

10TheEthicsofBigDataApplicationsintheConsumerSector ....161 MarkusChristen,HeleneBlumer,ChristianHauser, andMarkusHuppenbauer

11StatisticalModelling ..................................181

MarcelDettlingandAndreasRuckstuhl

12BeyondImageNet:DeepLearninginIndustrialPractice .......205 ThiloStadelmann,VasilyTolkachev,BeateSick,JanStampfli, andOliverDürr

13TheBeautyofSmallData:AnInformationRetrieval Perspective ..........................................233 MartinBraschler

14NarrativeVisualizationofOpenData .....................251 PhilippAckermannandKurtStockinger

15SecurityofDataScienceandDataScienceforSecurity ........265 BernhardTellenbach,MarcRennhard,andRemoSchweizer

16OnlineAnomalyDetectionoverBigDataStreams ............289 LauraRettig,MouradKhayati,PhilippeCudré-Mauroux, andMichał Piorkówski

17UnsupervisedLearningandSimulationforComplexity ManagementinBusinessOperations ......................313 LukasHollenstein,LukasLichtensteiger,ThiloStadelmann, MohammadrezaAmirian,LukasBudde,JürgMeierhofer, RudolfM.Füchslin,andThomasFriedli

18DataWarehousingandExploratoryAnalysisforMarket Monitoring ..........................................333 MelanieGeigerandKurtStockinger

19MiningPerson-CentricDatasetsforInsight,Prediction,andPublic HealthPlanning ......................................353 JonathanP.LeidigandGregWolffe

20EconomicMeasuresofForecastAccuracyforDemandPlanning: ACase-BasedDiscussion ...............................371 ThomasOtt,StefanGlüge,RichardBödi,andPeterKauf

21Large-ScaleData-DrivenFinancialRiskAssessment ..........387 WolfgangBreymann,NilsBundi,JonasHeitz,JohannesMicheler, andKurtStockinger

22GovernanceandITArchitecture .........................409 SergeBignens,MuratSariyar,andErnstHafen

23ImageAnalysisatScaleforFindingtheLinksBetweenStructure andBiology .........................................425 KevinMader

PartIIILessonsLearnedandOutlook

24LessonsLearnedfromChallengingDataScienceCaseStudies ...447

KurtStockinger,MartinBraschler,andThiloStadelmann

Chapter1

IntroductiontoAppliedDataScience

ThiloStadelmann,MartinBraschler,andKurtStockinger

Abstract Whatisdatascience?Attemptstodefineitcanbemadeinone (prolonged)sentence,whileitmaytakeawholebooktodemonstratethemeaning ofthisdefinition.Thisbookintroducesdatascienceinanappliedsetting,by first givingacoherentoverviewofthebackgroundinPartI,andthenpresentingthenuts andboltsofthedisciplinebymeansofdiverseusecasesinPartII; finally,speci fic andinsightfullessonslearnedaredistilledinPartIII.Thischapterintroducesthe bookandprovidesananswertothefollowingquestions:Whatisdatascience? Wheredoesitcomefrom?Whatareitsconnectionstobigdataandothermega trends?Weclaimthatmultidisciplinaryrootsandafocusoncreatingvalueleadtoa disciplineinthemakingthatisinherentlyaninterdisciplinary,appliedscience.

1AppliedDataScience

Itwouldseemreasonabletoassumethatmanyreadersofthisbookhave firstreally takennoticeoftheideaof “datascience” after2014.Indeed,whilealreadyused sparinglyandwithdifferentmeaningsforalongtime,widespreaduseoftheterm “datascience” datesbacktoonly2012orthereabouts(seeSect. 2).Ofcourse,the “substance” ofthe fieldofdatascienceisverymucholderandgoesbymanynames. Toattesttothisfact,theinstituteatwhichtheeditorsofthisbookarelocatedhas givenitselfthemissionto “buildsmartinformationsystems” alreadybackin2005. Andthemain fieldsofworkoftherespectiveeditors(InformationRetrieval, InformationSystems/DataWarehousing,andArtificialIntelligence/MachineLearning)allhavetraditionsthatspanbackfordecades.Still,afundamentalshifthasbeen underwaysince2012.

T.Stadelmann(*)·M.Braschler·K.Stockinger

ZHAWZurichUniversityofAppliedSciences,Winterthur,Switzerland

e-mail: stdm@zhaw.ch

© SpringerNatureSwitzerlandAG2019

M.Braschleretal.(eds.), AppliedDataScience, https://doi.org/10.1007/978-3-030-11821-1_1

Thischaptertracesthisfundamentalshiftbygivingahistoricalaccountofthe variousrootsofdatascience.1 However,whatdoweunderstandbythetermdata science?Asforthisbook,weadoptadefinitionthatatteststothebreadthandhistory ofthe field,isabletodiscriminateitfrompredecessorparadigms,andemphasizesits connectiontopracticebyhavingaclearpurpose:

Datasciencereferstoauniqueblendofprinciplesandmethodsfromanalytics, engineering,entrepreneurshipandcommunicationthataimatgeneratingvalue fromthedataitself.

Theseprinciplesandmethodsarediverse(e.g.,spanningdisciplinesfromITto legalstudies)andareappliedtoallkindsofdata(fromrelationaltomultimedia)to explicitlyachieveaspeci ficend:addedvalue.Thismakesdatascienceinherentlyan interdisciplinaryandappliedscienceandconnectsthetermcloselywiththedefinitionsofa dataproduct (anexploitableinsightderivedfromthecollectedfacts)and the datascientist (theonecarryingoutdatascienceendeavors).Allthreetermswill bemorethoroughlytreated,rooted,anddiscussedinChaps. 2–4

2TheHistoryofDataScience

Thissectionintendstogiveaconciseanswertotwoquestions:whatistheconnectionbetweendata science andbusiness,especiallyinthepresenceofamassive mediahype?Andwhatfueledtheavailabilityof(andtrustin)large-scaledata analysis?Amorecompleteoverviewofthemostinfluentialpublicationsleading todatascienceasweknowitisgivenbyPress(2013).

2.1DataScience,Business,andHype

Theunderstandingofdatascienceasthe fieldconcernedwithallaspectsofmaking senseofdatagoesbacktodiscussionsinthescientificcommunitythatstartedwith Tukey(1962)2 andwheresummarizedbyCleveland(2001)inrequiringanindependentscienti ficdisciplineinextensiontothetechnicalareasofthe fieldof statistics.Notablementionsgotothefoundationofthe fieldof “knowledgediscoveryindatabases” (KDD)(Fayyadetal. 1996)aftertheKDDworkshopin1989,3 the firstmentioningof “datascience” inthetitleofascienti ficconferencein1996

1 Basedonupdated,translated,andconsiderablyextendedversionsof(StockingerandStadelmann 2014;Stockingeretal. 2016).

2 AboutthesametimeasTukeyused “datascience” inreferencetostatistics,PeterNaurinSweden usedtheterm(interchangeablywith “datalogy”)torefertocomputerscience(Sveinsdottirand Frøkjær 1988).

3 See https://www.kdnuggets.com/meetings/kdd89/index.html .Since1995,theterm “datamining” hasrisentoprominence: http://www.aaai.org/Conferences/KDD/kdd95.php

(Hayashietal. 1996),andLeoBreiman’s(2001)famouscalltounitestatisticaland computationalapproachestomodelingdata.Theseeventsleadtothefoundationof the firstscientificdatasciencejournals4 in2002andthe firstdatascienceresearch centersin2007.5

However,widespreadrecognitionbeyondascienti ficcommunity,includingthe dynamicsweseetoday,onlystartedaftercertaincontributionsfrombusiness:Hal VariantellstheMcKinseyQuarterlyin2009thatthe “sexyjobofthenext10years willbestatisticians” (Manyika 2009).Thisviewbroadensbeyondstatisticsafterthe introductionoftheterm “datascientist” byPatilandHammerbacherin2008during theircollaborationatLinkedInandFacebook(Patil 2011).Bothfelttheneedfora newjobdescriptionfortheirteammembersthat,ontheonehand,gotdeep engineeringknow-howand,ontheotherhand,weredirectlyshapingtheeconomic valueofthecompany’scoreproducts: “thosewhousebothdataandscienceto createsomethingnew.” Earlier,DavenportandHarris(2007)andothershadpreparedthewayforanacceptanceofthoseterms(Smith 2011)byinfluentialpopular scientificbooksthatcontinuedtoaccompanythedevelopmentofdatascience (Siegel 2013;Domingos 2015).

Thetwoconcepts the fieldofdatascienceaswellasthejobdescriptionofadata scientist intheirnowpopularform(Loukides 2010)togetherwiththeirfameperse thusultimatelyresultedfromaneedanddevelopmentwithinbusinesses6 (Patil 2011).Thescientificdiscussion,onceinaleadingrole,haddifficultytokeepup withthedynamicsof2010–2015andfollowedwithsomedelay(Provostand Fawcett 2013;Stadelmannetal. 2013).Itiscurrentlyacceleratingagain(seeBrodie (2015b)andhischapterslaterinthisbook).

Omnipresent,however,sincetheadoptionofthetopicinmassmediahasbeena hype[seesomeofitsexpressions,e.g.,inHumby(2006)orDavenportandPatil (2012)]strongenoughtoprovokeskepticismeveninbenevolentexperts.While hypecanleadtounreflectedandhencebaddecisionsonalllevels(fromjobchoiceto entrepreneurialandlegislativeagendasetting),itshouldnotcloudtheviewonthe realpotentialandchallengesofdatascience:

• Economicpotential :theMcKinseyGlobalInstituteestimatesthenetworthofthe opendatamarketalonetobethreetrilliondollars(Chuietal. 2014).Arecent updateexplainsthatthispotentialisnotrealizedyet,andcertainlynotoverhyped

4 See,e.g., http://www.codata.org/publications/data-science-journal (inaugurated2002,relaunched 2015)and http://www.jds-online.com/ (since2003).

5 See,e.g., http://datascience.fudan.edu.cn/ (undertheterm “DataologyandDataScience”).

6 Thisanchoringofthemodernunderstandingofdatasciencemoreinbusinessthaninacademiais themainreasonformanyofthereferencesinthisworkpointingtoblogpostsandnewspaper articlesinsteadofscientificjournalsandconferencepapers.Itreflectscurrentrealitywhilenot makingthepointthatacademiaissubordinate.Datascienceasa fieldandbusinesssectorisinneed ofthearranging,normativeworkofacademiainordertoestablishsolidmethodicalfoundations, codesofconduct,etc.Thisbookismeantasabridgebuilderinthisrespect.

(Henkeetal. 2016).Earlier,Manyikaetal.(2011)estimatedatotalshortcoming of1,90,000newdatascientists.

• Societalimpact:dataanalyticsaffectsmedicalcare(Parekh 2015),political opinionmaking(Harding 2017;alsoKrogerusandGrassegger 2016 andthe aftershocksoftheUSpresidentialelection2016withregardstotheinvolvement ofthecompanyCambridgeAnalytica),andpersonalliberty(Lietal. 2015; seealsoChap. 6 onrisksandsideeffects).

• Scientificinfluence:data-intensiveanalysisasthefourthparadigmofscienti fic discoverypromisesbreakthroughsindisciplinesfromphysicstolifesciences (Heyetal. 2009;seealsoChap. 8 “ondevelopingdatascience”).

Hypemerelyexclaimsthat “dataisthenewoil!” andjumpstopremature conclusions.Theoriginalquotecontinuestobemoresensible: “[ ]ifunrefined, itcannotreallybeused.Ithastobechanged[ ]tocreateavaluableentitythat drivesprofitableactivity” (Humby 2006).Thisalreadyhintsatthenecessityofthe preciseandresponsibleworkofadatascientist,guidedbyabodyofsoundprinciples andmethodsmaintainedwithinascientificdiscipline.However,howdidindividual voicesof “bigdataevangelists” growintoacommonunderstandingofthepowerand usefulnessoftheresourceofdatabymeansofanalytics?

2.2DifferentWavesofBigData

Datasciencehasprofoundrootsinthehistoryofdifferentacademicdisciplinesas wellasinscienceitself(seealsothedetaileddiscussioninthenextchapter).The surgeoflarge-scalescienceinthesecondhalfofthetwentiethcentury,typifiedby facilitieslikeCERN7 ortheHubbleSpaceTelescope,8 isthedirectenablerofdata scienceasaparadigmofscientificdiscoverybasedondata.Thesefacilitieshave arguablyenabledthe firstwave ofbigdata:asingleexperimentatCERN,for example,wouldgeneratehundredsofterabytesofdatainjustonesecond,ifnot forahardware filterthatwoulddoapreselectionofwhattorecord.

Consequently,speci ficprojectslikeRD45(Shiers 1998)wherelaunchedalready inthe1990stomanagethesehighvolumesofdatabeforeanycommercialdatabase managementsystemwasabletohostpetabytes(Düllmann 1999).9 Thisrisein scientificdatavolumeswasnotjustduetotechnicalabilitybutduetoachangeof paradigm(Heyetal. 2009):The firstparadigmofsciencebasicallywastoperform theoreticalstudies;thesecondparadigmaddedempiricism:theexperimental

7 See https://home.cern/ (thewebsiteoftheweb’sbirthplace).

8 See http://hubblesite.org/

9 Additionally,unlikewithrelationaldatabasesinindustryatthattime,thetypesofdatatobestored forscientificexperimentsfrequentlycomprisednumericaldata(suchastemperature,velocity,or collisioncountsforparticles),oftenstoredinobject-orienteddatabasesystemsorimages(e.g.,from starsorgalaxies),bothathighervolumesandspeed. 6T.Stadelmannetal.

Fig.1.1 Examplesoftheamountofdatacreatedeveryminutepubliclyontheweb,asof September2018andcomparedtomid-2017.Adaptedfrom:Domo(2017, 2018)

evaluationoftheoreticalhypotheses.Becauseofthecomplexityandexpensiveness oflarge-scalescienti ficexperimentslikeatCERN,computersimulationsemergedas thethirdparadigmofscientificdiscovery(calledcomputationalscience).Now,the fourthparadigmisdata-intensivescience:evaluating,foranygivenexperiment, all thefacts(i.e.,thecompletedataset,notjustsub-samplesandhand-engineered features),combiningthemto allpossible probabilistichypotheses(seealsoBrodie’s chapteron “whatisdatascience” later).

Followinglarge-scalescience,the secondwave ofbigdatawastriggeredby internetcompanies10 likeGoogle,Yahoo,orAmazonatthebeginningofthetwentyfirstcentury.Incontrasttoscientificdata,webcompaniesoriginallyfocusedon managingtextdata;thecontinuingdataexplosion(seeFig. 1.1)isstillfueledby additionallyindexingmoreandmoreimagesandvideos.Socialmediacompanies suchasFacebookandLinkedIngaveindividuals insteadoflarge-scalescienti fic facilities theabilitytocontributetothegrowthofdata;thisisregardedasthe third wave ofthedatatsunami.Finally,the fourthwave iscurrentlyrollingupbasedonthe riseofmachine-generateddata,suchaslog-filesandsensordataontheInternetof things.

10 Allofthefollowingthreeexamplecompanieshavetransformedthemselvesconsiderablysince thetimesofthesecondwave(see https://abc.xyz/ and https://www.oath.com/ forGoogleand Yahoo,respectively; https://www.amazon.com/ stilllooksfamiliar,butcompare http://www. visualcapitalist.com/jeff-bezos-empire-chart/ ).

Fig.1.2 Snapshotfromthepreparationsofabusinessroadshowinillustrationofthehopesand dreamsconnectedwiththeterm “bigdata” asusedbythepublicpressaround2013(picture courtesyofT.S.).Thehopesanddreamshavebeenseamlesslytransferredtootherwordingasof thewritingofthisbook.Thisisinstarkcontrasttothecontinuousscholarlyworkonbigdata discussed,e.g.,byValarezoetal.(2016)andthescientificcommunitythatadoptedthesamename (see,e.g., https://journalofbigdata.springeropen.com/ )

3DataScienceandGlobalMegaTrends

Thescientificandcommercialdevelopmentofdatasciencehasbeenaccompanied byconsiderablebuzzinthepublicpress.Inthissection,wereviewthecontemporary trendsofbigdata,AI,anddigitalization,respectively,andputthetermsintothe contextoftheprofessionaldiscussion.Ourgoalistodisentanglethemeaningofthe termsashypewordsfromtheirscientificdefinitionbyshowingdiscrepanciesin publicunderstandingfromwhatexpertsrefertowhenusinglargelyoverlapping vocabulary,thuscontributingtoasuccessfuldialog(Fig. 1.2).

3.1BigData

In2013–2014, “bigdata” wasthefavoritebuzzwordinbusiness:thenewoil (McAfeeetal. 2012)oftheeconomy.Italludedexclusivelytothetechnicalorigins oftheterm,namely,Laney’s(2001) “3Vs” (variety,velocity,andvolume)as

attributesofthegrowing flood11 ofdata:theamount,thenumberofsources,andthe speedatwhichnewdataarrivesisverylarge,thatis, “big” (Soubra 2012).Itisthis technicaldefinitionthatisalsoeponymousofthescientificsub-disciplineofinformationsystemsresearchthatencompassesthedevelopmentofdatabasemanagementsystemsatscale.12 Datascience,onthecontrary,isfarfromfocusing exclusivelyon “big” inthesenseof “large” data:whilelargeitselfisalwaysa relativetermascomparedtothecomputationalresourcesoftheday,13 datascienceis concernedwithgeneratingvaluefrom allkindsof data(seeBraschler ’slaterchapter on “smalldata”).

Thereisadifferent,moreeconomicalthantechnologicalconnotationtothepublic discussiononbigdatathatconveyssomemeaningforthedatascientist:itisbest seeninahistoricversionoftheWikipediaarticleonbigdatafrom2014.14 Inits “See also” section,theterm “bigdata” isbroughtintorelationshipwithtermslike “big oil,”“bigtobacco,”“bigmedia,” etc.Theconnotationisasfollows:atleastasmuch asfromthedescriptionofthephenomenonofincreasedvariety/velocity/volume,the termbigdatamightstemfromawholeeconomy’shopeofhavingfoundthenewoil (Humby 2006),ofgettingnewbusinessopportunities,andoflaunchingthe “nextbig thing” aftertheInternetandmobilerevolution.15 Thisexplainswhythetermhas beenhypedalotinbusinessforseveralyears.Additionally,thisalsoexpressesthe fearofindividualsbeingusheredintothehandsofa “bigbrother,” justasitis expressedasapresentrealityintheother “big*” termsfromabove.

Theterm “bigdata” uptoherethuscontributesatwo-foldmeaningtothe professionaldiscussionondatascience: first, technologically,itgivesadescription ofthegrowingstateofdata(andassuchisascientificsub-disciplineofresearchin databases,informationsystems,anddistributedsystems).Second, economically,it expressesahopeforbusinessopportunitiesandvoicesasubtleconcernwithrespect totheattacheddangersofthisbusiness.Bothdimensionsareworthytobeexplored andhavetoberesearched.Thegreatestpotentialoftheterm,however,mayliein pointingtothefollowing social phenomenon16:

11 InavariationofNaisbittandCracknell’s(1984)famousquoteonmegatrends,EricBrown(2014) said: “Today,wearedrowningindataandstarvedforinformation.”

12 Thetopleagueofinternationaldatabaseresearchersmeetsundertheumbrellaof “verylargedata bases” (http://www.vldb.org/)since1992.

13 See,e.g.,theseminalbookbyWittenetal.(1999)on “managinggigabytes” thatwasallegedly influentialinbuildingGooglebutwouldnotqualifyasdiscussing “big” acoupleofyearslater. Similarly,thetestcollectionatthe firstTRECconference,at2gigabytesofsize,poseda considerablechallengetotheparticipantsin1992(HarmanandVoorhees 2006).

14 Thefollowingdiscussionisbasedon https://en.wikipedia.org/wiki/Big_data asofMay1,2014.It isaccessibleviaWikipedia’shistorybutton.

15 DanArielyexpressedthisinaFacebookpostgoneviralonJanuary6,2013: “Bigdataislike teenagesex:everyonetalksaboutit,nobodyreallyknowshowtodoit,everyonethinkseverybody elseisdoingit,soeverybodyclaimstheyaredoingit... ” (see http://t.co/tREI1mRQ).

16 Thisthoughtwas firstformulatedbyMichaelNatuschinhisKeynoteatSDS|2014,the1stSwiss ConferenceonDataScience(seealsoFig. 1.1 intheprefacetothisbook): https://www.zhaw.ch/en/ research/inter-school-cooperation/datalab-the-zhaw-data-science-laboratory/sds2014/michaelnatusch/

Table1.1 AIhypeatitsworst.Themetricsofthe “RocketAIlaunchparty” prankatNIPS2016 (Tez 2016)

RSVPstoparty316

CVssentviaemailinadvance46

Well-knowninvestorsthatgotintouchto fund 5

Planningtime <8h

Moneyspent$79fordomain,$417foralcohol,snacksandpolice fine

EstimatedvalueofRocketAI$O(107)

People(andorganizations)havechangedtheirmindsetinthelastdecade.Datais nowregardedasbeingavailable(cheapifnotforfree)forvirtuallyanyaspectofthe world,meaningthatwecanhavefactsforpotentiallyanyphenomenonontheplanet. Additionally,wehavethetechnologyreadytoautomaticallymakeuseofthesefacts viatheprinciplesandmethodsofdatascience,foralmostallexistingbusiness processes.Thisenablesoptimized(i.e.,fact-based)decisions,whichhaveameasurablevalueindependentofthedatahavingpropertiesofupto n Vs(Vorhies 2014). Thissocialvalueof “bigdata” thusisthis:itrefersto abigchangeinthinkingabout thepossibilitiesofdata-drivenautomateddecisionmaking.

3.2Arti

ficialIntelligence

Theterm “bigdata” waslargelyforsakenbythepublicpressaftercirca2yearsof constantuse(White 2015),butitdidnotleaveavacuum:unforeseenbreakthroughs indeeplearningtechnologyasof2012endedthelastAIwinter 17 around2015(see alsoStadelmannetal.’slaterchapteron “deeplearninginindustrialpractice”)and directlyturneditintothenext “AI” hype.Thisunreasonablecycleofpopularitycan betracedintheopen,too,forexample,Simardetal.(2003)displaytheAIwinterof the2000swiththefollowingquote: “[ ]itwasevenpointedoutbytheorganizers oftheNeuralInformationProcessingSystem(NIPS)conferencethattheterm ‘neuralnetworks ’ inthesubmissiontitlewasnegativelycorrelatedwithacceptance.” Ontheotherhand,theRocketAIstory(Tez 2016)illustratesthepeakofthehype:at theNIPSconferenceof2016,expectationsinneuralnetworkswhereagainsohigh thatthejokeoftwoPhDstudentsofa “launchparty” forafake,fancyAIstart-up attractedlargeunsolicitedfunding,applications,andattendeeswithminimumeffort withinaday(seeTable 1.1).

AIinthepublicpressasof2018mainlyreferstotheexpectationto “dowith computersanythingthatahumancoulddo andmore.” Itoftenascribeshuman-like propertiestoAIsystemsasreflectedinlargerpartsofthediscussionrevolving

17 See https://en.wikipedia.org/wiki/AI_winter

aroundtermslikerobots(Kovach 2017),digitalassistants(Kremp 2018),selfdrivingcars(Roberts 2018),chatbots(SpoutSocial 2018),andneuralnetworksas digitalbrains(Gruber 2017).Whatcontributesto(ifnotevencauses)thehigh,even inflated,expectationsistheuseoftermsoriginallycoinedforintelligentliving beings(“intelligence, ”“learning,”“cognitive,”“social”).Everybodyhasanintuitive understandingofwhat “intelligence” meansinahumancontextandsubconsciously ascribessaidpropertiestothetechnicalsystem.

Thescientificcommunityisnotinnocentofthisdilemma,evenifittriestoclarify things(Brooks 2017):inprivatecommunication,18 oneofthefathersofAIregretted coiningtheterm “artificialintelligence” attheDartmouthworkshopin1956exactly fortheoutgrowthsdescribedabove,mentioningthatitwouldhavebeenwiser(but maybelesssuccessful)tohavegonewiththesecondproposednameforthe field “complexcomputerapplications.” Itisexactlythisthatdefinesthescienti ficdisciplineofAItoday(RussellandNorvig 2010):acollectionofdiversetechniques,from efficientsearchalgorithmstologictovariousshadesofmachinelearning,tosolve tasksofeverydaylifethatusuallycanonlybesolvedbyhumans,inanattemptthat mightlookintelligent fromtheoutside.Assuch,the fieldofAIisnotconcernedwith researchingintelligencepersenorinreproducingit;butitdeliverspracticalsolutionstoproblems,forexample,inbusinessformanydecades(Hayes-Rothetal. 1983),evenwithdeeplearning(LeCunetal. 1998).

3.3Digitalization

Differenttechnologicalandindustry-speci fictrends19 additionallygetsummarized undertheunifyingterm “digitalization”20 inthepublicdiscourse.Theaddedvalueof thistermpersecanreasonablybequestioned:thingsarguablybecamedigital digitized sincetheITrevolutionofbusinessesandsocietiesinthelastcentury.The modernuseextendsthismegatrendbyemphasizingincreasedinterconnectedness (socialnetworks)andautomation.Thistrendisspecificallyenabledbydatascience, basedontheavailabilityofdigitaldata(“bigdata” inthesocialsenseabove)and analyticstechnologies(“AI”).Itspansalmostallindustryandsocietalbranches,and hencethediscussionnotonlyinvolvesdatascienceprofessionals technicalpeople butalsosociologists,politicians,etc.,withvaluablecontributionstothephenomenonatlarge.

Themissingselectivityofthepublicuseof “digitalization” andthe abovementioned “buzz” wordscreateaproblem:expertsandlaypeoplespeakin

18 ThestatementwasorallywitnessedatanAIplanningconferenceinthe1990sbyacolleaguewho wishestoremainanonymous.

19 ComparetermslikeFinTech(Dappetal. 2014),MedTech(MedTechEurope 2018),EdTech,etc., (Mayer 2016)aswellasIndustrie4.0(Kagermannetal. 2011).

20 Not “digitization”—comparethearticlebyClerck(2017).

thesametermsbutmeandifferentthings.Thenew “AIalgorithm” insidea company’sproductispotentiallymorestatisticsthanAI,speakingintechnical terms;thejustpurchased “bigdataplatform ” mightlikelyrefertoananalyticstool notspeci ficallydesignedtohandlelargedata(aswouldbethecaseifcalledsuchbya bigdataresearcher);anddigitalizationchangesoureducation,butlikelynotpredominantlyinthesensethatwenowhavetoreplacehumanteachers,butbyteaching studentsskillsinhandlingadigitalizedsociety(includingskillsinhandlingdigital mediaandbasicunderstandingsofdatasciencetechnology)(Zierer 2017).

Themissingselectivityintheuseoftermscannotberemovedfromthediscourse. 21 Itisthusimportantfordataprofessionals datascientists tounderstand whatexpertsandlaypeoplemeanandhearwhenspeakingofsuchterms,inorderto anticipatemisunderstandingsandconfrontunreasonableexpectations.

4Outlook

Whatisthefutureofdatascience?Datascienceasadisciplineofstudyisstill inits infancy (Brodie 2015a),andtheprinciplesandmethodsdevelopedinitsunderlying disciplineshavetobefurtheredinordertoadapttothephenomenonwecalledbig dataintheprevioussection.Thismaturingofdatasciencewillbeaddressedintwo latercompanionchaptersbyMichaelBrodieinPartIIofthebook.

Fromabusinessperspective,datasciencewillcontinuetodelivervaluetomost industries22 byintroducingpossibilitiesforautomationofrepetitivetasks.23 Arecent overviewofsuccessfuldata-driveninnovationsinSwitzerland,presentedatthe first “KonferenzDigitaleSchweiz,” showedtheoverallpotentialbydemonstratingthat theinnovationdepthincurrentdatascienceprojectsissurprisinglylow(Swiss AllianceforData-IntensiveServices 2017):onethirdofbusinessinnovationswas achievedbydeployingtechnologyandprocessesthathavebeenwell-knownfor decades;anotherthirdwasachievedbyconsultingcompaniesonrecentinnovations indata-drivenbusinessmodelsandtechnologies;andforonlyonethird,applied

21 Someexpertssuggesttouseallthediscussedtermssynonymouslyforthesakeofsimplicity,e.g., Brodieinhislaterchapteron “developingdatascience” speaksof “AI/datascience”.Whilethis mightbeappropriateincertainsituations,maintainingproperattributioncertainlyhelpsinother situationsbymaintainingconciseandeffectivecommunication.Usingpreciseterminologyprevents inflatedexpectations,describestrueexpertise,andgivesguidanceinwhereto findit(e.g.,inwhat discipline).

22 FrançoisBancilhonputitfranklyinhisECSS2013keynote: “mostindustrieswillbedisrupted” (see http://www.informatics-europe.org/ecss/about/past-summits/ecss-2013/keynote-speakers. html).

23 SeeBrooks(2017)foracounterargumentonthehopes(orfears)thattoomanyjobscouldbe automatedinanearerfuture.ButasMeltzer(2014)pointsout,repetitivetaskseveninjobs consideredhigh-profile(e.g.,medicaldiagnosisorlegaladvice)couldbeautomatedquitewell: automationpotentialliesinrepetitivenessperse,notthedifficultyoftherepetitivetask.

researchprojectsfosteredthefoundationforthebusinessinnovation.PartIIofthis bookreportsonnumerouscasestudiesemergingfromthatlatterthird.

Whilethebenefittobusinessesisfairlyobviousandeasilymeasurableintermsof profit,theeffectofdatascienceonoursocietiesismuchlesswellunderstood.Recent reportswarnaboutpotentialblindspotsinourcoretechnologies(RahimiandRecht 2017)andgoasfarassuggestingtotreatAItechnologysimilartonuclearweapons inlimitingaccesstoresearchresults(Brundageetal. 2018).Therecentemergenceof theword “techlash” mightindicatesociety’s firstlarge-scaleadversereactiononthe dawnofdigitalization(Kuhn 2018).ClemensCapexploressuchissuesinhischapter towardstheendofPartIofthisbook,whileWidmerandHegyshedsomelighton thelegalspaceinwhichadatascientistoperates.

Thenextthreechapterswillcontinuedefiningwhatdatascience,adatascientist, andadataproductis,respectively.Asstatedinthepreface,theyarebestreadin ordertogetacoherentpictureoftheframeforthisbook.Theremainingchapterscan beapproachedinanyorderandaccordingtopersonalinterestorprojectneed.A concisesummaryofalllessonslearnedwillbepresentedinPartIII.Weintendthis parttoformbestpracticesforapplyingdatasciencethatyouwillfrequentlyreferto asyoustartyourownprofessionaldatasciencejourney.

References

Breiman,L.(2001).Statisticalmodeling:Thetwocultures(withcommentsandarejoinderbythe author). StatisticalScience,16(3),199–231.

Brodie,M.L.(2015a). Theemergingdisciplineofdatascience.Keynoteatthe2ndSwiss WorkshoponDataScienceSDS|2015.AvailableMay3,2018,from https://www.youtube. com/watch?v¼z93X2k9RVqg

Brodie,M.L.(2015b). Doubtandverify:Datasciencepowertools.AvailableMarch23,2018, from http://www.kdnuggets.com/2015/07/doubt-verify-data-science-power-tools.html Brooks,R.(2017).ThesevendeadlysinsofAIpredictions. MITTechnologyReview. Available March28,2018,from https://www.technologyreview.com/s/609048/the-seven-deadly-sins-ofai-predictions/ Brown,E.D.(2014). Drowningindata,starvedforinformation.AvailableMarch27,2018,from http://ericbrown.com/drowning-in-data-starved-for-information.htm Brundage,M.,Avin,S.,Clark,J.,Toner,H.,Eckersley,P.,Garfinkel,B.,etal.(2018).The malicioususeofartificialintelligence:Forecasting,prevention,andmitigation. arXivpreprint arXiv:1802.07228

Chui,M.,Farrell,D.,&Jackson,K.(2014). Howgovernmentcanpromoteopendata.Available March23,2018,from https://www.mckinsey.com/industries/public-sector/our-insights/howgovernment-can-promote-open-data

Clerck,J.(2017).Digitization,digitalizationanddigitaltransformation:Thedifferences. i-SCOOP AvailableMarch23,2018,from https://www.i-scoop.eu/digitization-digitalization-digital-trans formation-disruption/ Cleveland,W.S.(2001).Datascience:Anactionplanforexpandingthetechnicalareasofthe field ofstatistics. InternationalStatisticalReview,69(1),21–26.

Dapp,T.,Slomka,L.,AG,D.B.,&Hoffmann,R.(2014). Fintech–thedigital(r)evolutioninthe financialsector.FrankfurtamMain:DeutscheBankResearch.

Davenport,T.H.,&Harris,J.G.(2007). Competingonanalytics:Thenewscienceofwinning Boston:HarvardBusinessPress.

Davenport,T.H.,&Patil,D.(2012). Datascientist:Thesexiestjobofthe21stcentury.Available March23,2018,from http://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ ar/1

Domingos,P.(2015). Themasteralgorithm:Howthequestfortheultimatelearningmachinewill remakeourworld.NewYork:BasicBooks.

Domo.(2017). Dataneversleeps5.0.AvailableMarch23,2018,from https://www.domo.com/ learn/data-never-sleeps-5

Domo.(2018). Dataneversleeps6.0.AvailableOctober9,2018,from https://www.domo.com/ learn/data-never-sleeps-6

Düllmann,D.(1999).Petabytedatabases. ACMSIGMODRecord,28(2),506.

Fayyad,U.,Piatetsky-Shapiro,G.,&Smyth,P.(1996).Fromdataminingtoknowledgediscovery indatabases. AIMagazine,17(3),37. Gruber,A.(2017,January17).WennMaschinenlernenlernen. SpiegelOnline.AvailableMay 10,2018,from http://www.spiegel.de/netzwelt/web/kuenstliche-intelligenz-wenn-maschinenlernen-lernen-a-1130255.html

Harding,C.(2017). Digitalparticipation – Theadvantagesanddisadvantages.AvailableMarch 23,2018,from https://www.polyas.de/blog/en/digital-democracy/digital-participation-advan tages-disadvantages

Harman,D.K.,&Voorhees,E.M.(2006).TREC:Anoverview. AnnualReviewofInformation ScienceandTechnology,40(1),113–155.

Hayashi,C.,Yajima,K.,Bock,H.H.,Ohsumi,N.,Tanaka,Y.,&Baba,Y.(Eds.).(1996). Data science,classification,andrelatedmethods:Proceedingsofthe fifthconferenceoftheinternationalfederationofclassificationsocieties(IFCS-96),Kobe,Japan,March27–30,1996. SpringerScience&BusinessMedia.

Hayes-Roth,F.,Waterman,D.A.,&Lenat,D.B.(1983). Buildingexpertsystem.Boston,MA: Addison-WesleyLongman.

Henke,N.,Bughin,J.,Chui,M.,Manyika,J.,Saleh,T.,Wiseman,B.,&Sethupathy,G.(2016). The ageofanalytics:Competinginadata-drivenworld.McKinseyGlobalInstitutereport.

Hey,T.,Tansley,S.,&Tolle,K.M.(2009). Thefourthparadigm:Data-intensivescientific discovery (Vol.1).Redmond,WA:MicrosoftResearch. Humby,C.(2006,November). DataisthenewOil!.ANASeniormarketer ’ssummit,Kellogg School. http://ana.blogs.com/maestros/2006/11/data_is_the_new.html Kagermann,H.,Lukas,W.D.,&Wahlster,W.(2011).Industrie4.0:MitdemInternetderDinge aufdemWegzur4.industriellenRevolution. VDInachrichten,13,11. Kovach,S.(2017). WetalkedtoSophia – TheAIrobotthatoncesaiditwould ‘destroyhumans’ TechInsideryoutubevideo.AvailableMay10,2018,from https://www.youtube.com/watch? v¼78-1MlkxyqI Kremp,M.(2018,May9).GoogleDuplexistgruseliggut. SpiegelOnline.AvailableMay10,2018, from http://www.spiegel.de/netzwelt/web/google-duplex-auf-der-i-o-gruselig-gute-kuenstlicheintelligenz-a-1206938.html

Krogerus,M.,&Grassegger,H.(2016).Ichhabenurgezeigt,dassesdieBombegibt. Das Magazin,(48–3).AvailableMay11,2018,from https://www.tagesanzeiger.ch/ausland/ europa/Ich-habe-nur-gezeigt-dass-es-die-Bombe-gibt/story/17474918 Kuhn,J.(2018). “Techlash”:DerAufstandgegendieTech-Gigantenhatbegonnen. Süddeutsche Zeitung.AvailableApril3,2018,from http://www.sueddeutsche.de/digital/digitalisierungtechlash-der-aufstand-gegen-die-tech-giganten-hat-begonnen-1.3869965 Laney,D.(2001).3Ddatamanagement:Controllingdatavolume,velocityandvariety. META GroupResearchNote,6(70).

LeCun,Y.,Bottou,L.,Bengio,Y.,&Haffner,P.(1998).Gradient-basedlearningappliedto documentrecognition. ProceedingsoftheIEEE,86(11),2278–2324.

Li,R.,Lu,B.,&McDonald-Maier,K.D.(2015).Cognitiveassistedlivingambientsystem:A survey. DigitalCommunicationsandNetworks,1(4),229–252. Loukides,M.(2010). Whatisdatascience? AvailableMarch23,2018,from https://www.oreilly. com/ideas/what-is-data-science

Manyika,J.(2009).HalVarianonhowtheWebchallengesmanagers. McKinseyQuarterly AvailableMarch23,2018,from https://www.mckinsey.com/industries/high-tech/our-insights/ hal-varian-on-how-the-web-challenges-managers

Manyika,J.,Chui,M.,Brown,B.,Bughin,J.,Dobbs,R.,Roxburgh,C.,&Byers,A.H.(2011). Big data:Thenextfrontierforinnovation,competition,andproductivity.AvailableMarch23,2018, from https://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-datathe-next-frontier-for-innovation

Mayer,M.(2016). Fintech?Edtech?Adtech?Duriantech? – The10buzzieststartupsectors AvailableMarch23,2018,from https://techsauce.co/en/startup-2/ fintech-edtech-adtechduriantech-the-10-buzziest-startup-sectors/ McAfee,A.,Brynjolfsson,E.,Davenport,T.H.,Patil,D.J.,&Barton,D.(2012).Bigdata:The managementrevolution. HarvardBusinessReview,90(10),60–68.AvailableMarch23,2018, from https://hbr.org/2012/10/big-data-the-management-revolution MedTechEurope.(2018).TheEuropeanmedicaltechnologyindustryin figures2018. MedTech EuropeBrochure.AvailableMay10,2018,from http://www.medtecheurope.org/EU-medtechindustry-facts-and- figures-2017

Meltzer,T.(2014).Robotdoctors,onlinelawyersandautomatedarchitects:Thefutureofthe professions? TheGuardian. AvailableMarch28,2018,from https://www.theguardian.com/ technology/2014/jun/15/robot-doctors-online-lawyers-automated-architects-future-professionsjobs-technology Naisbitt,J.,&Cracknell,J.(1984). Megatrends:Tennewdirectionstransformingourlives(No.04; HN59.2,N3.).NewYork:WarnerBooks. Parekh,D.(2015). Howbigdatawilltransformoureconomyandourlives.AvailableMarch 23,2018,from http://techcrunch.com/2015/01/02/the-year-of-big-data-is-upon-us/ Patil,D.(2011). Buildingdatascienceteams.AvailableMarch23,2018,from http://radar.oreilly. com/2011/09/building-data-science-teams.html Press,G.(2013). Averyshorthistoryofdatascience.AvailableMarch23,2018,from https://www. forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science Provost,F.,&Fawcett,T.(2013,March).Datascienceanditsrelationshiptobigdataanddatadrivendecisionmaking. BigData,1(1),51–59. Rahimi,A.,&Recht,B.(2017).ReflectionsonRandomKitchenSinks.AcceptancespeechforTest ofTimeAwardatNIPS2017.AvailableMarch28,2018,from http://www.argmin.net/2017/12/ 05/kitchen-sinks/ Roberts,D.(2018,May9).Here’showself-drivingcarscouldcatchon. Voxarticle.AvailableMay 10,2018,from https://www.vox.com/energy-and-environment/2018/5/8/17330112/self-driv ing-cars-autonomous-vehicles-texas-drive-ai Russell,S.J.,&Norvig,P.(2010). Artificialintelligence:Amodernapproach (3rded.).Upper SaddleRiver,NJ:PearsonEducation. Shiers,J.(1998).Buildingamulti-petabytedatabase:TheRD45projectatCERN.In Object databasesinpractice (pp.164–176).UpperSaddleRiver,NJ:PrenticeHall. Siegel,E.(2013). Predictiveanalytics:Thepowertopredictwhowillclick,buy,lie,ordie Hoboken,NJ:Wiley. Simard,P.Y.,Steinkraus,D.,&Platt,J.C.(2003).Bestpracticesforconvolutionalneuralnetworks appliedtovisualdocumentanalysis. ICDAR,3,958–962. Smith,D.(2011). “DataScience”:What’sinaname? AvailableMarch27,2018,from http://blog. revolutionanalytics.com/2011/05/data-science-whats-in-a-name.html Soubra,D.(2012). The3VsthatdefineBigData.AvailableMarch23,2018,from www. datasciencecentral.com/forum/topics/the-3vs-that-de fine-big-data

SpoutSocial.(2018).Thecompleteguidetochatbotsin2018. Sproutblog.AvailableMay 10,2018,from https://sproutsocial.com/insights/topics/chatbots/

Stadelmann,T.,Stockinger,K.,Braschler,M.,Cieliebak,M.,Baudinot,G.R.,Dürr,O.,& Ruckstuhl,A.(2013,August).ApplieddatascienceinEurope – Challengesforacademiain keepingupwithahighlydemandedtopic.In EuropeancomputersciencesummitECSS2013 Amsterdam:InformaticsEurope.

Stockinger,K.,&Stadelmann,T.(2014).DataSciencefürLehre,ForschungundPraxis. HMD PraxisderWirtschaftsinformatik,51(4),469–479.

Stockinger,K.,Stadelmann,T.,&Ruckstuhl,A.(2016).DataScientistalsBeruf.InD.Fasel,& A.Meier(Eds.), Bigdata.EditionHMD. https://doi.org/10.1007/978-3-658-11589-0_4 Sveinsdottir,E.,&Frøkjær,E.(1988).Datalogy TheCopenhagentraditionofcomputerscience. BITNumericalMathematics,28(3),450–472. SwissAllianceforData-IntensiveServices.(2017). Digitization&innovationthroughcooperation GlimpsesfromtheDigitization&InnovationWorkshopat “KonferenzDigitaleSchweiz” AvailableMarch28,2018,from https://www.data-service-alliance.ch/blog/blog/digitizationinnovation-through-cooperation-glimpses-from-the-digitization-innovation-workshop Tez,R.-M.(2016). RocketAI:2016’smostnotoriousAIlaunchandtheproblemwithAIhype. Blog post.AvailableMay10,2018,from https://medium.com/the-mission/rocket-ai-2016s-mostnotorious-ai-launch-and-the-problem-with-ai-hype-d7908013f8c9 Tukey,J.W.(1962).Thefutureofdataanalysis. TheAnnalsofMathematicalStatistics,33(1), 1–67.

Valarezo,U.A.,Pérez-Amaral,T.,&Gijón,C.(2016).Bigdata:Witnessingthebirthofanew discipline. JournalofInformaticsandDataMining,1(2).

Vorhies,W.(2014). Howmany “V’ s ” inbigdata?Thecharacteristicsthatdefinebigdata. AvailableMarch23,2018,from https://www.datasciencecentral.com/profiles/blogs/howmany-v-s-in-big-data-the-characteristics-that-de fine-big-data

White,A.(2015). Theendofbigdata – It’sallovernow. AvailableMarch23,2018,from https:// blogs.gartner.com/andrew_white/2015/08/20/the-end-of-big-data-its-all-over-now/ Witten,I.H.,Moffat,A.,&Bell,T.C.(1999). Managinggigabytes:Compressingandindexing documentsandimages.SanFrancisco,CA:MorganKaufmann.

Zierer,K.(2017,December27).WarumderFokusaufdasdigitaleKlassenzimmerUnfugist. SpiegelOnline.AvailableMay10,2018,from http://www.spiegel.de/lebenundlernen/schule/ digitales-klassenzimmer-die-schueler-muessen-wieder-in-den-mittelpunkt-a-1181900. html#ref¼meinunghpmobi

Chapter2 DataScience

Abstract Eventhoughithasonlyenteredpublicperceptionrelativelyrecently,the term “datascience” alreadymeansmanythingstomanypeople.Thischapter exploresbothtop-downandbottom-upviewsonthe field,onthebasisofwhich wedefinedatascienceas “auniqueblendofprinciplesandmethodsfromanalytics, engineering,entrepreneurshipandcommunicationthataimatgeneratingvaluefrom thedataitself. ” Thechapterthendiscussesthedisciplinesthatcontributetothis “blend,” brieflyoutliningtheircontributionsandgivingpointersforreadersinterestedinexploringtheirbackgroundsfurther.

1Introduction

“Datascience” isatermthathasenteredpublicperceptionandimaginationonly sincethe firsthalfofthedecade.Evenintheexpertcommunity,fundamental treatmentssuchas “WhatIsDataScience? ” (Loukides 2010)were firstpublished asrecentlyas2010.Yet,thesubstanceofwhatconstitutesdatasciencehasbeenbuilt upformuchlonger.Anattempttodefinetheterm “datascience” canfolloweithera top-downorabottom-upphilosophy.Ontheonehand,looking “top-down,” data scienceistheresearch fieldthatstudiesmechanismsandapproachesnecessaryto generatevalueandinsightsfromdata,enablingthebuildingofdataproducts. Importantly,a “dataproduct” isnotjustaproduct “dealing” withdata,butitisa productderivingitsvaluefromthedataandproducingdataitself(Loukides 2010). Ontheotherhand,adoptingthe “bottom-up” view,datascienceisaninterdisciplinaryresearch field(Stockingeretal. 2015)thatadoptsanew,holisticwayof exploitingdata,lookingbeyondsingleaspectssuchashowtostoredata,orhow toaccessit.Itfollowsthatweneedtointegratecompetenciesfrommanyolder disciplinesofstudy:technical-mathematicaldisciplinessuchas “computerscience” and “statistics,” butalsodisciplinessuchas “entrepreneurship” and “art.”

M.Braschler(*)·T.Stadelmann·K.Stockinger

ZHAWZurichUniversityofAppliedSciences,Winterthur,Switzerland e-mail: bram@zhaw.ch

© SpringerNatureSwitzerlandAG2019

M.Braschleretal.(eds.), AppliedDataScience, https://doi.org/10.1007/978-3-030-11821-1_2

Nooneview,top-downorbottom-up,issuperior.Infact,therewasandis considerabledisagreementexactlywheretheboundaryofdatascienceistobe drawn(Warden 2011).Ratherthanengageinthis “warofdefinitions,” wethinkit ishelpfultoviewthedifferentapproachesascomplementary.Forourownworkin talkingtoaudiencesasdiverseasstudents,colleagues,andbusinesspartners,we foundthefollowingdefinitionmosthelpful,andthusadoptitforthisbookon applieddatascience(Stadelmannetal. 2013):

Datasciencereferstoauniqueblendofprinciplesandmethodsfromanalytics,engineering, entrepreneurshipandcommunicationthataimsatgeneratingvaluefromthedataitself.

Whatmakesthisphrasingstandoutforusisthreefold:

1.Thedefinitiondistinguishesdatasciencewellfromprecedingparadigms:itisnot equaltoitsindividualparts,suchasanalytics,engineering,etc.(ortheir sub-disciplines,suchasAI,algorithms,orstatistics),thatis,nosingle sub-discipline “owns” datascience.Norisitsimplythesumoftheseparts,that is,itdoesnotincludeanysub-disciplineentirely.Instead,itreferstoa unique blendofprinciplesandmethods fromthem.Wearrivedatthisconclusionthrough intensivecollaborationbetweencomputerscientistsandstatisticiansatthe ZHAWSchoolofEngineeringandareconvincedthatitholdsgenerally.Unlike e-scienceandotherdomain-specificparadigms,datascienceisuniversalin applyingtoallkindsofdataandapplicationareas.Finally,unlikeindatamining, whichconcentratesonexploratorydataanalysis,thereisacleargoalindata scienceto generatevaluefromdata.Reflectingonthetop-downviewgiven above,thedataproductguidesthisvaluegeneration.

2.Thedefinitionconnectssciencetopractice:byemphasizingdatascienceasan appliedscience(encompassing entrepreneurship,havingthegoalof generating value),theimportantaspectofitbeing “groundedinreality”1 ishighlighted. Again,theapplicabilityofthishasbeenverifiedmanytimesoverinourworkin appliedresearchanddevelopmentoverthepastyears,anddistinguishesdata sciencefromsomeofthefundamentalworkdoneintheconstitutingdisciplines (e.g.,establishingthelawsofprobabilityremainsafundamentalresultinmath, notdatascience).

3.Thedefinitiontestifiestothebreadthandhistoryofthe field:the uniqueblendof methodsandprinciples explicitlyacknowledgesthatdatascienceis “standingon theshouldersofgiants” insteadof “reinventingthewheel.” Italsoacknowledges thefactthatitismorethananumbrellaterm:theblendwerefertoisunique,and notjustauniversalcollection,butatailoredselectionofrelevantmethods, principles,andtoolsfromtheconstitutingdisciplines.

Theremainderofthischapterwilltracethese “giants” andtheircontributionsto datascience.

1 SeealsoBrodie’slaterchapter “ondevelopingdatascience” .

Another random document with no related content on Scribd:

The Project Gutenberg eBook of Ruotsin rajalta

This ebook is for the use of anyone anywhere in the United States and most other parts of the world at no cost and with almost no restrictions whatsoever. You may copy it, give it away or re-use it under the terms of the Project Gutenberg License included with this ebook or online at www.gutenberg.org. If you are not located in the United States, you will have to check the laws of the country where you are located before using this eBook.

Title: Ruotsin rajalta

Tullikavalluskuvaus Tornionjoen laaksosta

Author: Väinö Kataja

Release date: January 29, 2024 [eBook #72810]

Language: Finnish

Original publication: Hämeenlinna: Arvi A. Karisto Oy, 1912

Credits: Juhani Kärkkäinen and Tapio Riikonen

RUOTSIN RAJALTA

Tullikavalluskuvaus Tornionjoen laaksosta

Kirj.

Hämeenlinnassa, Arvi A. Karisto Oy, 1912.

VÄINÖ KATAJA

Ruotsin puolen maantietä Haaparannalta päin mennä junnasi rahtikuorma

Tornionjokivartta ylöspäin.

Mies, joka kuorman perässä käveli, oli lyhyenlainen, puettuna päällyksettömään lammasnahkaiseen turkkiin. Keli oli huono, sillä oli sydäntalven pakkassää, vitikeli, joka on tihmein talven keleistä. Mutta vaikka mies näyttikin kuluneessa turkissaan ja kelottuneessa naapukassaan olevan tavallisia rahtimiehiä, oli hänellä valjaissa hyvä ja lihava hevonen, joka kävellä huiski roimasti, huonosta kelistä huolimatta. Mies sai joskus pistää pientä juoksua pysyäkseen perässä. Hän olikin jo ajanut useista rahtikuormista edelle ja oli nyt ihan yksin saapunut kahden kylän väliselle metsätaipaleelle. Kuorma oli päältä päin peitetty loimilla ja nahkasilla, mutta pitkän matkareslan harvojen ohimoliistojen välitse näkyivät kuin jauhosäkkien valkoiset hurstit.

Hän ei ollut vielä, sitten kun Haaparannalta läksi, kertaakaan levähdyttänyt hevosta eikä itsekään poikennut mihinkään tienposkessa oleviin tavallisiin syöttö- ja kahvipaikkoihin.

Kiire oli. Taipaleella, jolla muutamin paikoin oli loivaa myötälettä, antoi hän hevosen juosta, ohjia kiinnittäen ja massautellen suullaan. Mies hymyili itsekseen, ja hänen silmänsä kiiluivat. Hevosen juostessa hän keikahti näppärästi istumaan reslan partaalle, otti pienoisen taskumatin povestaan ja maistoi herneen. Ei paljoa… ei paljoa! — vakuutti hän itselleen, löi korkin lujaan pullon suulle ja hyppäsi jälleen kuorman perään kävelemään.

Lyhyt talvipäivä alkoi hämärtää ja pakkanen tuntui kiihtyvän.

— Parahiksi kerkiän… määräajaksi kerkiän, — höpisi hän, päivän hämärtymisestä aikaa arvaten.

Mutta kiire hänellä oli mielessä, sillä vaikka hevonen käveli, että höyry sieraimista punoi ja sen lavat ja kupeet olivat valkoisessa huurteessa, hoputteli hän yhä.

Kun metsätaival loppui, oli siinä, ennenkuin kylä alkoi, taas rahtimiesten kahvila, pienoinen punainen mökki tienvieressä, Kaakkuri-Jannen pirtiksi mainittu.

— Oikeinpa arvasin! — sanoi mies itsekseen, kun alkoi mökkiä lähestyä niin että jo näki pihalle. — Oikein arvasin, eivät ole vielä muut Haaparannalta palaavat ehtineet tänne syöttämään. Kovin hyvä, että ehdin sivuuttaa nuo rahtimies-hunsvotit…

Mökin pihalla oli jo tunnin verran seisoskellut ruma, rokonarpinen mies, Rämä-Heikiksi nimitetty, Suomen puolelta kotoisin, ja kuunnellut ja katsellut alaspäin niinkuin jotakin vartoen.

Rämä-Heikki kuuli jo etempää tulijan aisakellon ja tunsi sen äänestä, että oli oikea mies. Ennenkuin tulija ehti mökin kohdalle,

riensi hän jo vastaan.

»Onko se Ranta-Jussi?» kysyi hän, mutta tulija ei kuullut, kun pakkanen rääkkyi jalasten alla. Ei ajanut tulija pihaankaan, pysähdytti keskelle tietä, näppärästi vieden hevosen eteen laatikon, jossa oli kauroja.

Siinä tunsivat miehet toisensa. Tulija oli Ranta-Jussi, Palomäen Santeri-vainajan kavala kumppani.

»Jopa tulit täsmälleen», naurahti Rämä-Heikki. »Eikä taida olla tyhjänä reki…!»

»On nyt tavaraa», naurahti toinen vastaan. »Monta säkillistä konjakkia ja vielä lisäksi muita juotavia…

Mutta elä sinä…»

»Minäkö…!»

»No, luotan nyt sinuun, niinkuin ennenkin… Vaan elä sano mistä sait…»

»No huihai…»

Hevosen syödessä kauroja juttelivat miehet siinä minkä mitäkin tullikavalluksesta, joka nyt taas tänä talvena oli noussut entiseen voimaansa, vieläpä isommaksikin.

Niissä hommissa olivat nytkin sekä Ranta-Jussi että Rämä-Heikki. Ranta-Jussi oli nyt päässyt Lampan uskotuksi mieheksi ja Jussi oli vuorostaan ottanut Rämä-Heikin apurikseen. Kuiskaamalla miehet puhelivat, vaikkei ketään kuulijaa ollut näkösällä. Mökin mies,

Kaakkuri-Janne, joka oli molempien miesten uskottu, istuskeli ölvinä pirtissä, vaikka tiesikin, mitä miehet kuorman luona puuhasivat.

Rämä-Heikki oli avannut suuren nahkalaukkunsa, johon Ranta-Jussi luki pulloja, »olkirokkiin» pistettyjä.

Paljon niitä siihen meni, ja kun oli täyteen pannut, nauhoitti

Rämä-Heikki laukun ja nostaen sen selkäänsä virkkoi:

»Raskaspa siitä tuli, mutta kyllä se kevenee, kun Suomen puolelle pääsen…»

Säkki, josta Ranta-Jussi oli pulloja ottanut, oli tyhjennyt puolilleen.

»Kyllä Janne lopuista huolen pitää, enempää en uskalla ottaa tällä kertaa», sanoi Rämä-Heikki.

Ranta-Jussi nosti säkkilopun olalleen ja läksi astumaan mökkiin.

Rämä-Heikki seurasi perässä, varustellen laukkuaan olkapäille.

Portaille kiepsahti mies pirtistä vastaan ja kuiskasi: »Joutukaa! Voipi tulla rahtimiehiä!»

»Ohi ajoin Lamminpäässä, eivät ehdi vielä tänne!» vakuutu Jussi.

Mökin mies aukaisi avaimella oven kamariin, joka oli porstuan perällä ja oli puolillaan kaikenlaista rojua ja roskaa. Sinne vei Jussi säkin, ja Janne pisti oven lukkoon.

Rämä-Heikki oli sillä aikaa noussut suksilleen ja lähtenyt painaltamaan

Suomen puolelle, josta mökille oli hiihtänytkin.

»Olipa sillä nyt kiire», kummaili Jussi. »Olisi tehty tässä puoletkupit…»

»Sinua varten on kahvi jo valmiina ollut pari tuntia», ilmoitti Kaakkuri-Janne, nähtävästi hyvillään siitä, että hänkin, »uskotun tavaran» erinomaisena hoitajana, saisi taas rennot ryypyt palkakseen.

Miehet menivät pirttiin, jossa ei ollut ketään muuta kuin mökin vaimo, aivan kuuro ja melkein sokea. Janne sai itse olla sekä isäntänä että emäntänä.

Ranta-Jussi istahti pöydän päähän ja Janne alkoi hommata kahvia pöytään.

»Tuossa sinullekin taas, jos sattuu kipeä päivä», sanoi Jussi ja ojensi Jannelle täysinäisen konjakkipullon. Mutta povestaan otti hän toisen pullon, jonka laski pöydälle lisäten:

»Tästä teemme puoletkupit, vaan pitkää aikaa en uskalla viipyä enkä juodakaan. Iltayöstä pitää joutua perille.»

Ja maistettuaan kuppinsa nousi hän ikkunaan katsomaan. Maantie oli ihan mökin vieressä, niin että hän näki kuorman ja hevosensa, joka syödä rouskutteli kauroja. Mutta ei hän vielä tyytynyt siihenkään, vaan meni nyt portaille ja kuunteli. Ei kuulunut vielä taipaleelta minkäänlaisia kulkijain ääniä, pakkanen vain paukahteli, ja hämärän enetessä alkoivat revontulet syttyä pohjoisen taivaalla. Jussi palasi uudestaan pirttiin, teki toisen puolikuppisen ja supatteli Jannelle säkistä, jonka oli kamariin jättänyt.

»Jos käyvät kahvilla nuo jälessä tulevat rahtimiehet, niin ymmärrä sinä pitää suusi kiinni», varoitteli hän mökin miestä, joka tyytyväisenä jo teki kolmatta puolikuppista.

»Minäkö?» tokaisi toinen nousevassa humalassa. »Minä se juuri osaankin suuni kiinni pitää.»

Jussi napitti turkkinsa, painoi naapukan lujaan päähänsä ja läksi. Juuri kun hän ehti hevosensa luo tielle, kuului alhaalta päin tulevien ääniä ja rekien rytinää, kun jalakset pakkastietä vasten rääkkyivät. Jussi hoputti hevosen matkaan, hyppäsi kuormalle ja ajoi hölkkää, ehtiäkseen tien mutkauksen taaksen ennenkuin jälestä tulevat saapuivat mökin luokse.

Hän oli välttänyt tuttuja mökkejä eikä ollut kohdannut koko matkalla yhtään ihmistä, joka hänet olisi tuntenut. Nyt palatessa ei aikonut missään poiketa, niin oli patruuna neuvonut. Ruuna kyllä jaksaisi kotia asti yhtä kyytiä, oli vakuuttanut.

Mainion hyvin oli Jussin matka onnistunut. Perillä, Haaparannalla, ei tarvinnut muuta kuin ojensi kirjeen, niin heti alettiin hommata ja äkkiä oli konjakkikuorma pantuna. Ei tiedusteltu eikä kyselty hänen nimeään eikä mitään mistään virketty.

— Ei uskaltanut patruuna enää Joonasta tämmöiselle matkalle panna… Edellisellä kerralla kun oli käynyt, oli juonut itsensä hutikkaan ja syöttöpaikoissa reuhannut rahtimiesten kanssa. Viimein nukkui rekeen, ja kun heräsi, olivat konjakit melkein kaikki tiessään…

— Vaan minuun nyt luottaa kuin Aaprahamiin… luottaa nyt varsinkin, kun olen keksinyt uusia konsteja, ja jos ne nyt onnistuvat, niin silloin… Uuden pirtin hinnan lupasi…

Hänen suunsa meni muikeasti irviin ja hän tempasi ohjista.

»Hei vaan ruuna!» karjaisi hän ja antoi taas hölkätä pitkän matkaa.

— Isosti se nyt näyttää rupeavan yrittämään, patruuna, jatkoi Jussi taas mietteitään. Keskitaloon kuuluu saapuvan kuorma kuorman perästä, vaan vähän on vielä yli saatu ja vielä vaikeammaksi kai käy tästä puolin, kun kuulutaan tullimiehiä taas lisätyn… Mutta, vanherkki vieköön, jos kaikki käy niinkuin olen miettinyt, niin… Ja miksei käy, kun viisaasti ja varovasti ollaan parissa… On nyt konjakkia, ettei kesken lopu…

Taas meni Jussin suu muikeaan irviin…

— Oikeastaanhan tämä minun tuumani on Palomäen Santerivainajan keksintö, vaikkei hän sitä ehtinyt toimeen panna. Mutta usein siitä puhui minullekin… Viimeiseksi päivää kahta ennen kun tulivat ja löivät raudat jalkoihin. Oli se olemassa ovela ja viisas mies, Santeri-vainaja… Ei sitä ole toista tällä perällä… Keskitalon Hermanni tuo nyt yrittelee ja on rohkeakin ja julman vankka mies, mutta ei ole äly eikä hoksinki niin terävä kuin oli Santerilla… Eipä luota patruunakaan vielä häneen, omalla vastuulla saapi tuoda poikki, jos tahtoo… Ja on tuo tuonutkin ja onnistunutkin, mutta kuinka käynee, kun isommalta pitää liikkua…

Jussi pääsi kylän raitille, jossa maantie teki mutkia, väliin ihan rakennusten seinän vieritse kulkien. Ketään kulkijaa ei kuitenkaan tullut vastaan ja Jussi antoi ruunan hölkytellä ehtiäkseen pian kylän toiseen päähän, jossa taas alkoi taival.

Mutta ehdittyään kylän päähän kuuli hän edestään kovaa aisakellon kalkatusta, jonka tunsi Saalkreenin, vihaisimman ja

nokkelimman rajavartijan, aisatiu'uksi… Patruuna oli varoittanut tullimiehistä, vaikkei konjakkikuorman kuljettaminen Ruotsin puolen maantiellä ollutkaan laissa kielletty. Heitä oli hyvä vältellä sekä patruunan että hänen itsensäkin vuoksi. Jos tullimiehet tuntisivat Jussin, alkaisivat he vainuskella ja arvella, että jotakin oli tekeillä. Ettei hän herättäisi mitään huomiota, jäi hän kuorman perään kävelemään ja ohjasi hevosta vasempaan tiepuoleen, niinkuin ruotsalaisten tapa on.

Jo ajoivat kohdalle ja Jussi tunsi Saalkreenin äänen, joka kysyi:

»Varthän ska lasset?»

»Från Haparanda till Kengis», vastasi Jussi nostamatta naamaansa kauluksen sisältä ja pannen niukan ruotsinkielentaitonsa liikkeelle.

Tullimiehet ajoivat menemään ja Jussi taivalsi edelleen.

— Vielä te tästä kuormasta saatte maistaa, — naurahti Jussi, kun oli päässyt kappaleen matkaa eteenpäin.

Ilta oli jo kulunut myöhäksi. Muutamissa taloissa kylän päässä sammutettiin jo tulet ja Jussi päätteli mielessään, että parahiksi hän ehtisi perille. Oli vielä tämä metsäinen taival ja kylä mentävä ennenkun tulisi se kylä, jossa Lamppa asui. Mutta levollisemmin Jussi nyt kuormalla istui, kun tullimiehiä oli vastaan tullut. Varmasti oli hän Saalkreenin tuntenut äänestä ja toisen, joka reen perässä istui, arvasi hän Jönssoniksi, miehen ko'osta. Kolmas, joka istui kuski pallilla, saattoi olla Fynke tai se vasta tullut uusi tullimies, Andersson. Kolme miestä oli reessä. Yksi oli siis jäänyt Lampan tienoille vahtaamaan…

— Jospa nyt kaikki onnistuisi niin hyvin kuin tähän asti! — toivoi Jussi, ja jonkunlainen epäilys tuntui mieltä painavan.

Mutta hetken mietittyään hymähti hän:

— No, jos ei onnistu, niin eipä tuo tule minun vahingokseni!

Ja Jussi ajeli eteenpäin, silmät ja korvat jännityksessä.

Loppui taas taival ja alkoi kylä, nyt viimeinen ennenkuin Lampalle ehtisi. Joka talossa nukuttiin, eikä kylän raitilla näkynyt ketään liikkeellä. Keskikylällä tuli kaksi rahdista palaavaa hevosta vastaan. Mutta miehet nukkuivat reissään, tyhjien säkkien ja nahkasten alla, ettei näkynytkään. Jussi ohjasi hevosensa syrjään ja rahtimiesten lamakaakit kävellä vätöstivät sivu.

Tie nousi nyt mäelle, josta Jussi näki Lampan komean kauppakartanon pohottavan revontulien valaiseman yön läpi. Se oli kylän ylimmäinen talo, lähempänä joen rantaa kuin muut talot ja loitolla naapureista. Ei näkynyt valoja Lampastakaan, mutta Jussi tiesi, että siellä valvottiin; sekä patruuna että Joonas jo vartoivat häntä.

Mutta mäen alla, palasen matkaa tiestä, ihan metsän laidassa oli pienoinen punainen mökki, jossa oli sievä kuisti maantielle päin. Siinä asui kylän räätäli, nokkela ja hauska Tirkka-niminen vanhapoika. Asui ypö yksin somassa asunnossaan, ja kerrottiin hänen olevan hyvissä varoissa, koska oli säästäväinen ja ahkera mies. Mutta kohtelias oli vieraille kotonaan ja verraton juttuilemaan ja hauskoja kaskuja kertomaan.

Maantiestä erkani Tirkan mökille hevostie, jonka molemmin puolin oli tienhaaraan pystytetty pitkät näreet viitoiksi.

Tirkan tienhaaraan pysäytti Jussi hevosen ja kuunteli, nostaen naapukkansa pois korvilta. Ei kuulunut mitään. Hiljainen oli talven pakkas-yö, mutta levottomina roihusivat revontulet, valaisten joen uomaa ja sen kahden puolen olevia kukkuloita. Suoraan pohjoisessa remahtivat kellervänsinertäväksi jättiläislaineeksi, joka näytti kulkevan koko taivaanrannan poikki ja hipovan korkeimpien kukkuloiden huippuja.

— Nytpä Ruijanmeri lainehtii, — ajatteli Jussi. — Taitaa kestää vielä pakkasia.

Mutta hetken kuunneltuaan sitoi hän aisakellon kielen kiinni ja kääntyi kuormineen Tirkan mökille, ajaen ihan kuistin viereen.

Sisältä kuului liikettä, ovia aukaistiin ja hetken päästä ilmestyi pienoinen mies kuistin ovelle.

»Holl reit», sanoi mies.

»Holl reit», vastasi Jussi ja kysyi samassa:

»Onko kaikki selvää?»

»Selvää on», vastasi toinen. »Jopa tulit juuri täsmälleen niinkuin aioitkin. Otanko tulta?»

»Elä ota tulta», kielsi Jussi ja rupesi kaivamaan reestä pohjimmaista säkkiä. Saatuaan sen kiskotuksi pois, otti hän sen selkäänsä ja meni sisälle.

»Mitä kuuluu?» kysyi hän.

Mökin mies Tirkka ei kuitenkaan joutanut siihen vastaamaan, vaan kysyi vuorostaan:

»Koko säkillisenkö sinä jätät?»

»Niin on patruuna käskenyt. Tässä on monenlaista juotavaa… Kun vain nämä särpävät, niin eivät, piessä vie, kykenekään sinä yönä vahtaamaan…»

»Eivät kahteen päivään sen jälkeenkään», naurahti toinen ja nosteli säkkiä.

Jussi kertoi, että tullimiehet olivat tulleet Alakylän raitilla vastaan. Saalkreenin ja Jönssonin hän oli rekeen tuntenut, mutta kuskipallilla istuvasta miehestä ei tiennyt varmaan, oliko Fynke vai uusi tullimies, Andersson.

»Andersson! se on ollut. Ne kävivät tässä mennessään…»

»Joko kutsuit syntymäpäivääsi viettämään?»

»Jo käskin. Selitin, että kun nyt täytän viisikymmentä vuotta, niin olen ajatellut käskeä muutamia tuttaviani merkkipäiväkseni… sanoin ja selitin niinkuin puhe on ollut…»

»Niinpä tietenkin. Miltä näytti? Näyttivätkö tulleen hyvilleen?» tiedusteli Jussi.

»Hyvilleen tulivat ja lupasivat saapua…»

»Sen arvaa… jotka ovat kaikki muut niin persoja viinalle, paitsi Saalkreeni… Hän ei maista mitään?»

»Ei mitään…»

»Luuletko kirjeen tepsivän?»

»Epäilemättä. Kirje on jo muuten valmis ja huomenna, vähää ennen kuin tänne tulevat, toimitan sen hänelle… kaikki niinkuin on puhuttu… Hyvin käy kaikki!» vakuutti Tirkka, joka oli alkanut tarkastaa säkin sisältöä.

»Ne on kaikki valmiiksi pantu siellä Haaparannalla», sanoi Jussi.

»Mitä lieneekin kaikkea…»

»On täällä konjakkia ja likööriä…»

Jussi otti pullon povitaskustaan ja siitä ryypyn Tirkallekin tarjosi.

»Otamme tulta lamppuun», esitteli Tirkka.

»Eikö helvetissä! Fynke on kylässä ja voipi olla liikkeellä… Jos täältä sinun tuvaltasi näkee tulen, niin pian kiepsahtaa tänne», esteli Jussi.

»No, jo sinä olet hoksaava mies!» ihmetteli Tirkka. »Kummakos on, että patruuna sinuun luottaa!…»

»Minä tämän syntymäpäiväjuhlankin keksin!» kehui Jussi, hyvillään toisen kehumisesta.

»Olet sinä…!» kehui Tirkka yhä.

He istuivat sitten penkille ikkunan viereen, josta näki hevosen ja reen kumottavan pihalta. Jussi vieläkin neuvoi ja varoitteli, kuinka oli tehtävä. Tirkka ei missään tapauksessa saisi juoda itseään juhlassa

humalaan… piti olla vain maistavinaan, mutta ei kuitenkaan maistaa…

»Enpä tietenkään… kyllä minä ymmärrän, että tässä on iso kysymys», lupasi Tirkka.

»Mihin aiot juotavat kätkeä?» tahtoi Jussi tietää.

»Minä panen kamarin parren alle ja sieltä noudan aina sen mukaan kuin tarvitsee», ilmoitti Tirkka.

»Oikein on mietitty! Elä missään tapauksessa näytä, kuinka paljon sinulla on», varoitteli vielä Jussi.

»Huihai!»

Kun hetken olivat ääneti, sanoi Jussi:

»Jaa, jos tämä nyt onnistuu, niin se tekee patruunasta rikkaan miehen, mutta jos ei, niin hullusti käy… Se Saalkreenin pahus…?»

»Hänen suhteensa ei ole epäilemistä. Kirje on kirjoitettu sillä lailla, että hän ei malta olla menemättä ansaan, vaikka…»

»No, niin minäkin uskoisin… Vaan luehan minullekin nyt se kirje, että kuulen, minkälainen on!»

»Eihän tässä pimeässä…»

»En muistanutkaan… No olkoon! Näkeepä sen, lähteekö vai eikö. Käyn tietenkin vielä muutenkin vakoilemassa ennenkuin ryhdymme toimeen…»

Jussi nousi, napitti turkkinsa ja läksi. Tirkka seurasi häntä kuistin ovelle.

»Jos Saalkreenin saamme puijatuksi ja muuten kaikki onnistuu, niin et palkatta jää», sanoi Jussi ikäänkuin hyvästiksi ennenkuin kuistin ovella erkanivat.

»Hyvin käy kaikki… onpa nyt karvasta, että pysyvät talossa yhden yön seudun», uskoi Tirkka.

Hän sulki sitten kuistin oven ja painui pirttiin. Jussi kuunteli ensin, kuuluiko tieltä päin mitään ääntä tai liikettä, ja kun kaikkialla tuntui hiljaisuus, käänsi hän hevosen tielle päin ja ajoi menemään, tienhaarasta Lampalle kääntyen.

Samana iltamyöhänä, jona Ranta-Jussi oli palaamassa Haaparannalta, istui patruuna Lamppa konttorissaan, otsa rypyssä miettien. Sitten viime näkemän oli patruuna vanhennut ja laihtunut, ja ennen sileihin, kiiltäviin leukapieliin oli kasvanut harvaa, kankeaa partaa, joka pohotti harmajalta.

Kukaan ei tiennyt missä patruuna oli jälkeen Palomäen Santerin hukkumisen ollut, mutta monenlaisia huhuja oli liikkeellä. Mutta kotiuduttuaan hän alkoi hommata niinkuin ennenkin, entistä ehomminkin liikkua.

Nyt varsinkin tänä talvena oli hän laajentanut liikettään, perustaen haarakaupan Makon kylään ja isontaen omaansa.

Tikkatie, joka ennen takavuosina aina oli tehty suoraan Palomäestä Lampalle, oli nyt tikoitettu keskikylälle Keskitaloon, mutta nyt oli sitäpaitsi vielä muitakin teitä tikoitettu, niin että Lampalle nyt Suomen puolelta tuli kolme tikkatietä. Niistä yksi tie ei kuitenkaan vienyt Lampan rantaan, vaan nousi maihin Joenkäyrään, joka talo oli Lampan naapuri, Rantakäyrän talon vieressä, jossa tullimies Saalkreeni asui.

Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.