Issuu on Google+

Informazio-Konpetentziak ikasgaia Ikus-Entzunezko Komunikazioa Gradua

IZENA: Marta Prol

Irakurketa-galderak Mateos Sánchez, M.; García_figuerola, C. (2009). Recuperación de información en la web. Gijón: Trea • Lehenengo artikulu osoa irakurri eta gero erantzun galdera hauek. • Erantzun batzuetarako komeni da Interneten bilaketa batzuk egitea. • Bukatzean Interneten Issun igo. Gero zuen blogean ekarpena egin eta esteka txertatu. 1. Zein dira aipatzen diren bi arazo nagusienak informazioa bilatzerakoan? Lehenengo arazoa, erabiltzaileak informazioa bilatzen hasten denean sortzen da. Erabiltzaileak gehienetan zehaztasun falta izaten du “hitz gakoa” jartzerako orduan eta behar duen informazioa lortzea ezinezkoa egiten zaio. Bigarren arazoa, sistemarekin lotuta dago. Informazioa ematen duenean, sistemak milaka orri agertzen ditu eta erabiltzailearentzat oso saila egiten da informazio egokia aukeratzea.

2. Bilatzaileen Crawler-rak Robot ere deitzen dira. Azaldu zure hitzetan zer egiten duten. Bilatu Interneten nola izena duen Googlen Robotak. Crawlerrak Web osoan informazioa bilatzen duen sorftware bat da. Informazio hori aurkitzerakoan, beste orrialde batzuei bidaltzen dizkie, orri hauek, zerbitzari nagusiei bidaltzeko eta azken hauek, indizea egin dezaten. Googlen Robota GoogleBot du izena.

1


Informazio-Konpetentziak ikasgaia Ikus-Entzunezko Komunikazioa Gradua

3. Zer esan nahi du “búsqueda sintáctica”? Sistemak, erabiltzaileak idatzitako hitz zehatzak bilatzen dituenean. Askotan, hitz batzuk idazten ditugu, eta lortutako informazioan, hitz horiek zehatz mehats agertzen dira, baina ez da guk lortu nahi genuena.

4. Googlen algoritmoa Page Rank da. Zein da bere eginkizun nagusia ? Page Rank algoritmoak, webgune baten link- ak analizatu eta bakoitzari ematen zaion balorazioa aztertzen du. Esteka horien garrantziari balio bat emango zaio eta horren arabera, Googlek bilaketa zehaztuko du.

5. Googlen bilaketa bat egiten duzunean zer gertatzen da? Azaldu zer gertatzen den “Googlen” barruan Behin Google-en bilaketa bat hasten dugunean honako hau gertatzen da bere barruan:

Lehenik

eta

behin,

Crawlerrak

web

orrien

mailaketa

eta

berreskurapena aurrera eramaten dute. Orrialde horiek, store server-era eramaten dira honek repository-n konprimitu eta bildu dezan. Ondoren, indizazio gertatzen da indixer edo sorter-ean. Hau da, pauso bat atzera eginez, repository-n dokumentua deskonprimitu egiten da honakoan, dokumentua hit batean bihurtuz. Hit-a dokumentu hori ordezkatzen duten hitz edo terminoak dira. Bakoitzak dokumentuari buruzko informazio bat gordetzen 2


Informazio-Konpetentziak ikasgaia Ikus-Entzunezko Komunikazioa Gradua

dueta indexer-ak, hit-ak barrels-an pilatu egiten ditu. Anchors file deituriko fitxategian orrialdearekiko dauden link guztiak gordetzen dira eta URL resolver-a aipatutako fitxategiko dokumentu bakoitzari docID bat asignatu egiten dio. Lehen azaldu dugun bezala Page Rank-a orrialdeen balorazioa egiten du eta orain, Page Rank-a dokID bakoitzaren garrantzia aztertzen du. Gero, dokID bakoitza sorter-aren bitartez wordID bihurtzen dira. Dump Lexicon deituriko programaren bitartez, wordIDren zerrenda hartu egiten. Azkenengoz, Page Rank-ak emandako informazioaren arabera web orrialdeak-ak ordenatu egiten dira, bilaketaren emaitzak bezeroaren eskura jarriz.

3


10 ekarpena