Issuu on Google+

Informazio-Konpetentziak ikasgaia Ikus-Entzunezko Komunikazioa Gradua

IZENA: Ane Jauregi

Irakurketa-galderak Mateos Sánchez, M.; García_figuerola, C. (2009). Recuperación de información en la web. Gijón: Trea • Lehenengo artikulu osoa irakurri eta gero erantzun galdera hauek. • Erantzun batzuetarako komeni da Interneten bilaketa batzuk egitea. • Bukatzean Interneten Issun igo. Gero zuen blogean ekarpena egin eta esteka txertatu. 1. Zein dira aipatzen diren bi arazo nagusienak informazioa bilatzerakoan? Testu honetan webguneak informazioa bilatzeko tresna nagusienak bihurtu direla esaten da, eta asko hedatu direla beren sorreratik. Hala ere, oraindik arazoak daudela dio informazioa bilatzerako garaian. Honakoak dira bi arazo nagusiak: -

Erabiltzailea: Askotan arazoak izaten ditu bilatu nahi duena era zehatz eta garbian jartzeko. Ahalegin handia egin behar da oraindik ere.

-

Bilatzailea: Bilatzaile askok milaka orrialdetako emaitzak ematen dituzte eta oso zaila guztien artean zein den nahi genuen informazioa bereiztea.

2. Bilatzaileen Crawler-rak Robot ere deitzen dira. Azaldu zure hitzetan zer egiten duten. Bilatu Interneten nola izena duen Googlen Robotak. Crawler deiturikoak bilatzailearen motorraren zati bat dira. Bilaketan lehen pausua ematen duena da. Bere eginkizuna web guztia ikuskatzea da eta bilatu nahi denarekin zerikusia duen orrialde guztiak biltzea. Askotan weba kolapsatu egiten da Crawler guztiak bere kabuz egiten dutelako lana, denak adostasunez lan egin beharrean. Google bilatzaile ezagunaren Robotak, esaterako, Googlebot du izena.

3. Zer esan nahi du “búsqueda sintáctica”? 1


Informazio-Konpetentziak ikasgaia Ikus-Entzunezko Komunikazioa Gradua

“Búsqueda sintáctica” terminoak honakoa esan nahi du: Erabiltzaileak bere bilaketan idatzi dituen hitzak zein weborritan dauden bilatzen du, era honetan, bilaketarekin zerikusia duen informazioa lortzen da. Hala ere, honek badu alde txar bat. Izan ere, metodo horrekin gehiegizko informazioa bilatzen da eta zaila da erabiltzailearentzat berak nahi duena zehazki zein den asmatzea. Gainera, informazio errepikatu asko ere bilatzen da.

4. Googlen algoritmoa Page Rank da. Zein da bere eginkizun nagusia ? Google bilatzailearen algoritmoa den Page Ranken eginkizun nagusia bilaketan aurkitzen diren webgune guztien artean sailkapena egitea da. Bilaketa azkarragoa eta hain pisutsua izan ez dadin, webguneak beren garrantziaren arabera klasifikatzen ditu. Era honetan, bilatzailearen motorrak badaki zein diren bilaketarekin zerikusi gehien duten weborriak.

5. Googlen bilaketa bat egiten duzunean zer gertatzen da? Azaldu zer gertatzen den “Googlen” barruan Lehenik eta behin, hainbat Crawler-ek bilaketarekin zerikusia duten weborriak biltzen dituzte eta URL server deiturikoak zein url bildu behar dituen adierazten dio. Ondoren store server-ek repository izeneko lekura bidaltzen ditu aukeratutako webguneak, eta bakoitzari dokumentu identifikatzaile bat (docID) jartzen zaio. Indexer-ek dokumentu bakoitza hartu eta hits bihurtzen du eta, gero, barrels deiturikoetan almazenatzen ditu. Anchors file-n ere bakoitzaren enlazea gordetzen du. URL resolver-ek enlaze bakoitza url absolutuan bilakatzen du eta docID bat jartzen dio. Azkenik, datu base bat sortzen du dokumentuen PageRanka kalkulatzeko. Ondoren, sorter-ek wordID deituriko fitxeroetan bilakatzen ditu eta hauen

offsetsen lista bat egiten du. 2


Informazio-Konpetentziak ikasgaia Ikus-Entzunezko Komunikazioa Gradua

DumpLexicon izeneko programa batek lista hau hartzen du (indexer-ek sorturiko lexicon-arekin) eta lexicon berri bat sortzen dio. Amaitzeko, bilatzailearen

motorrak

guzti

honekin,

sortutako

PageRankarekin bilatzailearen emaitza sortuko du.

3

fitxeroarekin

eta


recuperacion de informacion en la web