Issuu on Google+

IZENA: Asier Rekalde Informazio-Konpetentziak ikasgaia Ikus-Entzunezko Komunikazioa Gradua

Irakurketa-galderak Mateos Sánchez, M.; García_figuerola, C. (2009). Recuperación de información en la web. Gijón: Trea • Lehenengo artikulu osoa irakurri eta gero erantzun galdera hauek. • Erantzun batzuetarako komeni da Interneten bilaketa batzuk egitea. • Bukatzean Interneten Issun igo. Gero zuen blogean ekarpena egin eta esteka txertatu. 1. Zein dira aipatzen diren bi arazo nagusienak informazioa bilatzerakoan? Lehenengo arazoa erabiltzaileek nahi duten informazioa lortzeko, nola bilatu, edo ze hitz gako erabili, erabakitzeko orduan dator. Honek erabiltzailearen aldetik esfortzu txiki bat eskatzen duelako eta erraza ez delako. Bigarrena aldiz, ordenagailuak ematen duen erantzunean dago. Informazio mordoa dagoenez interneten, hainbeste informazioarekin lan egitea ez da erraza, eta erabiltzaileei zaila egiten zaie. Bi arazo hauek frustrazioa sortzen dute erabiltzaileengan. 2. Bilatzaileen Crawler-rak Robot ere deitzen dira. Azaldu zure hitzetan zer egiten duten. Bilatu Interneten nola izena duen Googlen Robotak. Crawlerrak Web osoan informazioa bilatzen duen softwera da. Aurkitzerakoan, beste orrialdeei eskakizunak bidaltzen dizkie, bere informazioaz baliatzeko. Geroago beste prozesu baten bitartez, datu-base bat sortzeko. Googlen Robotak Googlebot dute izena.

1


3. Zer esan nahi du “búsqueda sintáctica”? Busquea sintáctica, erabiltzaileak erabili dituen hitzak soilik agertzen diren dokumentuak aurkituko dituela esan nahi du. Zehazki idatzitakoa. Hala ere, horrek ez du esan nahi, hitz berberak beste esanahi bat izan ez dezakeenik.

4. Googlen algoritmoa Page Rank da. Zein da bere eginkizun nagusia ? Informazioaren kalitatea baloratzen da eginkizuna, dokumentuen ezaugarri batzuk kontuan hartzen dituelarik. Azken finean, eginkizuna, informazio egokiena edo interesgarria aurkitzea da.

5. Googlen bilaketa bat egiten duzunean zer gertatzen da? Azaldu zer gertatzen den “Googlen” barruan

Banatuta dauden Crawler batzuk, informazioa bilatu egiten du eta URL jaso egiten du. Hau store server-era bidali eginten da, eta honek repository-an gordetzeaz arduratzen da. Hauen dokumentu identifikatzaile bat ezartzen zaie, (docID). Gorde ezkero, indizazio bat eramaten da aurrera, indexer eta sorter parte hartzen dutelarik. Azkenean Googleek badu “DumpLexicon” deituriko programa bat du, eta honetaz baliatuta eta PageRank-a jarraituta, kontsultei erantzuten die.


Informazio-Konpetentziak ikasgaia Ikus-Entzunezko Komunikazioa Gradua

3


irakurketa galderak