Recuperar informacion

Page 148

Propuesta y desarrollo de un modelo para la evaluación de la recuperación de información en la web.

1. La efectividad media en la recuperación de información es baja,

alrededor del diez por ciento en los primeros diez documentos recuperados. 2. Se detectan diferencias estadísticas considerables entre la precisión de

los motores de búsqueda analizados. Alta Vista, Open Text y Lycos resultan los mejores y Yahoo ocupa el último lugar. Otra cuestión importante a destacar es la amplia distancia entre el primero, alrededor del 40%, y el segundo, sobre el 20%. 3. En el caso de la exhaustividad no se detectan diferencias sustanciales

entre los motores. 4. La realización de una búsqueda aparece más fuertemente vinculada

al algoritmo de localización de la información que a los tipos de búsqueda que permite. 5. Aunque los motores siguen, en líneas generales, los principios generales

de la recuperación de información, su funcionamiento varía de alguna manera ya que es clara la tendencia a recuperar documentos irrelevantes o lejanamente relevantes de algunos de ellos, hecho difícilmente producible en el caso de un sistema de recuperación de información tradicional. Gordon y Pathak también aportan otras conclusiones no menos importantes, una de ellas se refiere a que los índices de los motores poseen tamaños muy diferentes (algunos son diez veces más grandes que otros) y, aunque algún motor, en su publicidad suela afirmar lo contrario, ninguno pretende realmente indexar toda la web. Los motores también difieren en la actualización periódica de los datos, en la posibilidad de que los usuarios añadan páginas por su cuenta, en el plazo de tiempo que se tarda en incorporar una nueva página indexada tras tener noticia de su existencia y en el seguimiento de la disponibilidad de los enlaces. Otro apartado interesante de este estudio es el dedicado al cálculo del grado de solapamiento. Como cada motor de búsqueda sigue distintos criterios a la hora de recopilar páginas de la web y actualizar sus índices, es interesante conocer qué porción de la web poseen en común los diversos motores de búsqueda. Una parte de los documentos en común se debe, seguramente al interés de los administradores de estos sitios web en incorporarlos (de forma manual y voluntaria) a los índices de los motores de búsqueda; aunque la política que siguen los motores de búsqueda para admitir a estas páginas sugeridas no siempre es la misma, y no todas llegan a formar parte de sus índices.

133


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.