TRabajo sobre Buscadores Web

Page 1

PRÁCTICA SOBRE BUSCADORES CURSO 2009/2010

ROBER C. ÁLVAREZ

PRÁCTICA SOBRE

BUSCADORES CURSO 2010

FACULTAD DE DOCUMENTACIÓN ASIGNATURA: SISTEMAS AVANZADOS DE RECUPERACIÓN DE LA INFORMACIÓN PROFESOR: JOSE RAÚL FERNÁNDEZ DEL CASTILLO DÍEZ ALUMNO: ROBERTO CARLOS ÁLVARE DELGADO AÑO: 2009/2010


PRÁCTICA SOBRE BUSCADORES CURSO 2009/2010

ROBER C. ÁLVAREZ

Resumen

El objetivo principal de este estudio es el de arrojar claridad y exponer las pautas de elección más pertinentes en las selección de las herramientas, que actualmente se ofrecen en la red y que posibilitan la localización y el acceso a la información que se espera recuperar.

Actualmente en una sociedad globalizada donde la cantidad de información que se arroja a la red crece de manera exponencial constantemente, toman especial interés e importancia los métodos para la recuperación de esa información, de una manera pertinente y exhaustiva. Para ello las herramientas que se utilizan son, entre otras, los denominados buscadores. Sin embargo, no todos estos buscadores siguen los mismos procesos de indización y recuperación de la información, ni siguen las mismas políticas de obtención y protección de datos. El saber evaluarlos se convierte en un requisito necesario a la hora de seleccionar el método más apropiado para los intereses del documentalista.

Palabras clave: Buscadores, motores de búsqueda, sistemas de recuperación de información, índices temáticos, metadatos.

Introducción y objetivos En este trabajo se va a tratar de analizar las características y los resultados de los buscadores más relevantes y populares que actualmente son accesibles en la red. Para ellos se van a seguir una serie de procedimientos consistentes básicamente en la utilización de los métodos propios para el análisis de este tipo de buscadores basados en las distintas teorías sobre la recuperación de la información, así por ejemplo, se analizarán principalmente los datos sobre precisión y exhaustividad, para una posterior comparativa, además también se analizarán los datos extraídos de un estudio metódico para la exploración de la interfaz de dichos buscadores y sus posibilidades de control.


PRÁCTICA SOBRE BUSCADORES CURSO 2009/2010

ROBER C. ÁLVAREZ

En definitiva, la realización de unas tareas de estudio que permitirán extraer unas conclusiones sobre el uso de estas herramientas. Dichas herramientas se dividirán en las siguientes: 

Buscadores: (de las que se seleccionan dos además de Google) o Google (http://www.google.com) o Yahoo (http://es.yahoo.com/) o Bing (http://www.bing.com/) o Ask (http://es.ask.com/) o Altavista (http://es.altavista.com) o Lycos (http://www.lycos.es)

Metabuscadores: (seleccionar sólo uno) o Kartoo (http://www.kartoo.com) o Dogpile (http://www.dogpile.com/) o Vivisimo (http://vivisimo.com/)

Búsqueda en redes sociales y blogs: (opcional) o Technorati (http://technorati.com/)

Herramientas de búsqueda en escritorio: (seleccionar uno) o Google Desktop (http://desktop.google.com/) o Yahoo Desktop (http://downloads.yahoo.com/) o Windows Desktop Search (http://www.microsoft.com/latam/windows/desktopsearch/def ault.mspx) o X1 Professional Client (http://pro.x1.com/)

Metodología de estudio Estrategia, planificación y justificación de la búsqueda: En cada uno de los casos llevados a estudio, será necesario determinar las estrategias, planificar las acciones y justificar los resultados. Para el estudio de estas aplicaciones se determinarán una serie de indicadores que permitirán realizar la comparativa expuesta como objetivo de este proyecto. Estos indicadores se centrarán en torno a una serie de puntos determinantes:

a) Consulta directa, interfaz y ayuda


PRÁCTICA SOBRE BUSCADORES CURSO 2009/2010

ROBER C. ÁLVAREZ

b) Búsqueda y sintaxis. i.

Datos de precisión a primera hoja de resultados (10) a 25 y 50 primeros resultados.

ii.

Datos de recall a primera pantalla, a 25 y 50 primeros resultados.

c) Estudio del diseño o tecnologías implicadas.

A parte de estas líneas principales, es posible incluir ciertos apartados e indicadores que ayuden a cumplimentar la comparativa así como a incrementar los niveles de calidad del estudio propuesto. 

Estudio de la interfaz, consulta directa y ayuda: a) “Captura” de la interfaz. (2 puntos) a. Disposición de los elementos: i. Elementos del servicio (0,5 puntos) ii. Herramientas de ayuda (0,5 puntos) b. Claridad de las opciones i. Fácilmente identificable (0,5 puntos) ii. Entendible (0,5 puntos) b) Posibilidades de la herramienta. (6,5 puntos) a. Consulta multi-formato i. Texto (0,5 puntos) ii. Imágenes (0,5 puntos) iii. Sonido (0,5 puntos) iv. Vídeo (0,5 puntos) b. Diferenciación de los enlaces ya visitados (0,75 puntos) c. Valoración de los contenidos de los resultados de búsqueda (0,75 puntos) d. Posibilidad de guardar resultados de búsqueda (0,75 puntos) e. Permite clasificación u ordenación de los elementos encontrados (0,75) f. Ofrece posibilidad de traducción (0,75 puntos) g. Contacto o buzón de sugerencias (0,75 puntos) c) Información corporativa (1,5 puntos) a. Permite enviar contenido para indexar (0,75 puntos) b. Ofrece información sobre las Políticas del buscador (0,75 puntos)


PRÁCTICA SOBRE BUSCADORES CURSO 2009/2010

ROBER C. ÁLVAREZ

Estudio de las posibilidades de búsqueda avanzada y sintaxis: a) Precisión en la estrategia de búsqueda (6 puntos) a. Búsqueda por palabra clave (0,5 puntos) b. Búsqueda exacta (0,5 puntos) c. Búsqueda con usando operadores boléanos (0,5 puntos) d. Búsqueda en índices (0,5 puntos) e. Búsqueda sin determinada palabra (0,5 puntos) f. Filtrar por tipo de documento (0,5 puntos) g. Filtrar por fecha determinada (0,5 puntos) h. Filtrar por última actualización (0,5 puntos) i. Filtros de seguridad (0,5 puntos) j. Permitir búsquedas en sitios concretos (0,5 puntos) k. Búsqueda de páginas similares (0,5 puntos) l. Búsqueda de páginas interconectadas por enlaces (0,5 puntos) b) Información adjunta a los resultados de búsqueda (4 puntos) a. Precisar el lugar donde esté la palabra clave (título, texto...) (0,5 puntos) b. Mostrar el número de resultados visualizados (0,5 puntos) c. Mostrar el idioma de las páginas recuperadas (0,5 puntos) d. Mostrar el formato del archivo recuperado (0,5 puntos) e. Ofrecer la fecha de última actualización de los datos recuperados (0,5) f. Ofrecer una pre-visualización de las recuperaciones (0,5 puntos) g. Ofrece publicidad relacionada (0,5 puntos) h. Incorpora algún tipo de restricción (por ejemplo por edad) (0,5 puntos)

Para plantear los parámetros sobre los datos de precisión a primera hoja de resultados y los datos de recall a primera pantalla, en primer lugar, es preciso determinar un marco metodológico que permita la comparación de los resultados bajo una misma perspectiva. Por ese motivo, se fijará una estrategia de búsqueda concreta que será repetida en los distintos buscadores analizados. De este modo será posible analizar los datos. Por otro lado es necesario establecer un universo delimitador del objeto de estudio que permita acotar la muestra y de este modo concretar y permitir ejecutar la


PRÁCTICA SOBRE BUSCADORES CURSO 2009/2010

ROBER C. ÁLVAREZ

labor de contraste y análisis de los resultados. Para este cometido, se ha optado por utilizar los datos del buscador Google, como elemento delimitador de los resultados y así permitir ciertas comparativas como por ejemplo la exhaustividad.

Estrategia para la generación de consultas: Término 1 = anime (se pretende evaluar la ambigüedad en un termino popular, debido a que puede referirse tanto a un tipo de modelo de animación, la japonesa, como a un tiempo verbal) Término 2 = dibujo animado (palabra compuesta sin comillas, se pretende encontrar la consistencia de este término en el proceso de recuperación, para evaluar las consultas pertinentes de las que no) Término 3 = cartoons (término anglosajón popularizado y extendido a otras lenguas, se pretende mostrar la capacidad para filtrar resultados en otras lenguas)

Estos términos serán sometidos a la siguiente evaluación según cada buscador:

Ref.

Ni10 Ni20 Ni30 Ni50

Ng1 Ng2 Ng3 Ng4

P/t1

n1/10 = P/t1.1 n2/20 = P/t1.2 n3/30 = P/t1.3 n4/50 = P/t1.4

P/t2

P/t3

E/t1

E/t2

E/t3

n1/10 = P/t1.1 n2/20 = P/t1.2 n3/30 = P/t1.3 n4/50 = P/t1.4

n1/10 = P/t1.1 n2/20 = P/t1.2 n3/30 = P/t1.3 n4/50 = P/t1.4

n1/ng4 =E/t1.1 n2/ng4=E/t1.2 n3/ng4=E/t1.3 n4/ng4=E/t1.4

n1/ng4 =E/t2.1 n2/ng4=E/t2.2 n3/ng4=E/t2.3 n4/ng4=E/t2.4

n1/ng4 =E/t3.1 n2/ng4=E/t3.2 n3/ng4=E/t3.3 n4/ng4=E/t3.4

Ni10- Ni50> 10-50 resultados primeros de búsqueda en buscador i. Ng1-Ng4> datos de referencia, universo acotado por el buscador Google. n1-n4> número de resultados obtenidos para cada término (según columna) P/t1> Precisión término 1 P/t2> Precisión término 2 P/t2> Precisión término 3 E/t1> Exhaustividad término 1 E/t2> Exhaustividad término 2 E/t3> Exhaustividad término 3


PRÁCTICA SOBRE BUSCADORES CURSO 2009/2010

ROBER C. ÁLVAREZ

Fórmulas para cumplimentar los datos:

Las dos medidas más utilizadas acostumbran a ser el índice de exhaustividad (recall) y el índice de precisión (precision). Las fórmulas para estos dos índices son las siguientes:

Exhaustividad =

Número de documentos relevantes recuperados _________________________________________ X 100 Número total de documentos relevantes presentes en el fondo documental

Precisión =

Número de documentos relevantes recuperados ______________________________________ X 100 Número total de documentos recuperados

Una vez obtenidos todos los datos se realizará una tabla conjunta de los buscadores analizados, para con ellos proceder a un contraste y reflexión adecuados. 

Estudio del diseño o tecnologías implicadas. A redactar con los siguientes contenidos y otros relevantes o específicos de cada buscador. a) Valores añadidos al servicio de búsqueda: a. Imagen de marca b. Cuentas asociadas a servicios c. Personalización de la interfaz de búsqueda d. Posibilidad de integrar el buscador en el navegador e. Otros b) Método o proceso de funcionamiento (detección de la calidad) a. Método de indexación. Generador de índices b. Método de rastreo. Spiders c. Método para posicionar los resultados. PageRank y otros d. Otros c) Puntos clave y puntos débiles a. Relevancia del buscador b. Posición comercial

Una vez realizado el estudio en todas sus fases y con todos los objetos del análisis, se procederá a realizar un análisis comparativo y contrastivo de los datos obtenidos, para acabar en unas conclusiones con cada uno de los buscadores.


ESTUDIO SOBRE BUSCADORES INTERFAZ Los elementos componentes de la interfaz del buscador vienen perfectamente identificables y centrados. Tanto las acciones para realizar búsquedas, como los servicios, las búsquedas avanzadas, imagen corporativa, diferentes idiomas, diferentes tipos de búsqueda, etcétera disponen de acceso directo desde la página principal. Nos encontramos ante una interfaz clara y poco masificada, circunstancias que convierten este buscador en una herramienta muy amigable y accesible.

CONTENIDOS Ofrece varios tipos de resultados al realizar una búsqueda “Web”, entre las que destaca imágenes y vídeos. En la disposición de los elementos recuperados, añade entre otros datos de actualización, URL, Título de la página, parte del contenido donde se reflejan las palabras clave recuperadas, número de visitas hoy, la opción de ir a similares, enlaces externos, resultados totales, tiempo de búsqueda… Además incorpora un menú que permite ampliar o redefinir la búsqueda ya realizada. Además de formulas para realizar búsquedas personalizadas directamente.


INTERFAZ Se trata de una interfaz diferente, con una imagen central de fondo que varía diariamente. Dispone un marco de búsqueda con diversas opciones, permite filtrar por diferentes posibilidades. Desde preferencias es posible ampliar algo los controles de la búsqueda. Desde la interfaz es posible acceder al buscador a sus servicios, información corporativa y diferentes idiomas. Bing, pertenece a Microsoft, por lo que está integrado en su navegador y permite búsquedas inmediatas. Por composición con menos opciones desde el menú principal y estructura simple, podemos afirmar que se trata de un buscador bastante amigable, pero con ciertas restricciones especialmente es su búsqueda avanzada (disponible después de hacer la búsqueda).

CONTENIDO Muestra los resultados de la búsqueda integrando resultados en imagen. Ofrece información sobre el título, un pequeño texto de donde se extrajo la palabra clave, así como la URL. También aporta los datos de cantidad de resultados obtenidos. Ofrece un menú donde poder concretar y ampliar los parámetros de búsquedas. Ofreciendo restricciones en Sitios/dominios, regiones o países e idioma.


INTERFAZ Se trata de un buscador con una Web de acceso muy sencilla, compuesta por una caja de búsquedas y una barra de herramientas modulable. Ask, ofrece la posibilidad de realizar búsquedas avanzadas, imágenes, software (búsqueda directa para descargas P2P, entre otras), divisas, el tiempo… Además de información corporativa y de privacidad. Estamos ante una interfaz, donde sobresale la escasez y simpleza de los elementos y opciones disponibles desde el acceso principal.

CONTENIDO Al igual que los otros buscadores consultados, Ask, reporta resultados “patrocinados” en el primer lugar de las respuestas a la búsqueda. Por otro lado, destaca la posibilidad de realizar un previsualización de los contenidos situando el cursor sobre un icono cercano a la URL resultante. También ofrece datos sobre el Título de la Web, y una frase de contenidos. También ofrece el número total de resultados obtenidos y la opción de ampliar y modificar los parámetros de la búsqueda para filtrar mejor los resultados.


ANÁLISIS Y CONTRASTE Análisis/ buscador

Ptos. x/10

Consulta directa, interfaz y ayuda Captura de la interfaz

Posibilidades de la herramienta

Disposición de los elementos

Claridad de las opciones

Consulta multi-formato

Elementos del servicio (0,50)

Herramientas de ayuda (0,50)

Fácilmente identificables (0,50)

Entendible (0,50)

Texto (0,50)

Google 0,45

0,30

0,45

0,45

Bing

0,35

0,40

0,30

Ask

0,40

0,30

0,40

Valoración de los contenidos (0,75)

Guardar resultados de búsqueda (0,75)

Clasificación u ordenación de los elementos (0,75)

Posibilidad de traducción (0,75)

Contacto o buzón de sugerencias (0,75)

Permite enviar contenido para indexar (0,75)

Políticas del buscador (0,75)

Imagen (0,50)

Vídeo (0,50)

0,50 0

0,50

0,50 0,75

0

0,50

0

0,75

0,75

0,75

0,75

7,4

0,40

0,50 0

0,50

0,50 0,75

0

0

0

0,75

0,25

0,50

0,75

5,95

0,45

0,50 0

0,45

0

0

0

0

0,75

0,50

0,45

0,75

5,7

Análisis/ buscador

Sonido (0,50)

Diferencia de los enlaces ya visitados (0,75)

Información Corporativa

0,75

Ptos. x/10

Estudio de las posibilidades de búsqueda avanzada y sintaxis Precisión en la estrategia de búsqueda

Información adjunta a los resultados de búsqueda

(todos los valores 0,50)

(todos los valores 0,50)

Boléanos

índices

Sin palabra

Tipo de doc.

Fecha

Actualizado

Seguridad

Sitio

similar

Interconectado

Lugar palabra

Nº visual.

Idioma

Formato

Actualiza.

Visual.

Publi.

Restricción

Google 0,50 0,50

0,45

0,25

0

0,50

0

0,50

0,30

0,50

0,50

0,40

0,50

0,50

0,50

0,50

0,50

0

0,50

0,50

7,90

Bing

0,50 0,50

0,50

0

0

0,40

0

0

0,20

0,50 0

0

0,50

0,50

0,50

0,50

0

0

0,50

0,50

5,60

Ask

0,50 0,50

0,50

0,0

0

0,10 0

0

0,20

0,50 0

0

0,50

0,40 0,50

0

0

0,50

0,50

0,40

5,10

P. clave

Exacta


ESTUDIO DE LA PRECISIÓN Y EXHAUSTIVIDAD (Fecha de consulta 21/05/10)

Ref./t1 Ref./t2 Ref./t3

Ng10 Ng20 Ng30 Ng50

10 15 21 34

9 18 27 46

8 16 22 41

P/t1

10/10 = 1 15/20 = 0,75 21/30 = 0,70 34/50 = 0,68

t1 = manga t2 = dibujo animado t3 = cartoons

GOOGLE P/t2 P/t3

9/10 = 0,9 18/20 = 0,9 27/30 = 0,9 46/50 = 0,92

8/10 = 0,8 16/20 = 0,75 22/30 = 0,73 41/50 = 0,82

E/t1

E/t2

E/t3

10/34 = 0,294 15/34= 0,441 21/34= 0,617 34/34= 1

9/46 = 0,195 18/46= 0,391 27/46= 0,587 46/46=1

8/41 = 0,195 15/41= 0,365 22/41= 0,536 41/41= 1

88.3 00.000 de resultados/ de los 50 primeros los 50 aparecen en castellano, sin necesidad de usar ningún filtro (Google.es) para t1 2.870.000 de resultados/ 50/50 en castellano, mismas condiciones, para t2 51.300.000 de resultados/ 6/50 en Castellano, mismas condiciones, para t3

Las búsquedas se han realizado teniendo en cuenta el uso predefinido por el propio buscador, es decir, la opción por defecto del buscador. En caso de Google, las búsquedas por defecto se realizaron en Google.es, en caso de Bing, las búsquedas por defecto se realizan en toda su base de datos sin fijar zonas o regiones, aunque predomina el castellano, en el caso de ASk.com para el t1 y t3 a pesar de estar en la sección es.ask.com prácticamente la totalidad de los resultados recuperados son en inglés.

t1: Los resultados de búsqueda son en un gran número referidos a los objetivos, es decir, a un tipo de dibujo japonés. Sin embargo entre los resultados no relevantes, cabe destacar la presencia de “manga” como nombre propio de algunos complejos turísticos españoles, en “la manga del mar menor” y también como referencia a longitud náutica. t2: Casi la totalidad de los resultado muestran la recuperación conjunta de los términos, sin embargo entre los no relevantes, destaca como referentes “dibujo animado” sobre elementos Web, como gifs animados o flash, además de noticias donde se menciona la palabra dibujo animado sin que tenga ninguna relación con el tema en sí. t3: A pesar de utilizar el mismo sistema de búsqueda que con los anteriores términos en este caso, se han recuperado un número muy pequeño de documentos relevantes en castellano. En Cuanto a los resultados en castellano, la mayoría se refiere a los dibujos animados de origen norteamericano, pero entre los no relevantes destacan los referidos a las viñetas de dibujos periodísticos.


Ref./t1 Ref./t1 Ref./t1

Nb10 Nb20 Nb30 Nb50

10 15 21 34

9 18 27 46

8 16 22 41

P/t1

8/10 = 0,8 16/20 = 0,8 25/30 = 0,833 41/50 = 0,82

BING P/t2

8/10 = 0,80 15/20 = 0,75 21/30 = 0,70 36/50 = 0,72

P/t3

E/t1

E/t2

E/t3

5/10 =0,5 8/20 = 0,4 12/30 = 0,4 15/50 = 0,3

8/34 = 0,235 16/34 = 0,470 25/34 = 0,735 41/34 = 1,205

8/46 = 0,173 15/46 = 0,326 21/46 = 0,456 36/46 = 0,782

5/41 = 0,121 8/41 = 0,195 12/41 = 0,292 15/41 = 0,365

241.000.000 de resultados/ de los 50 primeros los 50 aparecen en castellano, sin necesidad de usar el filtro (en BING.com /?cc=es) para t1 539.000 resultados/ todos los resultados en castellano para t2 150.000.000 resultados 33/50 son en castellano, el resto en inglés para t3. t1: Los resultados son especialmente positivos, destaca la aparición de información patrocinada en todas las páginas sobre hoteles y agencias de viajes con referencias a zonas de turismo costeras. También una agencia de abogados y grupos en Myspace entre otros. t2: Entre los documentos no relevantes aparecen una gran cantidad de noticias y foros que mencionan las palabras “dibujo animado” sin que tengan nada que ver con el contenido. Son una mera referencia. “Esta persona se parece a tal dibujo animado” “Me gusta tal personaje de este dibujo animado” etc. t3: Destacan un número elevado de resultados en castellano a diferencia de Google.es. Entre los resultados no relevantes están los referidos a un grupo de música con el mismo nombre y sobresalen una gran cantidad de resultados contenido “adulto” que desechamos. Como curiosidad también destacar que se muestre publicidad de telefónica, televisiones digitales, y seguros…


Ref./t1 Ref./t1 Ref./t1

Na10 Na20 Na30 Na50

10 15 21 34

9 18 27 46

8 16 22 41

P/t1

8/10 = 0,8 17/20 = 0,85 24/30 = 0,8 40/50 = 0.8

ASK P/t2

8/10 = 0,8 16/20 = 0,8 24/30 = 0,8 42/50 = 0,84

P/t3

E/t1

E/t2

E/t3

9/10 = 0,9 17/20 = 0,85 26/30 = 0,86 43/50 = 0,86

8/34 =0,235 17/34= 0,5 24/34= 0,705 40/34= 1,176

8/46 = 0,173 16/46= 0,347 34/46= 0,739 42/46= 0,913

9/41 = 0,219 17/41= 0,414 26/41= 0,634 43/41= 1,048

24.300.000 resultados/ de los 50 primeros tan sólo 4 son en castellano para es.ask.com con t1, la publicidad que muestra no está relacionado con el tipo de búsqueda. 969.000 resultados, todos en castellano. 13.800.000 resultados, el 100% de los recuperados (50) son en inglés. t1: Prácticamente todos los resultados son en inglés, en la sección de búsquedas relacionadas se aconsejan las búsquedas “mangas del mar menor”, “manga ropa” manga náutica” Manga Films”… Entre los resultados no relevantes destacan contenidos sobre foros de manga y contenidos para adultos. t2: La mayoría de los datos recuperados hacen referencia a dibujos animados, incluso la mayoría de los resultados patrocinados, entre los no relevantes, destacan los que recuperan páginas que mencionan redes sociales, noticias no relevantes y componentes o útiles web. t3: De los resultados no relevantes obtenidos durante la búsqueda, destacan la recuperación de “Cartoons” como un apellido así como las referencias a las caricaturas de prensa y alguna noticia controvertida. Otra característica es la gran cantidad de preview que pueden ser consultadas en estas secciones y en general en todas las búsquedas en ASK.com


GRÁFICOS COMPARATIVA Precisión/t1

Google.es

Exhaustividad/t1

Bing.com

Exhaustividad

Ask.com 1,2

Precisión

1 0,8 0,6 0,4

E/ t 1( 50) Ask.com

E/ t 1( 30)

Bing.com E/ t 1( 20)

Google.es

E/ t 1(10)

0,2

0

0

0,2 E/ t 1( 10)

P/ t 1( 50)

0,4

0,6

0,8

E/ t 1(20)

1 E/ t 1( 30)

1,2

1,4

E/ t 1( 50)

P/ t 1(10)

P/ t 1( 20)

P/ t 1(30)

Google.es

1

0,75

0,7

0,68

Ask.com

0,235

0,5

0,705

1,176

Bing.com

0,8

0,8

0,833

0,82

Bing.com

0,235

0,47

0,735

1,205

Ask.com

0,8

0,85

0,8

0,8

Google.es

0,294

0,441

0,617

1

N º bú squ e d a s

N ú m e r o de bú squ e d a s

Google.es

Exhaustividad/t2

Precisión/t2

Bing.com

Exhaustividad

Ask.com 1

Precisión

0,8 0,6 0,4

E/ t 2( 50) Ask.com

E/ t 2( 30)

Bing.com E/ t 2( 20)

Google.es

E/ t 2(10)

0,2 0

0,2

0,4

0,6

0,8

1

1,2

0 P/ t 2(10)

P/ t 2(20)

P/ t 2(30)

P/ t 2( 50)

E/ t 2( 10)

E/ t 2( 20)

E/ t 2(30)

E/ t 2(50)

Google.es

0,9

0,9

0,9

0,92

Ask.com

0,173

0,347

0,739

0,913

Bing.com

0,8

0,75

0,7

0,72

Bing.com

0,173

0,326

0,456

0,782

Ask.com

0,8

0,8

0,8

0,84

Google.es

0,195

0,391

0,587

1

N úm e r o d e b úsq ue da s

N º bú squ e d a s

Exhaustividad/t3

Precisión/t3

Google.es

Precisión

Ask.com

Exhaustividad

Bing.com 1 0,8 0,6 0,4

E/ t 3(50) Ask.com

E/ t 3(30)

Bing.com E/ t 3(20)

Google.es

E/ t 3( 10)

0,2

0

0,2

0,4

0,6

0,8

1

1,2

0 P/ t 3( 10)

P/ t 3( 20)

P/ t 3( 30)

P/ t 3(50)

Google.es

0,8

0,75

0,73

0,82

Ask.com

0,2

0,414

0,634

1,048

Bing.com

0,5

0,4

0,4

0,3

Bing.com

0,111

0,195

0,292

0,365

Ask.com

0,9

0,85

0,86

0,86

Google.es

0,195

0,365

0,536

1

N ú m e r o d e bú squ e da s

E/ t 3(10)

E/ t 3( 20)

E/ t 3(30)

N º b úsqu e d a s

E/ t 3(50)


Análisis/ buscador

Valores añadidos al servicio de búsqueda

Google

Bing

Ask

Valor

Estudio del diseño o tecnologías implicadas

Imagen marca Google dispone de una imagen de marca muy potente a nivel mundial. Su actividad y sus servicios son muy conocidos. Bing, dispone de una imagen muy potente, su presencia y su interfaz con una imagen de fondo atractiva, es muy llamativa y aumenta su valor de “imagen” La imagen de marca de Ask.com tal vez sea la más pobre de los dos anteriores. Muestra una imagen sencilla y modesta.

Otros servicios

Personalización

Asociado a Google existen multitud de servicios a los que se puede acceder desde su buscador, como Google Earth, Bloger, youtube, picasa…

Con IGoogle, es posible personalizar la interfaz de búsqueda de Google añadiendo servicios y más información.

Los servicios que pueden asociarse a Bing son los de Messenger entre algún otro. Al ser de la empresa Microsoft, dispone de un gran corporativismo.

Es posible personalizar algunos parámetros. Está directamente relacionado con Hotmail y otros servicios de personalización.

No dispone de ningún servicio destacable, sin embargo ofrece la búsqueda de software y una preview de las páginas, algo muy valorable

Es posible personalizar muy poco el buscador, pero aun así permite añadir ciertos contenidos al menú de búsquedas.

Integrar navegador Es posible integrar la herramienta de búsqueda a cualquier navegador, accediendo a las buscador desde cualquier lado.

Sobre 10

Método o proceso de funcionamiento

Puntos clave y puntos débiles

Otros

Indexación

Rastreo

Posición

Otros

Relevancia

Posición comercial Google se coloca en el lugar de líder indiscutible como buscador a nivel mundial. Tanto por sus servicios como por sus actividades destaca.

Existen Gadget y otras herramientas muy útiles que permiten integrarse a cualquier Web.

Permite añadir contenido a indexar de manera fácil y sencilla.

Dispone de spiders, Googleboots que recogen información y la indexan en los servidores de Google.

Utiliza el sistema de PageRank, datos de los meta Webs y análisis de contenido. Un complejo logaritmo.

Google prima entre los resultados sus herramientas, así como potencia la publicidad de sus servicios.

Estamos ante el buscador más popular de todos. Continuamente citado en medios de comunicación y foco de enorme controversia.

Bing viene instalado como buscador predeterminado en el navegador de Microsoft, Internet Explorer.

La navegabilidad y la ayuda disponible en Bing, en ocasiones es algo difícil de utilizar.

Permite indexar contenidos, pero el acceder a este servicio es una tarea bastante complicada. Dispone del Powerset, tecnología de semántica

El mecanismo de indexación y rastreo es similar al de otros buscadores, con spiders de rastreo que indexan contenido

El sistema utilizado por Bing para posicionar las páginas es un cúmulo de operaciones al que se hace difícil acceder.

Hemos destacado en el estudio la gran cantidad de contenido para adulto en un par de búsquedas, También una publicidad poco perfilada.

Estamos ante un buscador que aspira a ser alternativa a Google, la asociación e Microsoft con Yahoo espera recortar la popularidad y el uso a Google.

Estamos ante un buscador relativamente joven que ha adquirido cierta relevancia en poco tiempo.

6

Es posible añadir una barra de herramientas a los navegadores con el buscador

Permite realizar búsquedas en otros buscadores de la misma organización.

Ask muestra cierta prioridad en cuanto a la búsqueda en contenidos P2P como emule o biTorrent.

Ask rastrea el contenido de las web y los indexa según sus parámetros de prioridad, algo diferentes y más lentos al resto (no sufre de spam)

Ask utiliza una tecnología denominada ExpertRank os enlaces a un sitio web tienen más peso si proceden de otros sitios dedicados a un tema similar. También intenta mdeir la popularidad de cada click.

La idea que dio lugar a Ask.com fue la capacidad de responder preguntas realizadas en lenguaje natural.

En origen tuvo cierta relevancia, actualmente se asocia a un buscador menos potente, pero algo más especializado en contenidos de intercambio.

Ask.com fue el primer buscador comercial del tipo preguntarespuesta desarrollado para www.

6,5

8


Google Google es el buscador más popular de entre los analizados y probablemente de todos los existentes, pero esa popularidad se debe especialmente a la gran cantidad de servicios y herramientas asociadas a este buscador, además de una interfaz muy amigable y personalizable que ha convertido a Google en el buscador nº1. Sin embargo el estudio nos muestra que el buscador de Google, obtiene y ofrece resultados entre los más populares pero añadiendo gran cantidad de ruido según se va profundizando en más resultados. En cuanto a las posibilidades de búsquedas avanzadas, búsquedas en otros formatos e incluso incorporación de publicidad relevante, Google también parece encontrarse en una posición más destacada que el resto.

CONCLUSIONES Bing Bing es un buscador relativamente joven, que intentará incorporar la tecnología de Yahoo junto con la de Microsoft. Actualmente dispone de un número determinado de servicios donde destaca la asociación del buscador a Hotmail. En cuanto a sus posibilidades y su interfaz, no es tan intuitiva ni eficaz como la de Google, y en algunas ocasiones puede llegar a perderse. Sin embargo en cuanto a su faceta como buscador, es capaz de recuperar un enorme número de resultados. Un punto negativo, es que no parece incorporar ningún elemento previo de retracción a contenidos para adultos, auque si dispone de una herramienta para controlarlo. Igualmente se trata de un buscador muy potente. Destaca una interfaz muy atractiva con unas imágenes de fondo de gran calidad.

Ask Con Ask nos encontramos con un buscador que parece querer posicionarse en otro segmento del mercado. Las posibilidades de buscar contenidos de software directamente y relacionarse con herramientas de uso compartido P2P , combinada con su metodología de posicionamiento ExpertRank, demuestran en cierta medida esta posibilidad. Su origen como buscador semántico y su continua evolución le han relegado a una posición de buscador poco popular, sin embargo es bastante conocido en foros para expertos. En cuanto a sus resultados relevantes son bastante positivos, aunque el número total de elementos encontrados es bastante inferior que los otros buscadores. Indexa contenido de manera más lenta y predomina el contenido en inglés.


ANÁLISIS DE UN METABUSCADOR

DOGPILE: METABUSCADOR Se trata de una herramienta capaz de lanzar búsquedas simultáneas en los diferentes motores de búsqueda. Dogpile retorna las búsquedas desde los motores About, Ask.com, FinWhat, Google, LookSmart, MSN Search, Bing.com, Teoma, Yahoo! y otros buscadores populares, incluyendo de audio y video. Según un propio estudio realizado por Dogpile, sólo el 3% de los resultados son redundantes entre Google, Bing, Ask, Yahoo e incluso el 85% de los resultados de uno de estos buscadores puede ser contenido totalmente único. Esto justifica enormemente la existencia de este tipo de herramientas. Al lanzar una búsqueda el metabuscador ofrece los resultados dando los datos típicos de cada buscador y añadiendo desde cual de estos se ha adquirido la información. Permite realizar búsquedas avanzadas, búsquedas en diferentes formatos y ofrece diversos servicios.


Análisis/ buscador

Captura de la interfaz

Dogpile

Posibilidades de la herramienta

Disposición de los elementos

Claridad de las opciones

Consulta multi-formato

Elementos del servicio (0,50)

Herramientas de ayuda (0,50)

Fácilmente identificables (0,50)

Entendible (0,50)

Texto (0,50)

0,40

0,35

0,40

0,40

0,50 0

Análisis/ buscador

Sonido (0,50)

Diferencia de los enlaces ya visitados (0,75)

Imagen (0,50)

Vídeo (0,50)

0,50

0,50 0,75

Información Corporativa

Valoración de los contenidos (0,75)

Guardar resultados de búsqueda (0,75)

Clasificación u ordenación de los elementos (0,75)

Posibilidad de traducción (0,75)

Contacto o buzón de sugerencias (0,75)

Permite enviar contenido para indexar (0,75)

Políticas del buscador (0,75)

0

0

0

0

0,60

0

0,75

Dogpile 0,5

Precisión en la estrategia de búsqueda

Información adjunta a los resultados de búsqueda

(todos los valores 0,50)

(todos los valores 0,50)

Exacta

Boléanos

índices

Sin palabra

Tipo de doc.

Fecha

Actualizado

Seguridad

Sitio

similar

Interconectado

Lugar palabra

Nº visual.

Idioma

Formato

Actualiza.

Visual.

Publi.

Restricción

0,5

0,5

0

0

0,5

0

0

0

0,5

0

0

0,5

0

0

0

0

0

0,5

0,5

Características a añadir: Es capaz de ofrecer el resultado y su buscador, así como de determinar en cuantos de estos buscadores se repite el contenido. (redundancia) Identifica el contenido “normal” del contenido patrocinado. Permite búsquedas avanzadas muy completas y en diferentes formatos

A continuación se van a analizar el número de respuestas encontradas según los términos anteriores, relativas a los buscadores analizados en el estudio. Google Bing Ask Yahoo Otros Google Bing Ask Yahoo Otros Google Bing Ask Yahoo Otros t1 t1 t1 t1 t1 t2 t2 t2 t2 t2 t3 t3 t3 t3 t3 Nd10 Nd20 Nd30 Nd50

9 11 11 11

5 7 10 10

2 5 9 10

6 12 15 32

0 0 0 0

7 10 12 12

4 7 9 10

0 3 6 10

4 7 11 26

0 0 0 0

8 13 15 15

4 7 9 10

5,15

Ptos. x/10

Estudio de las posibilidades de búsqueda avanzada y sintaxis

P. clave

  

Ptos. x/10

Consulta directa, interfaz y ayuda

2 0 3 8

3 9 12 26

El número elevado de resultados se debe a la redundancia (el metabuscador marca resultados de varios buscadores)

0 0 0 0

4


Resultados en Dogpile para t1

t1 = manga t2 = dibujo animado t3 = cartoons

Cantidad de resultados

35 30

Una vez analizados los resultados podemos llegar a las siguientes conclusiones:

25 Googl e t1 Bi ng t1

20

Ask t1 15

El metabuscador Dogpile, ofrece un gran número de resultados de Google en sus búsquedas entre las primeras recuperaciones, según vamos avanzando en los resultados, los documentos relacionados con Google, van desapareciendo o aumentando muy poco a poco.

El buscador Bing aparece en un porcentaje muy estable, con un crecimiento paulatino, sin despuntes.

Los resultado en Ask aparecen un número de veces inferior, sin embargo su presencia aumenta según se avanza y profundiza en la cantidad de recuperaciones.

Yahoo Search, es el buscador que experimenta un enorme aumento al avanzar en el número de resultados totales recuperados. A partir de los 50 resultados prácticamente todos son del buscador de Yahoo.

A pesar de incluir más buscadores en su lanzamiento Dogpile no ha mostrado ningún resultado más, salvo los de Google, Ask, Bing y Yahoo Search, para los tres términos empleados en el análisis.

Cabe destacar un número no muy elevado de resultados obtenidos redundantes, es decir, la mayoría de los resultados son exclusivos de cada buscador y no se repiten en los otros.

Yahoo t1 Otr os t1

10

5 0 Nd10

Nd20

Nd30

Nd50

N º t ot a l de r e c upe r a dos

Resultados Dogpile para t2 30

Cantidad resultados

Las búsquedas se han realizado teniendo en cuenta el uso predefinido por el propio buscador, es decir, la opción por defecto del buscador. Fecha de las búsquedas: 22/05/2010

25

20

Googl e t2 Bi ng t2 Ask t2

15

Yahoo t2 Otr os t2

10

5

0 Nd10

Nd20

Nd30

Nd50

N º t ot a l r e c upe r a dos

Resultados en dogpile para t3

Cantidad de resultados

30

25

20

Googl e t3 Bi ng t3 Ask t3

15

El 88,3% de las principales son únicas

búsquedas

Sólo el 11,7% redundantes.

resultados

Yahoo t3 Otr os t3

10

5

0 Nd10

Nd20

Nd30 N º t ot a l de r e c upe r a dos

Nd50

son


Análisis/ buscador

Valores añadidos al servicio de búsqueda

Dogpile

Valor

Estudio del diseño o tecnologías implicadas

Imagen marca

Otros servicios

Personalización

Aparentemente dogpile dispone de una imagen de marca bastante trabajada y atractiva, sin embargo no se encuentra entre las páginas más visitadas según los ránkines de visitas, luego su popularidad está muy por debajo de los buscadores convencionales.

No dispone de ningún servicio relevante, sin embargo la capacidad de que dispone para lanzar búsquedas en varios buscadores y ofrecer los resultados mostrando qué buscador y si son redundantes, puede ser una herramienta bastante atractiva.

Ofrece la posibilidad de personalizar las búsquedas según sus resultados.

Integrar navegador Puede integrarse en la barra de herramientas del navegador que se utilice.

Sobre 10

Método o proceso de funcionamiento

Puntos clave y puntos débiles

Otros

Indexación

Rastreo

Posición

Otros

Relevancia

Ofrece información personalizada, distingue en los resultados la infor4mación patrocinada de la que no.

Se trata de una herramienta que lanza consultas en varios buscadores y luego ofrece los datos de cada uno.

Realiza un mecanismo de rastreo basado en los “metasearch”

Dogpile en su información corporativa habla de un posicionamiento basado en la popularidad.

Permite realizar búsquedas determinando y delimitando el buscador y el idioma a recuperar.

Actualmente no dispone de una relevancia muy marcada entre los usuarios pero dispone de todos los elementos necesarios para pasar a convertirse en un metabuscador popular

Información de referencia: http://www.dogpile.com/dogpile/ws/about/rfcid=1245/rfcp=left/_iceUrlFlag=11?_IceUrl=true

Dogpile Nos encontramos ante un metabuscador muy atractivo en imagen y posibilidades de uso. Las herramientas que ofrece para realizar consultas en múltiples buscadores y ofrecer sus resultados especificando si son patrocinados o no y si se repiten o no entre los buscadores empleados, hacen de Dogpile una herramienta a tener en cuenta para el estudio del posicionamiento. Además permite personalizar y realizar consultas en diferentes formatos al igual que ofrece herramientas o servicios como plus a su uso. En cuanto a los resultados, prima entre los primeros Google, pero prevalece Yahoo según se profundiza. En definitiva estamos ante un metabuscador óptimo a tener en cuenta.

Posición comercial Trata de posicionarse como un buscador que permita realizar búsquedas “libres” con un solo motor de búsqueda que aglutine la potencia de los demás buscadores.

6,5


ANÁLISIS DE UNA HERRAMIENTA DE ESCRITORIO


¿Qué es Google Desktop? Google Desktop es una herramienta de búsqueda en tu propio equipo, que utiliza la potencia del motor de búsqueda de Google. Proporciona una función de búsqueda de texto completo para correo electrónico, archivos, música, fotos, conversaciones, Gmail, páginas web visualizadas y un largo etcétera. Para posibilitar las búsquedas en tu equipo, Google Desktop realiza un proceso de indexación y estructuración de la información alojada en tu equipo, haciendo posible la localización de esta información de manera rápida y eficaz. Además de este servicio, esta herramienta permite localizar y recopilar información nueva de la web y mantener organizado, a través de accesorios, los contenidos que más te puedan interesar.

¿Cómo funciona? Al instalar Google Desktop se crea un índice en el que se pueden realizar búsquedas de los correos electrónicos, archivos, conversaciones e historial web y que permite encontrar la información que buscas en menos tiempo. Además del índice en sí, Google Desktop guarda copias de los elementos que encuentra en el disco duro del equipo. Esto permite ver las versiones anteriores de archivos modificados además de páginas web visitadas, incluso cuando no estás conectado a Internet. El índice y las copias de Google Desktop se guardan únicamente en el equipo en el directorio siguiente: “C:\Documents and Settings\%NOMBRE_DE_USUARIO%\Configuración local\Datos de programa\Google\Google Desktop”. Según la cantidad de datos de la que dispongas en el equipo, Google Desktop puede tardar varias horas en indexar toda la información existente. Al lanzar una búsqueda, se obtienen fragmentos de los documentos que ayudan a comprender el motivo por el que ese resultado es relevante. También ofrece vistas previas en miniatura de los resultados de la búsqueda de imágenes, vídeos y tu historial web.

Cuadro de búsqueda integrado en la barra de escritorio en el equipo, una vez instalado Google Desktop


Proceso de búsqueda Resultados útiles Cuando realices una búsqueda en Google Desktop, irás a una página donde se muestran los resultados de búsqueda más relevantes. Cada uno de ellos incluye el nombre de archivo y un breve fragmento con los términos de búsqueda resaltados. Puedes aplicar un filtro para buscar un tipo de elemento específico, por ejemplo, sólo archivos. Para ello, utiliza los vínculos de la parte superior de la página. Ahora también puedes obtener una vista previa de los resultados de búsqueda de Desktop directamente en el navegador. Ya no tendrás que esperar a que la aplicación se abra simplemente para comprobar que has encontrado el archivo que buscabas. Indexación inteligente Después de instalarlo, Google Desktop comienza a indexar el correo electrónico, los archivos y el historial web almacenado en tu equipo. Esta indexación única sólo se realiza cuando tu equipo permanece inactivo durante más de 30 segundos, de modo que no debería disminuir su rendimiento. No obstante, según la cantidad de elementos, este proceso puede durar varias horas. Desktop también se asegura de que el índice esté actualizado al añadir los nuevos correos electrónicos que recibas, archivos que hayas actualizado y las páginas web a medida que las visualizas. Buscar archivos suprimidos Google Desktop crea copias en caché (instantáneas) de tus archivos y otros elementos cada vez que los ves y guarda estas copias en el disco duro de tu equipo. En consecuencia, podrás usar Google Desktop para buscar elementos que has eliminado por error en lugar de tener que volver a crearlos desde cero. Formulario de búsqueda avanzada Si haces clic en "Búsqueda avanzada" junto al cuadro de búsqueda en la página principal de Google Desktop, aparecerá un formulario de búsqueda avanzada. En él puedes especificar fácilmente los tipos de búsqueda que deseas realizar sin necesidad de recordar operadores de búsqueda específicos. También puedes restringir el período de tiempo al que pertenecen tus resultados.* http://desktop.google.com/es


Servicios, Gadgets Desktop te ofrece acceso inmediato a información personalizada y reciente a través de Google Gadgets: miniaplicaciones interactivas que pueden ubicarse en cualquier lugar del escritorio o en tu página de iGoogle para mostrar correos electrónicos nuevos, previsiones meteorológicas, fotos y noticias personalizadas. Estos gadgets también incluyen un reloj, un calendario, un bloc de notas, una lista de tareas pendientes y muchas otras aplicaciones. También tienes la opción de añadir el gadget a tu escritorio, tu página de iGoogle o ambos.

Conclusión El consumo de memoria de Google Desktop es moderado, manteniéndose alrededor de 15-20 MBs de RAM. Sin embargo, no se pude evitar notar un ligero “alentamiento” general del PC, con un número básico de gatgets habilitados. La fortaleza de este Sidebar es básicamente la posibilidad de integrar diversos servicios de Google, al Sidebar. Estos servicios son enormemente variados y funcionales. Sin embargo, Google Desktop es más que una barra de Widgets. Aparte de permitir descargar miles de éstos, utiliza el poder del buscador de Google para hacer exactamente lo mismo, pero con nuestro PC. De esta manera, si queremos hallar algún archivo que se encuentre en cualquier rincón de nuestro disco duro, Google Desktop se encargará de encontrarlo, como ya se ha explicado anteriormente. Las desventajas son, básicamente, que Google Desktop ofrece más de lo necesario. El indexing que se realiza de todo nuestro disco duro, además de las páginas web visitadas, es algo que consume espacio en el disco, y los recursos de sistema. Otro problema puede ser deshabilitarlo, pues tampoco es tan simple encontrar las opciones integradas. Para usuarios de XP, puede ser una herramienta bastante útil, puede hallar de forma veloz la información en nuestro PC. Sin embargo en versiones posteriores, (vista o Win 7) el Windows search integrado realiza básicamente las mismas utilidades, y resulta poco apropiado mantener dos índices de archivos consumiendo recursos.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.