Recuperar informacion

Page 258

Propuesta y desarrollo de un modelo para la evaluación de la recuperación de información en la web.

web sobre los treinta temas analizados, los motores de búsqueda se encuentran más cerca de alcanzar ese centro en el caso de la segunda modalidad de búsqueda, aunque las distancias obtenidas por los motores de búsqueda evaluados son ciertamente considerables con respecto a esa colección ideal. Con la operación de intersección, el motor Google es el más cercano a la misma, seguido de cerca por Terra y MSN. Con la segunda posibilidad de búsqueda, el motor MSN y el motor Terra (por este orden), superan a Google. En ambos casos, los resultados más distantes los obtiene Alta Vista. Similitud de resultados obtenidos por los motores con ambas modalidades de búsqueda en el mismo tema. La última serie de cálculos de similitud realizada en este experimento, sirven para verificar el grado de semejanza de los resultados que ofrecen los seis motores en cada uno de los treinta temas analizados, según la modalidad de búsqueda empleada. Los resultados se recogen en la Tabla 6.21: Tema

1

2

3

4

5

6

7

8

9

10

INT

1

8

2

4

6

11

13

15

17

19

INT + FRA

7

9

3

5

10

12

14

16

18

20 Σsim

similitud

0,357 0,524 0,449 0,361 0,619 0,724 0,613 0,732 0,419 0,236 5,033

Tema

11

12

13

14

15

16

17

18

19

20

INT

21

23

25

27

29

31

33

35

37

39

INT + FRA

22

24

26

28

30

32

34

36

38

40 Σsim

similitud

0,419 0,561 0,694 0,531 0,242 0,423 0,716 0,296 0,611 0,479

Tema

21

22

23

24

25

26

27

28

29

30

INT

41

43

45

47

49

51

53

55

57

59

INT + FRA

42

44

46

48

50

52

54

56

58

60

10

Σsim similitud

0,662 0,182 0,206 0,673 0,662 0,574

0,35 0,579 0,508 0,724 15,12

Media 0,503

Media 0,5

Media 0,504

Tabla 6.21 Similitudes de los vectores de resultado obtenidos tema por tema en ambas modalidades de búsqueda. INT: búsquedas basadas en la operación de la intersección. INT + FRA: búsquedas basadas en las operaciones combinadas de intersección y frase literal. Σsim: suma parcial de las similitudes de cada fila Media: subtotal y total de medias de las similitudes. Fuente: elaboración propia.

243


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.