Page 1

Principios básicos en la búsqueda de información Hoy en día en Internet podemos encontrar respuestas y soluciones a casi todas las preguntas que se nos puedan ocurrir, desde las más específicas hasta las más genéricas, aunque algunas cosas son más fáciles de encontrar que otras. Por ello lo primero es identificar los conceptos clave de aquello que buscamos y el área al que pertenecen y plasmarlos en palabras, para luego pensar en qué tipo de fuente es posible que podamos encontrar información útil (recopilación de legislación, repositorio de manuales, etc..). En caso de búsquedas complejas podemos seguir los siguientes pasos para sistematizar este proceso: 1. Identificar palabras únicas, nombres característicos, abreviaturas o acrónimos relacionados con lo que buscamos. 2. Identificar organizaciones, sociedades o grupos que puedan tener información relevante sobre nuestra búsqueda. Buscar sus nombres (entre comillas si son compuestos) nos puede llevar a páginas de empresa, blogs, grupos de discusión u otras páginas desde las acceder a la información. 3. Pensar en términos más generales relacionados con lo que buscamos por si los términos anteriores no nos llevan a lo que buscamos. 4. Buscar sinónimos de los términos anteriores para realizar búsquedas alternativas 5. Identificar el tipo de fuentes adicionales a los motores de búsqueda en las que es posible que podamos encontrar información relacionada


¿Qué buscamos? Planificación de la búsqueda Actualmente el buscador más utilizado con diferencia es Google (en el último estudio disponible de Comscore más del 65% de las búsquedas en internet de EEUU se realizaron con Google) y muchas veces nos proporciona directamente los mismos datos que podemos encontrar usando buscadores específicos, así que, normalmente, lo mejor es empezar por una búsqueda previa en Google con las palabras clave que hayamos identificado y ver qué aparece. Si tenemos suerte encontraremos lo que queremos y ahí terminará la búsqueda y si no, los resultados nos valdrán para terminar de afinar nuestras claves de búsqueda y decidir la estrategia posterior o como hilo del que tirar para seguir buscando, pues muchas veces la información que buscamos no aparece directamente y el proceso requiere navegar por segundas o terceras páginas para llegar hasta la información. Para búsquedas complejas realizadas con herramientas genéricas no es raro estar entre 1 y 3 horas recorriendo páginas con poca información relevante hasta encontrar un hilo del que tirar (una página que te lleva a otra, que te lleva a otra…) que nos conduzca a la información deseada. Una vez encontrada una fuente con algo de información relevante relacionada, suele ser fácil llegar hasta lo que buscamos. Si en lugar de buscar un dato concreto estamos recopilando información sobre un tema, es recomendable realizar una lectura rápida de las páginas encontradas y guardar las urls de aquellas que nos parezcan interesantes (más adelante os contaremos varias alternativas) para, una vez tengamos un volumen suficiente, llevar a cabo una revisión posterior con más detenimiento. A veces cuando buscamos información sobre algo o alguien concreto no disponemos de información suficiente para conseguir un resultado concreto (por ejemplo estamos buscando un arquitecto valenciano que se llama Antonio del que no recordamos el apellido y con el nombre de la empresa que nos han dado no aparece nada). En estos casos puede ser muy útil información adicional de relevancia secundaria que nos permita realizar una búsqueda alternativa (por ejemplo si nos suena que le dieron un premio del colegio de arquitectos en el año 2000) y cruzar los resultados de esta búsqueda con los datos que perseguimos para poder refinar los resultados de esta búsqueda. Según lo que busquemos puede ser interesante realizar la búsqueda en inglés. Si no se domina este idioma se pueden traducir las palabras clave con un traductor en línea (Google tiene uno, Google Translate) y/o utilizar la


herramienta de traducción de páginas de Google que te presenta una traducción automática de las páginas encontradas. La calidad de la traducción depende del tipo de texto de las páginas, pero suele ser suficiente para entender la idea general del texto traducido.


Índices o directorios

Los índices son listados más o menos exhaustivos de páginas web ordenados por categorías. Uno de los pioneros en la creación de índices fue Yahoo, cuyo directorio http://dir.yahoo.com fue la primera gran herramienta de búsqueda en la red, aunque actualmente existen varios índices más con entidad suficiente como para resultar interesantes. Pueden ser útiles cuando se necesita información genérica sobre un tema y se quiere una visión general sobre qué webs hay disponibles sobre él o si se tiene acceso a índices temáticos focalizados en el tema sobre el que estamos buscando.

Los índices genéricos más conocidos son: Yahoo (http://dir.yahoo.com ) Biblioteca virtual WWW (http://vlib.org/ ) About (http://www.about.com ) Best of the web (http://botw.org/ ) En Wikipedia se puede accede a un listado de índices bastante completo (http://en.wikipedia.org/wiki/List_of_web_directories)


Buscadores

Actualmente los índices han quedado desplazados por los motores de búsqueda, de los que, como hemos dicho antes, el más conocido y utilizado es Google. Antes de comentar cuáles son los motores más populares y cómo usarlos vamos a hacer una breve descripción de cómo funcionan. Los motores de búsqueda tienen 3 componentes: El primer componente son los robots o arañas, que son programas que se conectan a diferentes webs y van accediendo al contenido de todas sus páginas para indexarlo. Normalmente parten de servidores con muchos accesos y a partir de los enlaces a otras webs que encuentran van pasando a inspeccionar otras webs. Recolectan información sobre el título de la página, su contenido y unas etiquetas de información que pone el creador denominadas metatags y con ella alimentan el siguiente componente, el índice. Existe un protocolo en internet que permite a los creadores de una página indicar que ésta no sea indexada. El siguiente componente del motor de búsqueda es el índice, que es una base de datos gigantesca en la que se almacena todo lo que las arañas van recolectando (y que nunca se acaba porque siempre están actualizando la información). Además de lo recolectado por las arañas el índice utiliza la información para crear unos valores de ordenación que permitan al interfaz de búsqueda seleccionar la información más relevante en cada caso. El algoritmo utilizado por cada buscador (el pagerank en el caso de Google) es uno de los secretos mejor guardados de las distintas empresas, pues es lo que les permite dar mejores resultados que su competencia y de forma más rápida, pero suele incluir, además del análisis del contenido de la página, la valoración del número de páginas externas que enlazan el contenido (lo que da una idea de su “popularidad”) y alguna variable más.


El tercer componente es la interfaz de búsqueda, que permite a los usuarios encontrar la información. Inicialmente los buscadores simplemente buscaban palabras o combinaciones de palabras pero van incorporando cada vez más la búsqueda por conceptos y acercándose al lenguaje natural (ya incorporan la búsqueda de sinónimos y otras estrategias y el objetivo es que en algún momento del futuro sean capaces de entender lo que se pide con frases en lenguaje estándar, como si se tratara de un ser humano, y buscarlo).

Como hemos dicho el buscador más empleado es Google pero hay varios buscadores que puede ser interesante utilizar si no encontramos lo que buscamos con él. http://www.google.com http://www.bing.com http://www.yahoo.com (www.altavista.com está basado en el mismo motor) http://www.ask.com


Metabuscadores

Además de los directorios y los motores de búsqueda existen agrupadores de buscadores, denominados metabuscadores, que lanzan la consulta a varios buscadores y devuelven el resultado obtenido. En principio la idea de integrar los resultados obtenidos por varios buscadores puede parecer buena, pero en muchos casos esta integración no hace más que complicar el que suele ser el principal problema, el exceso de resultados irrelevantes que ocultan lo que estamos buscando, pues al mezclar los resultados se pierde la ventaja de los algoritmos de relevancia empleados por los buscadores. La forma clásica de presentar los datos de los metabuscadores podéis verla en: http://www.metacrawler.com/ http://www.dogpile.com Si habitualmente realizas un tipo de búsquedas concretas, Google te permite crear tu propio portal personalizado de búsqueda. Tenéis las instrucciones en http://www.google.com/cse/ Terminamos este apartado con algunas recopilaciones de recursos de búsqueda (en inglés) para el que necesite todavía más recursos: http://www.internet4classrooms.com/search.htm http://hanlib.sou.edu/searchtools/ http://searchenginewatch.com/links


Mejora de la búsqueda Una vez realizada la primera búsqueda podemos encontrarnos sin resultados o con un número desorbitado de resultados irrelevantes que ocultan la verdadera información. En este apartado nos centraremos en mejorar estos resultados. Como trataremos técnicas genéricas y técnicas específicas del motor de búsqueda, nos centraremos en el ejemplo de Google al ser el más usado. Para saber cómo optimizar la búsqueda es necesario saber qué criterios utilizar el motor al realizarla. En el caso de Google debemos saber que todas las palabras son importantes sin que se diferencie entre mayúsculas y minúsculas e ignorando la puntuación, incluidos los símbolos @#$%^&*()=+[]\ y otros caracteres especiales (por ejemplo se puede buscar upv en mayúsculas y minúsculas o con alguno de los caracteres anteriores y el resultado es el mismo a efectos prácticos). Hay algunas excepciones a esta regla como que los artículos, pronombres, conjunciones, preposiciones, etc.. no son tenidos en cuenta excepto cuando se buscan frases hechas y expresiones habituales que los incluyen (por ejemplo si buscas “tanto va el cántaro a la fuente”) y lo mismo pasa con los símbolos especiales (por ejemplo si buscas C++ sí tiene en cuenta los +), o que a veces se buscan sinónimos de las palabras introducidas. (faltaría ejemplo de los sinónimos) Hay que tener cuidado con los acentos y probar con y sin ellos porque, aunque los resultados obtenidos son muy parecido, no son exactamente iguales y podríamos perder la página que buscamos (como ejemplo os proponemos buscar árbol y árbol y observar los resultados obtenidos). Google ofrece la posibilidad de que el navegador nos sugiera búsquedas conforme vamos tecleando. Esta función se puede deshabilitar en la página de configuración del buscador, a la que se accede desde la parte superior derecha de la pantalla (una vez hecha la primera búsqueda). Si tenemos cuenta de Google, la ventana de configuración nos ofrece la posibilidad de activar o


desactivar una función denominada Google Instant que hace que aparezcan los resultados conforme vamos tecleando.

Desde esta pantalla se puede seleccionar, además el idioma de la interfaz, en qué otros idiomas queremos que Google nos devuelva resultados, activar el filtro antipornografía Safesearch, seleccionar el número de resultados devueltos por página, bloquear resultados no deseados o decidir si los resultados se mostrarán en una nueva ventana.


1.1 Formas simples de mejorar la búsqueda En el caso de que no obtengamos resultados es necesario utilizar sinónimos o buscar términos alternativos que nos puedan llevar hasta la información deseada. También puede servir buscar términos más generales relacionados con el tema de interés para luego buscar un hilo interesante e ir tirando de él hasta volver a particularizar lo que buscamos o utilizar la técnica comentada anteriormente de buscar información relacionada tangencialmente con lo que necesitamos para, una vez encontrada, utilizarla para llegar a la información deseada. Si el problema son demasiados resultados que ocultan lo que estamos buscando (lo que suele ser más habitual) el primer recurso es utilizar las comillas alrededor de la frase a buscar para que en lugar de buscar palabras sueltas sin orden el motor busque frases concretas que acotan mucho más la búsqueda. También puede observarse cuáles son las palabras que más


aparecen en los resultados irrelevantes e incluirlas en la búsqueda con un – delante para que el motor descarte los resultados en los que aparecen. Algunas sugerencias para optimizar las búsquedas son: 1.1.1 Consultas sencillas

Introduce consultas sencillas. Si estás buscando una empresa determinada, introduce solo su nombre o todo lo que puedas recordar del nombre. Si estás buscando un concepto, un lugar o un producto determinados, empieza introduciendo su nombre. Si estás buscando una pizzería, escribe "pizza" y el nombre de tu ciudad o tu código postal. Para la mayoría de las consultas, no es necesario utilizar operadores avanzados ni sintaxis poco habitual. Te recomendamos que utilices términos sencillos.

1.1.1 Pensar en cómo está escrita la página

Piensa en cómo estará escrita la página que estás buscando. Los motores de búsqueda no son humanos, sino programas que buscan coincidencias entre las palabras que proporcionas y las páginas de la web. Utiliza las palabras con mayor probabilidad de aparición en la página. Por ejemplo, en lugar de escribir [ me duele la cabeza ], escribe [ dolor de cabeza ], ya que es el término que se utilizará en una página médica. La consulta [ ¿en qué países los murciélagos se consideran un augurio de mala suerte? ] resulta muy clara para una persona, pero es posible que el documento que contenga la respuesta no incluya esas palabras. En su lugar, introduce la consulta[ los murciélagos dan mala suerte en ] o simplemente [ murciélagos mala suerte ], ya que es probable que ese sea el resultado que aparezca en la página correcta.


1.1.1 Empezar la búsqueda con pocos términos e ir añadiendo

Empieza describiendo lo que necesitas con el menor número de términos posible y ve añadiendo términos para afinar la búsqueda. El objetivo de cada una de las palabras de una consulta es restringir la búsqueda lo máximo posible. Todas las palabras se tienen en cuenta, por lo que cada palabra adicional que se añada limitará los resultados. Si limitas demasiado la búsqueda, perderás una gran cantidad de información útil. La principal ventaja de empezar con pocas palabras clave es que, si no encuentras lo que necesitas, los resultados probablemente te indicarán cuáles son las palabras adicionales necesarias para definir mejor los resultados en la próxima búsqueda. Por ejemplo, [ tiempo cancún ] es una forma sencilla de encontrar información meteorológica y es posible que ofrezca mejores resultados que una consulta más larga, como [ previsión meteorológica para cancún méxico ]. 1.1.1 Usar palabras descriptivas

Selecciona palabras descriptivas. Cuanto más específica sea la palabra, mayor será la probabilidad de que encuentres resultados relevantes. Las palabras que no son muy descriptivas, como "documento", "sitio web", "empresa" o "información", no suelen ser necesarias. Sin embargo, debes tener en cuenta que, aunque la palabra tenga el significado correcto, si no es el término más utilizado, es posible que no encuentres la página que necesitas. Por ejemplo, [ tonos famosos ] es una consulta más descriptiva y más específica que [ sonidos famosos ].


Introducción Hoy en día podemos encontrar en internet gran cantidad de contenido de todo tipo. La facilidad con que podemos acceder al contenido e incorporarlo a nuestros materiales lleva muchas veces a la utilización indebida de las obras de otros, que están protegidas por defecto por derechos de autor. Existen mecanismos que permiten encontrar y utilizar de forma correcta material disponible en internet cuyos autores han querido ceder algunos o todos los derechos sobre el empleo de sus creaciones y en esta unidad vamos a conocerlas.

1 Objetivos 1. Conocer las licencias existentes para reutilizar contenido en Internet. 2. Conocer distintas herramientas para encontrar contenido reutilizable en Internet

2 Esquema • La reutilización de contenidos en Internet • Las licencias de Creative Commons • Las licencias GNU • Buscando contenido libre: Imágenes (I y II) • Buscando contenido libre: Sonido • Buscando contenido libre: Vídeo • Buscando contenido libre: Documentos • Captura de pantalla y otras imágenes

Todo  
Advertisement