Issuu on Google+

OPERADORES BOOLEANOS


TEORÍA DE CONJUNTOS


TEORÍA DE CONJUNTOS

CONJUNTO: Se entiende por conjunto a la agrupación en un todo de objetos bien diferenciados de nuestra intuición o nuestro pensamiento (Georg Cantor citado por Climent Coloma 2005). Los conjuntos se componen de elementos. Los elementos tienen carácter individual, tienen cualidades que permiten diferenciarlos, cada uno de ellos es único, razón por la que no existen elementos duplicados o repetidos.


OPERACI0NES CON CONJUNTOS

D IAGRAMA

DE

V ENN A U B


OPERACI0NES CON CONJUNTOS UNIÓN: Para cada par de conjuntos A y B existe un conjunto Unión de los dos, que se denota como A U B el cual contiene todos los elementos de A y de B. Operador Booleano: OR - Es la suma de dos conjuntos similares de palabras o conceptos


OPERACI0NES CON CONJUNTOS Operador Booleano OR: Se utiliza para encontrar registros que contengan cualquiera de los términos especificados para la búsqueda, en este caso se está apuntando a expandir la búsqueda. Ejemplo: Se requiere información sobre nuevos avances en la industria farmaceútica. Pharmaceutical industry OR Medical laboratories OR Pharmacology


OPERACI0NES CON CONJUNTOS

D IAGRAMA

DE

V ENN A n B


OPERACI0NES CON CONJUNTOS INTERSECCIÓN: Los elementos comunes a A y B forman un conjunto denominado intersección de A y B, representado por A n B. Es decir, es el conjunto que contiene a todos los elementos de A que al mismo tiempo están en B. Operador Booleano: AND – Es la unión o multiplicación de dos conjuntos (sets) de palabras o conceptos


OPERACI0NES CON CONJUNTOS Operador Booleano AND:

Se utiliza para localizar registros que contengan todos los términos que se especificaron en la búsqueda. Ejemplo:

Se está buscando información sobre empresas de telecomunicaciones en Colombia que presten el servicio de internet


OPERACI0NES CON CONJUNTOS

D IAGRAMA

DE

V ENN A \ B


OPERACI0NES CON CONJUNTOS

DIFERENCIA: Los elementos de un conjunto A que no se encuentran en otro conjunto B, forman otro conjunto llamado diferencia de A y B, representado por A\B Operador Booleano: NOT – Es la resta de un conjunto no deseado Ejemplo: Se requiere información sobre alucinógenos, excepto cocaína y marihuana Hallucinogens NOT cocaine NOT Marijuana


OPERADORES BOOLEANOS

Los operadores booleanos representados por símbolos matemáticos son: AND se representa como una multiplicación con símbolo de x OR - se representa como una suma con el símbolo de + NOT - se representa como una resta con el símbolo de –


OPERADORES BOOLEANOS

Ejemplo: Se desea información sobre “nutrición en niños”. iniciar la búsqueda se debe: 1. 2.

Antes de

Identificar palabras claves o conceptos claves. Identificar los posibles sinónimos, formas alternas de escribir el término, el singular y plural del término que se desea buscar.

Así: (child OR children OR kids) AND nutrition


OPERADORES BOOLEANOS

¿CÓMO SE REALIZA INFORMACIÓN?

EL

PROCESAMIENTO

DE

LA

Los operadores booleanos están basados en los principios matemáticos de multiplicación, suma y resta de conjuntos, por esta razón cada sistema de recuperación de información en línea tendrá un orden específico para procesar los operadores booleanos. Así, cuando en una estrategia de búsqueda aparezcan los tres operadores (AND, OR, NOT) el sistema empezará a procesarlos en un orden específico.


OPERADORES BOOLEANOS

Ciertos sistemas procesarán AND primero, luego OR Y finalmente NOT. Otros procesarán primero OR, luego AND y finalmente NOT. Esta estructura es «transparente» para los usuarios y se da por “default», por esta razón se utilizan paréntesis como en el algebra para indicarle al sistema que «aquello» entre paréntesis debe ser procesado primero y en conjunto.


OPERADORES BOOLEANOS

EJEMPLOS: Topic=(economic development OR economy development) AND Topic=(latin america)

SU(economic development) AND SU(latin america OR south america) AND PDN(>1/1/2000) AND PDN(<12/31/2010)


OPERADORES BOOLEANOS

EJERCICIO: Se desea información sobre 1.

Editoriales españolas especializadas en el área de la documentación.

2.

Universidades que oferten la Carrera de nutrición en el mundo.

3.

Clasificación de los felinos excepto los gatos.

4.

Tratamientos médicos para el tratamiento del VIH.


OPERADORES BOOLEANOS

SOLICITUD Contacto con editoriales españolas especializadas en el área de la documentación. En qué universidades puedo estudiar la Carrera de nutrición. Me interesa conocer la clasificación de los felinos excepto los gatos. No encuentro información sobre tratamientos para el VIH.

FORMULACIÓN CON OPERADORES BOOLEANOS


ELEMENTOS BÁSICOS PARA EL DISEÑO DE ESTRATEGIAS DE BÚSQUEDA


OPERADORES BOOLEANOS BÁSICOS RESUMEN: Y / AND= Encuentra todas las palabras de búsqueda. Ejemplo: internet AND education.

NO / NOT= Encuentra documentos que tengan la primera palabra, pero no la segunda. En algunas bases de datos se presenta como la opción AND NOT Ejemplo: Internet AND NOT html O / OR= Encuentra cualquiera de las palabras Ejemplo: Internet OR intranet


LOS LENGUAJES…

Vocabulario natural: Como hablamos en el día a día. Vocabulario controlado: Lenguajes documentales como tesauros, listas de encabezamientos de materia (LEMB) y clasificaciones.

Definen un vocabulario previamente elaborado, y admiten un limitado número de modificaciones en el momento de su utilización.


LOS LENGUAJES… VENTAJAS

Al utilizar lenguaje natural y/o permitir búsquedas se amplían las posibilidades del vocabulario, lo que puede generar mayores resultados, pero también exige mayores niveles de precisión en la búsqueda. En cuanto a los lenguajes o vocabularios controlados, proporcionan al usuario un punto de búsqueda, en vez de dos o más, y reduce la posibilidad de que la búsqueda sea incompleta. Lancaster menciona tres ventajas y funciones específicas:


LOS LENGUAJES… VENTAJAS

1. Se tiende a reducir las ambigüedades semánticas, diferenciando los distintos significados de los homógrafos (homonimia). 2. Se mejora la consistencia en la representación de la materia mediante el control de los sinónimos y cuasi sinónimos. 3. Facilita la realización de búsquedas amplias al establecer una estructura que une los términos relacionados semánticamente.


LOS LENGUAJES… VENTAJAS EN RESUMEN… Tomar la decisión de establecer el uso del lenguaje libre y/o del lenguaje controlado en las posibilidades de búsqueda de un sistema de recuperación conlleva tanto ventajas como inconvenientes. Al analizarlos comparativamente se puede concluir que uno neutraliza las deficiencias del otro, por ello, la mejor decisión sería la combinación de ambos en las distintas fases del tratamiento documental. Esta es una decisión que se refleja en muchas bases de datos y catálogos actualmente.


LOS LENGUAJES… EJEMPLO Se desea buscar información sobre las mujeres en Puerto Rico 1. En un buscador comercial podría buscarse: “la mujer puertorriqueña” / “mujeres puertorriqueñas” “mujeres boricuas”, “puertorriqueñas” entre otros…. 2. En una base de datos que maneje conectores y truncadores podrían plantearse las siguientes estrategias: Mujer? AND puertorriqueña? Mujer? AND Puerto Rico


LOS LENGUAJES…

EJERCICIO: Se requiere información acerca de la relación y el impacto de las nuevas tecnologías en la educación superior en el marco de la sociedad de la información.

1. 2. 3. 4.

Determinar las palabras clave. Normalizarlas a través del tesauro de la Unesco. Analizar y entender su estructura. Proponer dos estrategias de búsqueda utilizando los conectores y truncadores.

Tesauro de la Unesco en español


TRUNCAMIENTO

Técnica para recuperar información a través de sistemas que almacenan información en lenguaje / vocabulario natural (opuesto al vocabulario controlado) o cuando los usuarios interrogan el sistema en este mismo lenguaje. NOTA: antes de interrogar un sistema es necesario que se conozca cómo es el funcionamiento del mismo para lograr potenciar las búsquedas y lograr buenos resultados.


TRUNCAMIENTO

Algunos de los símbolos utilizados son: ? Máscara (Representa un caracter indefinido. Es repetible) # $ * Comodín (Representa una cadena variable de caracteres) Estos símbolos se utilizarán siguiendo las instrucciones dadas por el sistema de información.


TRUNCAMIENTO

Algunas formas de utilizar los símbolos son: 1. A la derecha Búsqueda: mujer? Recuperará: “mujeres”, “mujercita” y “mujerzuela”, Búsqueda: educat* Recuperará: educating

education,

educator,

educate,

and


TRUNCAMIENTO

Algunas formas de utilizar los símbolos son: 2. A la izquierda Búsqueda: ? computadoras Recuperará: “microcomputadoras” “minicomputadoras”.


TRUNCAMIENTO

Algunas formas de utilizar los símbolos son:

3. Dentro de palabras Búsqueda: Wom?n

Recuperará: Woman y Women


TRUNCAMIENTO

CONTINUANDO CON EL EJERCICIO: 1. Proponer dos estrategias de bĂşsqueda en lenguaje natural. 2. Proponer dos estrategias utilizando las palabras clave normalizadas, los conectores y truncadores.


OPERADORES DE PROXIMIDAD «Los operadores de proximidad especifican en qué orden y cuán cerca se prefiere una palabra o término de otra en una oración, párrafo o texto completo. Al utilizar operadores booleanos y operadores de proximidad combinados con los campos o elementos del récord (título, autor, resumen, texto completo del registro) donde se desea conseguir la información buscada de recuperación de información tiende a ser más precisa y relevante». (Tomado de http://www.upf.edu/search/cast/aj-prox.htm)


OPERADORES DE PROXIMIDAD NEAR: Es un operador similar al operador (AND), pero a diferencia de este operador, NEAR exige que entre ambas palabras no existan más de 10 palabras. Ej. Recuperación NEAR Información Boletín CERCA2 comercial:

Encuentra los documentos con "boletín de información comercial". Boletín CERCA3 comercial: Encuentra los documentos con "boletín económico de información comercial" "... información comercial publicada en el boletín de ..."


OPERADORES DE PROXIMIDAD

ADJ: Es un operador un poco parecido al operador AND, pero este exige que ambas palabras clave sean compuestas, aun cuando no estén en el orden indicado. Boletín ADJ comercial boletín comercial.

Encuentra los documentos con


Elementos básicos para el diseño de estrategias de búsqueda de información