Lo
primero hay que saber ¿qué es indización?
Es efecto de "indexar": Registrar ordenadamente datos e
informaciones, para elaborar su índice. El
resultado será utilizado como
herramienta de búsqueda y acceso al contenido de recursos en sistemas de
recuperación de información.
Recuperación de la información:
Se lleva
a cabo mediante consultas a la base de datos donde se almacena la información
estructurada. Hay que realizar la búsqueda teniendo en cuenta ciertos elementos
que permiten su precisión: índices, palabras clave, tesauros, ruido y silencio
documental.
-
Ruido documental: Son
aquellos documentos no relevantes recuperados por el sistema. La estrategia de búsqueda
ha sido demasiado genérica.
-
Silencio documental:
Documentos que no han sido recuperados. Esto se debe a que la estrategia de búsqueda
ha sido demasiado específica.
Indización documental.
Es considerado como un
proceso metodológico-intelectual que consiste en describir y extraer unos
vocablos especialmente expresivos e informativos (descriptores) que permiten la
clasificación y recuperación de cada artículo o documento publicado, llegar al
documento por autor(es), por título del documento, por palabra clave, editores,
título de revistas, año de publicación, etc.
Lenguajes de indización:
-Índices: Listado de términos normalizados que representan
el contenido de un recurso.
-Palabras
clave (Keywords): Término
significativo en lenguaje natural que representa el contenido del documento.
-Meta Keywords. La mayoría de los buscadores utilizan para localizar los
recursos, las palabras clave de cada página web.
-Tesauros: Un tesauro es un vocabulario controlado, estructurado en
relaciones jerárquicas y asociativas,
destinado a los documentalistas que,
para almacenar y recuperar los documentos de un sistema de información determinado,
recurren al uso de palabras clave para referirse a su contenido.
-Mapas Conceptuales:
Representación formal de un conjunto de temas y los enlaces a los documentos
relacionados con esos temas.
-Taxonomías: Lista jerárquica en forma de árbol, que
parte de los términos más generales a los más específicos, incluyendo también
términos relacionados.
Fases de la indización
Hay tres fases u
operaciones a realizar durante la indización:
- Examen del documento: Permite establecer su
contenido. Hay que prestar atención las partes más informativas (título,
resumen, introducción, conclusiones y títulos de los capítulos) y
preguntarse qué, cómo, cuándo y dónde.
- Extraer conceptos para identificarlo: Se
trata de extraer los conceptos que mejor concreten el tema del documento.
Se recomienda el uso de listados controlados.
- Selección de los términos de indización: Si
se utiliza un lenguaje documental, hay que traducir los conceptos
extraídos a los términos del lenguaje. Si se trata de texto libre, conviene
que los términos sean aceptados en fuentes de referencia: diccionarios,
manuales...
Navegación versus Recuperación de Información
La navegación es el
programa que permite consultar y obtener información mediante los sistemas
hipertexto.
Diferencias
La diferencia esencial
entre ambos conceptos, radica en la forma de obtener información; mientras que
en la recuperación de información se obtiene de forma lineal, la navegación
tiene la capacidad de obtener información a través del hipertexto. Esto quiere
decir que, la adquisición de conocimiento se realiza paulatinamente y
dependiendo del interés del usuario se profundiza a través de los nodos de
información en una materia u otra.
No hay comentarios:
Publicar un comentario