domingo, 13 de mayo de 2012

La Indización hoy



Para el Post que nos ocupa comenzaremos dando algunas definiciones esenciales para situarnos y comprender qué es la Indización en el campo de la documentación.

¿Qué es la Indización en el campo de la Documentación?

Consiste en la representación del contenido de un documento mediante un conjunto de términos que representan el tema o temas de los que trata el documento en cuestión.
En definitiva, consiste en una forma de representar el conocimiento con el el objetivo de hacerlo recuperable, pero con una finalidad marcada. Es decir, se persigue una óptima recuperación desde el punto de vista cuantitativo y cualitativo.

Se trata de un lenguaje especializado, definido por la norma DIN 2342 como el "área de la lengua que aspira a una comunicación unívoca y libre de contradicciones en un área especializada concreta. Cuyo funcionamiento se basa fundamentalmente en la terminología establecida. Es una lengua propia para cada una de las áreas del conocimiento. Existen tantos lenguajes especializados como áreas".

Los lenguajes especializados disponen de un vocabulario especializado, no exento de problemas en la representación, como puede ser la sinonimia, polisemia o la homonimia.

Indización + tecnología

La automatización de la Indización es un tema envuelto de polémica, ya que cuenta con un grupo de defensores al igual que con un grupo de detractores.
Unos defienden que la automzatización es de ayuda para el indizador, aportando objetividad, fiabilidad y un ahorro en tiempo.
En el lado opuesto nos encontramos a quienes piensan que la automatización elimina la subjetividad y señalan como gran handicap el coste.

Indización y el entorno 2.0

Quizás hoy en día nos encontramos aún en una tesitura similar. Los sistemas de tagging o etiquetado social (cuyo resultado se conoce con el nombre de folcsonomía) tienen ventajas y desventajas frente a otros modelos para la recuperación de información.

Este tipo de indización gira entorno a dos dimensiones: la personal y la colectiva, es decir, los usuarios confeccionan sus índices mediante etiquetas para el uso personal, pero que en definitiva se lleva a cabo en un entorno compartido (recuperación de recursos descritos por otros usuarios).

De este modo encontraremos  recursos indizados por múltiples usuarios lo que propicia una indización más que subjetiva. De esta manera los recursos tendrán un mayor número de términos para su descripción.

Debemos tener en cuenta los incovenientes que esto supondría, puesto que nos encontramos frente a un lenguaje no controlado y de una alta ambigüedad semántica.
Este asunto se debería resolver mediante algoritmos de ponderación, eliminación de tags vacíos...

De todos modos seguimos avanzando.



No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.