Organización, filtración y representación de la información

Saber organizar los contenidos electrónicos, analizarlos, procesarlos, filtrarlos y representarlos de forma sintética es cada día mas necesario en un entorno electrónico. Por ello es importante saber utilizar programas para hacer mapas conceptuales, sumarios, índices automáticos.

Organización del conocimiento

Introducción

El conocimiento puede ser estudiado desde distintas perspectivas: como un estado mental, que permite conocer y comprender a través de la información; como un objeto, que puede ser almacenado y manipulado; como proceso, el conocimiento se centra en la aplicación de la experiencia; desde la perspectiva organizativa, el conocimiento es la condición clave para el acceso a la información y la recuperación del contenido; por último, está la potencialidad del conocimiento para influir en la acción, desarrollando competencias y estrategias en el saber cómo.

La organización del conocimiento trata de optimizar la organización de los repertorios de conocimiento existentes en un dominio, para facilitar la recuperación, creación y compartición de conocimiento entre la comunidad de usuarios. Mientras que la gestión del conocimiento permite asegurar estratégicamente que los asuntos y flujos de conocimiento se conozcan y se utilicen en términos de valor empresarial.

Aunque existen múltiples formas de organizar el conocimiento, haremos uso de las formas documentales más consolidadas en el funcionamiento de los sistemas de información, pues se ha constatado que su empleo facilita la economía cognitiva de gestores y usuarios al conseguir representar el máximo de información sobre un objeto usando el mínimo de recursos conceptuales. Nos referimos a la clasificación documental, las ontologías y los topics maps (mapas temáticos).

La clasificación documental, que se configura generalmente a partir de la clasificación científica y filosófica de un dominio, trata con el conocimiento después de que éste se haya fijado en los documentos, con el fin de determinar la materia de que tratan para su ordenación en clases.

La organización del conocimiento (que es la base del proceso de indización y descripción) y la recuperación son dos cuestiones fundamentales en la clasificación documental. En la clasificación documental intervienen estas variables: la estructura del documento primario, la estructura del sistema de clasificación, la capacidad cognitiva del analista en la descripción de la materia del documento, el contexto en el que se crea y usa el sistema de clasificación, el contexto documental y la intertextualidad entre el sistema de clasificación y los documentos clasificados por ese sistema.

Topic map

Definición y norma

Es un documento o conjunto de documentos SGML y XML, interrelacionados en un espacio multidimensional en el que las localizaciones son topics (temas). Son herramientas empleadas para la gestión del conocimiento y la optimización de la recuperación de información.

Su diseño se ajusta a la norma ISO/IEC 13250-2000, que contiene una descripción no formal de los tipos de objetos que componen un topic map, así como una sintaxis XML de representación e intercambio.

Componentes y uso

Es un conjunto de:

topics, que son conceptos desde los que se puede navegar
ocurrencias de los topics en el documento
asociaciones, o relaciones entre los topics

Las aplicaciones de los topic maps pueden ser:

navegación: muestra todos los conceptos relacionados con el concepto central, siendo más intuitivo navegar en este espacio que en otro sistema de recuperación de información
mejora las preguntas en Internet
agentes personales para mejorar la eficiencia en el acceso a la web

Funcionamiento

Ofrece un conjunto organizado de topics, de enlaces sobre los recursos documentales indizados por estos topics, y las infinitas relaciones semánticas entre estos temas. Describe la organización de la información y cómo acceder a ésta, a través de los siguientes mecanismos:

gestión de varios nombres para cada topic
gestión de ocurrencias enlazando estos topics y los documentos externos indizados
gestión de relaciones semánticas, jerárquicas o no, entre los topics vía asociaciones
clasificación, simple o múltiple, de los topics con topics
mecanismo de filtraje de los topics permitiendo filtrar y personalizar el índice en función de los usuarios
mecanismo de identificación universal de los temas permitiendo identificar de manera única un tema representado en diferentes topic maps
capacidad de intercambiar y fusionar diferentes topic map

Ejemplos de topic maps

Ejemplo de XML Topic Maps (XTM) 1.0
http://www.techquila.com/tmsamples/xtm/punk/music-xtm.xml
Techquila´stopic map world
Más ejemplos en la página de Jan Algermissen

Ontología

Definición

Las ontologías ofrecen el conocimiento de un dominio de forma compartida y consensuada, ya sea entre personas, sistemas heterogéneos. Se definen como una especificación formal (legible por máquina), explicita de una conceptualización compartida, en la que los conceptos están organizados en forma de taxonomía. Más…

Componentes.

conceptos: ideas básicas que se intentan formalizar
relaciones: representan el enlace entre los conceptos de un dominio dado
funciones: son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología
Instancias: se utilizan para representar objetos determinados de un concepto
Axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología

Tipologías:

Ontologías de un dominio: se representa el conocimiento especializado pertinente de un dominio o subdominio.
Ontologías genéricas: se representan conceptos generales del conocimiento
Ontologías representacionales o meta-ontologías: se especifican las conceptualizaciones que subyacen a los formalismos de representación del conocimiento
Ontologías creadas para una actividad o tarea específica, son las ontologías creadas para una aplicación específica.

Usos

Se han construido ontologías específicas para aplicaciones en traducción automática, ciencias de la salud, recuperación de información., pero sobretodo se han empleado en la gestión del conocimiento y en la web semántica.

Ejemplos de ontologías

Ejemplo de La ontología de Mikrokosmos y su reutilización para el subdominio del cáncer, en Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento, M. Chantal Pérez Hernández, red iris, vol 18, 2002. disponible en http://elies.rediris.es/elies18/533.html
Ejemplo de Ernesto Krsulovic-Morales, Desarrollo de un sistema de anuario utilizando integración semántica en la web. Disponible en http://www.dcc.uchile.cl/~ekrsulov/slides/titulo/slide3-0.html

Tesauro

El tesauro es un lenguaje de indización controlado constituido por un conjunto de términos descriptores y no descriptores, y un sistema de relaciones que definen su contenido semántico.

La función principal del tesauro es controlar los sinónimos de forma que, documentos que tratan sobre los mismos temas o parecidos no sean indizados bajo términos diferentes.

En general, un tesauro interrelaciona los términos para construir un lenguaje documental estructurado, que es utilizado por los usuarios para la búsqueda de información en las bases de datos.

El proceso de indización del documento

Definición

La indización consiste en extraer los conceptos fundamentales del contenido de un documento y representarlos mediante unos términos adecuados, bien procedentes del lenguaje natural empleados por los autores o de un lenguaje documental previamente seleccionado, como es el tesauro. Las variables que intervienen en el proceso de indización son las siguientes: nivel de análisis, cualificación y pericia de los indizadores, tipo y volumen de información que va a indizarse, disponibilidad de tiempo, medios económicos y características del sistema de almacenamiento de la base de datos.

Metodología

En la práctica la indización de un documento se desarrolla en estas tres etapas:

Examen del documento: para determinar el tema de que trata. Algunas palabras, grupos de palabras, frases o párrafos tienen más importancia que otros en la identificación del contenido temático del documento. Leer solamente algunas partes de un documento para tener una idea del tema principal. A continuación presentamos una serie de recomendaciones:
- Consultar el índice de materias, el resumen en la cubierta del libro o en la contra cubierta, el prefacio, la introducción y las conclusiones.
- No leer todo el documento. Solamente cuando no existe una introducción, índice de materias, títulos de capítulos, es necesario leer parte del documento para poder adquirir una buena comprensión del tema principal.
Análisis conceptual: para segmentar el documento en unidades y elementos de análisis más operativos, anotar las palabras reflejando el tema principal, subdividir el texto según el tema y seleccionar los conceptos significativos.
- Se debe decidir qué conceptos representan el contenido del documento para que sean indizados. Es la etapa más compleja del proceso, porque, a menudo, se tropieza con los temas secundarios y temas paralelos, que ayudan al desarrollo y exposición del contenido, pero dificultan la tarea de selección y priorización.
- Es conveniente anotar las palabras importantes, es decir, las palabras significativas, o grupos de palabras que reflejan el tema principal.
- Si el documento trata de varios temas diferentes, hay que subdividirlo en varias partes, pudiendo cada una de ellas considerarse una publicación independiente.
- Hay que ponerse en el lugar de los utilizadores potenciales del documento y determinar el contenido informativo de éste mediante la identificación de la idea o de las dos o tres ideas pasando por alto todas las informaciones superfluas, marginales o imprecisas (de modo que pueda evitarse luego la inclusión de documentos no pertinentes), y detectando las informaciones implícitas (de modo que pueda soslayarse luego la no inclusión de documentos pertinentes).
- El resultado del análisis conceptual es una lista preliminar de conceptos significativos, que expresan el objeto preciso del documento.
Traducción al lenguaje del sistema, seleccionando los descriptores pertinentes del tesauro. El tercer paso en el proceso de indización es la representación de los conceptos elegidos utilizando el vocabulario controlado del tesauro elegido. Para expresar los conceptos seleccionados en términos de indización, hay que buscar en el tesauro seleccionado las palabras clave anotadas y seleccionar los descriptores más apropiados. Para ello, habrá que realizar los siguientes pasos:
- Buscar los conceptos seleccionados en el índice alfabético del tesauro.
- Dirigirse a la parte principal del tesauro (índice alfabético estructurado) que contiene toda la información sobre cada descriptor.
- Localizar la entrada para cada descriptor que traduce mejor cada concepto.
- Anotar el número del campo semántico en el cual se encuentra el descriptor. Leer la nota de alcance (NA), si esta existe, los descriptores que figuran en la lista como término genérico (TG), término específico (TE), y término relacionado (TR). De esta manera, se puede determinar si el descriptor original, o uno de los que esta listado abajo, es realmente el más apropiado.
- Si alguno de los conceptos no figuran en el tesauro tras haberlos buscado en la listas alfabéticas, habrá que explorar el índice jerárquico y buscar allí los descriptores existentes que designen los conceptos más cercanos a los de la pregunta formulada.

El proceso de indización está unido al proceso de búsqueda, de tal forma que el éxito en la recuperación de información dependerá de la habilidad para encajar una formulación específica de búsqueda con la descripción y caracterización de esa información.

La metodología de indización empleada por la Organización Internacional del Trabajo para la elaboración de su Tesauro ILO puede consultarse en http://www.oit.org

Normativa

Las normas existentes para el establecimiento y construcción de tesauros son esenciales y necesarias para cualquier indizador/documentalista que pretenda diseñar y desarrollar un tesauro en cualquier área del conocimiento.

Para los tesauros monolingües existen dos importantes normas internacionales:

La norma ANSI Z39.19:1993, y su correspondiente norma española UNE 50-106-90 (AENOR). Proporciona reglas o recomendaciones de normalización de los términos, define sus relaciones jerárquicas, de equivalencia y asociativas, la presentación alfabética, jerárquica y gráfica de las entradas, la verificación de los términos, su especificidad, así como la admisión y supresión de los mismos.
Y la norma ANSI Z39.19:1 993, de la American National Standards Institute, más precisa y detallada en sus recomendaciones aunque los contenidos, campo de aplicación, objetivos y manejo del vocabulario son similares. La principal novedad es la implicación del usuario como fuente de selección terminológica.

Otras normas de interés son:

UNE 50-121-91 Documentación. Métodos para el análisis de documentos, determinación de su contenido y selección de los términos de indización que equivale a la ISO 5963:1985. Documentation. Methods for examining documents, determining their subjects and selecting indexing terms.
UNE 50-125-1997 Documentación. Directrices para el establecimiento y desarrollo de tesauros multilingües, equivalente a la norma ISO 5964:1985 Guidelines for the Establishment and Development of Multiingual Thesauri

Ofrecemos la siguiente tabla de equivalencia

Normas Internacionales		Normas Españolas
ISO 2788:1985	Documentation. Guidelines for the Establishment and Development of Monolingual Thesauri.	UNE 50-106-90	Documentación. Directrices para el establecimiento y desarrollo de tesauros monolingües.
ANSI/NISO Z39.19:1993	Standard for Structure and Organization of Information Retrieval Thesauri.
ISO 5963:1985	Documentation. Methods for examining documents, determining their subjects and selecting indexing terms.	UNE 50-121-91	Documentación. Métodos para el análisis de documentos, determinación de su contenido y selección de los términos de indización.
ISO 5964:1985	Documentation. Guidelines for the Establishment and Development of Multilingual Thesauri.	UNE 50-125-97	Documentación. Directrices para el establecimiento y desarrollo de tesauros multilingües.

Indización Automática

La indización manual y la automática no son procedimientos equivalentes. No es posible imitar la capacidad cognitivo-lingüística humana por parte de las máquinas. La investigación en indización automática debe orientarse a la consecución de métodos que permitan el análisis de los textos por parte del ordenador de manera eficaz, pero sin necesidad de que la máquina llegue a comprenderlos. Se trata de lograr un sistema automático que sea capaz de asignar a los documentos un modo de representarlos que permita su eficaz recuperación.

Distinguiremos tres tipos de indización automática:

Indización asistida por ordenador: tras obtenerse los conceptos intelectualmente y asignarles términos de descripción, el almacenamiento de éstos se efectúa con apoyo informático.
Indización semiautomática: el ordenador extrae los conceptos, pero los términos son propuestos por una persona
Indización automática: el ordenador hace la extracción de los conceptos y valida su representación como descriptores.

La facilidad que para la creación de los contenidos ha supuesto la digitalización de los documentos y su distribución por Internet ha venido a resaltar aún más la necesidad de los procesos de indización automática, de una parte, por el número desmedido de documentos a tratar, y de otra, por la rapidez con que debe hacerse. Además, hemos de considerar que los costes de la indización humana son superiores que los de la indización automática.

La intervención de la inteligencia artificial ha facilitado que las computadoras vayan aproximándose a la competencia lingüística de los humanos. Los proyectos actuales de indización automática se caracterizan por la colaboración estrecha entre la inteligencia artificial y la gestión digital de los documentos. Gran parte de las experiencias actuales en indización automática y bastantes de los programas comercializados combinan el modelo lingüístico con las herramientas estadísticas.

Se ofrecen algunos programas de indización automática con su página web:

ASK JEEVES. http://www.aj.com
EXCALIBUR. http://www.excalib.com
LEXIWARE de Lexiquest (ERLI). http://www.lexiquest.com
OINGO, de Applied Semantics. http://www.appliedsemantics.com
RESEARCHINDEX, de NEC Research Institute CiteSeer. http://citeseer.nj.nec.com
SPIRIT (comercializado desde 1980, en un principio por Systex y luego spor Technologies GID). http://www.t-gid.com
TOPIC, de la empresa Verity. http://www.verity.com/products/

Diseño del Tesauro

Para el diseño y elaboración de un tesauro, se pueden seguir una serie de fases o etapas, establecidas en su mayoría en la norma UNE 50-106-90; la norma UNE 50-121-91 usada para la indización; y las recomendaciones de Aitchison en su manual práctico de Uso y construcción de tesauros, en su última edición. Estas fases son las que a continuación se detallan:

Campo Temático.La primera cuestión que hay que plantearse es la elección del tema del tesauro y el alcance del mismo.
Recopilación de los términos.La segunda fase consiste en la recopilación del vocabulario principalmente a través de la recogida de todos los términos que se encuentran en la literatura consultada y aquellos que se puede extraer de las conversaciones con expertos en el tema.A continuación, se comprueba que los predescriptores no tengan diversos sentidos, evitando la ambigüedad. En esta etapa se reduce la lista, ya que se eliminan las repeticiones evidentes. Puede resultar muy práctico, en este momento, la comparación de estos términos con los de otros tesauros.Para la recopilación terminológica se pueden utilizar una base de datos donde se crean diferentes carpetas que contienen los términos referidos a cada campo semántico del tesauro.
Control Terminológico.La normalización del vocabulario se puede llevar a cabo mediante la creación de un fichero alfabético, con el vocabulario ya depurado evitando con su elaboración la duplicación de entradas, el control gramatical de género y número de las expresiones y sirve, al mismo tiempo, como mecanismo de actualización del lenguaje, porque en él se registran las posibles incidencias de cada término.Al construir un tesauro es preciso fijar una terminología inequívoca, que supere sinonimias y polisemias, eligiendo, en la medida de lo posible, la trascripción, más comúnmente utilizada.La polisemia se define como la existencia de significantes con varios significados, es perjudicial en el tesauro y debe ser controlada.
La sinonimia se produce cuando un solo concepto está representado por varios significantes. En un lenguaje documental la sinonimia es beneficiosa siempre que esté controlada, pues ofrece todas las entradas posibles al sistema documental. Lo más habitual es elegir una expresión como descriptor y mantener los sinónimos como no descriptores.

La mayoría de los términos de un tesauro consiste en sustantivos o sustantivos y modificadores (frases sustantivadas). La mayor parte de las frases sustantivadas serán frases adjetivadas, pero puede haber frases preposicionales.

En general, en un tesauro deben evitarse los adjetivos, a menos que acompañen a un sustantivo. Sin embargo, en algunos tesauros pueden ser necesarios algunos adjetivos generales, que podrían modificar potencialmente muchos de los otros términos del vocabulario. Pero es aconsejable limitar al mínimo el uso aislado de adjetivos.

No deben utilizarse los infinitivos y participios de los verbos, sino en forma de sustantivos o formas verbales sustantivadas.

Existen algunas categorías de términos que pueden ser consideradas como verdaderos sinónimos. Los más evidentes son las abreviaturas y los acrónimos. En general, el término completo es preferente y la abreviatura aparece como término no descriptor de entrada. En algunos casos, una abreviatura o un acrónimo es de uso tan común que se ha olvidado de qué términos procede. En estos casos, se recomienda la utilización de la abreviatura o el acrónimo y considerar el término completo como un término de entrada, si se estima conveniente. Existen otros casos en los que la elección estará dictada por el tipo de usuarios a quien va dirigido el tesauro.

El autor de un tesauro también debe ser consistente en el uso del singular y del plural. La mayoría de los sustantivos aparecen en plural.

Cuando un descriptor designa una operación y el producto de la misma, se utiliza el singular para la operación y el plural para el producto, calificando, además, el primero con una expresión entre paréntesis. Ejemplo: Clasificación (proceso)/Clasificaciones (producto).

Las locuciones nominales, adjetivas y preposicionales deben ser presentadas en el orden de la lengua natural y no en la forma invertida. La forma invertida puede dar lugar a un reenvío hacia la forma directa.

En relación con la utilización de términos simples o compuestos, la norma ISO determina en su punto 7 que, por regla general, los descriptores deben representar en la medida de lo posible términos simples. Las nociones complejas pueden ser descompuestas en términos simples si alguno de los elementos de un término compuesto puede ser aceptado como descriptor.

La misma norma señala que deben mantenerse los términos compuestos como descriptores si la descomposición del descriptor compuesto puede generar problemas de comprensión, por ser conocido en su forma compuesta o si la descomposición puede generar confusión o ambigüedad, y para evitar la amplitud semántica.

Sobre este asunto UNESCO aconseja que se han de evitar en lo posible lazos gramaticales, artículos y preposiciones entre los descriptores compuestos. En español, para conseguir este objetivo se puede recurrir a la adjetivación.
Agrupación en Categorías, SubcategoríasEs la parte más importante y más difícil de construir. Se trata de crear una única estructura jerárquica del tesauro, que presenta sistemática y sintéticamente toda la información que hay en el mismo.Consiste en dividir en áreas temáticas de afinidad probada la futura lista de descriptores, dando una denominación a cada campo semántico, a cada subcampo, etc., constituyendo la estructura básica en la que distribuimos posteriormente los descriptores del fichero alfabético.
Establecimiento de la estructura conceptualConsiste en el establecimiento de los distintos elementos constitutivos del tesauro: los descriptores , los no descriptores, y las notas de alcance. Los descriptores se estructuran en campos semánticos según áreas temáticas, que pretenden reflejar la interdisciplinariedad del tesauro.
- Descriptores. Son los términos empleados para representar las nociones. Llamados también términos preferentes, preferidos, homólogos o autorizados son términos que han sido formalizados u homologados en el tesauro y que se emplean para representar sin ambigüedades las nociones contenidas en los documentos y en las peticiones de búsqueda documental. Ejemplo:
  - Docente
  - UF: Profesor
- No descriptores. Son sinónimos o cuasisinonimos de los descriptores. Llamados también términos equivalentes y términos no preferentes no pueden ser utilizados para indizar documentos ni para formular consultas pero cada uno de ellos reenvía a un descriptor, por lo que aumentan la tasa de precisión, es decir, la pertinencia de los documentos que responden a una consulta. Ejemplo:
  - Estudiante
  - USE: Alumno
- Notas de alcance. La nota de alcance se utiliza para evitar ambigüedades. Siempre que subsista una duda sobre la interpretación unívoca de un descriptor, bien porque sea utilizado con un sentido especial por exigencias del tesauro o bien porque pueda ser confundido con otro descriptor, se añade, con objeto de precisar el sentido escogido, una nota de alcance.
  No todos los descriptores necesitan una nota de alcance, sino sólo aquellos cuyo alcance puede ser poco claro para el usuario. Sería el caso de los términos poco usuales, incluyendo los términos extranjeros, los términos muy recientes, y los términos que son utilizados de un modo diferente al común.Una nota de alcance no tiene necesidad de ser una verdadera definición, sino una mera indicación de cómo debe ser usado un término.
Establecimiento de la estructura relacionalPermite establecer las relaciones semánticas que se establecen entre los términos: relaciones: equivalentes, jerárquicas y asociativas.
- De equivalenciaLas relaciones de equivalencia son las que existen entre términos diferentes con el mismo significado. Para hacer las sinonimias o cuasinonimias se envía al usuario de los términos no preferidos o no descriptores al término preferido o descriptor, mediante un USE.Los reenvíos USE proporcionan puntos de entrada adicionales en el vocabulario y por eso, a veces, se les designa como términos de entrada o que constituyen un vocabulario de entrada. El reenvío USE cumple dos funciones: dirigir desde un término, no utilizado en la indización, a otro término que es más o menos sinónimo y dirigir desde un término específico, no utilizado en la indización, al término o términos genéricos apropiados.Los términos preferentes deben ser aquellos que con mayor probabilidad pueden ser utilizados por los usuarios. En realidad no tiene mucha importancia la forma del término que seleccionemos, ya que también aparecerá la forma alternativa como término de entrada no preferente. En cualquier caso, es importante la consistencia: si las abreviaturas son unas veces términos preferentes y otras no, y las decisiones parecen arbitrarias, los usuarios se desorientarán.
- Jerárquicas.
  Las relaciones jerárquicas permiten reunir aquellos descriptores que, unos respecto de otros, son más generales o más específicos, colocándolos en niveles superiores o inferiores y formando así un conjunto jerárquico preciso. Un descriptor puede tener ninguno, uno, dos o más descriptores de inferior jerarquía a la suya.El establecimiento de niveles de generalidad y especificidad facilita, en el momento de la indización, la elección de los términos más específicos que definan un concepto, eliminando la posibilidad de ruidos en la búsqueda.Las relaciones jerárquicas se transcriben por medio de los operadores TG de Término Genérico y TE de Término Específico. El término genérico es aquel descriptor que designa una noción que engloba a otras nociones más específicas representadas por los términos específicos. El término específico es el descriptor que designa una noción incluida en una noción más amplia, representada por un término genérico.
  
  Los términos específicos deben representar un ‘tipo’ de término genérico. Si no es así, probablemente no será un verdadero TE.
  
  La mayoría de los términos de un tesauro tendrán sólo un término general. La aparición en varias jerarquías de una gran proporción de términos es indicativo de una deficiente elaboración del tesauro. Sin embargo, habrá casos en los que un término puede aparecer en más de una jerarquía, sobre todo en el caso de un tesauro multidisciplinar. En caso de duda, el término debe incluirse en la jerarquía con la que se relaciona de forma más habitual.
  
  Es improbable que las jerarquías de un tesauro convencional sean simétricas; unas serán más amplias y otras muy pequeñas.
- Asociativas.
  Las relaciones asociativas son las que se establecen entre términos que no son equivalentes y que no pueden relacionarse tampoco jerárquicamente.Se trata de la relación más importante pero a su vez puede convertirse en un cajón de sastre en donde es posible relacionar todos los términos, unos con otros.Se representa por el operador TR de Término Relacionado. Un descriptor puede tener ninguna, una, dos o más relaciones asociativas.
  
  Dos términos cuyos significados están relacionados, pero que aparecen en diferentes jerarquías, son candidatos a una relación TR.
  
  En todos los casos la prueba determinante es, sencillamente, ‘¿Es probable que alguien que busque información indizada con el término A pueda estar interesado también en la información indizada con el término B?’. Si la respuesta es afirmativa, A y B deberían estar relacionados mediante TR, en el supuesto de que ambos términos no hayan sido ya relacionados con TG/TE.
  
  Es conveniente que la relación TR sea recíproca para facilitar el mantenimiento del tesauro. Cuando A muestra que B es su TR, pero no ocurre así en B, existe peligro de que si B es eliminado posteriormente, se mantendrá bajo el término A un reenvío inexistente.
Las siglas empleadas para expresar estas relaciones y notas de alcance en la parte alfabética se utilizan en español, siguiendo la norma UNE 50-106-90 y son las siguientes:

SN	NA	Nota de alcance
USE	USE	Término preferido
UF	UP	Término no preferido
BT	TG	Término genérico
NT	TE	Término específico
RT	TR	Término relacionado

Implementación Tecnológica
- B.E.A.T. Josep Sau, Centre d’Informatica de la Universitat de Barcelona. Versiones en castellano, catalán e inglés. Tiene ayuda en castellano y el listado permutado en forma de KWIC. Como inconvenientes podemos destacar: el número máximo de descriptores que permite una familia es de sesenta, sumando las relaciones asociativas, jerárquicas y de equivalencia; hay que teclear de nuevo los términos cada vez que se establece una relación en el tesauro; no permite volcar los términos directamente desde un procesador de textos; y se trata de un programa que puede ocasionar dificultades de actualización del tesauro.
- Multites. Empleado, entre otros, en el Canadian Literacy Thesaurus, WorldBank Thesaurus. El software Multites, empleado, entre otros, en el Canadian Literary Thesaurus, World Bank Thesaurus, en TesQual, permite la conversión de ficheros y la generación de ficheros en lenguaje HTML permitiendo la inclusión del tesauro en la red Internet. Se desarrolla sobre el sistema operativo Windows y no hace falta teclear los términos cuando se establecen las relaciones semánticas.
- Thew. El programa Thew del Profesor Tim Craven tiene como inconveniente que no permite sacar ningún índice permutado.
- Lexico. Empleado en los tesauros elaborados por la Library of Congress.

Presentación del tesauro

Los términos que componen el tesauro y sus relaciones se pueden representar de varias formas, siendo las más comunes la presentación alfabética, la presentación jerárquica y la presentación gráfica. A continuación vamos a describir cada una de ellas. Seguiremos para ello el orden de presentación de las mismas en el tesauro. En el caso de la presentación gráfica hay tesauros que la utilizan en lugar de la presentación jerárquica; de tal manera que cuando la presentación de los términos se lleve a cabo jerárquica o gráficamente, es necesario que el tesauro esté provisto de un índice alfabético, que permita una primera toma de contacto con la información presente en el mismo y remita, mediante un código, a la parte jerárquica o gráfica.

Como complemento a estas formas de presentación es aconsejable elaborar un índice permutado general en donde estarán todos los descriptores alfabetizados tantas veces como términos lo compongan.

Presentación alfabética

Describe las relaciones de equivalencia considerando el número clasificatorio del descriptor.

Contiene la siguiente información: descriptor, número clasificatorio y no descriptor ordenados alfabéticamente.

Ejemplo de presentación alfabética del Tesauro TesQual:

Acceso discapacitados

USE: Acceso restringido

Acceso público C5311

Acceso restringido C5312

Acceso universal

USE: Acceso público

Presentación jerárquica

Contiene los descriptores estructurados en función de categorías o jerarquías.

La parte jerárquica da una visión de conjunto de la información contenida en el tesauro y permite conocer en qué medida se ha detallado un tema. Con esta agrupación jerárquica de los descriptores se puede efectuar un control general rápido de los campos temáticos tratados.

En la parte jerárquica del Tesauro TesQual aparecen los descriptores agrupados por las grandes áreas temáticas en las que se ha dividido el tesauro según la clasificación adoptada. Cada área temática agrupa por tanto únicamente los descriptores de su ámbito y sus correspondientes relaciones jerárquicas, situándose así cada descriptor de forma muy precisa en su contexto semántico.

La representación de la cadena jerárquica se hace por medio de códigos alfanuméricos. El número de dígitos indica el nivel jerárquico que ocupa cada término con respecto con a aquellos con los que se relaciona: los genéricos estarán situados por encima a la izquierda y con un dígito menos; los específicos se situarán por debajo de los anteriores sangrados a la derecha y con un dígito más.

A continuación puede verse un ejemplo de la representación jerárquica del Tesauro TesQual:

C2 Calidad universitaria
- C21 Acreditación de enseñanzas universitarias
  - C211 Programa de acreditación de la ANECA
    - C2111 Proyectos piloto de acreditación
      - C21111 Agentes de la acreditación
      - C211111 Auditores de la ANECA
      - C211112 Comité interno de valoración
      - C211113 Comité Nacional de Acreditación
      - C211114 Coordinadores de subcomités
        
        C2111141 Coordinador del subcomité de ciencias de la salud

Presentación permutada

Existen dos tipos de índices permutados, el índice KWIC (Key Word In Context) y el índice KWOC (Key Word Out Context).

Además de las formas de presentación descritas anteriormente, existe la posibilidad de incluir índices permutados en el tesauro, que facilitan el acceso a la información contenida en los índices alfabético y jerárquico.

A continuación presentamos a modo de ejemplo dos términos del índice KWOC del Tesauro TesQual:

Boletines
- Boletines de indización y resumen
- Boletines de las comunidades autónomas
- Boletines de las provincias
- Boletines de sumarios
- Boletines oficiales
Bolonia
- Declaración de Bolonia
- Proceso de Bolonia

Presentación gráfica

Muestran sobre todo las relaciones jerárquicas existentes entre descriptores y por lo general, los reenvíos hacia términos asociados se indican en los márgenes del esquema gráfico.

Los tesauros de representación gráfica se complementan con un índice alfabético estructurado que contiene notas aclaratorias, reenvíos entre términos preferentes y no preferentes y referencias a términos genéricos, específicos y relacionados. Por ello, en este tipo de representación no es necesario asignar símbolos a cada término en particular.

Las tres formas más usuales de representación gráfica son la estructura arborescente, (Los diagramas arborescentes es la forma de representación gráfica más simple. Suelen construirse pocos diagramas por tesauro. En estos tesauros la estructura jerárquica sólo aparece en los diagramas, el listado alfabético se limita a darnos el término más amplio en el que se incluye el descriptor buscado para, en pasos sucesivos, acabar en los descriptores más genéricos que dan nombre a los distintos diagramas.) los diagramas de flechas y los terminogramas.

Filtración de la información

Introducción

La práctica de resumir se inserta en el paradigma de la representación documental o conjunto de procesos que experimentan los documentos en el seno de una colección determinada, con el objetivo de facilitar su recuperación, y sobre todo de potenciar su capacidad informativa. Su resultado es el resumen, documento secundario muy apreciado entre profesionales y estudiosos por su potencial informativo, convirtiéndose en el más importante vehículo de información referencial al servicio del principio de entropía que rige el comportamiento humano. El resumen es un instrumento eficaz en los sistemas de recuperación automatizados, ya que muchos creadores de bases de datos lo utilizan como fuente de indización para la selección de palabras claves representativas, y por tanto como clave de búsqueda en texto libre. Incluso en el contexto de los documentos electrónicos enlazados de un modo reticular, el resumen sigue siendo el metadato de más complejidad y relevancia informativa.

El resumen como prototipo

La razón de ser obedece principalmente a la necesidad de identificar el contenido documental, de forma rápida y fiable. Son muchos los científicos y profesionales los que confían en esta herramienta para el desarrollo de su trabajo.

El protagonismo de los resúmenes se hace notar, ante una sociedad llena de cambios tecnológicos y constantes aumentos de información. Se trata de una herramienta que ofrece información estructura, que con ayuda de los sistemas hipertexto permite crear redes semánticas entre documentos útiles para los avanzados entornos de búsqueda actuales.

Definición

El resumen es un breve texto representativo, autónomo, intencional. Destaca su textualidad, pues no podemos pasar por alto que se trata de un verdadero texto lleno de coherencia y cohesión; su autonomía, o independencia documental con respecto al texto de partida; y su diversidad, pues para un mismo texto se pueden realizar distintos resúmenes dependiendo de los factores de producción y sobre todo del nivel de descripción analítica que se requiera.

Objetivos

La definición de los objetivos documentales, el entorno operativo definido por el tipo de texto a resumir, las características de los posibles usuarios, y las condiciones de trabajo de los resumidores influye considerablemente en el proceso de resumir.

Funciones

Sus funciones más importantes:

Indicar: generando un microtexto que indique, es decir suministre indicios sobre el documento que representa.
Informar: el resumen se equipara a cualquier otro documento primario, siendo esta su más noble cualidad documental.
Sustituir: ahorrando tiempo al usuario en el manejo de información filtrada siendo sustituto del documento original.
Orientar: en el entorno electrónico en una doble dirección: 1. como etiquetas metadatos de los documentos electrónicos y 2. como unidades independientes en una red de resúmenes con sus preceptivos hiperenlaces.

De la importancia concedida a cada uno de estas funciones se desprenderá la estrategia más adecuada para elaborar el resumen.

Factores

Deben ser tenidos en cuenta: documento a resumir, objetivos documentales, resumidor, usuario y tipo de resumen.

Documento. Término polisémico concebido como la acumulación permanente y estable de signos que puede ser explorada libremente, con la doble función de almacenar datos e informar. Es conservador permanente de la información y difusor discrecional de la misma. El desarrollo de la nuevas tecnologías también ha dejado huella en este entorno, obligando a distinguir entre documentos textuales y electrónicos o multimedia. Los documentos textuales, y sobre todo los científicos suelen presentar una estructura lineal -acompañado en ocasiones de gráficos- y una inconfundible metodología OMRC (objetivos, metodología, resultados y conclusiones), que permiten al resumidor (estudiante, investigador,..) sintetizar la información de una forma menos compleja. Los documentos tienen una estructura fija y son algo más complejos al combinar diversas técnicas multimedia (vídeos, imágenes en movimiento, sonido, hipertexto, etc.). Su análisis es muy sofisticado debido principalmente a la diversa naturaleza informativa de los documentos de los que se ocupa, a la yuxtaposición de canales por la que dichas informaciones se transmiten y a la escasa normalización existente en los procesos de descripción y representación documental.
Resumidor. Es el elemento más importante del sistema y de su competencia y habilidades va a depender la calidad de los resúmenes.
Usuario / destinatario. El perfil y las funciones asignadas son factores que condicionan el proceso resumidor. No es lo mismo hacer un resumen para un compañero de clase que para presentar una comunicación a un congreso pues será este el elemento clave para su aceptación o no.
El resumen. Es el recurso de información más solicitado por científicos y profesionales, porque permite de una forma anticipada la consulta o rechazo del original, sin necesidad del acceso directo.

Procedimiento

Aunque la elaboración del resumen supone un proceso único y encadenado de operaciones intelectuales, estableceremos con fines de aprendizaje la siguiente secuencia:

Lectura / Comprensión

La lectura es la toma de contacto entre el estudiante y el texto, operación a través de la cual se consigue una comprensión del significado del documento, identificando los detalles físicos (párrafos, gráficos, títulos, subtítulos, etc.) y cognitivos (ideas principales, secundarias, conclusiones, etc.) que posteriormente serán claves para elaborar el resumen.

Hay dos tipos de lectura:

Lectura rápida: el tiempo estimado es muy breve y se pretende destacar los elementos más importantes del documento: tema principal y secundario, estructura de la información,… Se aconseja resaltar las ideas relevantes bien subrayándolas en el texto o bien redactando un pequeño esquema. La finalidad es obtener una idea general del contenido del documento y comprender la estructura cognitiva del mismo.
Lectura estratégica: es una lectura más activa y pausada, deteniéndose en cada párrafo importante, reflexionando sobre las ideas que se han expuesto y analizando aquellos segmentos textuales que concentra una mayor cantidad de información: objetivos, metodología y conclusiones.

La comprensión de un texto es la representación mental que hacemos de su significado. En este proceso intervienen una serie de variables: conocimientos del lector, datos del texto, contexto, objetivos que se persiguen. Comprender supone captar la estructura del texto e integrar de forma coherente la información nueva en los propios conocimientos y esquemas del que lee.

Análisis / Interpretación

Es todo proceso por el cual se divide un objeto o un documento en sus componentes o fases fundamentales. De la comparación entre los elementos se extraen los rasgos específicos y diferenciadores que permite diferenciar unos de otros.

El análisis se despliega a través de estas fases

Segmentación del texto: se recomienda estratificar la información en párrafos, normalmente los mismos que proporciona el texto del documento.
Estrategias de reducción: en cada segmento de texto es conveniente leerlo detenidamente y seleccionar aquella información relevante. De esta manera, la información se reduce considerablemente.
Identificación de las ideas principales: algunos documentos ofrecen las denominadas palabras identificativas, tales como en conclusión, como idea principal, por consiguiente, etc., para indicar que a continuación viene una información relevante.
Jerarquizar la información: Jerarquizar la información: determinando y organizando las ideas principales y secundarias, con la ayuda de la elaboración de un mapa conceptual.

La interpretación, es un proceso individualizado y creativo que permite hacer conexiones entre la información procedente de distintas fuentes para ampliar las ideas propias asignando a las palabras y conceptos un determinado significado y generar nueva información.

Síntesis / Producción

Es la fase más compleja del proceso, ya que no se puede someter a ningún criterio normalizador, depende exclusivamente del autor de resumen que pone en juego sus cualidades, habilidades, conocimientos e intereses documentales para sintetizar el contenido del documento original en unas cuantas líneas.

Una vez seleccionada, interpretada y esquematizada la información relevante del documento se redacta el resumen a modo de texto breve que recoge el contenido esencial del documento original, de forma que al tratarlo no sea necesario recurrir al original. La elaboración de todo resumen estará presidido por los siguientes criterios:

Fidelidad, respetando en cada momento el contenido original, no omitiendo partes sustanciales y evitando comentarios personales.
Precisión, evitando siempre la redundancia y la repetición
Claridad expositiva, utilizando una terminología apropiada, teniendo en cuenta los usuarios y nivel de conocimientos.

Normativa

ISO 214-1976: Documentation Abstracts for publications and documentation enlaza a la pagina oficial ISO, para comprar la norma.
Esta norma proporciona una breve introducción y un apartado dedicado a definiciones, se centra principalmente en el tratamiento del contenido de los documentos, en la presentación y estilo, finalizando con una serie de ejemplos.
UNE 50-103-1990 AENOR (Asociación Española de Normalización y Certificación), es el organismo español encargado de elaborar las normas españolas. La norma UNE 50-103-1990, es la equivalente a la ISO 214-1976, con la única diferencia de que incluye sus propios comentarios y, propone ejemplos propios.

Tipos de resúmenes

Es difícil determinar una clasificación exhaustiva de los resúmenes, ya que en la práctica los criterios se entremezclan dando lugar a clasificaciones cada vez diferentes, dependiendo de la persona o entidades que se encarguen de producir resúmenes. Proponemos la siguiente clasificación:

Densidad informativa

En física la densidad es una magnitud que pone en relación la masa y el volumen de un cuerpo. En el entorno del resumen documental, la densidad al igual que en física relaciona la cantidad (masa) de información que contiene y el volumen ocupada. Por lo que, las magnitudes profundidad (nivel de descripción) y densidad son directamente proporcionales, de forma que al aumentar una automáticamente aumenta la otra.

La densidad informativa del resumen lleva consigo la siguiente tipología:

Resumen indicativo. Sirve de alerta al estudiante, anunciándole la existencia del documento y ofreciéndole la información suficiente para que decida si vale la pena iniciar la lectura. Su extensión no suele sobrepasar las 50 palabras por lo que hace de este tipo de resumen una herramienta ideal para aquellos estudiantes que deban resumir un gran número de documentos. En este caso, la densidad informativa y su profundidad son máximas.
Resumen informativo. Su función es la de informar al estudiante sobre el contenido explícito del documento, incluyendo aquella información relevante que en el resumen indicativo no se incluyen. La estructura se basa en el esquema OMRC, esto es Objetivos, Metodología, Resultados y Conclusiones del documento resumido. Su extensión está comprendida entre los 100 y 300, en función de la longitud del documento original. En este caso, la densidad y la profundidad es menor que en el indicativo.

Autoría del resumen

La autoría depende del agente que se encargue de llevar a cabo esta compleja operación, distinguiéndose los resúmenes humanos y resúmenes automatizados.

Resúmenes humanos, elaborados por:

Autor del documento: El autor es el que engendra el documento y por tanto nadie mejor que él para conocer el contenido de la obra. Pero esto presenta distintas desventajas, por un lado a la hora de realizar el resumen ya que una cualidad imprescindible es la objetividad y el autor puede llegar a confundirla y dejarse llevar por ideas o emociones. Por otro lado, el autor de un documento carece a veces de conocimientos y técnicas para llevar a cabo un resumen de calidad. No por ello no deja de ser un resumen útil, principalmente para los profesionales resumidores que les permite avanzar rápidamente sobre el contenido del documento dejándoles sólo las tareas documentales.
Experto o especialista: Es aquella persona que se dedica hacer resúmenes del campo en el que es especialista garantizando la imparcialidad que al autor puede costarle más esfuerzo. Este agente flaquea en que desconoce las herramientas documentales para llevar a cabo un buen resumen.
Resumidor profesional: Es el que mejor conoce las técnicas de análisis y filtración de información. Pero carece muchas veces de competencias científica en una materia. Las cualidades básicas que distinguen a un buen resumidor son: capacidad de entrega, formación científica específica, observador, conocimiento de técnicas de lectura y de comprensión, y dominio del lenguaje.

Resúmenes automatizados

Con el desarrollo de la gran cantidad de documentos digitales, se hace necesario establecer programas que permitan procesar los textos de forma automática. Los métodos automáticos diseñados hasta ahora pretenden actuar de la misma forma que lo haría la mente humana, pero esto no es probable ya que para realizar un resumen se pone en práctica la capacidad cognitiva/intelectual del hombre difícil de plasmar en la herramientas informáticas. Se investiga en programas inteligentes basados en aspectos sociocognitivos de los documentos capaces de especificar las características de legibilidad, precisión y brevedad en sus productos.

Forma de presentación de los resúmenes

Se distinguen dos modalidades de presentar la información, en texto libre y texto estructurado.

Resúmenes en texto libre. Son aquellos que no disponen de una estructura específica en la presentación de información. Se distinguen dos tipos los telegráficos, que presentan la información de una manera concisa y esquemática, se caracterizan por ser rápidos de escribir y de leer. Por otro lado están los resúmenes discursivos, donde la información que se presenta es de forma literaria y amplia.
Resúmenes estructurados. Todos los resúmenes estructurados deben incluir la estructura básica en todo proceso científico: objetivos, metodología, resultados y conclusiones. La forma discursiva está basada en la estructura y el texto que se obtiene se caracteriza por su cohesión.

Modo de difusión

La difusión se basa entorno al medio en que se va a presentar el resumen, bien puede ser en formato papel (bibliográfico) o electrónico.

Difusión bibliográfica. Este modo de difusión es el empleado tradicionalmente antes del desarrollo de las nuevas tecnologías, actualmente se utiliza para publicar el resumen con el artículo científico en las revistas científicas. También se pueden encontrar las revistas de resúmenes que están formadas por el conjunto de resúmenes de los documentos originales analizados, agrupados y estructurados según un plan de clasificación temática preestablecido.
Difusión electrónica. Se caracteriza por el enorme auge que se está produciendo en el mundo electrónico, donde la transmisión de información tiene multitud de vías. De forma que el resumen puede difundirse rápidamente por medio de las bases de datos, las revistas electrónicas, internet, etc. Su mayor cualidad es que se le pueden agregar hiperenlaces dando lugar a una cadena continuada de pequeños resúmenes denominados microtextos interactivos.

Automatización

El auge electrónico en todas las ramas de la ciencia ha supuesto un gran cambio en el entorno profesional, aunque existen procesos documentales como RESUMIR que se resisten a la automatización, debido a la dificultad de conferir a un ordenador mediante reglas y algoritmos procesos y estrategias cognitivas individuales. Por fortuna para los resumidotes, resumir sigue siendo una tarea que requiere de la intervención de expertos humanos para garantizar la transición entre dos estructuras significantes de un documento a través de una estructura de significado común.

No obstante, se han producido avances en el dominio de la sintaxis oracional, pues hay programas que permiten el reconocimiento de las unidades léxicas y la extracción simple de información. El problema surge en las facetas interpretativa y pragmática, donde fluyen los efectos de ambigüedad e imprecisión terminológico-conceptual del lenguaje y los condicionantes contextuales y documentales de cualquier situación de comunicación. Pese a los avances derivados de la lingüística computacional y del Procesamiento del Lenguaje Natural (PLN), los sumarios y extractos automáticos son de escasa calidad, pues son unidades de significado incoherentes que aportan indicios sobre el contenido de los documentos.

Los métodos automáticos para la representación textual podemos agruparlos:

Métodos de extracción, basados en la estructura superficial y en el uso de técnicas estadísticas que permitan seleccionar la información en función de la frecuencia de las palabras clave, de la localización de la información..
Como ejemplo destacamos la aplicación ANES (1995)
Métodos de sumarización, centrados en las estructuras retórica y/o profunda de los documentos y en los avances del procesamiento del lenguaje natural, permiten la creación de sumarios empleando recursos como plantillas web y plantillas metadatos.
Como ejemplos destacan PROTEUS (1991), SUMMONS (1995), SIM-SUM (1998)
Métodos gráfico-relacionales, basados en técnicas vectoriales y algoritmos gráficos de mapeo de información, permiten extraer información en lenguaje natural de las similitudes y diferencias de un conjunto de documentos. Sobresale el sistema SMART (1989)
Métodos híbridos, que a modo de banco de trabajo asisten al resumidor en el proceso de creación de pre-resúmenes.
Mencionamos la aplicación TEXNET

Se ofrece una selección de softwares para la producción de extractos y sumarios:

Domain-independent single document summarization through focus analysis. http://www1.cs.columbia.edu/~hjing/sumDemo/FociSum/Sistema desarrollado por la Universidad de Columbia que extrae la información mediante plantillas que posteriormente utiliza para elaborar el resumen.
Welcome to the trestle project home-page. 2000 http://nlp.shef.ac.uk/trestle/Sistema desarrollado por la Universidad de Sheffield con el objetivo de generar extractos de forma automática de los documentos almacenados mediante técnicas lingüísticas.
Inxight. 2005 http://www.inxight.com/Sistema que genera extractos mediante técnicas estadísticas que estudian la longitud de la oración, las palabras clave y la longitud de la oración.
Sinope summarizer. Summarize with lighting speed. 2005 http://www.sinope.nl/en/sinope/index.htmlGenera extractos mediante la aplicación de técnicas lingüísticas que determinan la información relevante de los documentos.
Produits et services en ligne pour le traitement de l´information textuelle. 2003 http://www.pertinence.net/index.htmlSistema apoyado por la Agencia francesa de Innovación cuyo objetivo principal es generar sumarios automáticos de textos multilingues mediante el análisis de técnicas lingüísticas.

Representación de la información

Introducción

En la representación de la información la unidad de significación más elemental es la palabra, que se va agrupando para forma unidades semánticas superiores. La frase es una unidad significante intermedia que tradicionalmente se estudia gramaticalmente. El texto es la unidad superior, y provoca una situación de cambio en la estructura de conocimiento de las personas.

Existen varias formas de representación:

Conceptos: expresa el contenido de la realidad científica, su estructura interna, dimensión y relaciones con otros conceptos. Los conceptos generales son polisémicos y semánticamente subjetivos, mientras que los conceptos especializados referidos a dominios científicos concretos, son más precisos y denotativos. Para representar los conceptos existen diferentes procedimientos, como pueden ser: las representaciones dimensionales; rasgos o atributos cualitativos; proposiciones o representaciones reticulares formadas por nodos conceptuales y enlaces asociados; plantillas en las que el concepto no se describe como una colección de atributos sino como una pauta holística que guarda cierto isomorfismo estructural con los objetivos categorizados.
Redes semánticas: organizan el conocimiento mediante nodos conceptuales y enlaces, representando las interrelaciones de manera asociativa. Existen aplicaciones informáticas que despliegan redes semánticas de documentos científicos como el caso de ATLAS/ti, Thenestsys…
Mapas conceptuales: representan de forma ergonómica y visual los conceptos fundamentales de cualquier documento al margen de su soporte y estructura. A nuestro juicio es uno de los mejores recursos para la representación y estructuración de la información.

Mapa conceptual

Una forma dinámica y visual de representar gráficamente la información principal de cualquier documento y en especial el resumen, es a través de mapas conceptuales, pues no sólo favorecen las habilidades cognitivas del estudiante sino además aportan una orientación más ecológica y clarificadora en los procesos de descripción y recuperación.

Definición

El mapa conceptual denominado también cognitivo, semántico, mental, es una alternativa complementaria al lenguaje natural en la función de representar y comunicar conocimiento. Siendo empleado en la representación y organización de información, se convierte en una técnica de aprendizaje significativo (proceso activo, constructivo y acumulativo de comprensión de nuevos conocimientos y de su inclusión en una base de conocimiento preexistente). Es una poderosa herramienta para transformar el conocimiento tácito en explicito.

Este instrumento educativo fue ideado por Joseph Novak en la década de los años sesenta, como una forma de poner en práctica las teorías de David Ausubel sobre aprendizaje significativo. La construcción de mapas conceptuales enfatiza la importancia de adquirir nuevo conocimiento en las estructuras cognitivas existentes, mediante la asimilación de nuevos conceptos en forma de proposiciones.

Los mapas conceptuales se usan en una amplia variedad de disciplinas por su capacidad para explicitar las estructuras de conocimiento de cualquier tema, documento… y por su capacidad para presentar estructuradamente un cuerpo de conocimiento complejo de manera simplificada. Desde nuestra dilatada experiencia docente, hemos descubierto que es una herramienta cognitiva crucial para el estudiante y el profesional de la documentación, sobretodo en la representación significativa de información, en el análisis documental y en los procesos de toma de decisiones.

Elementos de un mapa conceptual

Los elementos fundamentales que componen un mapa conceptual son éstos:

Los conceptos: regularidad en los acontecimientos o en los objetos que se designa a través de un término. «Libro», «mamífero», o «atmósfera» son ejemplos de conceptos.
Palabras de enlace: que se utilizan para unir los conceptos y para indicar el tipo de relación que se establece entre ellos. Por ejemplo, si relacionamos los conceptos «edad» y «experiencia», mediante las palabras de enlace «proporciona» o «modifica», las proposiciones que genera son parecidas pero no idénticas
Las proposiciones: dos o más términos conceptuales unidos por palabras para formar una unidad semántica . «La ciudad tiene una zona industrial» o «el ser humano necesita oxígeno» son ejemplos de proposiciones

Proceso de construcción

Se compone de cinco etapas:

selección de los conceptos
listado de los conceptos desde los más abstractos a los más concretos
agrupación de los conceptos relacionados e incorporación de otros conceptos de interés
ordenación de los mismos en una trama bi/tridimensional
enlace de cada par de conceptos mediante líneas etiquetadas en forma preposicional o proposicional.

En función de los formatos adoptados destacamos los tipos de mapa araña, jerárquicos, diagramáticos y sistémicos.

En qué situaciones se puede utilizar el mapa conceptual

Generar y organizar ideas:

tomar apuntes, resumir y analizar un texto (para ordenar las ideas sin tener en cuenta el orden en el cual se transmiten);
escritura creativa (escribir sus palabras clave y organizar las ideas en categorías principales y subcategorías hasta llegar al plan del texto)
organizar el trabajo propio

Representar y organizar el conocimiento:

representando un dominio de conocimiento concreto y sus interrelaciones
señalando las interacciones entre los conceptos
aprendiendo eficazmente
facilitando la navegación

Comunicar y compartir:

una información con una estructura temática compleja
información en red de forma estructurada

Tomar decisiones :

en el proceso de autoaprendizaje
en trabajos en equipo
en decisiones profesionales

Evaluación de un mapa conceptual

No hay dudas de que los mapas conceptuales y las redes semánticas constituyen una excelente base para la autoevaluación y que el análisis de estos instrumentos mentales está en la base del desarrollo de las habilidades del pensamiento crítico y del aprendizaje autónomo de los estudiantes universitarios en el espacio europeo de enseñanza superior.

Para evaluar la calidad de un mapa conceptual, debemos considerar algunos de los siguientes aspectos:

Conocimientos que proporciona
Capacidad organizativa.
Habilidades cognitivas necesarias
Profundidad del procesamiento.
Estructuras conceptuales.
Fomento del aprendizaje significativo.

Ventajas en el entorno informático

Se transforma en un componente básico de la arquitectura de los sistemas hipermedia, complementando texto e imágenes con diagramas activos. Esa activación es la base de los sistemas hipertextuales, estructura dinámica e interactiva que permite representar y organizar la información de un modo reticular con múltiples itinerarios de exploración.

Software de mapas conceptuales

CON LICENCIA
- Knowledge Manager: el programa de los mapas conceptuales. Es un potente instrumento para construir mapas mentales, mapas conceptuales, mapas semánticos, redes semánticas, bases de conocimiento conceptual y diagramas con una extensión funcional que enriquece y facilita el atesoramiento conceptual y la gestión activa e interactiva del conocimiento.
- VisiMap
- MindGenius Software disponible en (o su explicación en) que ofrece una evaluación gratis
FREEWARE
- The IHMC Concept Mapping Software

Habilidades y competencias

Adquirir y usar con precisión estrategias y técnicas para la organización y filtración de la información.
Habilidades para extraer e interpretar la información, creando resúmenes, sumarios
Manejo de herramientas para la organización de la información: mapas conceptuales, redes semánticas.
Destrezas y habilidades para la clasificación, categorización e indización de la información, creando sistemas automatizados
Manejo del tesauro como instrumento de control terminológico para la recuperación de información
Aprender a usar los índices para localizar la información
Conocimientos de programas informáticos para la elaboración de mapas conceptuales, como medio económico y gráfico de representación de la información
Dominio de estrategias y métodos para sintetizar la información y construir nuevos conceptos, integrando la información nueva y previa en la creación de conocimiento.

Dossier electrónico

Organización del conocimiento

CRAVEN, Timothy. (2002). Thesaurus construction. Faculty of Information and Media Studies, University of Western Ontario. http://instruct.uwo.ca/gplis/677/thesaur/main00.htm (consultado el 29 de abril de 2004).
GANZMANN, J. (1990a). ‘Check-list for thesaurus software’. International classification, vol. 17, nº 3/4, pp. 155-157. Disponible en http://www.willpower.demon.co.uk/criteria.htm (consultado el 29 de abril de 2004).
GANZMANN, J. (1990b). ‘Criteria for the Evaluation of Thesaurus Software’. International classification, vol. 17, nº. 3/4, pp. 148-154. Disponible en http://www.willpower.demon.co.uk/ganzmann.htm (consultado el 29 de abril de 2004).
GARSHOL, Lars Marius. Metadata? Thesauri? Taxonomies? Topics map? : making sense of it all. [en línea]. Disponible en http://www.ontopia.net/topicmaps/materials/tm-vs-thesauri.html (consulta: 7 de julio de 2004)
International Labor Organization. Disponible en http://www.oit.org (consulta: 22 de julio de 2004)
Inspiration Software http://www.inspiration.com/
LOZANO TELLO, Alfonso. Ontologías en la web semántica. [en línea]. En I Jornada de Ingeniería web ’01. Disponible en http://www.informandote.com/jornadasIngWEB/articulos/jiw02.pdf (consulta: 7 de julio de 2004)
Mapas conceptuales http://www.mapasconceptuales.com
MIDDLETON, Michael. Queensland University of Technology. Controlled Vocabularies. Disponible en http://www.imresources.fit.qut.edu.au/vocab/ (consultado el 25 de julio de 2007).
MILSTEAD, Jessica L. (2000). About Thesauri. JELEM. Disponible en http://www.bayside-indexing.com/Milstead/about.htm (consultado el 19 de enero de 2004).
MONDECA. Questions-réponses. [en línea]. 2004 Disponible en http://www.mondeca.com/french/faqs.htm (consulta: 7 de julio de 2004).
SANTOS GUILLÉN, Ana Isabel; PIEDRAFITA MORENO, José Manuel; MARAÑÓN BADAYA, David. Ontologías para la gestión del conocimiento. [en línea]. Disponible en http://es.geocities.com/ontologia04/ (consulta: 7 de julio de 2004)
SIGEL, Alexander. Towards knowledge organization with topic maps. [en línea] 2000. Disponible en http://www.gca.org/papers/xmleurope2000/pdf/s22-02.pdf (consulta: 10 de marzo de 2004)
SILVA MUÑOZ, Lydia. Representación de ontologías en la web semántica. [en línea]. 2002. Disponible en http://www.inf.ufrgs.br/~clesio/cmp151/cmp15120021/artigo_lydia.pdf (consulta: 7 de julio de 2004)
Topic maps and graphical structures. [en línea]. 2000 Disponible en http://www.xm.co.nz/op/tm.htm (consulta: 7 de julio de 2004)
Topic map http://www.topicmaps.net
THESAURUS CONSTRUCTION. Welcome to the Introductory Tutorial on Thesaurus Construction. Disponible en http://instruct.uwo.ca/gplis/677/thesaur/main00.htm (consultado el 16 de julio de 2004).
UNIVERSIDAD DE ALICANTE. Biblioteca y archivo. Biblioteca digital. Referencia electrónica – tesauros y clasificaciones. Disponible en http://www.ua.es/es/bibliotecas/referencia/electrónica/tesauros.html (consultado el 16 de julio de 2004).
WILL, Len. (2003). Publications on thesaurus construction and use. Willpower Information. Disponible en http://www.willpowerinfo.co.uk/thesbibl.htm (consultado el 19 de enero de 2004).
XML TOPIC MAPS (XTM 1.0). [en línea] 2003. Disponible en http://xmlfr.org/topicmaps.org/xtm/1.0/ (consulta: 7 de julio de 2004)

Tesauros

Tesauro de la UNESCO. Disponible en http://www.ulcc.ac.uk/unesco/index.htm
Tesauro ISOC de Economía del CINDOC. Disponible en http://thes.cindoc.csic.es/index_ECON_esp.html
Tesauro de la OIT. Disponible en http://www.oit.org
Tesauro del Cindoc http://thes.cindoc.csic.es/index_esp.html

Filtración de la información

ANGHELUTA, Roxana; De Busser, RIK. Moens, Marie-France. The use of topic Segmentation for Automatic Summarization. [en línea] DUC 2002. Disponible en: http://www-nlpir.nist.gov/projects/duc/pubs/2002papers/kuleuven_angheluta.pdf (consulta: 7 de julio de 2004)
BOGURAEV, Branimir K. and NEFF, Mary S. Discourse Segmentation in Aid od Document Summarization [en línea]. 2000. Disponible en http://www.research.ibm.com/talent/documents/bran_mary_segsum_hicss33.pdf (consulta: 11 de julio de 2004)
CRAVEN, Timothy C. Human creation of abstracts with selected computer assistance tools [en línea] En Information Research, vol.3, n.4, 1998. Disponible en http://informationr.net/ir/3-4/paper47.html (consulta: 6 de julio de 2004)
Domain-independent single document summarization through focus analysis http://www1.cs.columbia.edu/~hjing/sumDemo/FociSum/
ENDRES-NIGGEMEYER, Brigitte. «SimSum: an empirically founded simulation of summarizing». [en línea] En Information Processing and Management, vol. 36,n.4, 2000, pp.659-682. Disponible en http://citeseer.ist.psu.edu/cache/papers/cs/9901/http:zSzzSzwww.ik.fh-hannover.dezSzikzSzpersonenzSzbenzSzSimSumlastPaper.pdf/endres-niggemeyer00simsum.pdf (Consulta: 22 de Noviembre de 2006)
Extractor. http://www.extractor.com/
Human creation of abstracts with selected computer assistance tools. http://informationr.net/ir/3-4/paper47.html
Intext: Intelligent Internet Tools. http://www.intext.com/
Inxight http://www.inxight.com/
Island software. http://www.islandsoft.com/products.html
PINTO, M. Abstracting/Abstract Adaptation to Digital Environments: research trends. Journal of Documentation 2003, vol. 59,5, pp, 581-608. DISPONIBLE SOLO UGR http://ejournals.ebsco.com/Journal2.asp?journalid=104927
Portal IMATEC: laboratorio para el análisis de imagen. http://www.mariapinto.es/imatec
Produits et services en ligne pour le traitement de l´information textuelle. http://www.pertinence.net/index.html
Sumarización de textos. Universidad de Ottawa. http://www.site.uottawa.ca/tanka/ts.html
Summarization Resources http://www1.cs.columbia.edu/~hjing/summarization.html
UNIS. Summ-it summarization applet http://www.computing.surrey.ac.uk/SystemQ/

Representación de la información

DIEZ GUTIERREZ, E.J. Los mapas conceptuales. [en línea]. Disponible en http://www3.unileon.es/dp/ado/ENRIQUE/Didactic/Mapas.htm (Consulta: 31 de mayo de 2004)
EMAGISTER.COM, Introducción al desarrollo de mapas conceptuales. Curso online. [en línea]. Disponible en http://www.emagister.com/introduccion-al-desarrollo-mapas-conceptuales-cursos-407998.htm (Consulta: 31 de mayo de 2004)
Knowledge Manager: el programa de los mapas conceptuales [en línea]. Disponible en http://www.conceptmaps.it/KM-KnowledgeManager-esp.htm (Consulta: 31 de mayo de 2004)
Qu´est-ce qu´une carte conceptuelle. [en línea]. Disponible en http://tecfa.unige.ch/tecfa/teaching/staf17/0102/ress/doc/p1_fad/cc.pdf (consulta: 31 de mayo de 2004)
The IHMC Concept Mapping Software http://cmap.ihmc.us/download/index.php (consulta: 31 de mayo de 2004)
VisiMap, disponible en http://www.coco.co.uk/ (consulta: 31 de mayo de 2004)

Dossier bibliográfico

Organización del conocimiento

AGUADO, A. [et al.] Definición: nuevas tendencias en tesauros y otros vocabularios controlados. En: IV Congreso ISKO-España, Granada, 22-24 de abril de 1999. Granada: Universidad de Granada. pp. 127-132.
AITCHISON, J. et al.. Thesaurus construction and use: a practical manual. 4ª ed. London: Aslib, 2000
ALVARO BERMEJO, C. et al.. ‘Evaluación de los Tesauros Disponibles en Lengua Española’. Revista Española de Documentación Científica, v. 12, nº 3. pp. 283-297. (1989a)
ASOCIACIÓN ESPAÑOLA DE NORMALIZACIÓN. Directrices para el establecimiento de tesauros monolingües. Norma española. UNE 50-106-90. Madrid, AENOR, 1990
ASOCIACIÓN ESPAÑOLA DE NORMALIZACIÓN. Documentación: Métodos para el análisis de documentos, determinación de su contenido y selección de términos de indización. Norma española UNE 50-121-91. Madrid, AENOR, 1991.
GIL URDICIAIN, B. Manual de lenguajes documentales. Madrid: Noesis. p. 183, 1996.
GILCHRIST, Alan. Thesauri, taxonomies and ontologies: an etymological note. En Journal of Documentation, vol. 59, n. 1, 2003, pp. 7-18.
LANCASTER, F. W.. Indexing and abstracting in theory and practice. Londres, The Library Association,1991.
LANCASTER, F. W. El control del vocabulario en la recuperación de información. Valencia: Universidad de Valencia, 1995.
MOYA MARTÍNEZ, G. y GIL LEIVA, I. Evaluación de software de gestión de tesauros. Ciencias de la Información, v. 32, nº 3, 2001.
PINTO, M. A user view of the factors affecting quality of thesauri in social science databases. Library & Information Science Research, 2008, vol. 30, n. 3, pp. 216-221.
PINTO, M (ed). Manual de clasificación documental. Madrid: Síntesis, 1997.
PINTO, M. y CORDÓN, J. A. Técnicas documentales aplicadas a la traducción. Madrid: Síntesis. pp. 113-119.

Filtración de la información

CURRÁS, E. Ontologías, taxonomía y tesauros: manual de construcción y uso. Gijón: Trea, 2005.
GILCHRIST, Alan. Thesauri, taxonomies and ontologies: an etymological note. En Journal of Documentation, vol. 59, n. 1, 2003, pp. 7-18.
LANCASTER, W.; PINTO, M. Procesamiento de la información científica. Madrid: Arco/Libros, 2001.
PINTO, M.; MITRE, M.; DOUCET, A.-V.; SANCHEZ, M.J. Aprendiendo a resumir. Gijón: Trea, 2005.
PINTO, M. El resumen documental: paradigmas, modelos y métodos. Madrid: Fundación German Sánchez Ruiperez, 2001.
PINTO, M. (coords.). Procesamiento de la información científica. Madrid: Arco/Libros, 2001.
PINTO, M. Engineering the Production of Metainformation: the abstracting concern. Journal of Information Science, 2003, vol. 29, 5, pp, 429-441

Representación de la información

GONZALEZ GARCIA, F. et al. Una aportación a la mejora de la calidad de la docencia universitaria: los mapas conceptuales. Universidad Pública de Navarra, 2000
PINTO MOLINA, M.; GARCIA MARCO, F. J.; AGUSTÍN LACRUZ, M. Del C. Indización y resumen de documentos digitales y multimedia: técnicas y procedimientos. Gijón: Trea, 2002