Icono de conformidad con el Nivel A, de las Directrices de Accesibilidad para el Contenido Web 1.0 del W3C-WAI

Dirección: Maria Pinto Molina    

Inicio > Organización, filtración y representación de la información

ORGANIZACIÓN, FILTRACIÓN Y REPRESENTACIÓN DE LA INFORMACIÓN

Saber organizar los contenidos electrónicos, analizarlos, procesarlos, filtrarlos y representarlos de forma sintética es cada día mas necesario en un entorno electrónico. Por ello es importante saber utilizar programas para hacer mapas conceptuales, sumarios, índices automáticos.

Organización del conocimiento

Filtración de la información

Representación de la información

Habilidades y Competencias

Dossier electrónico

Dossier bibliográfico

 

Organización del conocimiento

  • Introducción

    El conocimiento puede ser estudiado desde distintas perspectivas: como un estado mental, que permite conocer y comprender a través de la información; como un objeto, que puede ser almacenado y manipulado; como proceso, el conocimiento se centra en la aplicación de la experiencia; desde la perspectiva organizativa, el conocimiento es la condición clave para el acceso a la información y la recuperación del contenido; por último, está la potencialidad del conocimiento para influir en la acción, desarrollando competencias y estrategias en el saber cómo.

    La organización del conocimiento trata de optimizar la organización de los repertorios de conocimiento existentes en un dominio, para facilitar la recuperación, creación y compartición de conocimiento entre la comunidad de usuarios. Mientras que la gestión del conocimiento permite asegurar estratégicamente que los asuntos y flujos de conocimiento se conozcan y se utilicen en términos de valor empresarial.

    Aunque existen múltiples formas de organizar el conocimiento, haremos uso de las formas documentales más consolidadas en el funcionamiento de los sistemas de información, pues se ha constatado que su empleo facilita la economía cognitiva de gestores y usuarios al conseguir representar el máximo de información sobre un objeto usando el mínimo de recursos conceptuales. Nos referimos a la clasificación documental, las ontologías y los topics maps (mapas temáticos).

    La clasificación documental, que se configura generalmente a partir de la clasificación científica y filosófica de un dominio, trata con el conocimiento después de que éste se haya fijado en los documentos, con el fin de determinar la materia de que tratan para su ordenación en clases.

    La organización del conocimiento (que es la base del proceso de indización y descripción) y la recuperación son dos cuestiones fundamentales en la clasificación documental. En la clasificación documental intervienen estas variables: la estructura del documento primario, la estructura del sistema de clasificación, la capacidad cognitiva del analista en la descripción de la materia del documento, el contexto en el que se crea y usa el sistema de clasificación, el contexto documental y la intertextualidad entre el sistema de clasificación y los documentos clasificados por ese sistema.

  • Topic map
  • Definición y norma

    Es un documento o conjunto de documentos SGML y XML, interrelacionados en un espacio multidimensional en el que las localizaciones son topics (temas). Son herramientas empleadas para la gestión del conocimiento y la optimización de la recuperación de información.

    Su diseño se ajusta a la norma ISO/IEC 13250-2000, que contiene una descripción no formal de los tipos de objetos que componen un topic map, así como una sintaxis XML de representación e intercambio.

  • Componentes y uso
  • Es un conjunto de:

    • topics, que son conceptos desde los que se puede navegar
    • ocurrencias de los topics en el documento
    • asociaciones, o relaciones entre los topics

    Las aplicaciones de los topic maps pueden ser:

    • navegación: muestra todos los conceptos relacionados con el concepto central, siendo más intuitivo navegar en este espacio que en otro sistema de recuperación de información
    • mejora las preguntas en Internet
    • agentes personales para mejorar la eficiencia en el acceso a la web

  • Funcionamiento

    Ofrece un conjunto organizado de topics, de enlaces sobre los recursos documentales indizados por estos topics, y las infinitas relaciones semánticas entre estos temas. Describe la organización de la información y cómo acceder a ésta, a través de los siguientes mecanismos:

    • gestión de varios nombres para cada topic
    • gestión de ocurrencias enlazando estos topics y los documentos externos indizados
    • gestión de relaciones semánticas, jerárquicas o no, entre los topics vía asociaciones
    • clasificación, simple o múltiple, de los topics con topics
    • mecanismo de filtraje de los topics permitiendo filtrar y personalizar el índice en función de los usuarios
    • mecanismo de identificación universal de los temas permitiendo identificar de manera única un tema representado en diferentes topic maps
    • capacidad de intercambiar y fusionar diferentes topic map

  • Ejemplos de topic maps

  • Ontología

  • Definición

    Las ontologías ofrecen el conocimiento de un dominio de forma compartida y consensuada, ya sea entre personas, sistemas heterogéneos. Se definen como una especificación formal (legible por máquina), explicita de una conceptualización compartida, en la que los conceptos están organizados en forma de taxonomía. Más...

  • Componentes:
    • conceptos: ideas básicas que se intentan formalizar
    • relaciones: representan el enlace entre los conceptos de un dominio dado
    • funciones: son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología
    • Instancias: se utilizan para representar objetos determinados de un concepto
    • Axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología

  • Tipologías:
    • Ontologías de un dominio: se representa el conocimiento especializado pertinente de un dominio o subdominio.
    • Ontologías genéricas: se representan conceptos generales del conocimiento
    • Ontologías representacionales o meta-ontologías: se especifican las conceptualizaciones que subyacen a los formalismos de representación del conocimiento
    • Ontologías creadas para una actividad o tarea específica, son las ontologías creadas para una aplicación específica.

  • Usos

    Se han construido ontologías específicas para aplicaciones en traducción automática, ciencias de la salud, recuperación de información., pero sobretodo se han empleado en la gestión del conocimiento y en la web semántica.

  • Ejemplos de ontologías

  • Tesauro

    El tesauro es un lenguaje de indización controlado constituido por un conjunto de términos descriptores y no descriptores, y un sistema de relaciones que definen su contenido semántico.

    La función principal del tesauro es controlar los sinónimos de forma que, documentos que tratan sobre los mismos temas o parecidos no sean indizados bajo términos diferentes.

    En general, un tesauro interrelaciona los términos para construir un lenguaje documental estructurado, que es utilizado por los usuarios para la búsqueda de información en las bases de datos.

  • El proceso de indización del documento
    • Definición

      La indización consiste en extraer los conceptos fundamentales del contenido de un documento y representarlos mediante unos términos adecuados, bien procedentes del lenguaje natural empleados por los autores o de un lenguaje documental previamente seleccionado, como es el tesauro. Las variables que intervienen en el proceso de indización son las siguientes: nivel de análisis, cualificación y pericia de los indizadores, tipo y volumen de información que va a indizarse, disponibilidad de tiempo, medios económicos y características del sistema de almacenamiento de la base de datos.

    • Metodología

      En la práctica la indización de un documento se desarrolla en estas tres etapas:

      • Examen del documento: para determinar el tema de que trata.
      • Análisis conceptual: para segmentar el documento en unidades y elementos de análisis más operativos, anotar las palabras reflejando el tema principal, subdividir el texto según el tema y seleccionar los conceptos significativos.
      • Traducción al lenguaje del sistema, seleccionando los descriptores pertinentes del tesauro.
      • El proceso de indización está unido al proceso de búsqueda, de tal forma que el éxito en la recuperación de información dependerá de la habilidad para encajar una formulación específica de búsqueda con la descripción y caracterización de esa información.

        La metodología de indización empleada por la Organización Internacional del Trabajo para la elaboración de su Tesauro ILO puede consultarse en http://www.oit.org

    • Normativa

      Las normas existentes para el establecimiento y construcción de tesauros son esenciales y necesarias para cualquier indizador/documentalista que pretenda diseñar y desarrollar un tesauro en cualquier área del conocimiento.

      Para los tesauros monolingües existen dos importantes normas internacionales:

      • La norma ANSI Z39.19:1993, y su correspondiente norma española UNE 50-106-90 (AENOR). Proporciona reglas o recomendaciones de normalización de los términos, define sus relaciones jerárquicas, de equivalencia y asociativas, la presentación alfabética, jerárquica y gráfica de las entradas, la verificación de los términos, su especificidad, así como la admisión y supresión de los mismos.
      • Y la norma ANSI Z39.19:1 993, de la American National Standards Institute, más precisa y detallada en sus recomendaciones aunque los contenidos, campo de aplicación, objetivos y manejo del vocabulario son similares. La principal novedad es la implicación del usuario como fuente de selección terminológica.

      Otras normas de interés son:

      • UNE 50-121-91 Documentación. Métodos para el análisis de documentos, determinación de su contenido y selección de los términos de indización que equivale a la ISO 5963:1985. Documentation. Methods for examining documents, determining their subjects and selecting indexing terms.
      • UNE 50-125-1997 Documentación. Directrices para el establecimiento y desarrollo de tesauros multilingües, equivalente a la norma ISO 5964:1985 Guidelines for the Establishment and Development of Multiingual Thesauri

      Ofrecemos la siguiente tabla de equivalencia

      Normas Internacionales
      Normas Españolas
      ISO 2788:1985 Documentation. Guidelines for the Establishment and Development of Monolingual Thesauri. UNE 50-106-90 Documentación. Directrices para el establecimiento y desarrollo de tesauros monolingües.
      ANSI/NISO Z39.19:1993 Standard for Structure and Organization of Information Retrieval Thesauri.    
      ISO 5963:1985 Documentation. Methods for examining documents, determining their subjects and selecting indexing terms. UNE 50-121-91 Documentación. Métodos para el análisis de documentos, determinación de su contenido y selección de los términos de indización.
      ISO 5964:1985 Documentation. Guidelines for the Establishment and Development of Multilingual Thesauri. UNE 50-125-97 Documentación. Directrices para el establecimiento y desarrollo de tesauros multilingües.

































  • Indización Automática

    La indización manual y la automática no son procedimientos equivalentes. No es posible imitar la capacidad cognitivo-lingüística humana por parte de las máquinas. La investigación en indización automática debe orientarse a la consecución de métodos que permitan el análisis de los textos por parte del ordenador de manera eficaz, pero sin necesidad de que la máquina llegue a comprenderlos. Se trata de lograr un sistema automático que sea capaz de asignar a los documentos un modo de representarlos que permita su eficaz recuperación.

    Distinguiremos tres tipos de indización automática:

    • Indización asistida por ordenador: tras obtenerse los conceptos intelectualmente y asignarles términos de descripción, el almacenamiento de éstos se efectúa con apoyo informático.

    • Indización semiautomática: el ordenador extrae los conceptos, pero los términos son propuestos por una persona

    • Indización automática: el ordenador hace la extracción de los conceptos y valida su representación como descriptores.

    La facilidad que para la creación de los contenidos ha supuesto la digitalización de los documentos y su distribución por Internet ha venido a resaltar aún más la necesidad de los procesos de indización automática, de una parte, por el número desmedido de documentos a tratar, y de otra, por la rapidez con que debe hacerse. Además, hemos de considerar que los costes de la indización humana son superiores que los de la indización automática.

    La intervención de la inteligencia artificial ha facilitado que las computadoras vayan aproximándose a la competencia lingüística de los humanos. Los proyectos actuales de indización automática se caracterizan por la colaboración estrecha entre la inteligencia artificial y la gestión digital de los documentos. Gran parte de las experiencias actuales en indización automática y bastantes de los programas comercializados combinan el modelo lingüístico con las herramientas estadísticas.

    Se ofrecen algunos programas de indización automática con su página web:


  • Diseño del Tesauro

    Para el diseño y elaboración de un tesauro, se pueden seguir una serie de fases o etapas, establecidas en su mayoría en la norma UNE 50-106-90; la norma UNE 50-121-91 usada para la indización; y las recomendaciones de Aitchison en su manual práctico de Uso y construcción de tesauros, en su última edición. Estas fases son las que a continuación se detallan:

    • Campo Temático
    • La primera cuestión que hay que plantearse es la elección del tema del tesauro y el alcance del mismo.

    • Recopilación de los términos
    • La segunda fase consiste en la recopilación del vocabulario principalmente a través de la recogida de todos los términos que se encuentran en la literatura consultada y aquellos que se puede extraer de las conversaciones con expertos en el tema.

      A continuación, se comprueba que los predescriptores no tengan diversos sentidos, evitando la ambigüedad. En esta etapa se reduce la lista, ya que se eliminan las repeticiones evidentes. Puede resultar muy práctico, en este momento, la comparación de estos términos con los de otros tesauros.

      Para la recopilación terminológica se pueden utilizar una base de datos donde se crean diferentes carpetas que contienen los términos referidos a cada campo semántico del tesauro.

    • Control Terminológico
    • La normalización del vocabulario se puede llevar a cabo mediante la creación de un fichero alfabético, con el vocabulario ya depurado evitando con su elaboración la duplicación de entradas, el control gramatical de género y número de las expresiones y sirve, al mismo tiempo, como mecanismo de actualización del lenguaje, porque en él se registran las posibles incidencias de cada término.

      Al construir un tesauro es preciso fijar una terminología inequívoca, que supere sinonimias y polisemias, eligiendo, en la medida de lo posible, la trascripción, más comúnmente utilizada.

      La polisemia se define como la existencia de significantes con varios significados, es perjudicial en el tesauro y debe ser controlada.

      La sinonimia se produce cuando un solo concepto está representado por varios significantes. En un lenguaje documental la sinonimia es beneficiosa siempre que esté controlada, pues ofrece todas las entradas posibles al sistema documental. Lo más habitual es elegir una expresión como descriptor y mantener los sinónimos como no descriptores.

      La mayoría de los términos de un tesauro consiste en sustantivos o sustantivos y modificadores (frases sustantivadas). La mayor parte de las frases sustantivadas serán frases adjetivadas, pero puede haber frases preposicionales.

      En general, en un tesauro deben evitarse los adjetivos, a menos que acompañen a un sustantivo. Sin embargo, en algunos tesauros pueden ser necesarios algunos adjetivos generales, que podrían modificar potencialmente muchos de los otros términos del vocabulario. Pero es aconsejable limitar al mínimo el uso aislado de adjetivos.

      No deben utilizarse los infinitivos y participios de los verbos, sino en forma de sustantivos o formas verbales sustantivadas.

      Existen algunas categorías de términos que pueden ser consideradas como verdaderos sinónimos. Los más evidentes son las abreviaturas y los acrónimos. En general, el término completo es preferente y la abreviatura aparece como término no descriptor de entrada. En algunos casos, una abreviatura o un acrónimo es de uso tan común que se ha olvidado de qué términos procede. En estos casos, se recomienda la utilización de la abreviatura o el acrónimo y considerar el término completo como un término de entrada, si se estima conveniente. Existen otros casos en los que la elección estará dictada por el tipo de usuarios a quien va dirigido el tesauro.

      El autor de un tesauro también debe ser consistente en el uso del singular y del plural. La mayoría de los sustantivos aparecen en plural.

      Cuando un descriptor designa una operación y el producto de la misma, se utiliza el singular para la operación y el plural para el producto, calificando, además, el primero con una expresión entre paréntesis. Ejemplo: Clasificación (proceso)/Clasificaciones (producto).

      Las locuciones nominales, adjetivas y preposicionales deben ser presentadas en el orden de la lengua natural y no en la forma invertida. La forma invertida puede dar lugar a un reenvío hacia la forma directa.

      En relación con la utilización de términos simples o compuestos, la norma ISO determina en su punto 7 que, por regla general, los descriptores deben representar en la medida de lo posible términos simples. Las nociones complejas pueden ser descompuestas en términos simples si alguno de los elementos de un término compuesto puede ser aceptado como descriptor.

      La misma norma señala que deben mantenerse los términos compuestos como descriptores si la descomposición del descriptor compuesto puede generar problemas de comprensión, por ser conocido en su forma compuesta o si la descomposición puede generar confusión o ambigüedad, y para evitar la amplitud semántica.

      Sobre este asunto UNESCO aconseja que se han de evitar en lo posible lazos gramaticales, artículos y preposiciones entre los descriptores compuestos. En español, para conseguir este objetivo se puede recurrir a la adjetivación.

    • Agrupación en Categorías, Subcategorías
    • Es la parte más importante y más difícil de construir. Se trata de crear una única estructura jerárquica del tesauro, que presenta sistemática y sintéticamente toda la información que hay en el mismo.

      Consiste en dividir en áreas temáticas de afinidad probada la futura lista de descriptores, dando una denominación a cada campo semántico, a cada subcampo, etc., constituyendo la estructura básica en la que distribuimos posteriormente los descriptores del fichero alfabético.

    • Establecimiento de la estructura conceptual
    • Consiste en el establecimiento de los distintos elementos constitutivos del tesauro: los descriptores , los no descriptores, y las notas de alcance. Los descriptores se estructuran en campos semánticos según áreas temáticas, que pretenden reflejar la interdisciplinariedad del tesauro.

      • Descriptores
      • No descriptores
      • Notas de alcance

    • Establecimiento de la estructura relacional
    • Permite establecer las relaciones semánticas que se establecen entre los términos: relaciones: equivalentes, jerárquicas y asociativas.

      • De equivalencia
      • Jerárquicas
      • Asociativas

      Las siglas empleadas para expresar estas relaciones y notas de alcance en la parte alfabética se utilizan en español, siguiendo la norma UNE 50-106-90 y son las siguientes:

  • SN
    NA
    Nota de alcance
    USE
    USE
    Término preferido
    UF
    UP
    Término no preferido
    BT
    TG
    Término genérico
    NT
    TE
    Término específico
    RT
    TR
    Término relacionado

    • Implementación Tecnológica

      B.E.A.T. Josep Sau, Centre d'Informatica de la Universitat de Barcelona. Versiones en castellano, catalán e inglés. Tiene ayuda en castellano y el listado permutado en forma de KWIC. Como inconvenientes podemos destacar: el número máximo de descriptores que permite una familia es de sesenta, sumando las relaciones asociativas, jerárquicas y de equivalencia; hay que teclear de nuevo los términos cada vez que se establece una relación en el tesauro; no permite volcar los términos directamente desde un procesador de textos; y se trata de un programa que puede ocasionar dificultades de actualización del tesauro.

      Multites. Empleado, entre otros, en el Canadian Literacy Thesaurus, WorldBank Thesaurus. El software Multites, empleado, entre otros, en el Canadian Literary Thesaurus, World Bank Thesaurus, en TesQual, permite la conversión de ficheros y la generación de ficheros en lenguaje HTML permitiendo la inclusión del tesauro en la red Internet. Se desarrolla sobre el sistema operativo Windows y no hace falta teclear los términos cuando se establecen las relaciones semánticas.

      Thew. El programa Thew del Profesor Tim Craven tiene como inconveniente que no permite sacar ningún índice permutado.

      Lexico. Empleado en los tesauros elaborados por la Library of Congress.

  • Presentación del tesauro

    Los términos que componen el tesauro y sus relaciones se pueden representar de varias formas, siendo las más comunes la presentación alfabética, la presentación jerárquica y la presentación gráfica. A continuación vamos a describir cada una de ellas. Seguiremos para ello el orden de presentación de las mismas en el tesauro. En el caso de la presentación gráfica hay tesauros que la utilizan en lugar de la presentación jerárquica; de tal manera que cuando la presentación de los términos se lleve a cabo jerárquica o gráficamente, es necesario que el tesauro esté provisto de un índice alfabético, que permita una primera toma de contacto con la información presente en el mismo y remita, mediante un código, a la parte jerárquica o gráfica.

    Como complemento a estas formas de presentación es aconsejable elaborar un índice permutado general en donde estarán todos los descriptores alfabetizados tantas veces como términos lo compongan.

    • Presentación alfabética
      Describe las relaciones de equivalencia considerando el número clasificatorio del descriptor.
    • Presentación jerárquica
      Contiene los descriptores estructurados en función de categorías o jerarquías.
    • Presentación permutada
      Existen dos tipos de índices permutados, el índice KWIC (Key Word In Context) y el índice KWOC (Key Word Out Context).
    • Presentación gráfica
      Muestran sobre todo las relaciones jerárquicas existentes entre descriptores y por lo general, los reenvíos hacia términos asociados se indican en los márgenes del esquema gráfico.

Filtración de la información

  • Introducción
  • La práctica de resumir se inserta en el paradigma de la representación documental o conjunto de procesos que experimentan los documentos en el seno de una colección determinada, con el objetivo de facilitar su recuperación, y sobre todo de potenciar su capacidad informativa. Su resultado es el resumen, documento secundario muy apreciado entre profesionales y estudiosos por su potencial informativo, convirtiéndose en el más importante vehículo de información referencial al servicio del principio de entropía que rige el comportamiento humano. El resumen es un instrumento eficaz en los sistemas de recuperación automatizados, ya que muchos creadores de bases de datos lo utilizan como fuente de indización para la selección de palabras claves representativas, y por tanto como clave de búsqueda en texto libre. Incluso en el contexto de los documentos electrónicos enlazados de un modo reticular, el resumen sigue siendo el metadato de más complejidad y relevancia informativa.

  • El resumen como prototipo

    La razón de ser obedece principalmente a la necesidad de identificar el contenido documental, de forma rápida y fiable. Son muchos los científicos y profesionales los que confían en esta herramienta para el desarrollo de su trabajo.

    El protagonismo de los resúmenes se hace notar, ante una sociedad llena de cambios tecnológicos y constantes aumentos de información. Se trata de una herramienta que ofrece información estructura, que con ayuda de los sistemas hipertexto permite crear redes semánticas entre documentos útiles para los avanzados entornos de búsqueda actuales.

    • Definición
    • El resumen es un breve texto representativo, autónomo, intencional. Destaca su textualidad, pues no podemos pasar por alto que se trata de un verdadero texto lleno de coherencia y cohesión; su autonomía, o independencia documental con respecto al texto de partida; y su diversidad, pues para un mismo texto se pueden realizar distintos resúmenes dependiendo de los factores de producción y sobre todo del nivel de descripción analítica que se requiera.

    • Objetivos

      La definición de los objetivos documentales, el entorno operativo definido por el tipo de texto a resumir, las características de los posibles usuarios, y las condiciones de trabajo de los resumidores influye considerablemente en el proceso de resumir.

    • Funciones

      Sus funciones más importantes:

      • Indicar: generando un microtexto que indique, es decir suministre indicios sobre el documento que representa.
      • Informar: el resumen se equipara a cualquier otro documento primario, siendo esta su más noble cualidad documental.
      • Sustituir: ahorrando tiempo al usuario en el manejo de información filtrada siendo sustituto del documento original.
      • Orientar: en el entorno electrónico en una doble dirección: 1. como etiquetas metadatos de los documentos electrónicos y 2. como unidades independientes en una red de resúmenes con sus preceptivos hiperenlaces.

      De la importancia concedida a cada uno de estas funciones se desprenderá la estrategia más adecuada para elaborar el resumen.

    • Factores

      Deben ser tenidos en cuenta: documento a resumir, objetivos documentales, resumidor, usuario y tipo de resumen.

      • Documento

        Término polisémico concebido como la acumulación permanente y estable de signos que puede ser explorada libremente, con la doble función de almacenar datos e informar. Es conservador permanente de la información y difusor discrecional de la misma. El desarrollo de la nuevas tecnologías también ha dejado huella en este entorno, obligando a distinguir entre documentos textuales y electrónicos o multimedia. Los documentos textuales, y sobre todo los científicos suelen presentar una estructura lineal -acompañado en ocasiones de gráficos- y una inconfundible metodología OMRC (objetivos, metodología, resultados y conclusiones), que permiten al resumidor (estudiante, investigador,..) sintetizar la información de una forma menos compleja. Los documentos tienen una estructura fija y son algo más complejos al combinar diversas técnicas multimedia (vídeos, imágenes en movimiento, sonido, hipertexto, etc.). Su análisis es muy sofisticado debido principalmente a la diversa naturaleza informativa de los documentos de los que se ocupa, a la yuxtaposición de canales por la que dichas informaciones se transmiten y a la escasa normalización existente en los procesos de descripción y representación documental.

      • Resumidor

        Es el elemento más importante del sistema y de su competencia y habilidades va a depender la calidad de los resúmenes.

      • Usuario / destinatario

        El perfil y las funciones asignadas son factores que condicionan el proceso resumidor. No es lo mismo hacer un resumen para un compañero de clase que para presentar una comunicación a un congreso pues será este el elemento clave para su aceptación o no.

      • El resumen

        Es el recurso de información más solicitado por científicos y profesionales, porque permite de una forma anticipada la consulta o rechazo del original, sin necesidad del acceso directo.

  • Procedimiento

    Aunque la elaboración del resumen supone un proceso único y encadenado de operaciones intelectuales, estableceremos con fines de aprendizaje la siguiente secuencia:

    • Lectura / Comprensión

      La lectura es la toma de contacto entre el estudiante y el texto, operación a través de la cual se consigue una comprensión del significado del documento, identificando los detalles físicos (párrafos, gráficos, títulos, subtítulos, etc.) y cognitivos (ideas principales, secundarias, conclusiones, etc.) que posteriormente serán claves para elaborar el resumen.

      Hay dos tipos de lectura:

      • Lectura rápida: el tiempo estimado es muy breve y se pretende destacar los elementos más importantes del documento: tema principal y secundario, estructura de la información,... Se aconseja resaltar las ideas relevantes bien subrayándolas en el texto o bien redactando un pequeño esquema. La finalidad es obtener una idea general del contenido del documento y comprender la estructura cognitiva del mismo.
      • Lectura estratégica: es una lectura más activa y pausada, deteniéndose en cada párrafo importante, reflexionando sobre las ideas que se han expuesto y analizando aquellos segmentos textuales que concentra una mayor cantidad de información: objetivos, metodología y conclusiones.

      La comprensión de un texto es la representación mental que hacemos de su significado. En este proceso intervienen una serie de variables: conocimientos del lector, datos del texto, contexto, objetivos que se persiguen. Comprender supone captar la estructura del texto e integrar de forma coherente la información nueva en los propios conocimientos y esquemas del que lee.

    • Análisis / Interpretación

      Es todo proceso por el cual se divide un objeto o un documento en sus componentes o fases fundamentales. De la comparación entre los elementos se extraen los rasgos específicos y diferenciadores que permite diferenciar unos de otros.

      El análisis se despliega a través de estas fases
      • Segmentación del texto: se recomienda estratificar la información en párrafos, normalmente los mismos que proporciona el texto del documento.
      • Estrategias de reducción: en cada segmento de texto es conveniente leerlo detenidamente y seleccionar aquella información relevante. De esta manera, la información se reduce considerablemente.
      • Identificación de las ideas principales: algunos documentos ofrecen las denominadas palabras identificativas, tales como en conclusión, como idea principal, por consiguiente, etc., para indicar que a continuación viene una información relevante.
      • Jerarquizar la información: Jerarquizar la información: determinando y organizando las ideas principales y secundarias, con la ayuda de la elaboración de un mapa conceptual.

      La interpretación, es un proceso individualizado y creativo que permite hacer conexiones entre la información procedente de distintas fuentes para ampliar las ideas propias asignando a las palabras y conceptos un determinado significado y generar nueva información.

    • Síntesis / Producción

      Es la fase más compleja del proceso, ya que no se puede someter a ningún criterio normalizador, depende exclusivamente del autor de resumen que pone en juego sus cualidades, habilidades, conocimientos e intereses documentales para sintetizar el contenido del documento original en unas cuantas líneas.

      Una vez seleccionada, interpretada y esquematizada la información relevante del documento se redacta el resumen a modo de texto breve que recoge el contenido esencial del documento original, de forma que al tratarlo no sea necesario recurrir al original. La elaboración de todo resumen estará presidido por los siguientes criterios:

      • Fidelidad, respetando en cada momento el contenido original, no omitiendo partes sustanciales y evitando comentarios personales.
      • Precisión, evitando siempre la redundancia y la repetición
      • Claridad expositiva, utilizando una terminología apropiada, teniendo en cuenta los usuarios y nivel de conocimientos.

  • Normativa
    • ISO 214-1976:

      Documentation Abstracts for publications and documentation enlaza a la pagina oficial ISO, para comprar la norma.

      Esta norma proporciona una breve introducción y un apartado dedicado a definiciones, se centra principalmente en el tratamiento del contenido de los documentos, en la presentación y estilo, finalizando con una serie de ejemplos.

    • UNE 50-103-1990

      AENOR (Asociación Española de Normalización y Certificación), es el organismo español encargado de elaborar las normas españolas. La norma UNE 50-103-1990, es la equivalente a la ISO 214-1976, con la única diferencia de que incluye sus propios comentarios y, propone ejemplos propios.

  • Tipos de resúmenes

    Es difícil determinar una clasificación exhaustiva de los resúmenes, ya que en la práctica los criterios se entremezclan dando lugar a clasificaciones cada vez diferentes, dependiendo de la persona o entidades que se encarguen de producir resúmenes. Proponemos la siguiente clasificación:

    • Densidad informativa

      En física la densidad es una magnitud que pone en relación la masa y el volumen de un cuerpo. En el entorno del resumen documental, la densidad al igual que en física relaciona la cantidad (masa) de información que contiene y el volumen ocupada. Por lo que, las magnitudes profundidad (nivel de descripción) y densidad son directamente proporcionales, de forma que al aumentar una automáticamente aumenta la otra.

      La densidad informativa del resumen lleva consigo la siguiente tipología:

      • Resumen indicativo

        Sirve de alerta al estudiante, anunciándole la existencia del documento y ofreciéndole la información suficiente para que decida si vale la pena iniciar la lectura. Su extensión no suele sobrepasar las 50 palabras por lo que hace de este tipo de resumen una herramienta ideal para aquellos estudiantes que deban resumir un gran número de documentos. En este caso, la densidad informativa y su profundidad son máximas.

      • Resumen informativo

        Su función es la de informar al estudiante sobre el contenido explícito del documento, incluyendo aquella información relevante que en el resumen indicativo no se incluyen. La estructura se basa en el esquema OMRC, esto es Objetivos, Metodología, Resultados y Conclusiones del documento resumido. Su extensión está comprendida entre los 100 y 300, en función de la longitud del documento original. En este caso, la densidad y la profundidad es menor que en el indicativo.

    • Autoría del resumen

      La autoría depende del agente que se encargue de llevar a cabo esta compleja operación, distinguiéndose los resúmenes humanos y resúmenes automatizados.

      Resúmenes humanos, elaborados por:

      • Autor del documento: El autor es el que engendra el documento y por tanto nadie mejor que él para conocer el contenido de la obra. Pero esto presenta distintas desventajas, por un lado a la hora de realizar el resumen ya que una cualidad imprescindible es la objetividad y el autor puede llegar a confundirla y dejarse llevar por ideas o emociones. Por otro lado, el autor de un documento carece a veces de conocimientos y técnicas para llevar a cabo un resumen de calidad. No por ello no deja de ser un resumen útil, principalmente para los profesionales resumidores que les permite avanzar rápidamente sobre el contenido del documento dejándoles sólo las tareas documentales.

      • Experto o especialista: Es aquella persona que se dedica hacer resúmenes del campo en el que es especialista garantizando la imparcialidad que al autor puede costarle más esfuerzo. Este agente flaquea en que desconoce las herramientas documentales para llevar a cabo un buen resumen.

      • Resumidor profesional: Es el que mejor conoce las técnicas de análisis y filtración de información. Pero carece muchas veces de competencias científica en una materia. Las cualidades básicas que distinguen a un buen resumidor son: capacidad de entrega, formación científica específica, observador, conocimiento de técnicas de lectura y de comprensión, y dominio del lenguaje.

      Resúmenes automatizados

      Con el desarrollo de la gran cantidad de documentos digitales, se hace necesario establecer programas que permitan procesar los textos de forma automática. Los métodos automáticos diseñados hasta ahora pretenden actuar de la misma forma que lo haría la mente humana, pero esto no es probable ya que para realizar un resumen se pone en práctica la capacidad cognitiva/intelectual del hombre difícil de plasmar en la herramientas informáticas. Se investiga en programas inteligentes basados en aspectos sociocognitivos de los documentos capaces de especificar las características de legibilidad, precisión y brevedad en sus productos.

    • Ejemplos de resúmenes

  • Forma de presentación de los resúmenes

    Se distinguen dos modalidades de presentar la información, en texto libre y texto estructurado.

    • Resúmenes en texto libre

      Son aquellos que no disponen de una estructura específica en la presentación de información. Se distinguen dos tipos los telegráficos, que presentan la información de una manera concisa y esquemática, se caracterizan por ser rápidos de escribir y de leer. Por otro lado están los resúmenes discursivos, donde la información que se presenta es de forma literaria y amplia.

    • Resúmenes estructurados

      Todos los resúmenes estructurados deben incluir la estructura básica en todo proceso científico: objetivos, metodología, resultados y conclusiones. La forma discursiva está basada en la estructura y el texto que se obtiene se caracteriza por su cohesión.

  • Modo de difusión

    La difusión se basa entorno al medio en que se va a presentar el resumen, bien puede ser en formato papel (bibliográfico) o electrónico.

    • Difusión bibliográfica

      Este modo de difusión es el empleado tradicionalmente antes del desarrollo de las nuevas tecnologías, actualmente se utiliza para publicar el resumen con el artículo científico en las revistas científicas. También se pueden encontrar las revistas de resúmenes que están formadas por el conjunto de resúmenes de los documentos originales analizados, agrupados y estructurados según un plan de clasificación temática preestablecido.

    • Difusión electrónica

      Se caracteriza por el enorme auge que se está produciendo en el mundo electrónico, donde la transmisión de información tiene multitud de vías. De forma que el resumen puede difundirse rápidamente por medio de las bases de datos, las revistas electrónicas, internet, etc. Su mayor cualidad es que se le pueden agregar hiperenlaces dando lugar a una cadena continuada de pequeños resúmenes denominados microtextos interactivos.

  • Automatización

    El auge electrónico en todas las ramas de la ciencia ha supuesto un gran cambio en el entorno profesional, aunque existen procesos documentales como RESUMIR que se resisten a la automatización, debido a la dificultad de conferir a un ordenador mediante reglas y algoritmos procesos y estrategias cognitivas individuales. Por fortuna para los resumidotes, resumir sigue siendo una tarea que requiere de la intervención de expertos humanos para garantizar la transición entre dos estructuras significantes de un documento a través de una estructura de significado común.

    No obstante, se han producido avances en el dominio de la sintaxis oracional, pues hay programas que permiten el reconocimiento de las unidades léxicas y la extracción simple de información. El problema surge en las facetas interpretativa y pragmática, donde fluyen los efectos de ambigüedad e imprecisión terminológico-conceptual del lenguaje y los condicionantes contextuales y documentales de cualquier situación de comunicación. Pese a los avances derivados de la lingüística computacional y del Procesamiento del Lenguaje Natural (PLN), los sumarios y extractos automáticos son de escasa calidad, pues son unidades de significado incoherentes que aportan indicios sobre el contenido de los documentos.

    Los métodos automáticos para la representación textual podemos agruparlos:

    • Métodos de extracción, basados en la estructura superficial y en el uso de técnicas estadísticas que permitan seleccionar la información en función de la frecuencia de las palabras clave, de la localización de la información..
      Como ejemplo destacamos la aplicación ANES (1995)

    • Métodos de sumarización, centrados en las estructuras retórica y/o profunda de los documentos y en los avances del procesamiento del lenguaje natural, permiten la creación de sumarios empleando recursos como plantillas web y plantillas metadatos.
      Como ejemplos destacan PROTEUS (1991), SUMMONS (1995), SIM-SUM (1998)

    • Métodos gráfico-relacionales, basados en técnicas vectoriales y algoritmos gráficos de mapeo de información, permiten extraer información en lenguaje natural de las similitudes y diferencias de un conjunto de documentos. Sobresale el sistema SMART (1989)

    • Métodos híbridos, que a modo de banco de trabajo asisten al resumidor en el proceso de creación de pre-resúmenes.
      Mencionamos la aplicación TEXNET

    Se ofrece una selección de softwares para la producción de extractos y sumarios:

     

Representación de la información

  • Introducción

    En la representación de la información la unidad de significación más elemental es la palabra, que se va agrupando para forma unidades semánticas superiores. La frase es una unidad significante intermedia que tradicionalmente se estudia gramaticalmente. El texto es la unidad superior, y provoca una situación de cambio en la estructura de conocimiento de las personas.

    Existen varias formas de representación:

    • Conceptos: expresa el contenido de la realidad científica, su estructura interna, dimensión y relaciones con otros conceptos. Los conceptos generales son polisémicos y semánticamente subjetivos, mientras que los conceptos especializados referidos a dominios científicos concretos, son más precisos y denotativos. Para representar los conceptos existen diferentes procedimientos, como pueden ser: las representaciones dimensionales; rasgos o atributos cualitativos; proposiciones o representaciones reticulares formadas por nodos conceptuales y enlaces asociados; plantillas en las que el concepto no se describe como una colección de atributos sino como una pauta holística que guarda cierto isomorfismo estructural con los objetivos categorizados.
    • Redes semánticas: organizan el conocimiento mediante nodos conceptuales y enlaces, representando las interrelaciones de manera asociativa. Existen aplicaciones informáticas que despliegan redes semánticas de documentos científicos como el caso de ATLAS/ti, Thenestsys...
    • Mapas conceptuales: representan de forma ergonómica y visual los conceptos fundamentales de cualquier documento al margen de su soporte y estructura. A nuestro juicio es uno de los mejores recursos para la representación y estructuración de la información.

  • Mapa conceptual

    Una forma dinámica y visual de representar gráficamente la información principal de cualquier documento y en especial el resumen, es a través de mapas conceptuales, pues no sólo favorecen las habilidades cognitivas del estudiante sino además aportan una orientación más ecológica y clarificadora en los procesos de descripción y recuperación.

    • Definición

      El mapa conceptual denominado también cognitivo, semántico, mental, es una alternativa complementaria al lenguaje natural en la función de representar y comunicar conocimiento. Siendo empleado en la representación y organización de información, se convierte en una técnica de aprendizaje significativo (proceso activo, constructivo y acumulativo de comprensión de nuevos conocimientos y de su inclusión en una base de conocimiento preexistente). Es una poderosa herramienta para transformar el conocimiento tácito en explicito.

      Este instrumento educativo fue ideado por Joseph Novak en la década de los años sesenta, como una forma de poner en práctica las teorías de David Ausubel sobre aprendizaje significativo. La construcción de mapas conceptuales enfatiza la importancia de adquirir nuevo conocimiento en las estructuras cognitivas existentes, mediante la asimilación de nuevos conceptos en forma de proposiciones.

      Los mapas conceptuales se usan en una amplia variedad de disciplinas por su capacidad para explicitar las estructuras de conocimiento de cualquier tema, documento... y por su capacidad para presentar estructuradamente un cuerpo de conocimiento complejo de manera simplificada. Desde nuestra dilatada experiencia docente, hemos descubierto que es una herramienta cognitiva crucial para el estudiante y el profesional de la documentación, sobretodo en la representación significativa de información, en el análisis documental y en los procesos de toma de decisiones.

    • Elementos de un mapa conceptual

      Los elementos fundamentales que componen un mapa conceptual son éstos:

      • Los conceptos: regularidad en los acontecimientos o en los objetos que se designa a través de un término. «Libro», «mamífero», o «atmósfera» son ejemplos de conceptos.
      • Palabras de enlace: que se utilizan para unir los conceptos y para indicar el tipo de relación que se establece entre ellos. Por ejemplo, si relacionamos los conceptos «edad» y «experiencia», mediante las palabras de enlace «proporciona» o «modifica», las proposiciones que genera son parecidas pero no idénticas
      • Las proposiciones: dos o más términos conceptuales unidos por palabras para formar una unidad semántica . «La ciudad tiene una zona industrial» o «el ser humano necesita oxígeno» son ejemplos de proposiciones

    • Proceso de construcción

      Se compone de cinco etapas:

      • selección de los conceptos
      • listado de los conceptos desde los más abstractos a los más concretos
      • agrupación de los conceptos relacionados e incorporación de otros conceptos de interés
      • ordenación de los mismos en una trama bi/tridimensional
      • enlace de cada par de conceptos mediante líneas etiquetadas en forma preposicional o proposicional.

      En función de los formatos adoptados destacamos los tipos de mapa araña, jerárquicos, diagramáticos y sistémicos.

    • En qué situaciones se puede utilizar el mapa conceptual

      Generar y organizar ideas:

      • tomar apuntes, resumir y analizar un texto (para ordenar las ideas sin tener en cuenta el orden en el cual se transmiten);
      • escritura creativa (escribir sus palabras clave y organizar las ideas en categorías principales y subcategorías hasta llegar al plan del texto)
      • organizar el trabajo propio

      Representar y organizar el conocimiento:

      • representando un dominio de conocimiento concreto y sus interrelaciones
      • señalando las interacciones entre los conceptos
      • aprendiendo eficazmente
      • facilitando la navegación

      Comunicar y compartir:

      • una información con una estructura temática compleja
      • información en red de forma estructurada

      Tomar decisiones :

      • en el proceso de autoaprendizaje
      • en trabajos en equipo
      • en decisiones profesionales

    • Evaluación de un mapa conceptual

      No hay dudas de que los mapas conceptuales y las redes semánticas constituyen una excelente base para la autoevaluación y que el análisis de estos instrumentos mentales está en la base del desarrollo de las habilidades del pensamiento crítico y del aprendizaje autónomo de los estudiantes universitarios en el espacio europeo de enseñanza superior.

      Para evaluar la calidad de un mapa conceptual, debemos considerar algunos de los siguientes aspectos:

      • Conocimientos que proporciona
      • Capacidad organizativa.
      • Habilidades cognitivas necesarias
      • Profundidad del procesamiento.
      • Estructuras conceptuales.
      • Fomento del aprendizaje significativo.

    • Ventajas en el entorno informático

      Se transforma en un componente básico de la arquitectura de los sistemas hipermedia, complementando texto e imágenes con diagramas activos. Esa activación es la base de los sistemas hipertextuales, estructura dinámica e interactiva que permite representar y organizar la información de un modo reticular con múltiples itinerarios de exploración.

      Software de mapas conceptuales

      CON LICENCIA

      • Knowledge Manager: el programa de los mapas conceptuales. Es un potente instrumento para construir mapas mentales, mapas conceptuales, mapas semánticos, redes semánticas, bases de conocimiento conceptual y diagramas con una extensión funcional que enriquece y facilita el atesoramiento conceptual y la gestión activa e interactiva del conocimiento.
      • MindGenius Software disponible en (o su explicación en) que ofrece una evaluación gratis

      FREEWARE


    • Ejemplos de mapas

Habilidades y competencias

 
  Adquirir y usar con precisión estrategias y técnicas para la organización y filtración de la información.  
 

Habilidades para extraer e interpretar la información, creando resúmenes, sumarios

 
Manejo de herramientas para la organización de la información: mapas conceptuales, redes semánticas.
 
Destrezas y habilidades para la clasificación, categorización e indización de la información, creando sistemas automatizados
 
Manejo del tesauro como instrumento de control terminológico para la recuperación de información
 
Aprender a usar los índices para localizar la información
 
Conocimientos de programas informáticos para la elaboración de mapas conceptuales, como medio económico y gráfico de representación de la información
 

Dominio de estrategias y métodos para sintetizar la información y construir nuevos conceptos, integrando la información nueva y previa en la creación de conocimiento.

 

 

Dossier electrónico

Dossier bibliográfico

Fecha de Creación 15/10/2004 | Fecha de Actualización 13/04/2011