La representación lingüística del conocimiento y su relevancia en la ingeniería lingüística

Autora: Lidia Cámara de la Fuente (STAR Servicios Lingüísticos )

Citación recomendada: Lidia Cámara de la Fuente. La representación lingüística del conocimiento y su relevancia en la ingeniería lingüística [en linea]. "Hipertext.net", núm. 2, 2004. <http://www.hipertext.net>

1. Prefacio
2. Introducción
3. Acerca del método de representación y transferencia
4. De la información al conocimiento
4.1. Tipos de conocimiento
4.2. Tareas vinculadas a la gestión del conocimiento
5. Formas de representación del conocimiento: la fuerza del lenguaje
6. Disciplinas vinculadas a la representación lingüística del conocimiento
7. Relevancia de la representación del conocimiento en la ingeniería lingüística y del conocimiento
8. A modo de conclusión
9. Bibliografía
10. Anexo: Glosario sobre representación lingüística del conocimiento e ingeniería de enfoque cognitivo

1. Prefacio

La motivación para escribir este artículo nace tras un encuentro de profesionales e investigadores de ámbitos disciplinarios diversos, convocados a participar en un curso sobre gestión del conocimiento. Durante este encuentro, pude constatar que documentalistas , informáticos , lingüistas y no así los economistas , en muchas ocasiones, estábamos hablando de lo mismo, pero la comunicación sufría interferencias. Las torpezas dadas en la comunicación eran sobre todo de naturaleza semántica, sólo salvables tras el esclarecimiento verbal de lo que cada uno entendía por un concepto. De ahí nació la idea de escribir un artículo que ejemplificara la confluencia de varias disciplinas en torno al conocimiento y a la representación de éste.

2. Introducción

El presente artículo tiene como principal objetivo, inferible fácilmente del título, contextualizar el concepto de representación del conocimiento dentro de sus posibles marcos de estudio y aplicación.

Para ello, enumeraremos qué tipos de conocimiento existen, en función tanto de su contenido como de su transferencia. Seguidamente, para poder contextualizar el dominio de la representación del conocimiento, tipificaremos las tareas relacionadas con la gestión del conocimiento.

Una vez que hayamos contextualizado los términos conocimiento , representación lingüística (textual y sintética) del conocimiento y gestión del conocimiento, nos ocuparemos de las disciplinas troncales y específicas vinculadas a la representación lingüística del conocimiento y sus implicaciones en el desarrollo de aplicaciones informatizadas (productos de ingeniería lingüística y del conocimiento).

Nuestra aportación a la investigación vinculada al conocimiento representado mediante términos concluye con un breve glosario que contiene las unidades terminológicas que hemos considerado especialmente relevantes y novedosas en este contexto

No obstante, antes de abordar los temas previstos, hemos considerado pertinente introducir brevemente algunas propuestas y decisiones relacionadas con la metodología empleada para plasmar el conocimiento que deseamos transferir a nuestros lectores. Esta concisa explicación pretende ser un método de transferencia de conocimiento que sirva de ejemplo, y su aplicación en el desarrollo de este artículo se traduce en un conjunto de muestras de cómo se puede representar el conocimiento para su mejor gestión.

3. Acerca del método de representación y transferencia

La transferencia del saber se complica, especialmente, si ese saber es difícil de anclar a un método científico empírico. Eso hace que el nivel de abstracción sea mayor y, por tanto, que la comprensión pueda ser a veces ardua. Por ello, hemos querido documentar el presente artículo no únicamente mediante el relato verbal o exposición (lenguaje natural plagado de términos), sino mediante mapas mentales que sinteticen la matriz conceptual que subyace al texto.

Los mapas mentales son diagramas de nodos conceptuales relacionados entre sí que sirven para representar conocimiento. Mediante estos instrumentos, se establecen relaciones entre el nuevo conocimiento transferido y el conocimiento del que dispone la persona que los interpreta.

Éste es, pues, un potente instrumento de representación lingüística sistemática y visual de conocimiento. (En el apartado Formas de representación del conocimiento se explica con detalles qué son este tipo de representaciones.)

Así mismo, se trata de un método gráfico que fomenta y aviva las posibilidades del procesamiento de los conocimientos explícitos e implícitos que se desarrollan en el encéfalo, como la activación y organización de la memoria , la capacidad del aprendizaje y el desarrollo semántico del lenguaje (Buzan, 1996).

4. De la información al conocimiento

Desde la aplicación sistemática de la tecnología para procesar información , una de las definiciones más extendidas de información es la aportada por Shannon y Weaver (1963), padres de la teoría de la información que más peso ha tenido en los últimos años. Para éstos, el concepto información es un producto vinculado a la cantidad de datos de un mensaje y, por tanto, tiene un enfoque estadístico. La información es, además, un proceso secuencial identificable con un paradigma lineal subyacente. El contenido de la información, el mensaje codificado, tiene, pues, un emisor y un receptor, se transmite a través de un canal y está incluido en un contexto.

Figura 1: Modelo de Shannon y Weaver para la comunicación de información

El esquema anterior representa un modelo de comunicación de información entendida como producto de generación y transmisión lineal de datos ya codificados o representados de forma simbólica utilizando, sobre todo, el lenguaje.

El conocimiento es todo aquello susceptible de saberse o creerse acerca de un mundo real o ficticio. Desde el punto de vista neurocientífico , para que haya conocimiento, basta con que se activen las neuronas y desarrollen las relaciones sinápticas que generan a su vez posibles relaciones semánticas. Esta actividad no es lineal, porque pueden establecerse muchas relaciones al mismo tiempo en diferentes zonas del encéfalo que pueden variar en función del contexto y la percepción individual y social del agente (Kandel, 1997:345-349). Todo este complejo procesamiento de asociación y conexión de tipo físico es conocido como conocimiento humano o también bioconocimiento para diferenciarlo del conocimiento del que puede procesarse mediante artefactos. El bioconocimiento es, pues, un producto dinámico de un proceso neuronal no lineal con muchas variables que dificultan su gestión.

Desde el punto de vista de la gestión empresarial del conocimiento (gestión organizativa), que entiende el conocimiento como parte integrante de un proceso, este término se define como la suma de lo que es conocido, un cuerpo de verdades, principios e información, que, en el contexto de los negocios, guía las operaciones (Bassie, 1997). Esta definición de conocimiento como guía de las tareas relacionadas - entre otras cosas, con la gestión de la información - que deben ejecutarse en el marco de una entidad, refleja también la particularidad de tener como objetivo influir en los procesos del agente y tiene, por tanto, un sentido dinámico.

La vaga línea que separa información de conocimiento depende, pues, de diferentes variables, difícilmente tangibles, ya que no es factible dar una respuesta definitiva a preguntas como las siguientes: qué influjo debe existir en el receptor de la información, qué predominio y caudal de información relevante para el receptor es concluyente para su progreso cognitivo y qué aplicaciones prácticas obtiene el receptor de la información recibida en forma de mensaje. La respuesta a estos interrogantes depende no sólo de la percepción de la información que tenga cada agente o receptor, sino del momento en que ese agente la interprete, si es que lo hace. Para Davenport y Prusak (1999), que no llegan a hablar de conocimiento, consideran que es el receptor - y no el emisor- quien decide si el mensaje que ha recibido es realmente información. Un informe lleno de tablas con símbolos donde no exista una leyenda puede ser considerado información que representa conocimiento por quien lo escribe, pero, a su vez, puede ser juzgado como ruido por el receptor, porque no es capaz de interpretar lo que recibe.

En el ámbito de la semántica léxica y computacional , Díez (1999, 3-1) hace la distinción entre conocimiento y razonamiento :

"Además, tenemos que distinguir también entre conocimiento y razonamiento, ya que el primero está ligado a los sistemas de representación y almacenamiento de la información y el segundo a la recuperación, conexión e inferencias y cálculos hechos con esa información (motores de inferencia), creando información nueva. A priori, cualquier sistema de representación del conocimiento ha de servir para realizar tareas de razonamiento."

La distinción de Díez es aplicable a los entornos de la ingeniería del conocimiento , en los que el conocimiento se concibe entonces como la información preparada para que los motores de inferencia puedan "razonar" y, por lo tanto, el resultado sería un razonamiento.

Nosotros seguiremos llamando conocimiento también al razonamiento en el contexto de una aplicación o un sistema, puesto que, concretamente en el proceso del acceso a la información, ésta se convierte en conocimiento si el acto comunicativo a través de una interfaz es satisfactorio para el usuario o receptor, responsable de la primera parte de la emisión del mensaje, en forma de entrada de datos al sistema de acceso a la información y, por último, responsable también de la satisfacción obtenida, con independencia del proceso inferencial que haya realizado el sistema. El sistema de información interactúa como receptor y emisor con el humano ofreciéndole una respuesta al humano (emisor y receptor) que siempre está supeditada al mensaje introducido, sin tener en cuenta el contexto.

Concluyendo, datos , información y conocimiento , y su diferenciación son, para nuestros fines, elementos inseparables e integrantes de un proceso que influye en el procesamiento cognitivo humano: el de la gestión de conocimiento. Esta idea la asumimos de Cornella (2000:7), quien la sintetiza y resume de la siguiente forma.

"la metabolización de la información, su conversión en estructuras mentales, generalmente permanentes, lleva a la creación de conocimiento en nuestras mentes. Así si un determinado contexto nos lleva a interpretar los datos de una determinada manera, en ese acto hemos creado información. La combinación de esa información con otras informaciones no puede llevar a crear un modelo de interpretación (reflexión y análisis), nos permite llegar a conclusiones (síntesis), hace que nos surjan ideas nuevas (abstracción), de manera que puede decirse que hay un antes y un después de nuestro estado mental."

4.1. Tipos de conocimiento

A pesar de las variables definitorias que explican qué es el conocimiento, en este apartado nos proponemos diseñar un esquema de su tipología siguiendo criterios que atañen a su contenido y a su transferencia.

En lo que respecta al contenido semántico que puede englobar el saber, se pueden tipificar cinco tipos de conocimiento (Kirakowski, 1988, 2-1).

Conocimiento de procedimientos

También se conoce como conocimiento procedural , y se refiere a cómo se hacen las cosas. Este tipo de conocimiento es un paradigma para representar el conocimiento para su aplicación en entornos de inteligencia artificial.
Conocimiento de objetos y hechos

También se conoce como conocimiento declarativo , y se refiere al conocimiento sensorial. Éste es esencial tanto para interpretar el mundo externo como para ubicar su propio yo en un contexto. Este tipo de conocimiento es un paradigma para representar el conocimiento para su aplicación en entornos de inteligencia artificial.
Conocimiento de consecuencias

También se conoce como conocimiento de razonamiento , y se refiere al que se infiere a partir del conocimiento de procedimientos y del conocimiento de objetos y de hechos. Asimismo este tipo de conocimiento sienta las bases para generar razonamiento basado en casos y para facilitar el aprendizaje en conocimiento procedural y declarativo. Este tipo de conocimiento es un paradigma para representar el conocimiento para su aplicación en entornos de inteligencia artificial.
Conocimiento de definiciones

Es el conocimiento articulado, elaborado, asentado, sintetizado y formulado derivado del conocimiento de procedimientos, de hechos y de consecuencias. Este tipo de conocimiento tiene fundamentos epistemológicos y se representa de forma textual mediante la descripción de sus características y la estructuración de las relaciones que existen entre los conceptos (estructuras conceptuales) que subyacen al texto de la definición. Este conocimiento se utiliza como recurso lingüístico lexicográfico para adquirir conocimiento de forma automatizada, extrayéndolo de las estructuras conceptuales. Así mismo, este conocimiento contribuye al modelado del conocimiento dando pautas para la organización de la macroestructura y de la microestructura del conocimiento de un dominio.
Metaconocimiento

Es el conocimiento acerca del conocimiento que tiene como objetivo automatizar la gestión del conocimiento, es decir, guiar la planificación y la aplicación del conocimiento en el entorno de un sistema. Este tipo de conocimiento, por tanto, incluye información acerca del conocimiento de definiciones, de procedimientos, de objetos y de hechos que posee un sistema. Este término determina la existencia de un nivel de conocimiento abstracto que identifica los fundamentos implícitos y explícitos del conocimiento en un sistema. Este tipo de conocimiento es una metodología y técnica utilizada en ingeniería lingüística para desarrollar sistemas basados en conocimiento (ingeniería del conocimiento).

Figura 2: Tipos de conocimiento en cuanto al contenido

En este mapa, se ha tipificado el conocimiento en los cinco grupos que acabamos de describir. Sin embargo, es frecuente encontrar diferentes tipos de conocimiento combinados.

Si clasificamos el conocimiento en cuanto a su transferencia , cabría agruparlo en dos categorías, a saber:

Conocimiento tácito es el saber que tienen un individuo u entidad compuesta de individuos. Este conocimiento responde a preguntas sobre cómo se hacen las cosas: cómo se resuelven problemas, cuándo resolverlos y de dónde se obtienen los recursos para poder solventarlos. Está orientado a la experiencia y tiene un motor consciente y otro inconsciente : por eso, es difícil hacerlo explícito en su totalidad. Este saber engloba todas las habilidades que tienen las personas y se transfiere de manera informal.

Según Reber (1995:15), el término conocimiento tácito aparece por primera vez en dos obras de Polanyi (1958/1974). Sin embargo, el concepto implícito en el término de proceso intelectual (cognitivo) y emocional (de conducta) con dos niveles de percepción , el consciente y el inconsciente , es una idea formulada por Lashley (1956, 1-18).

Figura 3: Dificultad de transferencia de los niveles de conocimiento

El conocimiento explícito, también llamado conocimiento convencional , es aquel que ya está representado o documentado y se utiliza como medio para transmitir los procedimientos que se han que seguir para resolver de forma óptima cualquier trabajo, problema o proceso, en general. Por tanto, este conocimiento está orientado conscientemente a la resolución de problemas y se haya siempre representado, lo que supone poder acceder a él conscientemente. Todo el conocimiento representado es conocimiento explícito y se genera a partir de conocimiento tácito o de conocimiento previo explícito. Esta representación del conocimiento es la interfaz entre el cerebro y el mundo exterior.

El conocimiento representado se convierte en producto tangible , con respecto al conocimiento que se crea, se infiere, se interpreta, se deduce, se desprende, se dilucida, y que engloba el conocimiento tácito. Más adelante explicaremos de qué formas y mediante qué recursos se puede representar el conocimiento.

El conocimiento que no es representado y, por tanto, no es explícito es un proceso difícil de medir debido a su intangibilidad. La representación del saber puede someterse a un modelado relativo, es decir, se puede partir de términos, estructuras conceptuales comunes o procedimientos que ayuden a codificar el conocimiento para desarrollar y gestionar de forma más eficiente el conocimiento individual y colectivo. Otro término que identifica el mismo concepto englobado en gestión de conocimiento explícito y es gestión de contenidos. Aquí utilizamos indistintamente ambos términos.

4.2. Tareas vinculadas a la gestión del conocimiento

Desde que la gestión del conocimiento se ha incorporado como asignatura en muchos estudios relacionados con la administración y dirección de empresas, el término ha logrado notables cuotas de popularidad, hasta el punto de que a menudo se llega a pensar que se trata de algo nuevo.

Sin embargo, si consideramos que la gestión del conocimiento es un concepto que engloba la generación , la representación , la adquisición -término también conocido como gestión del aprendizaje -, y la transferencia de saber , es obvio inferir que, de hecho, las tareas vinculadas a la gestión del conocimiento no son algo reciente.

En este sentido, las universidades y cualquier centro de formación son centros de gestión del conocimiento por tener como objetivo la generación y la transferencia del saber , en beneficio de la adquisición de ese mismo saber. Sin ir más lejos, los seminarios, cursos, conferencias son modelos de transferencia de conocimiento.

Así mismo, desde su origen, las bibliotecas están concebidas para almacenar y clasificar conocimiento explícito para facilitar su transferencia. Las bibliotecas y cualquier centro de documentación gestiona el conocimiento una vez que está representado, es decir, cuando ya se ha convertido en texto, imagen o sonido, o en alguna combinación de tales elementos.

Al elaborar la tipología de las clases de conocimiento según el criterio del contenido que representa, hemos asumido una clasificación de entidades no estancas que permiten su combinatoria. En cuanto a las tareas relacionadas con la gestión del conocimiento, se debe partir de lo mismo. Las siguientes categorías -generación, adquisición, representación y transferencia- que representamos en el siguiente mapa, tampoco son entidades invariables e inmóviles. Estas entidades representan actos relacionados con la gestión del conocimiento e interconectados entre sí, y dan cuenta de su propia naturaleza, proceso muy dinámico y complejo no lineal.

Figura 4: Tareas vinculadas al complejo proceso de la gestión del conocimiento

La adquisición de conocimiento es el acto en el que el agente incorpora nuevos procesos de decisión para resolver problemas o para optimizar procedimientos. La dificultad estriba en la obtención del conocimiento tácito de otros expertos. Mucho menos arduo resulta, sin embargo, adquirir conocimiento ya representado, es decir, explícito. La generación de conocimiento difiere poco de la adquisición de conocimiento, ya que cuando el agente adquiere saber, ese conocimiento tácito se genera en el cerebro. Ahora bien, si el agente convierte ese saber en conocimiento explícito, entonces el agente también se convierte en generador de conocimiento explícito. En el ámbito de la ingeniería del conocimiento la adquisición es la primera fase necesaria antes de diseñar una herramienta basada en conocimiento (sistema experto). En esta fase el gestor de la información o el ingeniero de conocimiento debe hacer una prospección de datos sobre los procesos de decisión usados por el experto humano y debe analizar los protocolos relacionados con los procesos que debe realizar el sistema de gestión para poder hacer una síntesis de los conocimientos relevantes para el sistema. En esta fase se identifica el proceso de estrategias naturales de decisión que posee el experto humano.
La representación de conocimiento es un proceso en el que interviene también el acto de la transferencia de ese mismo conocimiento para su posterior plasmación en algún lenguaje simbólico para representar, así, contenidos. Es un mecanismo para transformar el lenguaje tácito en lenguaje explícito. La representación del conocimiento, además de un proceso, es un producto dependiente del saber que identifica que sirve para la transferencia de conocimiento. Así mismo, este producto sirve de materia prima para la adquisición de conocimiento y también para la generación de nuevo conocimiento. Más adelante dedicamos parte de este trabajo a identificar las formas en las que se puede representar el conocimiento.
La transferencia de conocimiento es la parte del acto comunicativo en la que se establece una transmisión de contenidos, a través de algún canal auditivo o visual, a un agente receptor. Existe transferencia de contenidos, si existe una representación previa del conocimiento. En el ámbito de la ingeniería del conocimiento, las interfaces de los sistemas expertos sirven para transferir el conocimiento que se desea obtener del sistema.

5. Formas de representación del conocimiento: la fuerza del lenguaje

A través del arte, la ciencia y la tecnología se manifiesta y se representa el conocimiento. Estar dotados de esta capacidad cognitiva de crear, transferir y representar conocimiento es lo que nos hace diferentes con respecto a otros seres.

La ciencia utiliza, sobre todo, el lenguaje como mediador del conocimiento estructurándolo y representándolo, y la tecnología desarrolla artefactos que son productos derivados de conceptualizaciones cognitivo-lingüísticas. Los desarrollos tecnológicos son aparatos o máquinas resultantes de pensamientos organizados con un objetivo concreto. En este sentido, se podría decir, que, en parte, cualquier máquina es una aplicación de conocimiento especializado y, por tanto, una representación aplicada del conocimiento.

El arte es también otra de las manifestaciones para la representación de conocimiento. Sin embargo, la transferencia de sus contenidos es mucho más difícil de consensuar. La razón de esta dificultad estriba en el papel que desempeña la percepción, es decir, el conocimiento sensorial o emocional, con respecto al peso que adquiere el conocimiento cognitivo o intelectual. Esto supone que los mecanismos argumentativos para defender el significado que contiene la obra representada, de alguna manera, estén sesgados igualmente por la percepción del agente que interpreta la pieza representada.

La poesía, la pintura, la escultura y, en general, todas las modalidades que se engloban en el concepto de arte son representaciones de conocimiento que se alimentan, a su vez, del conocimiento generado en todas las disciplinas científicas y que se sirven también de los desarrollos tecnológicos.

El contenido producido y representado mediante el arte utilizando arte, ciencia y tecnología también es otra forma de representación del conocimiento. La materia prima utilizada para estos fines es muy diversa y no es patrimonio específico de un ámbito. Así, pueden encontrase recursos lingüísticos, visuales y auditivos en cualquier manifestación de arte, ciencia y tecnología.

Sin embargo, y, a pesar del afán interdisciplinar de este artículo, dejaremos a un lado las representaciones del conocimiento en el ámbito del arte y la tecnología, para concentrarnos en la representación del conocimiento científico.

Dentro de los recursos que se pueden utilizar para la representación de conocimiento, nos centraremos en destacar el papel del lenguaje por su relevancia particular. El lenguaje es básico en el desarrollo y transferencia de contenidos. Se ha demostrado que las tareas vinculadas a la gestión del conocimiento están íntimamente relacionadas con los procesos cognitivo-lingüísticos que tienen lugar en el cerebro, y se materializan en forma de conocimiento representado a través del lenguaje (Kandel, 1995, y Jorba y Sanmarti, 1996). El lenguaje es el reflejo del modelo de procesamiento del pensamiento humano. Y, visto desde esta perspectiva, el lenguaje empieza a entenderse y a explicarse más allá de las limitaciones impuestas por la lingüística tradicional, marcada por el entendimiento del lenguaje como fenómeno lineal.

El lenguaje es un fenómeno complejo y dinámico en el sentido de que está siempre en movimiento: por ser una herramienta universalmente utilizada que siempre está siendo actualizada por los agentes que intervienen e interactúan en el acto de la comunicación, y porque produce manifestaciones de formas espontáneas dependientes de las condiciones sicológicas, fisiológicas y sociales. Esta diversidad compleja siempre creciente debe buscar una coherencia dentro de la misma estructura del sistema y dentro de un entramado aparentemente caótico (Steels, 1996 y 2000). Esta concepción del lenguaje responde a un paradigma complejo como un mapa abierto, conectable, descentralizado y con múltiples jerarquías variables, reflejo de las estructuras y la organización del conocimiento humano (bioconocimiento). Se trata de un paradigma de conocimiento complejo alternativo al paradigma lineal de los modelos inductivos y deductivos (causa-efecto).

En el esquema que sigue mostramos las formas de representación del conocimiento atendiendo a la materia prima utilizada para esa representación (recursos lingüísticos, imágenes y sonido) y las formas que ésta adopta.

Figura 5: Recursos y formas de representación del conocimiento

Por recursos lingüísticos, entendemos el lenguaje natural y los términos cuya naturaleza de representación también es lingüística. La relevancia de los términos en la representación de contenidos la analizamos más adelante. Estas son las formas en las que pueden aparecer estos recursos lingüísticos representando extractos de conocimiento:

La representación lingüística textual aglutina el lenguaje natura l y los términos , que conjuntamente dan forma a cualquier tipo de documento presentado en forma de relato verbal, como el artículo, la guía, el informe, el manual o la tesis, entre otros. Este tipo de representación la consideramos de carácter analítico o explicativo, frente a las representaciones estructurales, que son la síntesis de un análisis.
La representación lingüística sintética se abastece para la producción de sus contenidos, ante todo, de los términos estructurados para representar sistemas conceptuales (tesauros, ontologías, glosarios, etc). Así mismo, los términos pueden aparecer en diagramas y mapas, como único recurso lingüístico o en combinación con otros recursos de tipo visual o auditivo.
Los documentos estructurados en forma de relato verbal pueden abastecerse de lenguaje natural y términos para la representación de sus contenidos y pueden utilizar otros recursos, como representaciones estructurales, abastecidas de imágenes, símbolos o iconos.
Las representaciones multimedia son una combinación de materia prima y tipo de representación; en cuanto a la materia prima utilizada, pueden hacer uso de lenguaje natural, términos, imagen o sonido, y pueden aparecer en extractos de conocimiento de tipo analítico o de tipo sintético.

Lo que llamamos conocimiento son conceptualizaciones representadas que explican la naturaleza de nuestro mundo real y abstracto, pero el conocimiento en sí, no existe en la naturaleza (Galinsky, 2001). Se representa el contenido de nuestros razonamientos. Como ya hemos visto, la representación se hace a través de símbolos de tipo lingüístico , de tipo visual o de tipo auditivo. Los símbolos son transportadores de conocimiento que pueden apelar a cualquiera de nuestros sentidos para hacernos llegar el contenido semántico y el sentido perceptivo que encierran.

El lenguaje natural , la palabra y el texto, son la forma más potente de representación del conocimiento y, por tanto, de gestionar la información (Codina, 2001:201); es más, la generación, representación y transferencia del conocimiento a través del lenguaje es uno de los factores determinantes para la supervivencia de nuestra especie sobre otros homínidos (Junyent, 2003:40-41).

Los términos son unidades de naturaleza lingüística que representan conocimiento de un determinado dominio y son consensualizaciones para denominar conceptos a fin de poderlos transmitir. Ya hemos aludido a la trascendencia del lenguaje como fenómeno determinante para el desarrollo de conocimiento. Si, además, esto lo unimos a la funcionalidad de los términos, que acabamos de explicar, podemos afirmar que no existe conocimiento sin terminología.

Los términos son parte fundamental de la estructura textual que representa el conocimiento y se presentan tanto en la microestructura como en la macroestructura de cualquier representación lingüística de contenidos.

Por microestructura, entendemos el conjunto de unidades que:

componen la matriz cognitiva (sistema conceptual) sobre la que se construye un texto (documento);
sirven de elementos identificadores, o descriptores para identificar el contenido de un documento;
materializan las presentaciones estructurales (gráficos, esquemas, mapas mentales, tesauros, ontologías...) de conocimiento;
integran los nodos, vértices de los diferentes esquemas de representación del conocimiento (mapas conceptuales, marcos, redes semánticas...) utilizados en el ámbito de la inteligencia artificial;

Y por macroestructura, entendemos:

los productos textuales finales: el texto adaptado a diferentes tipos de documentos: material didáctico, tesis, informes de proyecto, informes anuales, guía, manual, etc.;
los sistemas de representación estructural para gestionar los productos textuales finales y para gestionar el conocimiento de una disciplina.

6. Disciplinas vinculadas a la representación lingüística del conocimiento

En el apartado anterior hemos visto que los términos desempeñan un papel preferente en la representación del conocimiento. Si consideramos cuál es su naturaleza (lingüística), lo que representan (conocimiento) y su función (comunicar y transferir conocimiento), no es difícil deducir qué disciplinas troncales intervienen en su estudio.

En el siguiente esquema hemos representado de qué disciplinas se obtienen los fundamentos en los que se apoyan toda la investigación y el método relacionados con la representación lingüística del conocimiento (lingüística , ciencias del conocimiento, y ciencias de la información y la comunicación). Así mismo, en el esquema, apuntamos qué disciplinas interdisciplinares se han derivado de las fundamentales y dan respuestas a las incógnitas relacionadas con la representación de contenidos, en cuanto unidades que representan tanto la microestructura como la macroestructura que subyacen a cualquier representación lingüística de conocimiento.

Figura 6: Fundamentos disciplinares de la representación lingüística del conocimiento

La terminología es una ciencia interdisciplinar que se nutre de un conjunto específico de conocimientos conceptualizado en otras disciplinas (lingüística , ciencia del conocimiento y ciencias de la información y la comunicación). Así mismo, es una ciencia transdisciplinar porque los productos terminológicos son las piezas de representación lingüística en las que debe apoyarse cualquier campo de conocimiento científico para poder adquirir, generar y transferir el conocimiento específico de cualquier dominio (Cabré 1998a:70). Eso quiere decir que en el campo del derecho, de la medicina, o de la física, por ejemplo, la disciplina de la terminología desempeña un papel fundamental como proveedora de términos transportadores de conocimiento que median en la comunicación, como identificadora de reglas subyacentes en la generación y relación de los términos, y como método y habilidad de trabajo.

La práctica terminológica y su aplicación para conceptuar los avances científicos y técnicos data de hace tres siglos (Cabré, 1993:21). Sin embargo, no será hasta 1931 cuando se publique el primer trabajo de sistematización metodológica para el desarrollo de técnicas terminologías y terminográficas, a cargo de Wüster. En su obra póstuma, Einführung in die allgemeine Terminologielehre und terminologische Lexikographie (Eugen Wüster , 1979/ 1998), este ingeniero austriaco desarrolla planteamientos teóricos (Teoría General de la Terminología) que han servido de base para fundamentar la terminología moderna, de la que ya se han derivado nuevas concepciones (Cabré, 1999:122-124).

La organización del conocimiento es una disciplina de formación reciente que estudia las leyes, los principios y los procedimientos para estructurar el conocimiento especializado e identificar y establecer la arquitectura en la que se sustenta el conocimiento de cualquier dominio.

Mucho antes de que la organización del conocimiento alcance el estado de disciplina, es tratada por Aristóteles en su empeño por fragmentar el mundo para entenderlo y, así, poder clasificarlo. Desde entonces, esta actividad ha sufrido cambios espectaculares. De concepciones puramente metafísicas y especulativas, desarrolladas en el terreno de la filosofía, la epistemología y la ontología, se ha pasado a concepciones físicas y informático-pragmáticas, desarrolladas desde diversas ramas (biblioteconomía, documentación, epistemología, informática , inteligencia artificial , semiótica , terminología , etc.), desplegadas a partir de las ciencias fundamentales: lingüística, ciencias del conocimiento y ciencias de la información y la comunicación.

Los inicios de esta disciplina como tal coinciden con los avances de la documentación y la biblioteconomía. La publicación en Viena del tratado sobre documentación Handbuch der Klassifikation (1947) del austriaco Paul Otlet da pautas para generar instrumentos fundamentales para la gestión de conocimiento científico, basando toda su estrategia en la organización (clasificación) de los contenedores (documentos) donde se guarda el conocimiento representado, es decir, la información. Los trabajos del alemán Wilhelm Ostwald , premio Nobel de química en 1906, son también transcendentales en el desarrollo de la disciplina de la organización del conocimiento. Ostwald plantea por primera vez soluciones para la organización del trabajo intelectual (el trabajo intelectual es conceptualmente igual a lo que denominados conocimiento científico). Con su propuesta de que el conocimiento debe organizarse de forma fragmentada, estandarizada, normalizada e internacionalizada, Ostwald se convierte en el precursor de la web semántica (Ostwald, 1912).

Este campo de estudio es de naturaleza interdisciplinar y se nutre de los aportes recibidos de la lingüística , las ciencias del conocimiento y las ciencias de la información y la comunicación. El objeto de esta disciplina es, por una parte, la organización del conocimiento explícito (conocimiento representado), es decir, socializado o registrado a fin de optimizar la circulación del conocimiento en la sociedad y, por otra, el desarrollo de metodologías que sustenten paradigmas de conocimiento válidos, escalables y ampliables. También se considera una disciplina científica, esto es, sujeta al método científico, de carácter aplicado (García Marco, 1998)

En el siguiente mapa, representamos el despliegue de disciplinas que, desde las ciencias fundamentales, pueden vincularse al ámbito de la representación del conocimiento, desde la perspectiva de su microestructura (terminología) y de su macroestructura (representación del conocimiento).

Figura 7: Interdisciplinariedad de la representación lingüística del conocimiento

La esfera que representa las disciplinas de la terminología y la organización del conocimiento tiene flechas en su interior en varias direcciones. Con ellas, queremos representar que estas materias están vinculadas a todas las disciplinas derivadas de las ciencias troncales resaltadas en círculos mayores. El mapa quiere, ante todo, dar cuenta de la interdisciplinariedad y complejidad del ámbito en el que nos movemos.

Si partimos de nuestra propuesta (Cámara, 2000:20-49), derivada de una propuesta clasificatoria de García Gutiérrez (1984 y 2002), el mapa que apuntamos a continuación muestra las disciplinas de las que se parte para el estudio de la representación, organización y aplicación del conocimiento (lingüística documental y ciencias del conocimiento). Esta clasificación es una prueba más de las diferentes formas de ordenar el saber, y de disponer de etiquetas que representen nuestras categorías con fines específicos y especializados.

Figura 8: La lingüística documental y las ciencias del conocimiento en la representación, organización y aplicación del conocimiento

7. Relevancia de la representación del conocimiento en la ingeniería lingüística y del conocimiento

Desde que la sociedad de la información global y multilingüe -caracterizada por la omnipotente influencia de las tecnologías de la información y de la comunicación- ha expandido su influencia vertiginosamente, la gestión de los recursos lingüísticos se ha convertido en una necesidad ineludible para la mayoría de las entidades públicas y privadas.

La industria del conocimiento irrumpe con fuerza ofreciendo respuestas que acaben con la infotoxicación y que contribuyan a la creación de más conocimiento a partir de información codificada como simples datos. Esta industria, por su estrecha relación con la codificación del conocimiento como información textual, depende de métodos, herramientas y recursos lingüísticos que han venido desarrollando las industrias de la lengua.

Cada año se crean nuevas asociaciones, comunidades y grupos de interés que se involucran como usuarios o como desarrolladores en actividades relacionadas con la gestión de recursos lingüísticos. Para abastecer de materia prima al mercado son necesarios nuevos lenguajes relacionados con dominios de especial interés, relacionados también con los diferentes registros de la lengua, con una dimensión diferente entre el lenguaje escrito y el oral (chat), y por último, relacionados con la tipología y estructuración textual. De esta materia prima lingüística se abastecen ámbitos tan diversos como el de la traducción e interpretación, el reconocimiento de voz, la recuperación de información en entornos abiertos (Internet) y cerrados (Intranet), y la gestión del conocimiento. Todas estas aplicaciones a las que se dedica la ingeniería lingüística están relacionadas con la gestión de la información y del conocimiento. Son aplicaciones que precisan trabajar con el conocimiento representado en forma de productos terminográficos , sistemas conceptuales y otros recursos lingüísticos , así como métodos , herramientas y experiencia acumulada en este sector de la industria de la lengua.

Desde el punto de vista cognitivo, los sistemas desarrollados en el ámbito de la ingeniería lingüística están estrechamente vinculados a la ingeniería del conocimiento, porque sus planteamientos se basan en estructuras lingüísticas que conforman sistemas conceptuales variables que ofrecen respuestas probables. Esta visión cognitiva se está aplicando en muchos de los retos asociados al procesamiento del lenguaje natural. En este sentido, los nuevos sistemas de traducción automatizada, por ejemplo, se basan en corpus textuales paralelos (memorias de traducción) que se indizan utilizando bases de conocimiento que ayudan a estructurar y desambiguar los posibles resultados que ofrece la máquina (Hutchins y Somers, 1995:417-422). Es un planteamiento diferente con respecto a las primeras épocas de la ingeniería lingüística. La primera época parecía ser meramente estadística hasta que se introdujeron estrategias basadas en conocimiento lingüístico de tipo morfológico y después sintáctico. El renacimiento de la relevancia de la semántica en los desarrollos de la ingeniería lingüística es el resultado de los avances aportados por la ciencia del conocimiento. Esta evolución de planteamientos corresponde a un cambio de paradigma del conocimiento, de uno lineal a otro complejo. Los sistemas de recuperación de información también han sufrido una transformación cuya evolución también ha repercutido en su denominación: sistemas de recuperación de conocimiento , sistemas de gestión de conocimiento. De Mey ha tipificado cuatro etapas en el desarrollo del tratamiento de la información que coindican las que determinan la evolución de la ingeniería lingüística (De Mey, 1980).

La ingeniería lingüística es una actividad eminentemente aplicada. Es el resultado de representar en forma de artefactos y lenguajes artificiales las deducciones que se obtienen del área de trabajo de la lingüística textual, de la lingüística computacional, de la informática, de la terminología y de la organización del conocimiento.

Las áreas de la ingeniería lingüística vinculadas al diseño y desarrollo de sistemas basados en conocimiento son:

Adquisición de conocimiento (knowledge acquisition)

-Identificación de unidades o grupos de conocimiento

-Extracción de datos que representan unidades o grupos de conocimiento

Modelado de conocimiento (knowledge modelling)

-Desarrollo de metadatos interpretables e intercambiables de forma digital

-Arquitectura del conocimiento (metodología para la macroestructura)

-Macroestructura: Estructura para la clasificación, indización y recuperación del conocimiento (sistemas conceptuales)

Representación de conocimiento (knowledge representation)

-Creación de términos

-Recopilación de unidades o grupos de conocimiento

-Identificación de las relaciones semánticas entre unidades o grupos de conocimiento

-Microestructura: estructuración de unidades o grupos de conocimiento

-Macroestructura: estructura para la clasificación, indización y recuperación del conocimiento (sistemas conceptuales)

Infraestructura para el desarrollo de ingeniería de conocimiento (knowledge engineering development infrastructure)

-Bases de conocimiento (knowledge base)

-Reglas de inferencia (inference rules)

-Recuperación de conocimiento (knowledge retrieval)

-Interacción y diseño de interfaces humano-máquina (human-computer interaction /human-computer interface design)

Todas estas áreas enumeradas de forma secuencial están relacionadas entre sí, como intentamos representar en el siguiente esquema:

Figura 9: Ramas de la ingeniería lingüística vinculadas al diseño y desarrollo de sistemas basados en conocimiento

La adquisición de conocimiento está relacionada con una actividad humana que corresponde a la prospección de información (conocimiento) que se obtiene de un experto. En el ámbito de la ingeniería lingüística, y más específicamente de la ingeniería de conocimiento, también se desarrollan herramientas para la extracción automatizada de datos que representan conocimiento, por ejemplo, de tipo léxico o terminológico. Esta extracción se puede realizar de forma manual, a partir de diccionarios electrónicos y de córpora textuales digitalizados (Moreno, 2000:2-3)

La construcción y el mantenimiento de conocimiento sobre un dominio mediante diccionarios (enciclopedias), ontologías, clasificaciones (epistemografías), están vinculados a la representación del conocimiento. Ésta puede beneficiarse de la adquisición del conocimiento, influye en el modelado del conocimiento y, por último, es una pieza insustituible para definir infraestructuras de desarrollo para la ingeniería de conocimiento.

De las tareas correspondientes a la representación del conocimiento, se deben desprender los parámetros (Cámara, 2000) vinculados a las propiedades:

que nos ofrecen las estructuras semánticas descritas en el sistema conceptual decidido en el modelado del conocimiento, y
pragmáticas generadas a partir del input de los usuarios, ya sea de forma directa, ya mediante una interfaz de consulta y alimentación.

De estas propiedades se pueden derivar reglas para el desarrollo del motor de inferencia y de control, dos de los módulos que integran un sistema de gestión basado en conocimiento, como veremos más adelante. La forma que tengamos de presentar el conocimiento, es decir, de publicarlo, dependerá de los criterios adoptados para la representación de la microestructura y de la macroestructura. Por tanto, la publicación del conocimiento está vinculado a su representación y modelado.

La importancia de la representación del conocimiento en redes multiasociativas basadas en probabilidades marca una etapa cognitiva que también repercute en la ingeniería lingüística. Se trata de que los sistemas simulen la forma de procesar la información en el cerebro, lo que supone representar previamente esa forma de clasificar y estructurar el cerebro para alimentar el sistema con información que pueda generar instrumentos de gestión de conocimiento.

Para ello, la estructuración del conocimiento representado que conforma la llamada base de conocimiento de cualquier sistema experto es esencial. Eso quiere decir que cualquier proyecto de inteligencia artificial que utilice el conocimiento como clave de la resolución automatizada de problemas cognitivos deberá confeccionar en primera instancia un proyecto de representación de conocimiento de un ámbito concreto de especialidad para poder generar una buena base de conocimiento de donde se pueda inferir y transferir nuevo conocimiento.

Cualquier sistema cuyo objeto sea gestionar conocimiento tiene que contar con una base de conocimiento, que es un módulo que contiene la memoria estructurada de un determinado dominio experto y, por tanto, uno de los dispositivos esenciales de cualquier sistema basado en conocimiento (SBC).

Base de conocimiento experto
La base de conocimiento experto, como se puede ver en la ilustración que sigue, es el módulo de mayor capacidad de memoria , pues es ahí donde se almacenan las estructuras lingüísticas con sus relaciones semánticas. Estas estructuras conceptuales son la representación del conocimiento experto mediante términos , y deben servir para la resolución de problemas específicos. Del conocimiento morfológico y semántico aportado por las relaciones semánticas, se obtienen algunas reglas predictivas que anticipan las consultas de los usuarios y proponen soluciones basadas en ecuaciones de probabilidad. Estas reglas son dependientes del dominio experto y de la información almacenada sobre ese dominio, aunque algunas puedan considerarse reglas genéricas, aplicables, por tanto, a cualquier dominio.

Los otros dispositivos genéricos de cualquier SBC son los siguientes:

Motor de inferencia y de búsqueda

El motor o máquina de inferencia activa el proceso que hace a la máquina razonar a partir de los datos. Las relaciones conceptuales representadas en la base de conocimiento se utilizan como motor inferencial. Este proceso se realiza mediante reglas de control y razonamiento que activan la propiedades de la base de conocimiento. El motor de inferencia cuenta también con una memoria de trabajo donde se almacenan los datos de entrada y las conclusiones intermedias que se van generando durante el proceso de razonamiento.
Interfaces de usuario (interfaces humano-máquina)

Las interfaces son el puente que permiten la comunicación entre el humano y la máquina. Ofrecen al usuario una posibilidad de entrada y de salida del sistema. En la interfaz de consulta , el usuario debe introducir las unidades de conocimiento a las que desee relacionar su consulta. Como resultado de hacer interactuar las reglas del motor de inferencia con un término de la estructura de la base de conocimiento, el sistema debe proporcionar opciones de consulta. Y estas opciones dependerán siempre del material almacenado en la base de conocimiento experto, y no de las reglas del motor de inferencia.

Figura 10: Arquitectura de un sistema basado en conocimiento (SBC)

Los sistemas basados en conocimiento se apartan de otros modelos tradicionales por separar el conocimiento según el modo en que se usa ese conocimiento. De esta manera, la probabilidad de las respuestas satisfactorias obtenidas por el sistema aumenta, de tal modo que se reducen las respuestas deterministas que no se corresponden con el paradigma del conocimiento humano (paradigma de conocimiento complejo), ya explicado.

Los SBC son sistemas que resuelven problemas utilizando una representación simbólica del conocimiento humano mediante el lenguaje (Jackson, 1999). Separan el conocimiento especifico del problema (base de conocimiento representado de forma textual) de las bases de reglas para solucionarlo (máquina de inferencia). Mediante esta separación, consiguen un alto rendimiento en un dominio especifico haciendo uso de heurísticas y de inferencia simbólica (Morales y Sucar, 1999).

La diversidad y posibilidad combinatoria del conocimiento nos obliga a usar el conocimiento sobre campos altamente específicos. Así, los SBC usan el conocimiento sobre un campo específico para hallar la solución de un problema de ese campo. La solución encontrada debe estar vinculada a la que extrae una persona con conocimiento sobre el campo del problema, enfrentada a ese mismo problema.

Las ventajas de los SBC estriban en que amplían la difusión y conservación del conocimiento, pueden modificarse y, además, pueden resolver problemas disponiendo de información incompleta con ayuda del motor de inferencia.

Los inconvenientes a los que se enfrenta un SBC están vinculados a que las repuestas ofrecidas no indican siempre una solución de búsqueda deseada; más aún, el conocimiento que pueda tener el sistema se concentra en el dominio experto y ese conocimiento experto es difícil de extraer del humano experto para sistematizarlo.

El rendimiento de los sistemas basados en conocimiento experto depende de la cantidad y la calidad del conocimiento representado de un dominio especifico, es decir, de una base de conocimiento experto. Así, el papel de las técnicas de solución de problemas de forma algorítmica queda relegado a un segundo plano, y se hace imprescindible una buena planificación de base cognitiva para modelar y representar el conocimiento (Cámara, 2002:85-88).

8. A modo de conclusión

La relación entre la información y el conocimiento es muy estrecha por dos razones. Por una parte, el conocimiento es un producto generado a partir de la metabolización de la información y, por otra, la información es conocimiento explícito.

El conocimiento explícito es la forma más eficaz para la transferencia del conocimiento , porque ya está representado, a diferencia del conocimiento tácito, que no lo está. El conocimiento tácito es el saber que tiene un agente sobre un dominio concreto. Ese agente sabe qué decisiones tomar partiendo de su propia memoria, percepción y razonamiento (base de conocimiento humano). Este bioconocimiento es muy complejo de representar, ya que intervienen muchos factores difíciles de determinar. No obstante, reflexionar acerca del conocimiento que sí está representado es un paso para acercarnos a la microestructura y la macroestructura del bioconocimiento, cuyo funcionamiento se caracteriza por su complejidad. Los procesos relacionados con el funcionamiento del bioconocimiento son procesos cognitivos complejos de asociación múltiple. Así, la adquisición, la transferencia y la representación del conocimiento forman un ente indisociable de cuya sinergia se retroalimenta su funcionamiento.

Los recursos para representar el conocimiento pueden ser de tipo lingüístico, visual o auditivo. Uno de los recursos más poderosos para representar conocimiento es el lingüístico. No es el único, pero sí el más potente, y se utiliza también para codificar contenidos por medio de recursos visuales o auditivos. Su representación puede adoptar forma de relato verbal dando forma a cualquier tipo textual posible. Este tipo de representaciones textuales utilizan lenguaje natural y términos , mientras que las representaciones lingüísticas estructurales se forman mediante términos, y ofrecen información acerca de la microestructura y macroestructura que puede tener un domino específico.

La representación del conocimiento desempeña un papel especialmente relevante en las disciplinas de la terminología y de la organización del conocimiento. Éstas, a su vez, se nutren de múltiples disciplinas cuyo denominador común es su fundamento lingüístico , cognitivo y comunicativo. El resultado de la interdependencia de estas ciencias puede resolver incógnitas relacionadas con la representación del conocimiento mediante el lenguaje, a través del cual se representan formas y estructuras que responden a un paradigma de conocimiento complejo , cuya característica dominante es su dinamismo y su capacidad para representar constantemente nuevo conocimiento generando así nuevos recursos lingüísticos.

Los recursos lingüísticos de un determinado dominio que tienen como función la representación del conocimiento sirven para alimentar uno de los componentes imprescindibles de un sistema que gestione recursos lingüísticos de base cognitiva. Este componente se denomina base de conocimiento y en él se halla almacenado, siguiendo un modelado previo, el conocimiento representado de un dominio de especialidad.

Todas las aplicaciones de la ingeniería lingüística , es decir, todos los desarrollos de sistemas informáticos que puedan reconocer, comprender, interpretar y generar lenguaje humano en todas sus formas siguiendo un modelo cognitivo conforman un ámbito especifico de la ingeniería lingüística. Este subcampo se conoce bajo el nombre de ingeniería del conocimiento. El renacimiento de la relevancia semántica en los desarrollos de la ingeniería lingüística es el resultado de los avances aportados por la ciencia del conocimiento. Esta evolución de planteamientos corresponde a un cambio de paradigma de conocimiento, de uno lineal a otro complejo. La trascendencia de las representaciones lingüísticas del conocimiento es crucial para la ingeniería del conocimiento, ya que estos sistemas basan su funcionamiento en una base de conocimiento específico. Por eso, la eficacia de estas bases de conocimiento depende siempre de la calidad del contenido, la capacidad de acceso al conocimiento representado y la asociabildad de los elementos de la estructura que conforma la base de conocimiento en cuestión.

El aporte interdisciplinar que va desde planteamientos filosóficos a emulaciones de modelos mentales en lenguajes legibles por la máquina, pasando por todas las ciencias asociadas a la lingüística, a la ciencia del conocimiento y a las ciencias de la información y la comunicación, será esencial para modelar las estructuras y representar los contenidos de la base de conocimiento. Por ello, la representación de conocimiento tiene una aplicación imprescindible en la ingeniería de enfoque cognitivo. Un acercamiento interdisciplinar nos proporciona nuevas líneas de trabajo para despejar incógnitas, nos presenta nuevos retos y nos obliga a alcanzar un mayor consenso a la hora de representar el conocimiento para facilitar la transferencia de conocimiento entre profesionales de diferentes disciplinas. Un acercamiento interdisciplinar es un esfuerzo cuyo resultado siempre se traducirá en nuevos puntos de vista generando un movimiento informacional que acaba metabolizándose en conocimiento.

9. Bibliografía

Bassie L. (1997). "Harnessing the power of Intellectual Capital." IAC-ACC, 51: 12 [Disponible en http://www.montague.com/le/le/096.html ]

Buzan, T. (1996). El libro de los mapas mentales , Barcelona: Urano Cabré, T. (1993). La terminología: Teoría, metodología, aplicaciones. Barcelona: Antártida/Empúries.

Cabré, M. T. (1999). La terminología. Representación y comunicación. Una teoría de base comunicativa y otros artículos. Barcelona: IULATERM

Cabré, M. T., Domènech, M., et al. (2001). "Las características del conocimiento especializado y loa relación con el conocimiento general", en Cabré, T. (ed.) (2001), La terminología científico-técnica , Barcelona: IULATERM

Cámara, L. (2002). Herramientas para la gestión de conocimiento. Proyecto de investigación. [Disponible en la biblioteca del IULA/UPF]

Codina, L., Domènech, M., et al. (2001). "Sobre los elementos a considerar en la representación del conocimiento de cara a la recuperación de información (el punto de vista cognitivo)", en Cabré, T. (ed.) (2001), La terminología científico-técnica , Barcelona: IULATERM

Cornella, A. (2000). "La información no es necesariamente conocimiento", Infonomía.com: La empresa es información Davenport, T. H. y Prusak, L. (2000). Working Knowledge , Harvard Business School Press

De Mey, M. (1980). "The relevance of the cognitive paradigm for information science." Harbo, O.(ed.) Theory and Application of Information Research. London: Mansell,.48-61.

Díez Orzas, P. L. (1999). La relación de meronimia en los sustantivos del léxico español: contribución a la semántica computacional. Estudios de Lingüística Española, Volumen 2

Galinsky, C. (2001). Terminology and knowledge representation. Viena: Infoterm García Gutiérrez, A. (1984) . Lingüística documental. Barcelona: Mitre

García Gutiérrez, A. (2002). La memoria subrogada: mediación, cultura y conciencia en la red digital. Granada: Editorial de la Universidad de Granada

García Marco, F.J. (1998). "El concepto de información: una aproximación transdisciplinar" Revista general de Información y Documentación , Volumen 2

Hapke, T. (2003). "From the world brain to the first transatlantic information dialogue: activities in information and documentation in Germany in the first half of the 20th century." En Proceedings from Library and Information Congress: 69th IFLA General Conference and Council , Berlín

Hutchins, W. J. y Somers H. L. (1992). An Introduction to Machine Translation. New York: Academic Press. Versión en español (1995), Introducción a la traducción automática, Madrid: Visor

Jorba, J. y Sanmarti, N. (1996). Enseñar, aprender y evaluar: un proceso de regulación continua. Madrid: MEC Kandel, E.R; Schwartz, I.H. y Jessel, T.M. (1995). Essentials of Neural Science and Behavior , Nueva York: Appleton-Lange. Versión en español (1997) Neurociencia y Conducta , Madrid: Prentice Hall

Kirakowski, J. (1988). Human Computer Interaction: from Voltage to Knowledge, Cratwell-Bratt Brompley 1988 Lashley, K. (1956). "Cerebral Organization and Behavior." En Solomon, H., (ed.) (1975), The Brain and Human Behavior , Baltimore, Williams & Wilkins.

Moreno, A.: (2000). Diseño e implementación de un lexicón computacional para lexicografía y traducción automática , Estudios de Lingüística Española. Volumen 9.

Ostwald, W. (1912). Das Gehirn der Welt , Munich: die Brücke Shannon C.E. y Weaver W. (1949). The mathematical theory of communication. IIlinois: Illinois University Press

Steels, L. (1996). "Synthesising the origins of language and meaning using co-evolution, self-organisation and level formation.", en Hurford, J., C. Knight and M. Studdert-Kennedy (ed.) (1997 ) Evolution of Human Language. Edinburgh Univ. Press. Edinburgh

Steels, L. (2000). "The puzzle of language evolution" en Weber, G. (ed) Kognitionswissenschaft, vol. 8, Berlin: Springer-Verlag

Stone, M. (2003). "Knowledge Representation for Language Engineering", en Farghaly, A. (ed.) (2003) A Handbook for Language Engineers , Standford, CSLI Publications.

Tramullas, J. (1997). Introducción a la documática , Madrid: Kronos.

Wüster, E. (1979/ 1998). Introducción a la teoría general de la terminología y a la lexicografía terminológica. IULA-UPF. Barcelona.

10. Anexo: Glosario sobre representación lingüística del conocimiento e ingeniería de enfoque cognitivo

Este pequeño glosario es un extracto del sistema conceptual subyacente al artículo que hemos elaborado. Debe ser una herramienta más que ayude al lector a contextualizar el conocimiento que hemos pretendido transferir. Las definiciones de los términos o nodos conceptuales están sujetas a transformaciones, puesto que el tema que hemos abordado vive una importante evolución.

BASES DE CONOCIMIENTO (base de datos)

EN: KNOWLEDGE BASE

Colección de unidades de conocimiento expresadas mediante un lenguaje formal de representación de conocimiento. Son uno de los módulos que integran los sistemas de base cognitiva. Estos módulos tienen una gran capacidad de memoria y en ellos se almacena el conocimiento representado lingüísticamente sobre un dominio específico. Estos productos son el resultado de un análisis y una síntesis sobre un dominio de especialidad concreto y deben servir junto con los otros dispositivos que componen un sistema experto, a dar asistencia a nuestro procesamiento mental.

--> Representación del conocimiento,

--> Sistemas basados en conocimiento.

EPISTEMOLOGÍA

EN: EPISTEMOLOGY

Teoría y disciplina. Por una parte, es la teoría filosófica del conocimiento. Y por otra, la disciplina acerca de los métodos descriptivos del conocimiento. El producto epistemológico sintetizado sobre el dominio del conocimiento tras una prospección de datos, su análisis y su síntesis representada de forma textual es un lenguaje del dominio. Algunos autores llaman a este producto final epistemografía (García Gutiérrez, 2002), en el ámbito de la biblioteconomía y la documentación, es más común utilizar los términos lenguaje de indización o lenguaje documental. En el ámbito de la computación y de la inteligencia artificial se utiliza sistemáticamente ontología para identificar productos ontológicos y también de tipo epistemológico.

--> Lenguaje de indización

INGENIERÍA DEL CONOCIMIENTO

EN: KNOWLEDGE ENGINEERING

Ámbito de la inteligencia artificial que se concentra en desarrollar sistemas basados en representaciones de conocimiento experto. En este sentido todo el área de la ingeniería lingüística -traducción automatizada, recuperación de información, organización del conocimiento, lexicografía, etc- basado en conocimiento experto puede incluirse en este ámbito de la inteligencia artificial.

--> Sistema basados en conocimiento experto

--> Ingeniería lingüística

--> Inteligencia artificial

INGENIERÍA LINGÜÍSTICA

EN: LANGUAGE ENGINEERING

Aplicación de los conocimientos de la lingüística computacional al desarrollo de sistemas informáticos que puedan reconocer, comprender, interpretar y generar lenguaje humano en todas sus formas. Desde el punto de vista de la informática, también puede entenderse como rama de la inteligencia artificial que se concentra en desarrollar sistemas basados en representaciones de conocimiento experto aplicadas en el área de la traducción automatizada, recuperación de información, organización del conocimiento.

--> Ingeniería del conocimiento

--> Inteligencia artificial

INTELIGENCIA ARTIFICIAL

EN: ARTIFICIAL INTELLIGENCE

Disciplina considerada hasta hace muy poco tiempo una de las ramas de las ciencias de la información aplicada (informática), actualmente este campo de estudio se considera de naturaleza interdisciplinar que se nutre no sólo de las ciencias de la información y comunicación, sino que se aprovecha de las aportaciones de la lingüística y de las ciencias del conocimiento. El objetivo de esta disciplina es mayoritariamente aplicado ya que aspira a diseñar sistemas que emulen procesos humanos considerados de alto nivel como la comprensión del lenguaje, la adquisición de nuevo conocimiento, el la generación de razonamiento y la resolución de problemas de tipo intelectual, en general.

Existen diferentes paradigmas en esta disciplina dependiendo del planteamiento lógico (procesamiento simbólico, búsqueda heurística) o planteamiento cognitivo,: como los agentes inteligentes y los sistemas expertos basados en conocimiento de base cognitiva y estructural cuyo valor viene dado por la base de datos donde se guarda el conocimiento representado de forma estructurada. Todos los avances teóricos y aplicados vinculados a los sistemas expertos basados en conocimiento engloban una subdisciplina conocida como ingeniería del conocimiento

--> Ingeniería del conocimiento

-->Representación del conocimiento

LENGUAJE DE INDIZACIÓN

LENGUAJE DOCUMENTAL

EN: INDEX LANGUAGE

Conjunto de conceptos normalizado y consensuado de términos que representan el contenido de un documento, clasificándolos a fin de poder recuperarlos después. Estos lenguajes pueden ser meras listas de términos o sistemas conceptuales de diferente sofisticación, dependiendo en este último caso de la estructura de las relaciones que se establecen entre los términos.

-->Sistema conceptual

MAPA CONCEPTUAL

EN: CONCEPT MAP

Formalismo para la representación del conocimiento propuesto por John Sowa que usa una estructura compleja, similar a una red semántica, para representar información en aplicaciones de inteligencia artificial, concretamente en las aplicaciones basadas en conocimiento.

El modelo de mapa propuesto por Ausubel es un diagrama para explorar conocimiento y contextualizarlo, éste aglutina los conceptos y las proposiciones fundamentales en un lenguaje explícito, mostrando las relaciones de jerarquía, como las relaciones cruzadas entre grupos de conceptos y de proposiciones y tiene objetivos prioritariamente didácticos que se presenta como una ayuda para organizar el conjunto global de relaciones que se intenta comprender.

--> Mapa mental

--> Red semántica

--> Representación de conocimiento

MAPA MENTAL

EN: MIND MAP

Son mapas o gráficos de conceptos que indican las relaciones entre conceptos representados mediante imágenes o/y o entre las palabras que usamos para representar conceptos, es decir, términos. Estas matrices conceptuales son sintetizaciones del conocimiento que puede ser representado mediante una estructura de relato verbal. La diferencia entre los mapas y la estructura del texto estriba en el paradigma estructural de red asociativa y distribuida en el caso de los mapas y el paradigma lineal en el caso del relato verbal. En este sentido los mapas mentales se asemejan mucho más a cómo el cerebro procesa la información, la almacena pudiendo inferir pensamientos y consecuencias propios que son la base del conocimiento.

Por tanto, estas representaciones de conocimiento también son una metodología. Son un método de aprendizaje que contribuye a agilizar y asimilar la información escrita y por tanto, la adquisición del conocimiento. Es un método que sigue un paradigma de red asociativa y distribuida en contraste con paradigma lineal que rige el conocimiento representado en forma de relato verbal.

--> Mapa conceptual

--> Representación de conocimiento

MARCO

EN: FRAME

Formalismo utilizado en el ámbito de la inteligencia artificial para la representación del conocimiento que sirve para describir objetos y clases de objetos. Se trata de un esqueleto estructural en forma de tabla compuesto por un grupo de campos que aceptan etiquetas que marcan la categoría en función de sus características y restricciones dadas por reglas de lógica simbólica. El problema de este formalismo es la variabilidad de los ámbitos de conocimiento que representa. Es un problema filosófico de tipo epistemológico que data de antes de la revolución informática. Se debe construir un esqueleto apto para representar con él un mundo cambiante.

--> Inteligencia Artificial

MODELADO DEL CONOCIMIENTO

EN: KNOWLEDGE MODELING

Habilidad técnica vinculada a la representación del conocimiento y encuadrada en la disciplina de la inteligencia artificial. El modelado incluye la creación, traspaso, elaboración (representación del conocimiento) y utilización de contenido en entornos virtuales y tiene aplicaciones inmediatas en los sistemas expertos basados en conocimiento

--> Organización del conocimiento

--> Representación del conocimiento

ORGANIZACIÓN DEL CONOCIMIENTO

EN: KNOWLEDGE ORGANIZATION

Disciplina de formación reciente, que estudia las leyes, los principios y los procedimientos para estructurar el conocimiento especializado en cualquier disciplina. Esta campo de estudio es de naturaleza interdisciplinar nutrida por los aportes recibidos de la lingüística, las ciencias del conocimiento (terminología y epistemología) y las ciencias de la información y comunicación. El objeto de esta disciplina es el conocimiento explícito (conocimiento representado), es decir, socializado o registrado a fin de optimizar la circulación del conocimiento en la sociedad y es considerada una disciplina científica (esto es, sujeta al método científico) de carácter aplicado.

--> Representación de conocimiento

PARADIGMA LINEAL DE CONOCIMIENTO

PARADIGMA CARTESIANO

Teoría sobre la estructura del conocimiento identificada como una secuencia de causas y efectos, de conceptos generales y específicos, de estructuras arborescentes o jerárquicas. La transmisión del conocimiento es lineal, y se ordena secuencialmente de acuerdo a etapas, edades y escalas mentales que son también secuenciales. Este modelo engloba una visión cartesiana (lineal) donde la relación causa-efecto es el objetivo excluyendo al observador y los procesos adyacentes. Este paradigma define el conjunto total (el todo) a partir de las parte; es estructuralista y reduccionista y, como tal, busca los postulados y los componentes fundamentales de cada una de las partes; se empeña en encontrar la Verdad Absoluta y Final. Â«Pienso, luego existoÂ».

--> Paradigma complejo del conocimiento

PARADIGMA COMPLEJO DEL CONOCIMIENTO

PARADIGMA CUÁNTICO

Teoría sobre la estructura y organización del conocimiento identificada como un mapa abierto, conectable, descentralizado y con múltiples jerarquías variables. Se trata de un paradigma de conocimiento complejo alternativo al paradigma lineal de los modelos inductivos y deductivos (causa-efecto). Este modelo engloba la teoría formulada por de Deleuze y Guattari (1994: 13-25) quienes explican, a partir de un paradigma del rizoma, la complejidad de la estructura del conocimiento. Su teoría del rizoma se basa en principios de conexión y heterogeneidad. Se incluye al observador como parte y conciencia del proceso; es sistémico y define las partes en función de la dinámica de las interacciones del conjunto; toda estructura implica la existencia de un proceso subyacente; es epistemológico puesto que incluye y relaciona el proceso del conocimiento con la identidad y descripción del fenómeno: percibe la realidad como una red o entretejido de relaciones e interacciones intrínsecamente dinámicas y no jerarquizadas: no pretende encontrar la Verdad Absoluta, sino descripciones limitadas y aproximadas de la realidad, porque la realidad cambia constantemente. Es decir, que la realidad se crea en el proceso de conocerla. "Siento, luego soy"

La evolución del paradigma cartesiano al complejo se debe a cuatro acontecimientos trascendentales, que afecta al método, concepción, organización y desarrollo del conocimiento.

Max Planck (1858-1949) Premio Nobel de física en 1918	Descubrimientos que fundamentan la teoría cuántica.	Toda ley debe formularse, como ley estadística, como probabilidad, acabando con el determinismo.
Werner Heinsenberg (1901-1976) Premio Nobel de física en 1932	El principio de incertidumbre	El objeto de estudio ya se modifica por el mero hecho de la observación
Albert Einstein (1879-1955) Premio Nobel de física en 1921	Teoría de la relatividad	El tiempo y el espacio dejan de ser absolutos y la materia deja de ser eterna al transformarse en energía
Niels Bohr (1885-1962) Premio Nobel de física en 1922	El principio de complementariedad	Un modelo no puede representar adecuadamente la realidad por eso necesitamos otros modelos explicativos complementarios

Estos acontecimientos trascendentales para el mundo científico ha acabado con la concepción de una organización lineal del conocimiento y ha obligado a construir un nuevo paradigma de conocimiento que incide en otra forma de ver el mundo y de plantearse la ciencia. Este nuevo modelo debe ampliar nuestra visión y nuestra perspectiva de la ciencia.

Además del sinónimo de paradigma cuántico, existen una confluencia de varias denominaciones con una teoría del conocimiento alternativa a la lineal. En ese sentido estas son algunas de las denominaciones encontradas: Paradigma rizomático, Paradigma en red asociativa y distribuida

--> Paradigma lineal del conocimiento

RED SEMÁNTICA

EN: SEMANTIC NETWORK

Desde el punto de vista de la terminología, se trata de un desarrollo analítico, encabezada por el término que vincula y estructura las definiciones contextuales e implícitas de ese término. Cada red consiste en el despliegue de un conjunto de enunciados ordenados bajo diversos niveles de un nodo, el cual puede ser un término simple o complejo. Cada enunciado de la red contiene ese término. Las definiciones explícitas, si las hay, van al principio.

Desde el punto de vista de la inteligencia artificial, se trata de un esquema para representar conocimiento donde los objetos o los conceptos se almacenan como los nodos donde se ancla toda la estructura de un gráfico enlazándose entre sí mediante relaciones de conceptos formando los arcos. Así es una representación grafica del conocimiento en la que existe una jerarquía de Nodos.

--> Inteligencia artificial

--> Representación del conocimiento

--> Terminología

REPRESENTACIÓN DEL CONOCIMIENTO

EN: KNOWLEDGE REPRESENTATION

Resultado de la traducción de forma simbólica del conocimiento, siendo éste el resultado, por parte del humano, de la maduración semántica de la información y su experiencia.

Rama de la organización del conocimiento dedicada al análisis, modelización y síntesis de los procesos de simbolización conceptual del saber humano en el ámbito de cualquier disciplina. Las tareas más relevantes de esta rama son el análisis, la clasificación, la indización y el conjunto de aspectos informáticos y lingüísticos relacionados con la traducción simbólica del conocimiento.

Rama de la inteligencia artificial que describe una habilidad técnica concentrada en la especificación de la información acerca de dominios concretos para su aplicación en el entorno informático. Es un campo de estudio que aglutina resultados conceptuales, matemáticos y computacionales. De los primeros se derivan nuevas manifestaciones, enunciados y desarrollos acerca del mundo, los resultados matemáticos pueden dar pautas para generar reglas aplicables a los resultados conceptuales y por último, resultados computacionales que son el desarrollo tecnológico de los resultados conceptuales y matemáticos.

Es una técnica muy útil de organizar la información para facilitar su procesamiento. Los esquemas de representación más habituales son los de reglas de lógica simbólica, marcos (frames), redes semánticas y mapas conceptuales. La implementación de estos esquemas se denomina modelado del conocimiento.

--> Mapa conceptual

--> Marco

--> Modelado del conocimiento

--> Red semántica

SISTEMA BASADO EN CONOCIMIENTO

SISTEMA BASADO EN CONOCIMIENTO EXPERTO

SISTEMA EXPERTO

EN: KNOWLEDGE-BASED SYSTEMS (KBS)

EXPERT SYSTEM

Aplicaciones del dominio de la inteligencia artificial diseñados para emular la resolución de problemas tal y como lo hace un humano.

Este tipo de sistemas contienen una base de conocimiento que interactúa con un motor compuesto de reglas algorítmicas a fin de inferir nuevo conocimiento. El conocimiento utilizado en estos sistemas es de tipo especializado, o relativo a un dominio concreto.

--> Ingeniería del conocimiento

--> Inteligencia artificial

SISTEMA CONCEPTUAL

EN: STRUCTURED-CONCEPT SYSTEM (SCS)

Cualquier tipo de sistema que represente conceptos siguiendo unos criterios de relación entre las unidades que lo componen. El tesauro es un ejemplo de este tipo, porque relaciona las unidades conceptuales de tipo lingüístico (los términos) siguiendo reglas o criterios de relaciones semánticas como las de jerarquía, sinonímicas, asociativas, etc. Si los sistemas conceptuales además se aplican en la indización de documentos, entonces al sistema conceptual se le llama lenguaje de indización.

--> Lenguaje de indización

TERMINOLOGÍA

EN: TERMINOLOGY

Campo de investigación científica interdisciplinar que integra aportaciones de la teoría del conocimiento, relativas a los tipos de conceptualización de la realidad y a la relación de los conceptos entre sí, de la teoría de la comunicación, relacionadas con los tipos de situaciones que pueden producirse y de la teoría del lenguaje. Esta disciplina tiene como objeto de estudio las unidades de conocimiento especializado (UCE) representadas mediante el lenguaje y con una función comunicativa dentro del texto, es decir, estudia las unidades que representan el conocimiento. En tanto que disciplina materia aplicada, sirve a distintos colectivos profesionales (Traductores, intérpretes, documentalistas, arquitectos de la información, ingenieros de conocimiento, lingüistas,...) y a diversas finalidades, siempre conservando su doble función de base: la representación y la comunicación del conocimiento especializado. (Cabré, 2001:21)

--> Representación del conocimiento