CVC. Congreso de Sevilla. La lengua española y las nuevas tecnologías.

DICCIONARIOS ELECTRÓNICOS

	Sistema de diccionarios electrónicos del español Carlos Subirats Rüggeberg. Laboratorio de Lingüística Informática. Universidad Autónoma de Barcelona
	1. Las primeras investigaciones sistemáticas de la gramática en el léxico de las lenguas naturales (cf. Gross, 1975) han permitido determinar la complejidad de la distribución de las propiedades formales en el léxico. La investigación léxico-gramatical (ibid.) ha puesto de manifiesto que la complejidad de la distribución de las reglas gramaticales en el léxico de las lenguas naturales crece progresivamente, a medida que aumenta el número de elementos del léxico estudiados, sin que se haya observado ningún signo de convergencia entre ambos parámetros. En efecto, el estudio sistemático de la gramática en el léxico ha puesto de manifiesto que no existen dos elementos del léxico que tengan exactamente las mismas propiedades formales, con lo cual se ha demostrado la falta de base empírica de las gramáticas generativas (cf. Gross, 1975, 1979), las cuales tratan de determinar las reglas gramaticales al margen del estudio sistemático de su distribución en el léxico. De hecho, no solo no se puede separar el léxico del estudio de la gramática, sino que en el estado actual de nuestro conocimiento sobre las lenguas naturales, el estudio de las propiedades gramaticales consiste en su determinación en el léxico. Por lo tanto, el concepto de regla no puede tener un valor «explicativo» o «regularizador» en sí mismo, como en la gramática tradicional o en la generativa, sino que su función consiste en permitir la determinación de las propiedades formales de los elementos que constituyen el léxico de las lenguas naturales. En realidad, la disociación arbitraria entre el léxico y la gramática se ha podido mantener en la lingüística, en la medida en que no se ha verificado la complejidad de la distribución de las propiedades gramaticales en el léxico. La teoría léxico-gramatical propone el estudio de las lenguas naturales mediante la construcción de un léxico-gramática, integrado por un sistema modular de gramáticas y diccionarios electrónicos interrelacionados. Un sistema de diccionarios electrónicos está formado por: a) Diccionarios electrónicos, que están integrados por el léxico de formas de base de una lengua, con un código alfanumérico asociado, que especifica: i) sus propiedades morfológicas de flexión y/o su categoría gramatical; ii) la(s) tabla(s) del sistema de gramáticas electrónicas, en la que se determinan sus propiedades gramaticales. b) Programas, que generan automáticamente diccionarios electrónicos de formas flexivas, a partir de los diccionarios de formas de base. Un sistema de gramáticas electrónicas está constituido por tablas matrices binarias informatizadas, en las que las líneas corresponden a entradas del léxico y las columnas a propiedades gramaticales. En la intersección de las líneas, correspondientes a las entradas X, Y, Z, con las columnas, que corresponden a las propiedades formales P₁, P₂ ... P_n, aparece un signo «+», cuando una entrada posee una determinada propiedad, o un signo «—», cuando no posee dicha propiedad. La información gramatical de un sistema de gramáticas electrónicas se consulta automáticamente mediante programas. De acuerdo con la estructura modular que acabamos de describir, el léxico- gramática del español estará constituido por un Sistema de Diccionarios Electrónicos del Español (SDEE) y por un Sistema de Gramáticas Electrónicas del Español (SGEE). A su vez, el SDEE (Sistema de Diccionarios Electrónicos del Español) está integrado por un Diccionario Electrónico de Formas Simples del Español (DEFSE) y un Diccionario Electrónico de Formas Compuestas del Español (DEFCE). El léxico-gramática del español constituirá la primera representación sistemática formalizada de nuestro conocimiento lingüístico y permitirá llevar a cabo nuevas aplicaciones tecnológicas en el campo de la industrialización del español, como el análisis léxico automático (cf. Silberztein, 1989), el análisis sintáctico automático y la generación automática de textos².
	2.1. El DEFSE (Diccionario electrónico de formas simples del español) está integrado por un léxico español de 69 000 formas simples, es decir, cadenas de caracteres entre dos espacios en blanco consecutivos, que funcionan como una unidad independientemente de sus características morfológicas o de su estructura interna, como p. ej., sol, silla, niña, intransitividad o rompecabezas. A su vez, el DEFSE contiene componentes de palabras compuestas, que no pueden funcionar independientemente fuera de dichos compuestos, como p. ej., a troche y moche, que constituyen componentes del adverbio compuesto a troche y moche, y que no tienen un funcionamiento independiente fuera de dicho adverbio. Cada una de las entradas del DEFSE va acompañada de un código alfanumérico, que especifica sus propiedades morfológicas de flexión y/o su categoría gramatical (cf. fig. 1). La recopilación del léxico del DEFSE se ha hecho partiendo de los diccionarios tradicionales españoles se consulta humana. No obstante, los diccionarios tradicionales plantean problemas lingüísticos, que impiden su utilización como modelos exclusivos para la realización de un léxico electrónico. En primer lugar, hay un número importante de palabras del español, las cuales no figuran en los diccionarios tradicionales del español; así p. ej., palabras de uso común, como crispación, encomiable, exhaustividad, obsesivamente o ridiculización, por citar tan solo algunos ejemplos, no figuran ni en el diccionario de la Real Academia (1984) ni en el de Moliner (1983). En segundo lugar, los diccionarios tradicionales no tienen un criterio sistemático para la determinación de sus entradas; así p. ej., la Academia (1984) no trata los verbos establecerse (‘instalarse’) o sublevarse (‘levantarse’) como entradas independientes, sino como simples acepciones bajo las entradas de los verbos establecer (‘instituir’, ‘decretar’) y sublevar (‘indignar’). No obstante, establecer, establecerse, sublevar y sublevarse, constituyen cuatro verbos formal y semánticamente distintos y, desde una perspectiva formal, se deben considerar como cuatro entradas independientes. En tercer lugar, los diccionarios tradicionales no proporcionan información sistemática sobre las propiedades flexivas de sus entradas. En el caso de los diccionarios tradicionales, el lector humano puede suplir con su intuición lingüística aquellas informaciones que o bien no se especifican, o se especifican de forma ambigua. No obstante, un diccionario electrónico constituye una descripción sistemática del léxico de una lengua para usos informáticos y, por lo tanto, debe solucionar los problemas que plantean los diccionarios tradicionales: 1) En primer lugar, debe estar formado por una recopilación sistemática de todo el léxico general de la lengua española. 2) En segundo lugar, la determinación de las entradas se debe realizar utilizando de forma sistemática un criterio formal³. 3) En tercer lugar, la especificación de las propiedades morfológicas flexivas debe realizarse sistemáticamente para todo el léxico. 2.2. En un texto español cualquiera, no sólo aparecen palabras en sus formas de base, es decir, verbos en infinitivo, y nombres y adjetivos en masculino y/o singular, sino también en sus correspondientes formas flexivas. En consecuencia, un diccionario electrónico para usos informáticos debe incluir todas las formas posibles del léxico general del español, es decir, sus formas de base y sus correspondientes formas flexivas. Las formas flexivas de las entradas del DEFSE que tienen flexión morfológica se obtienen automáticamente, mediante un programa de generación de formas verbales y un programa de generación de formas nominales y adjetivas⁴ (cf. fig. 3). Los programas de generación de formas flexivas consultan los códigos alfanuméricos que acompañan a los verbos, los nombres y los adjetivos del DEFSE; dichos códigos remiten a los programas a una clase flexiva específica, dentro de los ficheros de clases flexivas (cf. fig. 3), los cuales contienen un análisis sistemático de la flexión verbal, nominal y adjetiva del español, tanto regular como irregular. A partir de la información que obtienen en los ficheros de clases morfológicas flexivas, los programas generan automáticamente todas las formas simples flexivas de la entrada correspondiente del DEFSE, especificando sus propiedades morfológicas de flexión; a su vez, los programas indican la forma de base, a la que está asociada cada una de las formas flexivas generadas (cf. fig. 2). En consecuencia, los programas de generación de formas simples flexivas crean automáticamente el Diccionario Electrónico de Formas Simples Flexivas del Español (DEFSFE) a partir del DEFSE; el DEFSFE contiene unas 600 000 formas, las cuales constituyen todas las formas posibles pertenecientes al léxico general de la lengua española.
	3. 1. El léxico del español no está constituido únicamente por palabras simples, es decir, por palabras que constituyen una unidad ortográfica y que funcionan como una unidad léxica, sino también por palabras compuestas, es decir, grupos de dos o más formas simples que funcionan como una unidad léxica y cuyas propiedades semánticas y sintácticas no se pueden deducir a partir de las propiedades de las formas simples que integran dicho compuesto. En el léxico del español, existen palabras compuestas pertenecientes a todas las clases de palabras, es decir, nombres compuestos, como p. ej. ingeniero técnico, ropa interior, centro de gravedad, madre de alquiler, nuevo rico o paquete bomba, adjetivos compuestos, como p. ej., bien educado, en funciones, de sangre azul, adverbios compuestos, como p. ej., al fin y al cabo, a sabiendas, de vez en cuando, en consecuencia o sin decir esta boca es mía, conjunciones compuestas, como p. ej., a medida que, a pesar de, con tal de o puesto que, y preposiciones e interjecciones compuestas, como p. ej., acerca de o en contra de, y qué demonios o cielo santo. En el marco del SDEE, las palabras compuestas⁵ se incluyen en el Diccionario Electrónico de Formas Compuestas del Español (DEFCE), el cual incluirá todas las palabras compuestas del léxico general de la lengua española. El DEFCE, cuya realización está en fase de desarrollo, está integrado actualmente por un léxico de unas 24 000 formas compuestas, con información categorial asociada a cada una de sus entradas y con información sobre las propiedades morfológicas de flexión asociada a las entradas nominales. 3.2. Los nombres compuestos, al igual que las palabras simples (cf. 2.2.), no aparecen en un texto únicamente en su forma de base, sino también en sus correspondientes formas flexivas. En consecuencia, un diccionario electrónico para usos informáticos no sólo debe incluir las formas de base de los nombres compuestos, sino también sus formas flexivas. La flexión de los nombres compuestos depende, en primer lugar, de las propiedades flexivas de las formas simples que lo integran, en segundo lugar, de su estructura tipológica y, en tercer lugar, de su género morfológico. Cada una de las entradas nominales del DEFCE va acompañada de una especificación sistemática de estas tres propiedades: 1) En primer lugar, se especifican las propiedades flexivas de las formas simples, que experimentan variaciones de forma en la flexión del compuesto, con el mismo código alfanumérico que llevan dichas formas simples en el DEFSFE (cf. figs. 4 y 5). 2) En segundo lugar, cada una de las entradas nominales del DEFCE lleva una especificación de su estructura tipológica, ya que dicha estructura determina cuál, o cuáles, serán las formas simples —que integran el compuesto— que experimentarán variaciones de forma en la flexión de género y/o número del compuesto; así p. ej., en la formación del plural del nombre compuesto bomba atómica, es decir, bombas atómicas, se flexionan las dos formas simples que integran dicho compuesto, es decir, el nombre y el adjetivo; por el contrario, en la flexión de género y número del compuesto maestro de escuela, es decir, maestra de escuela, maestros de escuela, maestras de escuela, el único elemento que experimenta variación de forma es el primer nombre, mientras que el segundo nombre permanece invariable. El hecho de que en la flexión de bomba atómica varíen las dos formas simples que integran dicho compuesto, mientras que en la flexión de maestro de escuela sólo varíe el primer elemento nominal, está ligado a su estructura tipológica. En efecto, en la flexión de los nombres compuestos, formados por un nombre y un adjetivo, es decir, NA, varía el elemento nominal y el elemento adjetivo, mientras que en la flexión de los compuestos formados por un nombre, la preposición de y un nombre, es decir, NDN, solo varía el primer elemento nominal. En consecuencia, en el DEFCE, se indica la estructura tipológica de los compuestos, ya que dicha estructura determina las formas simples, qué son susceptibles de presentar variaciones de forma en la flexión del compuesto. La clasificación⁶ tipológica flexiva de los nombres compuestos del DEFCE es ésta. 3) En tercer lugar, las entradas nominales del DEFCE llevan una especificación con respecto a sus propiedades morfológicas de género, ya que la especificación del género de un nombre compuesto no se puede deducir regularmente a partir del género de sus componentes. Así p. ej., un compuesto, como p. ej. piel roja (‘indio indígena de América del Norte’), no conserva el género femenino de su núcleo nominal piel, sino que tiene un género masculino y femenino. En el DUCE, piel lleva el código categorial y flexivo, correspondiente a los nombres femeninos, que forman su plural añadiendo -es, es decir, N23, y roja lleva el código de los adjetivos que tienen flexión de género con las terminaciones -o, -a, -os, -as, es decir, A47, con la especificación F (femenino), es decir A47F, ya que tanto en la forma de base piel roja, como en su única forma flexiva, pieles rojas, el adjetivo aparece exclusivamente en femenino. No obstante, como el género del compuesto piel roja no corresponde con el género de su núcleo nominal, es necesario especificar el género del compuesto con un código adicional, en este caso mf (masculino y femenino). Por lo tanto, en el marco de la morfología de los nombres compuestos, el código que acompaña a las formas simples que integran un compuesto sólo sirve para determinar las variaciones de forma de dichas formas simples; el género del nombre compuesto se especifica mediante un código adicional. Así, la entrada correspondiente a piel roja tiene la siguiente estructura en el DEFCE: piel (N23) / roja (A47F),.NA: mf Como podemos observar, los códigos alfanuméricos entre paréntesis de las entradas del DEFCE especifican las propiedades flexivas de las formas simples que integran el compuesto y el código que se encuentra después de los dos puntos «:», tras la especificación de la estructura tipológica, indica su género. Esta es la información que procesa el programa de generación de formas flexivas compuestas⁸ del español para calcular las formas flexivas que genera automáticamente. En efecto, al igual que el programa de generación de formas simples, el programa de generación de formas compuestas lee los códigos alfanuméricos, que especifican las propiedades flexivas de las formas simples que sufren variaciones de forma en la flexión del compuesto; para calcular las formas flexivas de las formas simples que integran el compuesto, el programa de generación de formas compuestas consulta el mismo fichero de clases flexivas de nombres y adjetivos que utiliza el programa de generación de formas simples (cf. fig. 3); una vez determinadas las posibles variaciones flexivas de las formas simples que integran el compuesto, el programa consulta el género del compuesto, con objeto de realizar el cálculo definitivo de las formas flexivas compuestas que va a generar. El programa de flexión de formas compuestas no consulta la clasificación tipológica para generar la forma flexiva, ya que cuando dicho programa procesa una entrada para generar sus correspondientes formas flexivas, la determinación de las formas simples que van a experimentar una flexión, ya se ha efectuado. Así p. ej., como podemos observar en la fig. 4, es tan solo el primer elemento nominal de los compuestos NDN, el que lleva una especificación de sus propiedades flexivas, mientras que en el caso de los compuestos NA de la fig. 5, son ambos elementos, es decir, el nombre y el adjetivo, los que poseen una especificación de sus propiedades flexivas. Ello se debe a que los códigos alfanuméricos que especifican las propiedades flexivas de las formas simples que integran un compuesto se asignan automáticamente mediante un programa⁹, excepto en los casos ambiguos. Dicho programa consulta el código categorial y el código de flexión que llevan las formas simples que integran el nombre compuesto en el DEFSFE y asigna automáticamente dichos códigos a las correspondientes formas simples que integran el compuesto en el DEFCE. La especificación de las formas simples que recibirán un código categorial y un código de flexión por parte del programa de codificación automática, es decir, la determinación de las formas simples de un compuesto que experimentan variaciones formales en su flexión, se realiza, entonces, a partir de los códigos tipológicos flexivos, que hemos presentado anteriormente. El programa de flexión no podría utilizar directamente la estructura tipológica flexiva de un compuesto para determinar automáticamente el elemento que experimenta variaciones de forma y determinar su código categorial y flexivo a partir de la información del DEFSFE, porque existen casos ambiguos, que se tienen que codificar manualmente. Por ello, es necesario codificar las propiedades flexivas de las formas simples que integran los nombres compuestos, con objeto de eliminar los casos ambiguos, que no podría resolver el programa de flexión.
	4. El léxico español de palabras compuestas ha recibido un tratamiento marginal en los diccionarios tradicionales, ya que, en primer lugar, dichos diccionarios incluyen un número muy reducido de palabras compuestas, en segundo lugar, no proporcionan prácticamente ningún tipo de información categorial o la especificación del género de los compuestos y, finalmente, no dan ningún tipo de información sobre sus propiedades flexivas. Todos estos problemas lingüísticos nos han impedido utilizar los diccionarios tradicionales como única fuente de información para la recopilación del léxico de palabras compuestas del español. Los problemas que plantean los diccionarios tradicionales para la recopilación de palabras simples (cf. 2. l.), junto con los problemas que acabamos de presentar en relación a la recopilación de un léxico de palabras compuestas, muestran claramente que los diccionarios tradicionales no pueden constituir una fuente de información básica para la construcción de léxicos electrónicos. El problema que plantean los diccionarios tradicionales no se reduce a una cuestión de formatos. En efecto, el hecho de disponer de un diccionario tradicional en soporte magnético, eliminando, p. ej., los códigos de fotocomposición de los archivos informáticos que se utilizan en el proceso de edición, o el hecho de disponer de un diccionario tradicional de consulta humana en una base de datos, no altera las características del texto original, que plantea un conjunto de problemas lingüísticos, como lagunas léxicas, falta de sistematicidad en los criterios utilizados para la determinación de las entradas Y falta de información sobre la categoría y/o sobre las propiedades flexivas de las entradas. El cambio de formato de un diccionario tradicional puede facilitar su consulta, pero, por supuesto, no altera los problemas lingüísticos a los que hemos hecho referencia anteriormente.
	5. El SDEE constituirá una base de datos léxicos que permitirá desarrollar un conjunto de aplicaciones tecnológicas, como p. ej., el análisis léxico automático (cf. Silberztein, 1989) del español. El análisis léxico automático consiste en una etiquetación de todas las formas simples de un texto y en un reconocimiento automático de todas sus formas compuestas, con la especificación de la información gramatical que dichas formas simples y compuestas poseen en el SDEE. El análisis léxico automático de un texto español proporcionará la información lingüística que requieren los programas de análisis sintáctico automático, los cuales tendrán acceso al SGEE (Sistema de Gramáticas Electrónicas del Español). En su actual estado de desarrollo, el SDEE constituye una base de datos, que permite realizar una etiquetación automática de las formas simples de un texto español (cf. fig. 6)¹⁰. Esta etiquetación se realiza mediante un programa que asigna a las formas simples de un texto español, la información gramatical que poseen dichas formas en el DEFSFE (cf. fig. 2), es decir, la información morfológica y/o categorial, y la especificación de la forma de base a la que pertenecen (cf. 2.2.). En consecuencia, la etiquetación automática de un texto español constituye un procedimiento de análisis, que consiste en asignar a las palabras de un texto, la información que poseen dichas palabras en el SDEE. Este procedimiento de etiquetación, que se basa en el establecimiento de una asociación entre las palabras de un texto y la información contenida en un sistema de diccionarios electrónicos, permite analizar textos españoles con gran precisión y, en consecuencia, no está sujeto a las limitaciones de los programas de etiquetación, que deben realizar una segmentación de las palabras analizadas para determinar sus propiedades gramaticales. Los textos españoles etiquetados automáticamente pueden servir de entrada a los programas de reconocimiento de estructuras sintácticas locales, es decir, programas de reconocimiento de estructuras sintácticas, que no utilizan la información sintáctica de las gramáticas electrónicas. En la fase actual de desarrollo de nuestro proyecto, los programas de reconocimiento de estructuras locales se utilizan para la realización de búsquedas semiautomáticas de palabras compuestas en textos españoles en soporte magnético. El SDEE no solo permitirá desarrollar un conjunto de aplicaciones tecnológicas para el desarrollo de la industrialización del español, sino que proporcionará un conjunto de instrumentos informáticos de gran potencia para el desarrollo de un sistema de diccionarios electrónicos del español, que permitirá ampliar nuestro conocimiento sobre la estructura y las propiedades formales del léxico español.
	Referencias bibliográficas CASARES, Julio (1950): Introducción a la lexicografía moderna. Madrid: Consejo Superior de Investigaciones Científicas. COURTOIS, Blandine (1990): Dictionnaire électronique du LADL pour les mois simples du francais DELAS V06/2. Rapport Technique No. 20, Laboratoire d’Autoniatique Documentaire et Linguistique, Université Paris 7. ________ (1990) «Un système de dictionnaires électroniques pour les mots simples du français». Langue Française, 87: 11-22. COURTOIS, Blandine y Max SILBERZTEIN, cds. (1990): Les dictionnaires électroniques du français. Langue Française, 87. DANLOS, Laurence (1987): The Linguistic Basis of Text Generation. Cambridge: Cambridge University Press. GROSS, Maurice (1975): Méthodes en syntaxe. Paris: Hermann. ________ (1979): «On the failure of generative grammar». Language, 55.4: 859-885. ________ (En prensa): «Constructing lexicon-grarnmars». En B.T.S. Atkins y A. Zampolli, eds.: Computational Approaches to the Lexicon. Oxford: Oxford University Press. GROSS, Maurice y Dominique PERRIN, eds. (1989): Electronic Dictionaries and Automata in Computational Linguistics. Lecture Notes in Computer Science No.3 77. Berlin: Springer- Verlag. HARRIS, Zellig (1992): A Grammar of English on Mathematical Principles. New York: Wiley-Interscience. ________ (1991) A Theory of Language and Information. Oxford: Clarendon Press. LAPORTE, Eric (1988): Méthodes algorithmiques et lexicales de phonétisation de textes. Tesis doctoral, Université Paris 7, Centre d’Etudes et de Recherches en Informatique Linguistique. PELLAT-MASSO L. (1989-90): «Une description formelle des expressions figées de l’espagnol», Mémoires du D.E.A. d’Informatique Fondamentale, Université Paris VIII y Centre d’Etudes et de Recherches en Informatique Linguistique. MOLINER, María (1983): Diccionario de uso del español, 2 vols. Madrid: Gredos. REAL ACADEMIA ESPAÑOLA (l984): Diccionario de la lengua española, 2 vols. Madrid: Espasa Calpe. SECO, Manuel (1986): Diccionario de dudas y dificultades de la lengua española, Madrid: Espasa-Calpe. SILBERZTEIN, Max (1989): Dictionnaires électroniques et réconnaissance lexicale automatique. Ph. D. dissertation, Laboratoire d’Automatique Documentaire et Linguistique, Université Paris 7. ________ (1989): «The lexical analysis of French», en Electronic Dictionaries and Automata in Computational Linguistics. Lecture Notes in Computer Science No. 377 M.Gross y D.Perrin, eds. Berlin: Springer-Verlag, pàgs. 92-110. ________ (l990): «Le dictionnaire électronique des mots composés», Langue Française, 87: 71-83. SUBIRATS RÜGGEBERG, C. (1987): Sentential Complementation in Spanish. A lexicogrammatical study of three classes of verbs. Amsterdam/ Philadelphia: John Benjamins. ________ (1989): «Verbal morphology in the Electronic Dictionary of Spanish», Lingvisticae Investigationes, 13.1: 179-201. ________ (En prensa): «Verbal, nominal and adjectival inflexion in the Electronic Dictionary of Spanish», Lingvisticae Investigationes.
	Notas: Este proyecto de investigación se inició en 1987 bajo la dirección del profesor don José Manuel Blecua, con financiación del Ministerio de Educación. Actualmente, este proyecto se está desarrollando con financiación de la Dirección General de Telecomunicaciones (TIC90403). Queremos dar las gracias a Editorial Anthropos, por habernos ofrecido textos españoles en soporte magnético para su uso con fines de investigación. También deseo darle las gracias a Amelia de Irazazabal, directora del Instituto de Información y Documentación en Ciencia y Tecnología (CSIC), por haber puesto a nuestra disposición el Thesaurus SPINES Quisiera darles las gracias a M. Paz Álvarez, Josep M. Arús, Ramón Barquier, Ana Castellano, José A. Checa, Miguel Espinar, Sebastián Galera, Martí Griera, Diego de Haro, Antonio López, Iñaki Núñez, Maribel Rodríguez y a Lluis Tort, así como a los restantes miembros del Centro de Cálculo de la Universidad Autónoma de Barcelona por su colaboración. También quiero darles las gracias a Pilar Gabás, Joaquim Llisterri, Dolors Poch y a Antonio Ríos por toda la ayuda que me han prestado. También deseo expresar mi agradecimiento a Maurice Gross, Blandine Courtois y a Max Silberztein, cuya cooperación ha sido crucial para el desarrollo de este proyecto. Finalmente, quisiera dejar constancia de mi agradecimiento a José Manuel Blecua, sin cuya ayuda no se hubiese podido realizar este proyecto. Cf. Danlos, 1987, para una aplicación de las gramáticas electrónicas a la generación automática de textos en inglés y en francés. Cf. Subirats, 1989; 180-5. Los programas de flexión de formas verbales y el programa de flexión de formas nominales y flexivas han sido escritos por Blandine Courtois en el Laboratoire d’Automatique Documentaire et Linguistique (CNRS) de la Université Paris 7 y han sido adaptados al español en el marco de un proyecto de cooperación. Los verbos compuestos, como p. ej. tomar el pelo, tener en cuenta o adorar el santo por la peana constituyen operadores (cf. Harris, 1982), cuyo estudio se desarrolla en gramáticas electrónicas (cf. Pellat-Massó, 1989-90). Cf. Casares, 1950: 167-184 para una clasificación de las palabras compuestas dentro del marco de la gramática tradicional. C puede ser cualquier elemento constante, que no experimente variación de forma en la flexión del compuesto. El programa de generación de formas compuestas flexivas ha sido desarrollado por Blandine Courtois en el Laboratoire d’Automatique Documentaire et Linguistique (CNRS) de la Université Paris 7. El programa de etiquetación automática ha sido desarrollado por Max Silberztein en el Laboratoire d’Automatique Documentaire et Linguistique (CNRS) de la Université Paris 7. Cf. A. RIVADULLA, Probabilidad e inferencia científica, Barcelona: Editorial Anthropos, pág. 19, 1991.

	\| La lengua española y las nuevas tecnologías \| \| Portada del CVC \| \| Obras de referencia \| Actos culturales \| Foros \| Aula de lengua \| Oteador \| \| Rinconete \| El trujamán \| \| Enviar comentarios \| Centro Virtual Cervantes © Instituto Cervantes (España), 2003-. Reservados todos los derechos.