|
|
Sistema de
diccionarios electrónicos del español
Carlos Subirats Rüggeberg. Laboratorio de Lingüística
Informática. Universidad Autónoma de Barcelona |
|
1. Las primeras investigaciones sistemáticas de la gramática en el léxico
de las lenguas naturales (cf. Gross, 1975) han permitido determinar la complejidad de la
distribución de las propiedades formales en el léxico. La investigación
léxico-gramatical (ibid.) ha puesto de manifiesto que la complejidad de la
distribución de las reglas gramaticales en el léxico de las lenguas naturales crece
progresivamente, a medida que aumenta el número de elementos del léxico estudiados, sin
que se haya observado ningún signo de convergencia entre ambos parámetros. En efecto, el
estudio sistemático de la gramática en el léxico ha puesto de manifiesto que no existen
dos elementos del léxico que tengan exactamente las mismas propiedades formales, con lo
cual se ha demostrado la falta de base empírica de las gramáticas generativas (cf.
Gross, 1975, 1979), las cuales tratan de determinar las reglas gramaticales al margen del
estudio sistemático de su distribución en el léxico. De hecho, no solo no se puede
separar el léxico del estudio de la gramática, sino que en el estado actual de nuestro
conocimiento sobre las lenguas naturales, el estudio de las propiedades gramaticales
consiste en su determinación en el léxico. Por lo tanto, el concepto de regla no puede
tener un valor «explicativo» o «regularizador» en sí mismo, como en la gramática
tradicional o en la generativa, sino que su función consiste en permitir la
determinación de las propiedades formales de los elementos que constituyen el léxico de
las lenguas naturales. En realidad, la disociación arbitraria entre el léxico y la
gramática se ha podido mantener en la lingüística, en la medida en que no se ha
verificado la complejidad de la distribución de las propiedades gramaticales en el
léxico.
La teoría léxico-gramatical propone el estudio de las lenguas naturales mediante la
construcción de un léxico-gramática, integrado por un sistema modular de gramáticas y
diccionarios electrónicos interrelacionados. Un sistema de diccionarios electrónicos
está formado por:
a) Diccionarios electrónicos, que están
integrados por el léxico de formas de base de una lengua, con un código alfanumérico
asociado, que especifica:
i) sus propiedades morfológicas de
flexión y/o su categoría gramatical;
ii) la(s) tabla(s) del sistema de gramáticas electrónicas, en la que se
determinan sus propiedades gramaticales.
b) Programas, que generan automáticamente
diccionarios electrónicos de formas flexivas, a partir de los diccionarios de formas de
base.
Un sistema de gramáticas electrónicas
está constituido por tablas matrices binarias informatizadas, en las que las líneas
corresponden a entradas del léxico y las columnas a propiedades gramaticales. En la
intersección de las líneas, correspondientes a las entradas X, Y, Z, con las
columnas, que corresponden a las propiedades formales P1,
P2 ... Pn , aparece
un signo «+», cuando una entrada posee una determinada propiedad, o un signo «»,
cuando no posee dicha propiedad. La información gramatical de un sistema de gramáticas
electrónicas se consulta automáticamente mediante programas.
De acuerdo con la estructura modular que acabamos de describir, el léxico- gramática del
español estará constituido por un Sistema de Diccionarios Electrónicos del Español
(SDEE) y por un Sistema de Gramáticas Electrónicas del Español (SGEE). A su vez, el
SDEE (Sistema de Diccionarios Electrónicos del Español) está integrado por un
Diccionario Electrónico de Formas Simples del Español (DEFSE) y un Diccionario
Electrónico de Formas Compuestas del Español (DEFCE).
El léxico-gramática del español constituirá la primera representación sistemática
formalizada de nuestro conocimiento lingüístico y permitirá llevar a cabo nuevas
aplicaciones tecnológicas en el campo de la industrialización del español, como el
análisis léxico automático (cf. Silberztein, 1989), el análisis sintáctico
automático y la generación automática de textos2.
|
|
2.1. El DEFSE (Diccionario electrónico de
formas simples del español) está integrado por un léxico español de 69 000 formas
simples, es decir, cadenas de caracteres entre dos espacios en blanco consecutivos, que
funcionan como una unidad independientemente de sus características morfológicas o de su
estructura interna, como p. ej., sol, silla, niña, intransitividad o
rompecabezas. A su vez, el DEFSE contiene componentes de palabras compuestas, que no
pueden funcionar independientemente fuera de dichos compuestos, como p. ej., a troche y
moche, que constituyen componentes del adverbio compuesto a troche y moche, y que no
tienen un funcionamiento independiente fuera de dicho adverbio. Cada una de las entradas
del DEFSE va acompañada de un código alfanumérico, que especifica sus propiedades
morfológicas de flexión y/o su categoría gramatical (cf. fig. 1).
La recopilación del léxico
del DEFSE se ha hecho partiendo de los diccionarios tradicionales españoles se consulta
humana. No obstante, los diccionarios tradicionales plantean problemas lingüísticos, que
impiden su utilización como modelos exclusivos para la realización de un léxico
electrónico. En primer lugar, hay un número importante de palabras del español, las
cuales no figuran en los diccionarios tradicionales del español; así p. ej., palabras de
uso común, como crispación, encomiable, exhaustividad, obsesivamente o
ridiculización, por citar tan solo algunos ejemplos, no figuran ni en el diccionario
de la Real Academia (1984) ni en el de Moliner (1983). En segundo lugar, los diccionarios
tradicionales no tienen un criterio sistemático para la determinación de sus entradas;
así p. ej., la Academia (1984) no trata los verbos establecerse (instalarse)
o sublevarse (levantarse) como entradas independientes, sino como
simples acepciones bajo las entradas de los verbos establecer (instituir,
decretar) y sublevar (indignar). No obstante, establecer,
establecerse, sublevar y sublevarse, constituyen cuatro verbos formal y
semánticamente distintos y, desde una perspectiva formal, se deben considerar como cuatro
entradas independientes. En tercer lugar, los diccionarios tradicionales no proporcionan
información sistemática sobre las propiedades flexivas de sus entradas. En el caso de
los diccionarios tradicionales, el lector humano puede suplir con su intuición
lingüística aquellas informaciones que o bien no se especifican, o se especifican de
forma ambigua. No obstante, un diccionario electrónico constituye una descripción
sistemática del léxico de una lengua para usos informáticos y, por lo tanto, debe
solucionar los problemas que plantean los diccionarios tradicionales:
1) En primer lugar, debe estar
formado por una recopilación sistemática de todo el léxico general de la lengua
española.
2) En segundo lugar, la determinación de las entradas se debe realizar utilizando de
forma sistemática un criterio formal3.
3) En tercer lugar, la especificación de las propiedades morfológicas flexivas debe
realizarse sistemáticamente para todo el léxico.
2.2. En un texto español
cualquiera, no sólo aparecen palabras en sus formas de base, es decir, verbos en
infinitivo, y nombres y adjetivos en masculino y/o singular, sino también en sus
correspondientes formas flexivas. En consecuencia, un diccionario electrónico para usos
informáticos debe incluir todas las formas posibles del léxico general del español, es
decir, sus formas de base y sus correspondientes formas flexivas. Las formas flexivas de
las entradas del DEFSE que tienen flexión morfológica se obtienen automáticamente,
mediante un programa de generación de formas verbales y un programa de generación de
formas nominales y adjetivas4 (cf.
fig. 3). Los programas de generación de
formas flexivas consultan los códigos alfanuméricos que acompañan a los verbos, los
nombres y los adjetivos del DEFSE; dichos códigos remiten a los programas a una clase
flexiva específica, dentro de los ficheros de clases flexivas (cf. fig. 3), los cuales contienen un
análisis sistemático de la flexión verbal, nominal y adjetiva del español, tanto
regular como irregular. A partir de la información que obtienen en los ficheros de clases
morfológicas flexivas, los programas generan automáticamente todas las formas simples
flexivas de la entrada correspondiente del DEFSE, especificando sus propiedades
morfológicas de flexión; a su vez, los programas indican la forma de base, a la que
está asociada cada una de las formas flexivas generadas (cf. fig. 2). En consecuencia, los programas
de generación de formas simples flexivas crean automáticamente el Diccionario
Electrónico de Formas Simples Flexivas del Español (DEFSFE) a partir del DEFSE; el
DEFSFE contiene unas 600 000 formas, las cuales constituyen todas las formas posibles
pertenecientes al léxico general de la lengua española. |
|
3. 1. El léxico del español no está constituido únicamente por palabras simples, es
decir, por palabras que constituyen una unidad ortográfica y que funcionan como una
unidad léxica, sino también por palabras compuestas, es decir, grupos de dos o más
formas simples que funcionan como una unidad léxica y cuyas propiedades semánticas y
sintácticas no se pueden deducir a partir de las propiedades de las formas simples que
integran dicho compuesto. En el léxico del español, existen palabras compuestas
pertenecientes a todas las clases de palabras, es decir, nombres compuestos, como p. ej. ingeniero
técnico, ropa interior, centro de gravedad, madre de alquiler, nuevo rico o paquete
bomba, adjetivos compuestos, como p. ej., bien educado, en funciones, de sangre
azul, adverbios compuestos, como p. ej., al fin y al cabo, a sabiendas, de vez en
cuando, en consecuencia o sin decir esta boca es mía, conjunciones compuestas, como
p. ej., a medida que, a pesar de, con tal de o puesto que, y preposiciones e
interjecciones compuestas, como p. ej., acerca de o en contra de, y qué demonios o
cielo santo. En el marco del SDEE, las palabras compuestas5 se incluyen en el Diccionario Electrónico de Formas Compuestas del
Español (DEFCE), el cual incluirá todas las palabras compuestas del léxico general de
la lengua española. El DEFCE, cuya realización está en fase de desarrollo, está
integrado actualmente por un léxico de unas 24 000 formas compuestas, con información categorial asociada a cada una de sus entradas y con información sobre las propiedades
morfológicas de flexión asociada a las entradas nominales.
3.2. Los nombres compuestos, al igual
que las palabras simples (cf. 2.2.), no aparecen en un texto únicamente en su forma de
base, sino también en sus correspondientes formas flexivas. En consecuencia, un
diccionario electrónico para usos informáticos no sólo debe incluir las formas de base
de los nombres compuestos, sino también sus formas flexivas.
La flexión de los nombres compuestos depende, en primer lugar, de las propiedades
flexivas de las formas simples que lo integran, en segundo lugar, de su estructura
tipológica y, en tercer lugar, de su género morfológico. Cada una de las entradas
nominales del DEFCE va acompañada de una especificación sistemática de estas tres
propiedades:
1) En primer lugar, se especifican
las propiedades flexivas de las formas simples, que experimentan variaciones de forma en
la flexión del compuesto, con el mismo código alfanumérico que llevan dichas formas
simples en el DEFSFE (cf. figs. 4 y 5).
2) En segundo lugar, cada una de las entradas nominales del DEFCE lleva una
especificación de su estructura tipológica, ya que dicha estructura determina cuál, o
cuáles, serán las formas simples que integran el compuesto que
experimentarán variaciones de forma en la flexión de género y/o número del compuesto;
así p. ej., en la formación del plural del nombre compuesto bomba atómica, es decir,
bombas atómicas, se flexionan las dos formas simples que integran dicho compuesto, es
decir, el nombre y el adjetivo; por el contrario, en la flexión de género y número del
compuesto maestro de escuela, es decir, maestra de escuela, maestros de
escuela, maestras de escuela, el único elemento que experimenta variación de
forma es el primer nombre, mientras que el segundo nombre permanece invariable. El hecho
de que en la flexión de bomba atómica varíen las dos formas simples que integran
dicho compuesto, mientras que en la flexión de maestro de escuela sólo varíe el primer
elemento nominal, está ligado a su estructura tipológica. En efecto, en la flexión de
los nombres compuestos, formados por un nombre y un adjetivo, es decir, NA, varía el
elemento nominal y el elemento adjetivo, mientras que en la flexión de los compuestos
formados por un nombre, la preposición de y un nombre, es decir, NDN, solo varía
el primer elemento nominal. En consecuencia, en el DEFCE, se indica la estructura tipológica de los compuestos, ya que dicha estructura determina las formas simples, qué
son susceptibles de presentar variaciones de forma en la flexión del compuesto. La
clasificación6 tipológica flexiva de los
nombres compuestos del DEFCE es ésta.
3) En tercer lugar, las entradas nominales del
DEFCE llevan una especificación con respecto a sus propiedades morfológicas de género,
ya que la especificación del género de un nombre compuesto no se puede deducir
regularmente a partir del género de sus componentes. Así p. ej., un compuesto, como p.
ej. piel roja (indio indígena de América del Norte), no conserva el
género femenino de su núcleo nominal piel, sino que tiene un género masculino y
femenino. En el DUCE, piel lleva el código categorial y flexivo, correspondiente a
los nombres femeninos, que forman su plural añadiendo -es, es decir, N23, y
roja lleva el código de los adjetivos que tienen flexión de género con las
terminaciones -o, -a, -os, -as, es decir, A47, con la
especificación F (femenino), es decir A47F, ya que tanto en la forma de base piel
roja, como en su única forma flexiva, pieles rojas, el adjetivo aparece
exclusivamente en femenino. No obstante, como el género del compuesto piel roja no
corresponde con el género de su núcleo nominal, es necesario especificar el género del
compuesto con un código adicional, en este caso mf (masculino y femenino). Por lo
tanto, en el marco de la morfología de los nombres compuestos, el código que acompaña a
las formas simples que integran un compuesto sólo sirve para determinar las variaciones
de forma de dichas formas simples; el género del nombre compuesto se especifica mediante
un código adicional. Así, la entrada correspondiente a piel roja tiene la
siguiente estructura en el DEFCE: piel (N23) / roja (A47F),.NA: mf
Como podemos observar, los códigos
alfanuméricos entre paréntesis de las entradas del DEFCE especifican las propiedades
flexivas de las formas simples que integran el compuesto y el código que se encuentra
después de los dos puntos «:», tras la especificación de la estructura tipológica,
indica su género. Esta es la información que procesa el programa de generación de
formas flexivas compuestas8 del español
para calcular las formas flexivas que genera automáticamente. En efecto, al igual que el
programa de generación de formas simples, el programa de generación de formas compuestas
lee los códigos alfanuméricos, que especifican las propiedades flexivas de las formas
simples que sufren variaciones de forma en la flexión del compuesto; para calcular las
formas flexivas de las formas simples que integran el compuesto, el programa de
generación de formas compuestas consulta el mismo fichero de clases flexivas de nombres y
adjetivos que utiliza el programa de generación de formas simples (cf. fig. 3); una vez determinadas las
posibles variaciones flexivas de las formas simples que integran el compuesto, el programa
consulta el género del compuesto, con objeto de realizar el cálculo definitivo de las
formas flexivas compuestas que va a generar.
El programa de flexión de formas compuestas no consulta la clasificación tipológica
para generar la forma flexiva, ya que cuando dicho programa procesa una entrada para
generar sus correspondientes formas flexivas, la determinación de las formas simples que
van a experimentar una flexión, ya se ha efectuado. Así p. ej., como podemos observar en
la fig. 4, es tan solo el primer elemento nominal de los compuestos NDN, el que lleva una especificación de sus propiedades flexivas, mientras que en
el caso de los compuestos NA de la
fig. 5, son ambos elementos, es decir, el nombre y el adjetivo,
los que poseen una especificación de sus propiedades flexivas. Ello se debe a que los
códigos alfanuméricos que especifican las propiedades flexivas de las formas simples que
integran un compuesto se asignan automáticamente mediante un programa9, excepto en los casos ambiguos. Dicho programa consulta el código
categorial y el código de flexión que llevan las formas simples que integran el nombre
compuesto en el DEFSFE y asigna automáticamente dichos códigos a las correspondientes
formas simples que integran el compuesto en el DEFCE. La especificación de las formas
simples que recibirán un código categorial y un código de flexión por parte del
programa de codificación automática, es decir, la determinación de las formas simples
de un compuesto que experimentan variaciones formales en su flexión, se realiza,
entonces, a partir de los códigos tipológicos flexivos, que hemos presentado
anteriormente. El programa de flexión no podría utilizar directamente la estructura
tipológica flexiva de un compuesto para determinar automáticamente el elemento que
experimenta variaciones de forma y determinar su código categorial y flexivo a partir de
la información del DEFSFE, porque existen casos ambiguos, que se tienen que codificar
manualmente. Por ello, es necesario codificar las propiedades flexivas de las formas
simples que integran los nombres compuestos, con objeto de eliminar los casos ambiguos,
que no podría resolver el programa de flexión. |
|
4. El léxico español de palabras compuestas ha
recibido un tratamiento marginal en los diccionarios tradicionales, ya que, en primer
lugar, dichos diccionarios incluyen un número muy reducido de palabras compuestas, en
segundo lugar, no proporcionan prácticamente ningún tipo de información categorial o la
especificación del género de los compuestos y, finalmente, no dan ningún tipo de
información sobre sus propiedades flexivas. Todos estos problemas lingüísticos nos han
impedido utilizar los diccionarios tradicionales como única fuente de información para
la recopilación del léxico de palabras compuestas del español. Los problemas que
plantean los diccionarios tradicionales para la recopilación de palabras simples (cf. 2.
l.), junto con los problemas que acabamos de presentar en relación a la recopilación de
un léxico de palabras compuestas, muestran claramente que los diccionarios tradicionales
no pueden constituir una fuente de información básica para la construcción de léxicos
electrónicos. El problema que plantean los diccionarios tradicionales no se reduce a una
cuestión de formatos. En efecto, el hecho de disponer de un diccionario tradicional en
soporte magnético, eliminando, p. ej., los códigos de fotocomposición de los archivos
informáticos que se utilizan en el proceso de edición, o el hecho de disponer de un
diccionario tradicional de consulta humana en una base de datos, no altera las
características del texto original, que plantea un conjunto de problemas lingüísticos,
como lagunas léxicas, falta de sistematicidad en los criterios utilizados para la
determinación de las entradas Y falta de información sobre la categoría y/o sobre las
propiedades flexivas de las entradas. El cambio de formato de un diccionario tradicional
puede facilitar su consulta, pero, por supuesto, no altera los problemas lingüísticos a
los que hemos hecho referencia anteriormente. |
|
5. El SDEE constituirá una base de datos léxicos
que permitirá desarrollar un conjunto de aplicaciones tecnológicas, como p. ej., el
análisis léxico automático (cf. Silberztein, 1989) del español. El análisis léxico
automático consiste en una etiquetación de todas las formas simples de un texto y en un
reconocimiento automático de todas sus formas compuestas, con la especificación de la
información gramatical que dichas formas simples y compuestas poseen en el
SDEE. El
análisis léxico automático de un texto español proporcionará la información
lingüística que requieren los programas de análisis sintáctico automático, los cuales
tendrán acceso al SGEE (Sistema de Gramáticas Electrónicas del Español).
En su actual estado de desarrollo, el SDEE constituye una base de datos, que permite
realizar una etiquetación automática de las formas simples de un texto español (cf. fig. 6)10.
Esta etiquetación se realiza mediante un programa
que asigna a las formas simples de un texto español, la información gramatical que
poseen dichas formas en el DEFSFE (cf. fig.
2), es decir, la información morfológica y/o categorial, y la especificación de la
forma de base a la que pertenecen (cf. 2.2.). En consecuencia, la etiquetación
automática de un texto español constituye un procedimiento de análisis, que consiste en
asignar a las palabras de un texto, la información que poseen dichas palabras en el
SDEE.
Este procedimiento de etiquetación, que se basa en el establecimiento de una asociación
entre las palabras de un texto y la información contenida en un sistema de diccionarios
electrónicos, permite analizar textos españoles con gran precisión y, en consecuencia,
no está sujeto a las limitaciones de los programas de etiquetación, que deben realizar
una segmentación de las palabras analizadas para determinar sus propiedades gramaticales.
Los textos españoles etiquetados
automáticamente pueden servir de entrada a los programas de reconocimiento de estructuras
sintácticas locales, es decir, programas de reconocimiento de estructuras sintácticas,
que no utilizan la información sintáctica de las gramáticas electrónicas. En la fase actual de desarrollo de nuestro
proyecto, los programas de reconocimiento de estructuras locales se utilizan para la
realización de búsquedas semiautomáticas de palabras compuestas en textos españoles en
soporte magnético. El SDEE no solo permitirá desarrollar un conjunto de aplicaciones
tecnológicas para el desarrollo de la industrialización del español, sino que
proporcionará un conjunto de instrumentos informáticos de gran potencia para el
desarrollo de un sistema de diccionarios electrónicos del español, que permitirá
ampliar nuestro conocimiento sobre la estructura y las propiedades formales del léxico
español. |
|
Referencias bibliográficasCASARES, Julio (1950): Introducción a la
lexicografía moderna. Madrid: Consejo Superior de Investigaciones Científicas.
COURTOIS, Blandine (1990): Dictionnaire électronique du LADL pour les mois simples du
francais DELAS V06/2. Rapport Technique No. 20, Laboratoire dAutoniatique
Documentaire et Linguistique, Université Paris 7.
________ (1990) «Un système de dictionnaires électroniques pour les mots simples du
français». Langue Française, 87: 11-22.
COURTOIS, Blandine y Max SILBERZTEIN, cds. (1990): Les dictionnaires électroniques du
français. Langue Française, 87.
DANLOS, Laurence (1987): The Linguistic Basis of Text Generation. Cambridge:
Cambridge University Press.
GROSS, Maurice (1975): Méthodes en syntaxe. Paris: Hermann.
________ (1979): «On the failure of generative grammar». Language, 55.4:
859-885.
________ (En prensa): «Constructing lexicon-grarnmars». En B.T.S. Atkins y A. Zampolli,
eds.: Computational Approaches to the Lexicon. Oxford: Oxford University Press.
GROSS, Maurice y Dominique PERRIN, eds. (1989): Electronic Dictionaries and Automata in
Computational Linguistics. Lecture Notes in Computer Science No.3 77. Berlin:
Springer- Verlag.
HARRIS, Zellig (1992): A Grammar of English on Mathematical Principles. New York:
Wiley-Interscience.
________ (1991) A Theory of Language and Information. Oxford: Clarendon Press.
LAPORTE, Eric (1988): Méthodes algorithmiques et lexicales de phonétisation de
textes. Tesis doctoral, Université Paris 7, Centre dEtudes et de
Recherches en Informatique Linguistique.
PELLAT-MASSO L. (1989-90): «Une description formelle des expressions figées de
lespagnol», Mémoires du D.E.A. dInformatique Fondamentale, Université
Paris VIII y Centre dEtudes et de Recherches en Informatique Linguistique.
MOLINER, María (1983): Diccionario de uso del español, 2 vols. Madrid: Gredos.
REAL ACADEMIA ESPAÑOLA (l984): Diccionario de la lengua española, 2 vols. Madrid:
Espasa Calpe.
SECO, Manuel (1986): Diccionario de dudas y dificultades de la lengua española, Madrid:
Espasa-Calpe.
SILBERZTEIN, Max (1989): Dictionnaires électroniques et réconnaissance lexicale
automatique. Ph. D. dissertation, Laboratoire dAutomatique Documentaire et
Linguistique, Université Paris 7.
________ (1989): «The lexical analysis of French», en Electronic
Dictionaries and Automata in Computational Linguistics. Lecture Notes in Computer Science
No. 377 M.Gross y D.Perrin, eds. Berlin: Springer-Verlag, pàgs. 92-110.
________ (l990): «Le dictionnaire électronique des mots composés», Langue
Française, 87: 71-83.
SUBIRATS RÜGGEBERG, C. (1987): Sentential Complementation in Spanish. A
lexicogrammatical study of three classes of verbs. Amsterdam/ Philadelphia: John
Benjamins.
________ (1989): «Verbal morphology in the Electronic Dictionary of Spanish», Lingvisticae
Investigationes, 13.1: 179-201.
________ (En prensa): «Verbal, nominal and adjectival inflexion in the Electronic
Dictionary of Spanish», Lingvisticae Investigationes. |
|
Notas:
- Este proyecto de investigación se inició en 1987 bajo la
dirección del profesor don José Manuel Blecua, con financiación del Ministerio de
Educación. Actualmente, este proyecto se está desarrollando con financiación de la
Dirección General de Telecomunicaciones (TIC90403). Queremos dar las gracias a Editorial
Anthropos, por habernos ofrecido textos españoles en soporte magnético para su uso con
fines de investigación. También deseo darle las gracias a Amelia de Irazazabal,
directora del Instituto de Información y Documentación en Ciencia y Tecnología (CSIC),
por haber puesto a nuestra disposición el Thesaurus SPINES
Quisiera darles las gracias a M. Paz Álvarez, Josep M. Arús, Ramón Barquier, Ana
Castellano, José A. Checa, Miguel Espinar, Sebastián Galera, Martí Griera, Diego de
Haro, Antonio López, Iñaki Núñez, Maribel Rodríguez y a Lluis Tort, así como a los
restantes miembros del Centro de Cálculo de la Universidad Autónoma de Barcelona por su
colaboración. También quiero darles las gracias a Pilar Gabás, Joaquim Llisterri,
Dolors Poch y a Antonio Ríos por toda la ayuda que me han prestado. También deseo
expresar mi agradecimiento a Maurice Gross, Blandine Courtois y a Max Silberztein, cuya
cooperación ha sido crucial para el desarrollo de este proyecto. Finalmente, quisiera
dejar constancia de mi agradecimiento a José Manuel Blecua, sin cuya ayuda no se hubiese
podido realizar este proyecto.
- Cf. Danlos, 1987, para una aplicación de las gramáticas
electrónicas a la generación automática de textos en inglés y en francés.
- Cf. Subirats, 1989; 180-5.
- Los programas de flexión de formas verbales y el programa
de flexión de formas nominales y flexivas han sido escritos por Blandine Courtois en el
Laboratoire dAutomatique Documentaire et Linguistique (CNRS) de la Université Paris
7 y han sido adaptados al español en el marco de un proyecto de cooperación.
- Los verbos compuestos, como p. ej. tomar el pelo, tener
en cuenta o adorar el santo por la peana constituyen operadores (cf. Harris, 1982),
cuyo estudio se desarrolla en gramáticas electrónicas (cf. Pellat-Massó, 1989-90).
- Cf. Casares, 1950: 167-184 para una clasificación de las
palabras compuestas dentro del marco de la gramática tradicional.
- C puede ser cualquier elemento constante, que no
experimente variación de forma en la flexión del compuesto.
- El programa de generación de formas compuestas flexivas
ha sido desarrollado por Blandine Courtois en el Laboratoire dAutomatique
Documentaire et Linguistique (CNRS) de la Université Paris 7.
- El programa de etiquetación automática ha sido
desarrollado por Max Silberztein en el Laboratoire dAutomatique Documentaire et
Linguistique (CNRS) de la Université Paris 7.
- Cf. A. RIVADULLA, Probabilidad e inferencia
científica, Barcelona: Editorial Anthropos, pág. 19, 1991.
|
|
|
|
| La lengua española y las
nuevas tecnologías |
| Portada del CVC |
| Obras de referencia | Actos culturales | Foros | Aula de lengua | Oteador |
| Rinconete | El trujamán |
| Enviar comentarios |
Centro
Virtual Cervantes
© Instituto Cervantes (España), 2003-. Reservados todos los derechos.
|
|