Gramáticas formales chomskianas

Alejandro Villamor Iglesias

Podemos entender un modelo como un esquema que representa, de forma clara e ilustrativa, la forma de un objeto. Téngase en cuenta que un modelo representa la forma de algo, es decir, sus características esenciales, nunca el aspecto particular de su contenido. El principal objetivo que tiene un modelo es facilitar la comprensión y el estudio de aquello que representa. Utilizar modelos de los lenguajes naturales (gallego, portugués, español, árabe…) que empleamos en nuestro día a día, es de gran importancia para poder comprenderlos y estudiarlos mejor. De esta manera, los lenguajes formales son utilizados como modelos para la investigación de los naturales. Pero, ¿es en realidad ventajoso emplear un lenguaje formal como modelo de un lenguaje natural? Y, en el caso de que así fuera, ¿dónde residen estas ventajas?

A la hora de tratar este problema, es importante determinar que se entiende por gramática formal. Esta determinación es importante ya que la gramática formal genera los lenguajes formales, modelos de los naturales. Una gramática formal es una estructura caracterizada por dar especificación a cuatro variables: el vocabulario terminal, por ejemplo «mesa» o «lápiz»; el vocabulario no terminal, por ejemplo SN; el axioma, por ejemplo O, y las reglas de producción, como por ejemplo las reglas de rescritura. Que los ejemplos expuestos sean elementos del lenguaje natural no quiere decir que necesariamente deba ser así, pudiendo ser el vocabulario terminal, por ejemplo, elementos numéricos como 0 y 1 (un lenguaje binario). Dada la posible infinitud de las oraciones de un lenguaje, ¿cómo se pueden representar? Esta infinitud se representa mediante las reglas recursivas, las cuales permiten la infinitud de oraciones a partir de un número finito de reglas.

cooperativa generatio nova

Noam Chomsky realizó una jerarquía de gramáticas formales encargadas de generar distintos tipos de lenguajes formales. Uno de los fines de esta jerarquía consiste en exponer los distintos tipos de reglas que utilizamos para formar los distintos tipos de oraciones. En esta jerarquía, Chomsky distinguió a las gramáticas en función de su capacidad para generar lenguajes formales más o menos generales. Así, distingue cuatro tipos de gramáticas formales:

-La gramática de tipo 3, también llamada gramática regular o lineal, es la más básica de todas las gramáticas. Esta gramática permite generar oraciones elementales formadas regularmente a través de la inserción de una pieza gramatical tras otra hasta que se termine la oración. Esta gramática está incorporada y asumida por el resto de gramáticas. Genera los lenguajes lineales o regulares.

-La gramática de tipo 2, también llamada gramática libre de contexto, genera oraciones de mayor complejidad que la gramática de tipo 3. Esta gramática permite generar oraciones cuyo sentido se interrumpe a medio camino, para expresar otro y, posteriormente, conectar con el principio de la oración y terminar. Un ejemplo de estas oraciones es: «el bolígrafo, que tiene tinta, escribe». Para su formación, este tipo de oraciones requiere de memoria, de forma que se pueda rememorar la palabra, en el caso del ejemplo anterior `bolígrafo´, para terminar la oración con sentido. Este tipo de gramática asume a la gramática de tipo 3 y, asimismo, es asumida por las gramáticas posteriores. Además, supone un límite con respecto a los animales no humanos, que no son capaces de realizar dicho proceso de memorización. Esta gramática genera los lenguajes libres de contexto.

-La gramática de tipo 1, llamada gramática sensible al contexto, funciona de manera similar a la gramática libre de contexto ya que permite generar oraciones que requieren de memoria. Empero, esta gramática supone un mayor grado de complejidad porque implica una memorización de los principios de los términos, como el género y el número. Por ejemplo, en la oración «los bolígrafos, que tienen tinta, escriben» es necesario que las palabras se amolden al contexto. Es decir, si el sujeto, que son `los bolígrafos´, está en plural, entonces el resto de términos de la oración debe estar en plural. Esta gramática asume las propiedades de las gramáticas de tipo 3 y de tipo 2 y, a su vez, es asumida por la gramática de tipo 0. Genera los lenguajes sensibles al contexto.

-La gramática de tipo 0, o gramática irrestricta, es la más compleja de todas las gramáticas. Esta gramática genera oraciones autorreferenciales, contradictorias. Este tipo de oraciones, del tipo «es verdad que miento», provocarían que un ordenador entre en un bucle sin salida, en un proceso indecidible. Los seres humanos, gracias a nuestras capacidades cognitivas, sí que podemos salir de los bucles y emplear con sentido esta clase de oraciones. Esta gramática genera los lenguajes irrestrictos.

Con esta distinción de los distintos tipos de gramáticas formales, Chomsky llevó a cabo una superación del sistema de encadenamiento de palabras, el modelo estándar o el modelo de Markov. El sistema de encadenamiento de palabras fue otra forma de entender el lenguaje. A la cuestión acerca de cómo formamos las oraciones, el SEP proponía una visión conductista del lenguaje. Así, consideraba que cada uno de los  individuos tenemos una lista de palabras semejantes que se relacionan entre sí, formando una especie de cadena. Esta relación se produce a la manera de estímulo-respuesta, donde cada palabra funciona como estímulo para la elección de la siguiente, hasta que se termine la oración. Uno de los grandes problemas de esta teoría, entre otros, se resuelve en esta jerarquización, ya que el SEP no explica cómo podemos formar oraciones que requieren de memoria. La solución que aportan los generativistas de corte chomskiano es que las oraciones no son formadas como cadenas, sino como árboles donde las palabras se agrupan en sintagmas. Con esto, se puso de manifiesto que en el lenguaje no todos los elementos tienen el mismo peso, por lo que están jerarquizados en una geometría arbórea.

A su vez, para la construcción de las oraciones de los lenguajes formales, como los nombrados anteriormente en la jerarquía realizada por Chomsky, son necesarios: los elementos básicos con los que constituir las oraciones y las operaciones que realizar sobre eses elementos (principalmente se utilizan las reglas de concatenación y las reglas de rescritura). De este modo, las estructuras fundamentales que caracterizan a los lenguajes formales son: el monoide y el preorden. Mediante estas dos álgebras se podemos distinguir una oración gramatical de una agramatical. El  monoide se refiere a la operación de concatenación. En unos primeros momentos está formado por un conjunto de elementos terminales básicos que se van concatenando, en el caso del lenguaje natural son las letras del abecedario. El monoide tiene tres propiedades que permiten realizar estas asociaciones: la propiedad interna, la propiedad asociativa y el elemento neutro (λ). Por su parte, el preorden se refiere a la operación de rescritura. Está compuesto por el conjunto de símbolos formados por el alfabeto terminal, como `mesa´, y el no terminal, por ejemplo un nombre (N) o un sintagma verbal (SV).

Una vez aclarados estos conceptos acerca de la naturaleza de la gramática y los lenguajes formales, se entiende que un lenguaje formal es un buen modelo de un lenguaje natural cuando representa fielmente la forma de este. Es decir, cuando la estructura que muestra el formal se corresponde con la forma del segundo, pudiéndose estudiar las propiedades de uno en los términos del otro lenguaje. Esto se puede comprender con el siguiente ejemplo: las oraciones palindrómicas son aquellas que se leen igual hacia adelante que hacia atrás, por ejemplo: «Javier le habla a María y viceversa». Esta oración del lenguaje natural es correcta. Un lenguaje formal que representase correctamente esta oración en términos de 0 y 1 sería el teorema «0110», en donde el 0 simboliza a Javier y el 1 a María.

En vista de lo descrito desde las preguntas formuladas inicialmente, se podría considerar que el lenguaje formal sí que es una forma pertinente de representar al lenguaje natural ya que representa fielmente su forma de la manera descrita en los párrafos anteriores. Esta representación resulta,  además, de gran utilidad. Un claro ejemplo de esta utilidad se puede observar en las aplicaciones de los lenguajes formales en la construcción de autómatas. Si bien las gramáticas se encargan de generar, como se vio anteriormente, los lenguajes formales, los autómatas llevan a cabo un proceso de reconocimiento de eses lenguajes. Retornando a la jerarquización de los distintos tipos de gramáticas formales, Chomsky estableció una correspondencia biunívoca (es decir, cuando hay una correspondencia recíproca entre elementos de dos conjuntos) entre cada gramática y autómata. El lenguaje generado por una gramática regular o lineal puede ser reconocido por un autómata finito, el lenguaje libre de contexto por un autómata de pila, el lenguaje sensible al contexto por un autómata acotado linealmente y por último, los lenguajes irrestrictos pueden ser reconocidos por una máquina de Turing. Los beneficios que cualquiera de estos autómatas realiza a la sociedad son incuestionables.

cooperativa generatio nova
Comentarios De Facebook

Check Also

Los dos dogmas del empirismo de Quine

En 1951 el filósofo Willard van Orman Quine publicó uno de los artículos más relevantes …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *