Centro Virtual Cervantes

Obras de referenciaCongresos de la lengua

Congreso de Sevilla

Inicio



INTELIGENCIA ARTIFICIAL Y LENGUA ESPAÑOLA

Congreso de Sevilla
 

Sobre la representación de la imprecisión del lenguaje natural mediante conjuntos difusos
Ramón López de Mantarás. Instituto de Investigación en Inteligencia Artificial (IIA). Centro de estudios avanzados de Blanes, CSIC


Introducción

Durante las últimas décadas el tratamiento del lenguaje natural se ha convertido en una de las áreas más importantes de investigación en inteligencia artificial. Ello ha estimulado el desarrollo de teorías semánticas computacionales (McCawley, 1981), (Hintikka, 1982), (Janssen, 1978), (Niiniluoto, 1987), (Zadeh, 1981, 1984 y 1986).

Los enfoques tradicionales (truth-conditional, possible world, Montague, Model-Theoretic) están basados en lógicas bivaluadas que suponen que la extensión de un predicado es un conjunto clásico. Sin embargo, en general, el lenguaje natural se caracteriza por la presencia de predicados vagos cuya extensión no son conjuntos clásicos sino conjuntos difusos, es decir conjuntos tales que la transición entre pertenencia y no pertenencia es gradual en lugar de abrupta. A partir de esta observación, Zadeh (1981, 1984,1986) ha propuesto una teoría semántica computacional denominada test-score. En el resto de este artículo se describen los conceptos básicos de esta teoría.

Subir
 
El problema de la vaguedad

El principal problema que se plantea a la hora de querer darle un tratamiento a la posible vaguedad presente en la información e inherente al lenguaje natural, es decir cuál es el concepto de verdad aplicable. Tarski, en su teoría semántica de la verdad (Tarski, 1944), dice que la solución que él propone es «rigurosa» para aquellos lenguajes con una estructura «exactamente especificada», pero es sólo «aproximada» para los lenguajes naturales.

El lenguaje natural no está especificado de una forma exacta ni sintáctica ni semánticamente. Los enunciados sintácticamente mal formados no plantean problemas desde el punto de vista tarskiano, ya que no hay ninguna razón para asociarles valores de verdad. Por otro lado, si un enunciado es sintácticamente ambiguo entre dos o más lecturas, Tarski permite asignar un valor de verdad a cada lectura por separado.

Por contra, los enunciados semánticamente mal especificados o imprecisos lo son por el hecho de contener distintas expresiones vagas, mal definidas, pudiendo incluir tanto predicados (grande, joven, etc.), modificadores (casi, aproximadamente, etc.) o cuantificadores (muchos, pocos, etc.). Esto plantea problemas que no pueden ser tratados dentro del marco de la semántica clásica.

En algunos casos, el uso de expresiones vagas está basado esencialmente en razones epistémicas. Es decir, aunque nuestro lenguaje L sea semánticamente impreciso, podemos suponer que existe L’ de L semánticamente precisa pero que puede no ser útil por razones prácticas (por ejemplo, el coste de «precisar» puede ser demasiado alto, o bien puede ser muy difícil medir los conceptos de L’). Este proceso por el cual se puede pasar de una expresión vaga a su correspondiente expresión exacta fue denominado por Carnap «explicación» (Carnap, 1949).

Así pues, la vaguedad epistémica tampoco presenta en principio problemas graves a la teoría de la verdad de Tarski. Un enunciado vago de un lenguaje L se convierte en una disyunción de enunciados precisos en una extensión precisa L’ de L, y por tanto sobre esta disyunción es aplicable la definición tarskiana de verdad.

Ahora bien, a veces los contornos o fronteras dados por el método de la «explicación» parecen muy arbitrarios, por ejemplo, «X es calvo si X tiene menos de 200 cabellos en su cabeza», o bien «la mayoría de A son B si, y sólo si, como mínimo el 90 % de A son B». Algunas expresiones no parecen pues admitir fácilmente una explicación. La razón es que son expresiones inherentemente o semánticamente vagas. En estos casos no hay una caracterización precisa de sus significados que podría fijar de forma unívoca sus interpretaciones en la realidad (mundo real).

Una posible solución propuesta en (Niiniluoto, 1987) para la explicación de un concepto semánticamente vago es la siguiente. Supongamos que un concepto M se aplica sobre un conjunto de casos paradigma a1, .... an perteneciente a un Universo U. Entonces el método llamado de los ejemplos paradigmáticos propugna que M se aplicará también sobre otros casos en la medida que éstos sean suficientemente similares a alguno de los a1, .... an. A tal fin, supongamos que tengamos definida una medida de similitud S entre los elementos del universo U. Entonces parece natural considerar la extensión de M de una forma continua, definiendo para cada objeto x de U un grado de pertenencia a M proporcional al siguiente valor:

max {S(x,ai)|i = 1, ..., n}

Esta solución es muy próxima en espíritu a la que propone la teoría de los conjuntos difusos (Zadeh, 1965). De hecho, lo que propone es una interpretación particular (métrica) de los grados de pertenencia a un conjunto difuso.

Por otro lado, la teoría de los conjuntos difusos, la solución más aceptada, proviene de una interpretación filosóficamente distinta, basada principalmente en un concepto de verdad parcial. Esta interpretación proviene de proponer como solución para los casos de indeterminismo semántico la introducción de un nuevo valor de verdad, «indeterminado», además de los valores clásicos «cierto» y «falso». Esto lleva en principio a las lógicas a tres valores, como las de Lukasiewicz o Kleene. De una forma más general, en las lógicas infinitamente valuadas, un enunciado puede tener como valor de verdad cualquier real entre 0 y 1. Como es bien conocido, por ejemplo, en la lógica L- de Lukasiewicz, los valores de verdad para enunciados compuestos se definen por las siguientes reglas:

v (¬p) = 1 — v (p)

v (p q) = min [v (p), v (q)]

v (p v q) = max [v (p), v (q)]

v (p q) =
min [1,1 — v (p), + v (q)]

Estas definiciones pueden ser consideradas como reglas para determinar las extensiones difusas de fórmulas atómicas con predicados vagos. Así por ejemplo, si M es un predicado vago unario, se puede definir la extensión difusa de M a través de la función característica.

µM (a) = verdad [M (a)]

Es decir, si consideramos por ejemplo el predicado alto, que aplica sobre alturas, el grado de pertenencia de una altura, digamos 170 cm, al conjunto difuso alto es igual al grado de verdad de la proposición «ser alto» cuando la altura es 170 cm.

Para fórmulas compuestas, siguiendo las anteriores reglas, las extensiones se definirían como:

µ¬ M (a) = 1 — µM(a)

µM N (a) = min [µM (a), µM (a)]

µM V N (a) = max [µM (a), µM (a)]

µM N (a) = min [1,1 — µM (a) + µN (a)]

De esta forma, la teoría de los conjuntos difusos, introducida por Zadeh en el año 1965, aparece de forma natural como un formalismo para la representación de predicados vagos en estrecha relación con la lógica a infinitos valores de Lukasiewicz.


Subir

Semántica «Test-Score» de Zadeh

La teoría de conjuntos difusos permite extender el principio de composicionalidad de Frege de manera a posibilitar su aplicación a los lenguajes naturales. En lugar de representar el significado de una frase mediante la composición de los significados de sus constituyentes, la teoría de conjuntos difusos permite representarlo a partir del significado de una colección de relaciones difusas llamada «base de datos explicativa». Con esta nueva interpretación de la composicionalidad, el principio de Frege proporciona una base para representar el significado de descripciones complejas. Concretamente, puede utilizarse para representar el significado de frases que contienen: predicados vagos (alto, joven, etc.), cuantificadores vagos (varios, muchos, etc.), modificadores (muy, bastante, etc.) y cualificadores (posible, cierto, probable, etc.).

La extensión propuesta por Zadeh del principio de composicionalidad de Frege da lugar a la semántica test-score (Zadeh, 1986). En ella, toda entidad semántica (frase, predicado, cuantificador, etc.) está considerada como un sistema de restricciones flexibles. Por ejemplo, la frase «María es alta» induce una restricción flexible sobre la posible altura de María donde la flexibilidad de la restricción está caracterizada por el conjunto difuso ALTA, es decir que el grado de pertenencia µALTA(x) al conjunto ALTA de cada valor x de la altura es el valor de la posibilidad de que la altura de María sea x.

Concretamente, la representación del significado de una frase f, mediante el uso de la semántica test-score viene dada por el siguiente procedimiento:

1.   Identificación de las variables X1, .... Xn cuyos valores restringe la proposición. Generalmente estas variables son implícitas.

2.   Identificación de las restricciones R1, ... Rm inducidas por ƒ.

3.   Caracterización de cada una de las restricciones, Ri, mediante la descripción de un procedimiento de test que asocia una puntuación (test-score) Ti a cada Ri, indicando en qué grado se satisface la restricción. Generalmente Ti es un valor del intervalo [0,1].

4.   Agregación de las puntuaciones 1, ...m obteniendo una puntuación global de .

Es importante señalar que el significado de ƒ no está representado por el test-score global sino por el procedimiento descrito que conduce a .

Los test de las restricciones inducidas por ƒ se realiza en base a una colección de relaciones que constituyen una base de datos explicativa (BDE). La hipótesis básica de la semántica test-score es que las relaciones en la base de datos son conocidas para el agente (persona u ordenador) que lleva a cabo el proceso de representación del significado.

Por ejemplo, la frase «Ramón vive en una pequeña ciudad cerca de Barcelona» necesita la siguiente BDE para aplicar el procedimiento de test descrito.

BDE RESIDENCIA [Nombre; Ciudad]
            CIUDAD-PEQUEÑA [Ciudad; µ]
            CERCA [Ciudad1; Ciudad2; µ]

donde µ es el grado en que cada ciudad es pequeña en la relación CIUDAD-PEQUEÑA y el grado en que Ciudad1 es cercana a Ciudad2 en la relación CERCA.

Para llevar a cabo la agregación de las puntuaciones 1,....,m es necesario disponer del siguiente conjunto de reglas basadas en las operaciones estándar sobre conjuntos difusos.


Subir

Reglas relativas a modificación

Si la puntuación correspondiente a una restricción flexible R en un contexto dado es T, entonces, en este mismo contexto, la puntuación para:

a) «No R» es 1 — (negación)
b) «Muy R» es 2 (intensificación)
c) «Más o menos R» es ½ (relajación)

Reglas relativas a composición

Si las puntuaciones correspondientes a las restricciones R1 y R2 en un contexto dado son 1 y 2, entonces, en el mismo contexto, la puntuación para

a) R1 y R2 es min (2, 2)
b) R1 o R2 es max (2, 2)
c) Si R1 entonces R2 es min (1,1 — 1 + 2)

Reglas relativas a la cuantificación

Se aplican a frases del tipo Q A’s son B’s (por ejemplo «la mayoría de los estudiantes son solteros») donde Q es el cuantificador. A menudo el cuantificador está implícito como por ejemplo en la frase «comer demasiado produce obesidad» en la que el cuantificador implícito es «la mayoría» (la mayoría de los que comen demasiado son obesos).

Para representar los cuantificadores vagos es necesario definir la cardinalidad de un conjunto difuso.

Existen varias propuestas, la más conocida es la siguiente:

Sea F el conjunto difuso expresado por:

F = µ11 + µ2| µ2 + ... + µ2|un

Donde µi es el grado de pertenencia de u1 a F y «+» denota unión; entonces la cardinalidad de F o . contaje (F) es la suma de los n grados de pertenencia, es decir así.

La cardinalidad relativa contaje (F/G) se puede interpretar como la proporción de elementos de F que están en G. Es decir así.

siendo F G la intersección de los conjuntos difusos F y G. Entonces, en términos de las funciones de pertenencia de F y G, la cardinalidad relativa será así.

El concepto de cardinalidad relativa permite interpretar el significado de frases del tipo Q A’s son B’s mediante la expresión . contaje (B/A) son Q. Es decir que el test-score correspondiente sería así.

En efecto, esta expresión indica que la compatibilidad de la frase Q A’s son B’s con las denotaciones de A y B es igual al grado con que la proporción de B’s en A se ajusta a la denotación de Q.

Por ejemplo, si Q, mayoría y si este cuantificador viene dado por la relación «MAYORIA» [proporción; µ] en la BDE entonces es el valor µ correspondiente a la proporción = contaje (B/A) en la relación «MAYORIA».


Subir

Veamos finalmente dos ejemplos más completos:

1.   Consideramos de nuevo la frase:

p Ramón vive en una pequeña ciudad cerca de Barcelona

con la BDE

BDE RESIDENCIA [Nombre; Ciudad]
           CIUDAD-PEQUEÑA [Ciudad; µ]
           CERCA [Ciudad1; Ciudad2; µ]

En Residencia, Ciudad es la ciudad en la que reside Nombre; en «CIUDAD-PEQUEÑA»; µ es el grado en que cada ciudad es pequeña; y en «CERCA»; µ es el grado de cercanía entre Ciudad1 y Ciudad2.

El conjunto difuso de «las ciudades cercanas a Barcelona» se puede expresar por:

CCB Ciudad1 CERCA [Ciudad2 = Barcelona]

lo que permite calcular:

1 = µCCB ( ciudad RESIDENCIA [Nombre = Ramón])

a continuación calculamos:

2 = µCIUDAD-PEQUEÑA ( ciudad RESIDENCIA [Nombre = Ramón])

y finalmente

= min (1, 2)

2. Sea la frase

ƒ la mayoría de los jugadores de baloncesto son muy altos

y la correspondiente BDE:

JUGADORES [Nombre; Altura]
ALTO [Altura; µ]
MAYORÍA [proporción;µ]

primeramente hallamos altura de cada jugador:

ALTURA (nombrei) = ALTURA JUGADORES [Nombre = Nombrei]

A continuación, para cada i, hallar el grado con que Nombrei es ALTO

µi = µALTO [ALTURA (Nombrei)]

ello permite calcular el cardinal del conjunto de jugadores altos

contaje (ALTO)= µ1 + ... + µN

y la proporción de jugadores altos será 1/N [ contaje (ALTO)].

Finalmente, hallar el grado con el que la proporción calculada satisface la restricción flexible impuesta por el cuantificador «MAYORIA»

= µMAYORIA [1/N contaje (ALTO)]


Subir

Conclusión


Hemos descrito las ideas básicas de la semántica test-score que puede ser considerada como una generalización de las semánticas truth-conditional, possible world y model theoretic. Sin embargo, esta generalizaci6n permite la representación directa de la vaguedad inherente en el lenguaje natural, con lo que se consigue un mayor poder expresivo. Las ideas fundamentales son simples y con algo de práctica es fácil aprender cómo usar los procedimientos descritos.

Lo más difícil es automatizar el proceso por completo, es decir sin ayuda humana. La automatización completa requiere progresos en inteligencia artificial y, concretamente, en lenguaje natural y en representación del conocimiento.

Referencias bibliográficas


CARNAP, R., Logical Foundations of Probability. Chicago, University of Chicago Press, 1949.

HINTIKKA, J., «Game-theoretical semantics: insights and prospects», Notre Dame Journal of Formal Logic 23 (1982), 219-241.

JANSSEN, T., «Compositionality and the form of rules in Montague grammar», en Proceedings of the Second Amsterdam Symposium on Montague Grammar and Related Topics, Groenendijk, J. and Stokhoff, M. (eds.), 1978.

MC CAWLEY, J. D., Everything that Linguists have Always Wanted to Know about Logic. Chicago, University of Chicago Press, 1981.

NIINILUOTO, I., Truthlikeness. Sysnthese Library, vol. 185, Riedel, Holanda, 1987.

TARSKI, A., «The Semantic Conception of Truth and the Foundations of Semantics», en Philosophy and Phenomenological Research 4 (1944), 341-376.

ZADEH, L. A., «Test-score semantics for natural languages and meaning-representation via PRUF», Tech Note 247, AI Center, SRI International, Menlo Park, CA, 1981. También en: Empirical Semantics, Rieger, B. B. (ed.). Bochum, Brockmeyer, 1981, 281-349.

ZADEH, L. A., «Precisation of meaning via translation into PRUF», en Cognitive Constraints on Communication, Representation and Processes, Vaina, L. and Hintikka, J. (eds.), Dordrecht, Reidel, 1984.

ZADEH, L. A., «Test-score Semantics as a Basis for a Computational Approach to the Representation of Meaning», Literary and Linguistic Computing, vol. 1, núm. 1 (1986), 24-35.
 

Subir
| La lengua española y las nuevas tecnologías |

| Portada del CVC |
| Obras de referencia | Actos culturales | Foros | Aula de lengua | Oteador |
| Rinconete | El trujamán |

| Enviar comentarios |

Centro Virtual Cervantes
© Instituto Cervantes (España), 2003-. Reservados todos los derechos.