|
|
Sobre la
representación de la imprecisión del lenguaje natural mediante conjuntos difusos
Ramón López de Mantarás. Instituto de Investigación en
Inteligencia Artificial (IIA). Centro de estudios avanzados de Blanes, CSIC |
|
Introducción
Durante las últimas décadas el tratamiento del lenguaje natural se ha convertido en una
de las áreas más importantes de investigación en inteligencia artificial. Ello ha
estimulado el desarrollo de teorías semánticas computacionales (McCawley, 1981),
(Hintikka, 1982), (Janssen, 1978), (Niiniluoto, 1987), (Zadeh, 1981, 1984 y 1986).
Los enfoques tradicionales (truth-conditional, possible world, Montague,
Model-Theoretic) están basados en lógicas bivaluadas que suponen que la extensión
de un predicado es un conjunto clásico. Sin embargo, en general, el lenguaje natural se
caracteriza por la presencia de predicados vagos cuya extensión no son conjuntos
clásicos sino conjuntos difusos, es decir conjuntos tales que la transición entre
pertenencia y no pertenencia es gradual en lugar de abrupta. A partir de esta
observación, Zadeh (1981, 1984,1986) ha propuesto una teoría semántica computacional
denominada test-score. En el resto de este artículo se describen los
conceptos básicos de esta teoría. |
 |
El problema de la vaguedad
El principal problema que se plantea a la hora de querer darle un tratamiento a la posible
vaguedad presente en la información e inherente al lenguaje natural, es decir cuál es el
concepto de verdad aplicable. Tarski, en su teoría semántica de la verdad (Tarski,
1944), dice que la solución que él propone es «rigurosa» para aquellos lenguajes con
una estructura «exactamente especificada», pero es sólo «aproximada» para los
lenguajes naturales.
El lenguaje natural no está especificado de una forma exacta ni sintáctica ni
semánticamente. Los enunciados sintácticamente mal formados no plantean problemas desde
el punto de vista tarskiano, ya que no hay ninguna razón para asociarles valores de
verdad. Por otro lado, si un enunciado es sintácticamente ambiguo entre dos o más
lecturas, Tarski permite asignar un valor de verdad a cada lectura por separado.
Por contra, los enunciados semánticamente mal especificados o imprecisos lo son por el
hecho de contener distintas expresiones vagas, mal definidas, pudiendo incluir tanto
predicados (grande, joven, etc.), modificadores (casi, aproximadamente, etc.)
o cuantificadores (muchos, pocos, etc.). Esto plantea problemas que no pueden ser
tratados dentro del marco de la semántica clásica.
En algunos casos, el uso de expresiones vagas está basado esencialmente en razones
epistémicas. Es decir, aunque nuestro lenguaje L sea semánticamente impreciso, podemos
suponer que existe L de L semánticamente precisa pero que puede no ser útil por
razones prácticas (por ejemplo, el coste de «precisar» puede ser demasiado alto, o bien
puede ser muy difícil medir los conceptos de L). Este proceso por el cual se puede
pasar de una expresión vaga a su correspondiente expresión exacta fue denominado por
Carnap «explicación» (Carnap, 1949).
Así pues, la vaguedad epistémica tampoco presenta en principio problemas graves a la
teoría de la verdad de Tarski. Un enunciado vago de un lenguaje L se convierte en una
disyunción de enunciados precisos en una extensión precisa L de L, y por tanto
sobre esta disyunción es aplicable la definición tarskiana de verdad.
Ahora bien, a veces los contornos o fronteras dados por el método de la «explicación»
parecen muy arbitrarios, por ejemplo, «X es calvo si X tiene menos de 200 cabellos en su
cabeza», o bien «la mayoría de A son B si, y sólo si, como mínimo el 90 % de A son
B». Algunas expresiones no parecen pues admitir fácilmente una explicación. La razón
es que son expresiones inherentemente o semánticamente vagas. En estos casos no hay una
caracterización precisa de sus significados que podría fijar de forma unívoca sus
interpretaciones en la realidad (mundo real).
Una posible solución propuesta en (Niiniluoto, 1987) para la explicación de un concepto
semánticamente vago es la siguiente. Supongamos que un concepto M se aplica sobre un
conjunto de casos paradigma a1,
.... an
perteneciente a un Universo U. Entonces el método llamado de los ejemplos paradigmáticos
propugna que M se aplicará también sobre otros casos en la medida que éstos sean
suficientemente similares a alguno de los a1, .... an. A tal fin, supongamos
que tengamos definida una medida de similitud S entre los elementos del universo U.
Entonces parece natural considerar la extensión de M de una forma continua, definiendo
para cada objeto x de U un grado de pertenencia a M proporcional al siguiente
valor:max {S(x,ai)|i = 1, ..., n}
Esta solución es muy
próxima en espíritu a la que propone la teoría de los conjuntos difusos (Zadeh, 1965).
De hecho, lo que propone es una interpretación particular (métrica) de los grados de
pertenencia a un conjunto difuso.
Por otro lado, la teoría de los conjuntos difusos, la solución más aceptada, proviene
de una interpretación filosóficamente distinta, basada principalmente en un concepto de
verdad parcial. Esta interpretación proviene de proponer como solución para los casos de
indeterminismo semántico la introducción de un nuevo valor de verdad, «indeterminado»,
además de los valores clásicos «cierto» y «falso». Esto lleva en principio a las
lógicas a tres valores, como las de Lukasiewicz o Kleene. De una forma más general, en
las lógicas infinitamente valuadas, un enunciado puede tener como valor de verdad
cualquier real entre 0 y 1. Como es bien conocido, por ejemplo, en la lógica L- de
Lukasiewicz, los valores de verdad para enunciados compuestos se definen por las
siguientes reglas:
v (¬p) = 1
v (p)
v (p q) = min [v (p), v (q)]
v (p v q) = max [v (p), v (q)]
v (p q) = min [1,1 v
(p), + v (q)]
Estas definiciones
pueden ser consideradas como reglas para determinar las extensiones difusas de fórmulas
atómicas con predicados vagos. Así por ejemplo, si M es un predicado vago unario, se
puede definir la extensión difusa de M a través de la función característica.
µM (a) = verdad [M (a)]
Es decir, si consideramos por ejemplo el predicado alto, que
aplica sobre alturas, el grado de pertenencia de una altura, digamos 170 cm, al conjunto
difuso alto es igual al grado de verdad de la proposición «ser alto» cuando la
altura es 170 cm.
Para fórmulas compuestas, siguiendo las anteriores reglas, las extensiones se definirían
como:
µ¬ M (a) = 1 µM(a)
µM N (a) = min [µM
(a), µM (a)]
µM V N (a) = max [µM
(a), µM (a)]
µM N (a) = min [1,1 µM (a) + µN (a)]
De esta forma, la
teoría de los conjuntos difusos, introducida por Zadeh en el año 1965, aparece de forma
natural como un formalismo para la representación de predicados vagos en estrecha
relación con la lógica a infinitos valores de Lukasiewicz. |
 |
Semántica «Test-Score» de
ZadehLa
teoría de conjuntos difusos permite extender el principio de composicionalidad de Frege
de manera a posibilitar su aplicación a los lenguajes naturales. En lugar de representar
el significado de una frase mediante la composición de los significados de sus
constituyentes, la teoría de conjuntos difusos permite representarlo a partir del
significado de una colección de relaciones difusas llamada «base de datos explicativa».
Con esta nueva interpretación de la composicionalidad, el principio de Frege proporciona
una base para representar el significado de descripciones complejas. Concretamente, puede
utilizarse para representar el significado de frases que contienen: predicados vagos (alto,
joven, etc.), cuantificadores vagos (varios, muchos, etc.), modificadores (muy,
bastante, etc.) y cualificadores (posible, cierto, probable, etc.).
La extensión propuesta por Zadeh del principio de composicionalidad de Frege da lugar a
la semántica test-score (Zadeh, 1986). En ella, toda entidad semántica (frase,
predicado, cuantificador, etc.) está considerada como un sistema de restricciones
flexibles. Por ejemplo, la frase «María es alta» induce una restricción flexible sobre
la posible altura de María donde la flexibilidad de la restricción está caracterizada
por el conjunto difuso ALTA, es decir que el grado de pertenencia µALTA(x)
al conjunto ALTA de cada valor x de la altura es el valor de la posibilidad de que
la altura de María sea x.
Concretamente, la representación del significado de una frase f, mediante el uso
de la semántica test-score viene dada por el siguiente procedimiento:
1.
Identificación de las variables X1, .... Xn cuyos valores restringe la proposición. Generalmente estas
variables son implícitas.
2. Identificación de las restricciones R1,
... Rm inducidas por .
3. Caracterización de cada una de las restricciones, Ri,
mediante la descripción de un procedimiento de test que asocia una puntuación (test-score)
Ti a cada Ri, indicando
en qué grado se satisface la restricción. Generalmente Ti
es un valor del intervalo [0,1].
4. Agregación de las puntuaciones
1, ... m obteniendo una puntuación global
de .
Es importante señalar que el
significado de no está representado por el test-score global
sino por el procedimiento descrito que conduce
a .
Los test de las restricciones inducidas por se realiza en base a una
colección de relaciones que constituyen una base de datos explicativa (BDE). La
hipótesis básica de la semántica test-score es que las relaciones en la base de
datos son conocidas para el agente (persona u ordenador) que lleva a cabo el proceso de
representación del significado.
Por ejemplo, la frase «Ramón vive en una pequeña ciudad cerca de Barcelona» necesita
la siguiente BDE para aplicar el procedimiento de test descrito.
BDE
RESIDENCIA [Nombre; Ciudad]
CIUDAD-PEQUEÑA [Ciudad; µ]
CERCA [Ciudad1;
Ciudad2; µ]
donde µ es el grado en que cada ciudad es
pequeña en la relación CIUDAD-PEQUEÑA y el grado en que Ciudad1 es cercana a
Ciudad2 en la relación CERCA.
Para llevar a cabo la agregación de las puntuaciones
1,...., m es necesario disponer del
siguiente conjunto de reglas basadas en las operaciones estándar sobre conjuntos difusos. |
 |
Reglas relativas a modificación
Si la puntuación correspondiente a una restricción flexible R en un contexto dado es T,
entonces, en este mismo contexto, la puntuación para:
a) «No R» es 1
(negación)
b) «Muy R» es 2
(intensificación)
c) «Más o menos R» es
½
(relajación)
Reglas relativas a composición
Si las puntuaciones correspondientes a las restricciones R1 y R2 en
un contexto dado son 1 y
2, entonces, en el mismo contexto,
la puntuación para
a) R1
y R2 es min ( 2,
2)
b) R1 o R2 es max
( 2,
2)
c) Si R1 entonces R2
es min (1,1 1
+ 2)
Reglas relativas a la
cuantificación
Se aplican a frases del tipo Q As son Bs (por ejemplo «la mayoría de los
estudiantes son solteros») donde Q es el cuantificador. A menudo el cuantificador está
implícito como por ejemplo en la frase «comer demasiado produce obesidad» en la que el
cuantificador implícito es «la mayoría» (la mayoría de los que comen demasiado son
obesos).
Para representar los cuantificadores vagos es necesario definir la cardinalidad de un
conjunto difuso.
Existen varias propuestas, la más conocida es la siguiente:
Sea F el conjunto difuso expresado
por:
F = µ1|µ1
+ µ2| µ2 + ... + µ2|un
Donde µi
es el grado de pertenencia de u1 a F y «+» denota
unión; entonces la cardinalidad de F o .
contaje (F) es la suma de los n grados de pertenencia, es decir así.
La cardinalidad relativa contaje (F/G) se puede interpretar como la proporción
de elementos de F que están en G. Es decir
así.
siendo F G la
intersección de los conjuntos difusos F y G. Entonces, en términos de las funciones de
pertenencia de F y G, la cardinalidad relativa será así.
El concepto de cardinalidad
relativa permite interpretar el significado de frases del tipo Q As son Bs
mediante la expresión . contaje (B/A) son Q. Es decir que el test-score correspondiente
sería así.
En efecto, esta expresión indica
que la compatibilidad de la frase Q As son Bs con las denotaciones de A y B es
igual al grado con que la proporción de Bs en A se ajusta a la denotación de Q.
Por ejemplo, si Q ,
mayoría y si este cuantificador viene dado por la relación «MAYORIA» [proporción; µ]
en la BDE entonces es el valor µ
correspondiente a la proporción = contaje (B/A) en la relación «MAYORIA». |
 |
Veamos finalmente dos ejemplos más completos:
1. Consideramos de nuevo la frase:
p Ramón vive en
una pequeña ciudad cerca de Barcelona
con la BDE
BDE RESIDENCIA [Nombre;
Ciudad]
CIUDAD-PEQUEÑA [Ciudad;
µ]
CERCA [Ciudad1;
Ciudad2; µ]
En Residencia, Ciudad es la ciudad en la que reside Nombre; en «CIUDAD-PEQUEÑA»;
µ es el grado en que cada ciudad es pequeña; y en «CERCA»; µ es el grado de
cercanía entre Ciudad1 y Ciudad2.
El conjunto difuso de «las ciudades cercanas a Barcelona» se puede expresar por:
CCB Ciudad1 CERCA
[Ciudad2 = Barcelona]
lo que permite calcular:
1 = µCCB ( ciudad
RESIDENCIA [Nombre = Ramón])
a continuación calculamos:
2 = µCIUDAD-PEQUEÑA ( ciudad
RESIDENCIA [Nombre = Ramón])
y finalmente
= min ( 1,
2)
2. Sea la frase
la mayoría de los
jugadores de baloncesto son muy altos
y la correspondiente BDE:
JUGADORES [Nombre; Altura]
ALTO [Altura; µ]
MAYORÍA [proporción;µ]
primeramente hallamos altura de cada jugador:
ALTURA (nombrei) = ALTURA
JUGADORES [Nombre = Nombrei]
A continuación, para cada i, hallar el
grado con que Nombrei es ALTO
µi = µALTO [ALTURA
(Nombrei)]
ello permite calcular el cardinal del conjunto de
jugadores altos
contaje
(ALTO)= µ1 + ... + µN
y la proporción de jugadores altos será 1/N [
contaje (ALTO)].
Finalmente, hallar el grado con el que la proporción calculada satisface la restricción
flexible impuesta por el cuantificador «MAYORIA»
= µMAYORIA [1/N contaje
(ALTO)] |
 |
Conclusión
Hemos descrito las ideas básicas de la semántica test-score que puede ser
considerada como una generalización de las semánticas truth-conditional, possible
world y model theoretic. Sin embargo, esta generalizaci6n permite la
representación directa de la vaguedad inherente en el lenguaje natural, con lo que se
consigue un mayor poder expresivo. Las ideas fundamentales son simples y con algo de
práctica es fácil aprender cómo usar los procedimientos descritos.
Lo más difícil es automatizar el proceso por completo, es decir sin ayuda humana. La
automatización completa requiere progresos en inteligencia artificial y, concretamente,
en lenguaje natural y en representación del conocimiento.
Referencias bibliográficas
CARNAP, R., Logical Foundations of
Probability. Chicago, University of Chicago Press, 1949.
HINTIKKA, J., «Game-theoretical semantics: insights and prospects», Notre Dame
Journal of Formal Logic 23 (1982), 219-241.
JANSSEN, T., «Compositionality and the form of rules in Montague grammar», en Proceedings
of the Second Amsterdam Symposium on Montague Grammar and Related Topics, Groenendijk,
J. and Stokhoff, M. (eds.), 1978.
MC CAWLEY, J. D., Everything that Linguists have Always Wanted to Know about Logic. Chicago,
University of Chicago Press, 1981.
NIINILUOTO, I., Truthlikeness. Sysnthese Library, vol. 185, Riedel, Holanda, 1987.
TARSKI, A., «The Semantic Conception of Truth and the Foundations of Semantics», en Philosophy
and Phenomenological Research 4 (1944), 341-376.
ZADEH, L. A., «Test-score semantics for natural languages and meaning-representation via
PRUF», Tech Note 247, AI Center, SRI International, Menlo Park, CA, 1981. También
en: Empirical Semantics, Rieger, B. B. (ed.). Bochum, Brockmeyer, 1981, 281-349.
ZADEH, L. A., «Precisation of meaning via translation into PRUF», en Cognitive
Constraints on Communication, Representation and Processes, Vaina, L. and Hintikka, J.
(eds.), Dordrecht, Reidel, 1984.
ZADEH, L. A., «Test-score Semantics as a Basis for a Computational Approach to the
Representation of Meaning», Literary and Linguistic Computing, vol. 1, núm. 1
(1986), 24-35. |
|
|
|

| La lengua española y las
nuevas tecnologías |
| Portada del CVC |
| Obras de referencia | Actos culturales | Foros | Aula de lengua | Oteador |
| Rinconete | El trujamán |
| Enviar comentarios |
Centro
Virtual Cervantes
© Instituto Cervantes (España), 2003-. Reservados todos los derechos.
|
|