Centro Virtual Cervantes

Obras de referenciaCongresos de la lengua

Congreso de Sevilla

Inicio



INTELIGENCIA ARTIFICIAL Y LENGUA ESPAÑOLA

Congreso de Sevilla
 

Mesa redonda
José Manuel Pardo Muñoz. Universidad Politécnica de Madrid

 
En primer lugar, definamos «tecnología del habla» como el conjunto de técnicas que utilizan la señal acústica del habla oral como objeto de trabajo e intentan simular la capacidad humana de hablar y comunicarse por medio de habla. Con ello se realizan distintas aplicaciones tecnológicas como es la interacción del hombre con las máquinas usando lenguaje hablado.

La tecnología del habla podemos dividirla en dos apartados:

Conversión texto-habla: Un texto codificado en el ordenador se pronuncia automáticamente por el llamado sistema de conversión texto-habla.

Reconocimiento de habla: El habla pronunciada por un locutor se «entiende» por el ordenador y se transcribe en texto o se realiza una función determinada.

El habla oral es una expresión acústica de un lenguaje determinado, por lo que el estudio del lenguaje tal como se realiza por lingüistas es un elemento importante dentro del desarrollo de la tecnología del habla. Otros estudiosos del fenómeno del lenguaje a nivel físico, médico, cognitivo y psicológico contribuyen también directa o indirectamente en el desarrollo de la tecnología del habla.

Las investigaciones y desarrollos en tecnología del habla suelen realizarse en industrias de tecnologías de la información y de ordenadores. La cuestión que se plantea en esta mesa redonda es cuáles son las contribuciones específicas de los lingüistas en el desarrollo de estas tecnologías. Dividiremos la exposición en los dos apartados en los que dividimos la tecnología del habla antes mencionados.

Conversión texto-habla

La contribución lingüística al desarrollo de los sistemas de conversión texto-habla es fundamental. Nos referiremos principalmente a la síntesis por formantes. En ella, podemos diferenciar los apartados de módulos segmentales, módulos suprasegmentales, evaluación y diagnóstico y síntesis multilocutor y multientorno.

Respecto a la síntesis segmental los lingüistas son un elemento básico en la definición de las unidades de síntesis, en el análisis espectrográfico de las unidades, en la transcripción ortográfico-fonética para distintas variedades dialectales, en la definición del locutor y el corpus oral para extraer esas unidades y en el estudio de las relaciones entre los segmentos y la sintaxis y el nivel de discurso.

En cuanto a los módulos suprasegmentales, el trabajo fundamental requerido concierne al estudio de las relaciones de la prosodia con la sintaxis, semántica, nivel de discurso y diferentes estilos de habla e idiosincrasias del locutor. También es importante su contribución en el desarrollo de analizadores sintácticos y semánticos y en la definición de las unidades sintácticas y semánticas pertinentes.

En el nivel de evaluación y diagnóstico de los conversores texto-habla se trata por un lado de analizar el funcionamiento de cada módulo en el sistema y diagnosticar los posibles problemas de los mismos y del sistema total, al objeto de tener datos para poder comparar entre sistemas y mejorar los mismos. En estas tareas, la aportación lingüística es importante en la definición del material constituyente de los test segmentales y prosódicos y en la definición del método a seguir para realizar dichos tests.

Respecto a la síntesis de diferentes situaciones y locutores el trabajo lingüístico consiste en realizar análisis comparativos de los diferentes estilos del habla oral y de sus relaciones con las características y situaciones de los distintos locutores.


Subir


Reconocimiento de habla

En reconocimiento de habla, la participación lingüística se centra en los siguientes puntos:

— Estudio de las relaciones entre unidades fonéticas obtenidas estadísticamente y las unidades fonéticas utilizadas tradicionalmente en lingüística.

— Definición y estrategia necesarias para optimizar el uso de estas unidades utilizando análisis espectrográficos.

— Definición de reglas fonológicas y fonéticas para las distintas variedades dialectales (reglas de transcripción grafema-alófono). Este apartado coincide con una necesidad en conversión texto-habla.

— Definición de unidades sintácticas y semánticas para analizadores sintáctico-semánticos utilizados en reconocimiento. Este objetivo coincide también con un objetivo en síntesis de voz.

— Reglas y algoritmos de descomposición de palabras en raíces y sufijos / prefijos / afijos para optimizar el acceso a diccionarios.

— Definición y organización de los estilos de habla al objeto de dividir el problema de reconocimiento en conjuntos tratables.


Subir

Herramientas de utilidad

Para el desarrollo de las tecnologías antes mencionadas, es necesaria la utilización de corpus textuales y orales y de bases de datos lingüísticas, en cuya definición y realización es muy importante la colaboración de lingüistas. En concreto, se necesitan corpus textuales y corpus textuales anotados con categorías sintácticas y semánticas. Estos corpus muchas veces es necesario realizarlos a mano con ayuda de lingüistas.

Por otro lado, se necesitan también corpus orales (grabaciones de la señal acústica) y corpus orales anotados con transcripciones ortográficas, fonéticas, dialectales y de ambiente acústico. En la definición y organización de los mismos es importante la colaboración lingüística.

Por último, una base de datos lingüística de mucha necesidad es la constitución de diccionarios electrónicos con anotaciones fonéticas, morfológicas, sintácticas y semánticas.

Subir

Una experiencia real concreta


El Grupo de Tecnología del Habla del Departamento de Ingeniería Electrónica de la ETSIT de Madrid viene colaborando desde hace más de doce años con el profesor Quilis y colaboradores del Departamento de Lengua Española de la UNED en parte de las tareas anteriores. Fruto de esa colaboración, se han obtenido resultados concretos en tecnología de conversión texto-habla y reconocimiento de habla. Concretamente los puntos en los que los lingüistas han desarrollado una actividad importante han sido los siguientes:

— Análisis espectrográfico para la síntesis segmental en conversores texto-habla

— Análisis espectrográfico para el análisis de duraciones de sonidos

— Análisis espectrográfico para el análisis y generación de algoritmos de frecuencia fundamental

— Definiciones de corpus orales a grabar para obtener dichos datos en conversión texto-habla y definición y etiquetado de los mismos para el desarrollo de sistemas de reconocimiento de habla

— Establecimiento de relaciones entre sintaxis y prosodia

— Definición y desarrollo de un diccionario morfológico

— Elección de prototipos fonéticos iniciales a utilizar en el desarrollo de un sistema de reconocimiento de habla que usa reglas heurísticas


Subir

Conclusión


Como conclusión, puedo decir que nuestra experiencia de colaboración con lingüistas ha sido muy positiva y además pensamos que es necesaria para llevar a buen término cualquier desarrollo en lo que hemos denominado tecnologías del habla.
 

Subir
| La lengua española y las nuevas tecnologías |

| Portada del CVC |
| Obras de referencia | Actos culturales | Foros | Aula de lengua | Oteador |
| Rinconete | El trujamán |

| Enviar comentarios |

Centro Virtual Cervantes
© Instituto Cervantes (España), 2003-. Reservados todos los derechos.