|
|
Mesa redonda
José Manuel Pardo Muñoz. Universidad Politécnica de Madrid
|
| |
En primer lugar, definamos «tecnología del habla» como el conjunto de técnicas que
utilizan la señal acústica del habla oral como objeto de trabajo e intentan simular la
capacidad humana de hablar y comunicarse por medio de habla. Con ello se realizan
distintas aplicaciones tecnológicas como es la interacción del hombre con las máquinas
usando lenguaje hablado.
La tecnología del habla podemos dividirla en dos apartados:
Conversión texto-habla: Un texto
codificado en el ordenador se pronuncia automáticamente por el llamado sistema de
conversión texto-habla.
Reconocimiento de habla: El habla pronunciada por un locutor se «entiende» por
el ordenador y se transcribe en texto o se realiza una función determinada.
El habla oral es una expresión acústica de un
lenguaje determinado, por lo que el estudio del lenguaje tal como se realiza por
lingüistas es un elemento importante dentro del desarrollo de la tecnología del habla.
Otros estudiosos del fenómeno del lenguaje a nivel físico, médico, cognitivo y
psicológico contribuyen también directa o indirectamente en el desarrollo de la
tecnología del habla.
Las investigaciones y desarrollos en tecnología del habla suelen realizarse en industrias
de tecnologías de la información y de ordenadores. La cuestión que se plantea en esta
mesa redonda es cuáles son las contribuciones específicas de los lingüistas en el
desarrollo de estas tecnologías. Dividiremos la exposición en los dos apartados en los
que dividimos la tecnología del habla antes mencionados.
Conversión texto-habla
La contribución lingüística al desarrollo de los sistemas de conversión texto-habla es
fundamental. Nos referiremos principalmente a la síntesis por formantes. En ella, podemos
diferenciar los apartados de módulos segmentales, módulos suprasegmentales, evaluación
y diagnóstico y síntesis multilocutor y multientorno.
Respecto a la síntesis segmental los lingüistas son un elemento básico en la
definición de las unidades de síntesis, en el análisis espectrográfico de las
unidades, en la transcripción ortográfico-fonética para distintas variedades
dialectales, en la definición del locutor y el corpus oral para extraer esas unidades y
en el estudio de las relaciones entre los segmentos y la sintaxis y el nivel de discurso.
En cuanto a los módulos suprasegmentales, el trabajo fundamental requerido concierne al
estudio de las relaciones de la prosodia con la sintaxis, semántica, nivel de discurso y
diferentes estilos de habla e idiosincrasias del locutor. También es importante su
contribución en el desarrollo de analizadores sintácticos y semánticos y en la
definición de las unidades sintácticas y semánticas pertinentes.
En el nivel de evaluación y diagnóstico de los conversores texto-habla se trata por un
lado de analizar el funcionamiento de cada módulo en el sistema y diagnosticar los
posibles problemas de los mismos y del sistema total, al objeto de tener datos para poder
comparar entre sistemas y mejorar los mismos. En estas tareas, la aportación
lingüística es importante en la definición del material constituyente de los test
segmentales y prosódicos y en la definición del método a seguir para realizar dichos
tests.
Respecto a la síntesis de diferentes situaciones y locutores el trabajo lingüístico
consiste en realizar análisis comparativos de los diferentes estilos del habla oral y de
sus relaciones con las características y situaciones de los distintos locutores. |
 |
Reconocimiento de habla
En reconocimiento de habla, la participación lingüística se centra en los siguientes
puntos:
Estudio de las relaciones
entre unidades fonéticas obtenidas estadísticamente y las unidades fonéticas utilizadas
tradicionalmente en lingüística.
Definición y estrategia necesarias para optimizar el uso de estas unidades
utilizando análisis espectrográficos.
Definición de reglas fonológicas y fonéticas para las distintas variedades
dialectales (reglas de transcripción grafema-alófono). Este apartado coincide con una
necesidad en conversión texto-habla.
Definición de unidades sintácticas y semánticas para analizadores
sintáctico-semánticos utilizados en reconocimiento. Este objetivo coincide también con
un objetivo en síntesis de voz.
Reglas y algoritmos de descomposición de palabras en raíces y sufijos / prefijos
/ afijos para optimizar el acceso a diccionarios.
Definición y organización de los estilos de habla al objeto de dividir el
problema de reconocimiento en conjuntos tratables.
|
 |
Herramientas de utilidad
Para el desarrollo de las tecnologías antes mencionadas, es necesaria la utilización de
corpus textuales y orales y de bases de datos lingüísticas, en cuya definición y
realización es muy importante la colaboración de lingüistas. En concreto, se necesitan
corpus textuales y corpus textuales anotados con categorías sintácticas y semánticas.
Estos corpus muchas veces es necesario realizarlos a mano con ayuda de lingüistas.
Por otro lado, se necesitan también corpus orales (grabaciones de la señal acústica) y
corpus orales anotados con transcripciones ortográficas, fonéticas, dialectales y de
ambiente acústico. En la definición y organización de los mismos es importante la
colaboración lingüística.
Por último, una base de datos lingüística de mucha necesidad es la constitución de
diccionarios electrónicos con anotaciones fonéticas, morfológicas, sintácticas y
semánticas. |
 |
Una experiencia real concreta
El Grupo de Tecnología del Habla del Departamento de Ingeniería Electrónica de la ETSIT
de Madrid viene colaborando desde hace más de doce años con el profesor Quilis y
colaboradores del Departamento de Lengua Española de la UNED en parte de las tareas
anteriores. Fruto de esa colaboración, se han obtenido resultados concretos en
tecnología de conversión texto-habla y reconocimiento de habla. Concretamente los puntos
en los que los lingüistas han desarrollado una actividad importante han sido los
siguientes:
Análisis espectrográfico
para la síntesis segmental en conversores texto-habla
Análisis espectrográfico para el análisis de duraciones de sonidos
Análisis espectrográfico para el análisis y generación de algoritmos de
frecuencia fundamental
Definiciones de corpus orales a grabar para obtener dichos datos en conversión
texto-habla y definición y etiquetado de los mismos para el desarrollo de sistemas de
reconocimiento de habla
Establecimiento de relaciones entre sintaxis y prosodia
Definición y desarrollo de un diccionario morfológico
Elección de prototipos fonéticos iniciales a utilizar en el desarrollo de un
sistema de reconocimiento de habla que usa reglas heurísticas
|
 |
Conclusión
Como conclusión, puedo decir que nuestra experiencia de colaboración con lingüistas ha
sido muy positiva y además pensamos que es necesaria para llevar a buen término
cualquier desarrollo en lo que hemos denominado tecnologías del habla. |
|
|
|

| La lengua española y las
nuevas tecnologías |
| Portada del CVC |
| Obras de referencia | Actos culturales | Foros | Aula de lengua | Oteador |
| Rinconete | El trujamán |
| Enviar comentarios |
Centro
Virtual Cervantes
© Instituto Cervantes (España), 2003-. Reservados todos los derechos.
|
|