Joaquim Llisterri y Juan M. Garrido Almiñana
El desarrollo de la ingeniería lingüística en España, como en los demás países de nuestro entorno, viene condicionado tanto por el marco legal que rige las actividades de investigación y desarrollo tecnológico (I+D) en el contexto nacional como por los programas marco europeos. Por tal motivo, se inicia este apartado con una sucinta revisión de ambos aspectos.
El marco general para la investigación y el desarrollo tecnológico en España se estableció, como es sabido, en 1986 con la promulgación de la Ley de Fomento y Coordinación General de la Investigación Científica y Técnica, más conocida como «Ley de la Ciencia». La aplicación de esta ley ha resultado de los sucesivos Planes Nacionales de Investigación y Desarrollo Tecnológico, iniciados en 1988, de cuya coordinación general es responsable la Comisión Interministerial de Ciencia y Tecnología y de cuya ejecución se encarga la Secretaría General del Plan Nacional de I+D en la Dirección General de Investigación y Desarrollo del Ministerio de Educación y Cultura.
Si el I Plan Nacional (1988-1991) se orientó a cubrir las deficiencias del denominado «Sistema Español de Ciencia-Tecnología-Industria», el II Plan (1992-1995) fue el marco de un debate sobre política industrial, en el que se plantearon los problemas derivados de la transferencia de tecnología y de las necesarias relaciones entre el mundo universitario y el empresarial. Por consiguiente, en el III Plan Nacional (1996-1999) se ha prestado una especial atención a estos aspectos, mediante el Programa Nacional de Fomento de la Articulación del Sistema Ciencia-Tecnología-Industria (PACTI) complementado con la iniciativa ATYCA (Iniciativa de Apoyo a la Tecnología, la Seguridad y la Calidad Industrial), entre cuyas acciones se encuentra la promoción de la investigación y el desarrollo en la empresa.
El actual Plan Nacional de I+D se divide en diversos programas, en el marco de algunos de los cuales es posible llevar a cabo proyectos en el ámbito de la ingeniería lingüística, tal como se expone brevemente a continuación. En el apartado Proyectos con financiación nacional se resumen los datos generales relativos a estos proyectos.
Mencionaremos en primer lugar el Programa Nacional de Aplicaciones y Servicios Telemáticos, en el que se enmarcan proyectos destinados a ofrecer servicios basados en las tecnologías de las comunicaciones, como pueda ser el acceso a documentación y su búsqueda y extracción automatizada o la enseñanza a distancia.
Como se ha visto en la primera parte de este trabajo, uno de los campos de aplicación de la ingeniería lingüística es precisamente la recuperación de información mediante técnicas propias del procesamiento del lenguaje natural, por lo que este programa ofrece oportunidades para el desarrollo de este tipo de proyectos; la enseñanza de lenguas a distancia puede igualmente beneficiarse, como ya se ha indicado, de las técnicas y herramientas propias de la ingeniería lingüística en el marco de este programa.
En segundo lugar, cabe citar el Programa Nacional de Tecnologías de la Información y de las Comunicaciones. Una de las tareas que propone está específicamente dedicada al tratamiento de señales en las telecomunicaciones, incluyendo la codificación del habla. Igualmente se proponen proyectos en el área de la inteligencia artificial, entre los que se cuentan los relacionados con los interfaces multimodales es decir, sistemas de acceso a la información electrónica utilizando texto, imágenes y voz y con el procesamiento de la información textual. Este programa permite, por tanto, la realización de proyectos encaminados a utilizar las técnicas de entrada y salida de información oral y escrita presentadas en la figura 1 y las propias del procesamiento del habla y del texto resumidas en la figura 2 del apartado anterior. Como veremos en el apartado Programa nacional de tecnologías de la información y de las comunicaciones, existe un importante número de proyectos financiados en este contexto.
Aunque en menor medida que los dos anteriores, el Programa Nacional de Tecnologías Avanzadas de la Producción incluye entre sus líneas de trabajo el desarrollo de interfaces para la comunicación persona-ordenador, campo que, naturalmente, se relaciona de forma directa con la ingeniería lingüística.
Además de los programas nacionales, existen también en el III Plan Nacional de I+D programas denominados sectoriales como el Programa Sectorial de Promoción General del Conocimiento, mediante el que se financia investigación básica como se refleja en el apartado Programa sectorial de promoción general del conocimiento. El desarrollo de recursos lingüísticos constituye, por ejemplo, una actividad que enlaza plenamente con los objetivos del programa.
En el campo de las minusvalías, el Proyecto Integrado para la Tecnología de la Rehabilitación (PITER), en el que participan el Instituto Nacional de Migraciones y Servicios Sociales (IMSERSO), el Centro Estatal de Autonomía Personal y Ayudas Técnicas (CEAPAT), la Fundación ONCE y el CDTI, tiene como uno de sus objetivos el desarrollo de métodos de comunicación alternativos para personas con discapacidades, incluyendo específicamente los sistemas de reconocimiento óptico de caracteres y de reconocimiento y síntesis de habla para su incorporación a diversos entornos, tanto profesionales como domésticos.
En el terreno de la enseñanza, el Programa de Nuevas Tecnologías de la Información y de la Comunicación (PNTIC) del Ministerio de Educación y Cultura ha permitido el desarrollo de más de 3.000 proyectos educativos desde su creación en 1989, promoviendo el uso de las tecnologías de la información y de las comunicaciones en las escuelas e institutos. La enseñanza de lenguas haciendo uso de estas tecnologías es, naturalmente, el objetivo de algunos proyectos llevados a cabo en el marco del PNTIC.
Finalmente, cabe referirse al ya mencionado Programa Nacional de Fomento de la Articulación del Sistema Ciencia-Tecnología-Industria, que incorpora acciones encaminadas a la realización de proyectos concertados entre universidades y empresas, proyectos cooperativos entre empresas y centros tecnológicos y proyectos integrados, orientados a la investigación pre-competitiva. Este programa es de indudable interés para estimular el desarrollo de las industrias de la lengua, promoviendo la cooperación entre grupos de investigación dedicados a la ingeniería lingüística y empresas interesadas en la comercialización de productos que incorporen algunas de las aplicaciones como las mencionadas en la figura 5.
En el ámbito de la transferencia de tecnología y de la colaboración entre el mundo académico y el empresarial es importante también destacar el papel del Centro para el Desarrollo Tecnológico Industrial (CDTI), organismo estatal asignado al Ministerio de Industria y Energía, así como la existencia de una red de 77 Oficinas de Transferencia de Resultados de Investigación (OTRI) en las universidades, centros de investigación y asociaciones empresariales, apoyadas por la Oficina de Transferencia de Tecnología (OTT), adscrita a la Secretaría General del Plan Nacional de I+D.
Los programas nacionales encuentran su complemento en las diversas iniciativas coordinadas por las Comunidades Autónomas: Andalucía, Aragón, las Islas Canarias, Castilla y León, Cataluña, Galicia, Madrid, Valencia y el País Vasco, entre otras comunidades, cuentan con planes propios de investigación y desarrollo y de transferencia de tecnología, muchos de los cuales conceden una especial importancia a las tecnologías de la información y de las comunicaciones campo estrechamente relacionado con la ingeniería lingüística o al estudio de la lengua en sus diversas vertientes.
Este breve recorrido por los programas y los organismos responsables de la investigación y desarrollo en España muestra que, a pesar de la ausencia de un sector específicamente dedicado a la ingeniería lingüística como en los programas europeos que se presentan a continuación, existen diversas posibilidades de realización de proyectos en este ámbito, tanto en lo que se refiere a la investigación básica en procesamiento del lenguaje y del habla como a la investigación más aplicada que puede llevar al desarrollo de productos comerciales.
La investigación en la Unión Europea se rige, de forma parecida a lo que sucede en España, por los Programas Marco, el primero de los cuales se inició en 1984. El contenido y la estructura del actual IV Programa Marco (1994-1998) se han visto, naturalmente, influenciados por el Tratado de Maastrich, que en su Título XV establece las competencias de la Unión y de los Estados Miembros en materia de investigación y desarrollo. En estos momentos han empezado ya los preparativos para el V Programa (1998-2002), que contará con un programa dedicado a la sociedad de la información en el que se integrarán la ingeniería lingüística y las industrias de la lengua.
Los Programas Marco, gestionados por las Direcciones Generales de la Comisión Europea, se subdividen a su vez en programas de diversos tipos. Nos referiremos aquí especialmente a dos de los más directamente relacionados con la ingeniería lingüística y las industrias de la lengua: el Programa de Aplicaciones Telemáticas y el de Tecnologías de la Información.
El Programa de Aplicaciones Telemáticas (TAP) se gestiona desde la Dirección General XIII, encargada de las telecomunicaciones, el mercado de la información y la explotación de la investigación. Sus objetivos generales comprenden el desarrollo de proyectos en todas las áreas en las que pueden aplicarse con éxito las nuevas tecnologías de las comunicaciones administraciones, transporte, investigación, enseñanza, bibliotecas, áreas rurales y urbanas, salud, discapacitados y personas mayores, así como acciones denominadas horizontales, entre las cuales se cuentan la ingeniería lingüística y la ingeniería de la información.
Por lo que se refiere al sector dedicado a la ingeniería lingüística coordinado por una unidad específica de la Dirección General XIII (E-5), con sede en Luxemburgo se contemplan, en el IV Programa Marco, cuatro tipos de proyectos: aplicaciones piloto de la ingeniería lingüística, creación de recursos lingüísticos, investigación básica y acciones de apoyo y difusión. Como veremos más adelante en el apartado Programa de aplicaciones telemáticas, sector de ingeniería lingüística, se han financiado en este sector proyectos principalmente relacionados con los recursos lingüísticos y el procesamiento del lenguaje natural, que han contado con participantes españoles.
En la misma DG XIII/E se inició en 1996 el programa denominado Sociedad de la Información Multilingüe (SIML), estructurado en tres grandes líneas: creación de un marco europeo de servicios relacionados con los recursos lingüísticos, promoción del uso de las tecnologías lingüísticas y promoción del uso de herramientas avanzadas de tratamiento lingüístico en el sector público. Se han previsto también medidas de apoyo orientadas a evaluar el impacto social y económico del multilingüismo en Europa y a aumentar el conocimiento del potencial de la ingeniería lingüística por parte de sus futuros usuarios. Por el momento, aún no se han iniciado los proyectos concretos que se desarrollarán en este marco.
El Programa de Tecnologías de la Información (ESPRIT) está gestionado desde la Dirección General XIII, con competencias sobre la industria. ESPRIT incluye, entre otras, acciones dedicadas a la investigación a largo plazo, a las tecnologías del software, y a los sistemas multimedia, junto con actividades de coordinación y apoyo como las Redes de Excelencia, una de las cuales ELSNET, European Network in Language and Speech se dedica a la ingeniería lingüística. En lo que se refiere al campo que nos ocupa, en el marco del programa ESPRIT se han financiado especialmente proyectos en el área de las tecnologías del habla, tal como se hará patente en el apartado Programa de tecnologías de la información (ESPRIT).
Una vez presentado el marco general en el que se insertan los diferentes proyectos y actividades relacionados con la ingeniería lingüística y las industrias de la lengua, puede ser útil llevar a cabo una breve revisión del desarrollo de este campo en nuestro país en los últimos años, en lo que se refiere especialmente a la lengua española.
Probablemente, la primera vez que en España surgió una iniciativa institucional relacionada con la ingeniería lingüística fue en 1990, con la creación del programa de Tecnología Lingüística en el Área de Industrias de la Lengua de la Sociedad Estatal Quinto Centenario, continuado hasta 1992. Los principales resultados obtenidos en el área de los recursos lingüísticos por ejemplo el Archivo Digital de Manuscritos y Textos Españoles (ADMYTE) o el Corpus de Referencia de la Lengua Española Contemporánea la terminología con la constitución de la Red Iberoamericana de Terminología y los programas educativos se resumen en el informe sobre la lengua española en las autopistas de la información publicado por FUNDESCO en 1996 (pp. 27-30).
También el organismo constituido como Pabellón de España, con motivo de la Exposición Universal de Sevilla en 1992, prestó atención a las industrias de la lengua, con la organización de un congreso monográfico en Barcelona en 1991 titulado «Simposio de la Lengua Española. Ciencia y Tecnología», y con una sección dedicada a la lengua española y las nuevas tecnologías, en el Congreso de la Lengua Española celebrado en Sevilla en 1992, en colaboración con el Instituto Cervantes y bajo los auspicios de la Real Academia Española. En ambas ocasiones se contó con representantes del mundo universitario, así como de las empresas que en España llevan a cabo proyectos relacionados con el procesamiento del lenguaje y del habla y sus aplicaciones.
Con objeto de promover la participación española en proyectos europeos del IV Programa Marco, en 1993 se celebró en Madrid la conferencia «Lengua y Tecnología 2000», organizada por la Comisión de las Comunidades Europeas en colaboración con el Ministerio de Industria y Energía, el de Educación y Ciencia, la Sociedad Estatal Quinto Centenario, la Casa de América y el Instituto Cervantes; en esta reunión se presentaron diversos proyectos en curso en España así como los programas europeos en el ámbito de la ingeniería lingüística, congregando a expertos tanto de las universidades como del entorno empresarial.
Finalmente, en 1994 el Ministerio de Industria y Energía concedió, en el marco del Plan de Actuación Tecnológico Industrial-PEIN IV, una subvención al Instituto Cervantes para la creación y puesta en marcha del Observatorio Español de Industrias de la Lengua, que inició sus actividades durante 1995.
El Observatorio Español de Industrias de la Lengua (OEIL), cuyos fines son acordes a las actividades de difusión de la lengua y promoción de su investigación que el Instituto Cervantes tiene encomendadas, se concibe como un foco en el que se concentren los datos disponibles sobre las industrias de la lengua y la ingeniería lingüística en España, al que puedan acudir las personas u organismos interesados en recibir una serie de servicios de información y asesoramiento.
También forma parte de sus funciones organizar actividades de promoción orientadas a diversos sectores, informar sobre las posibilidades de formación, y difundir los programas europeos en el campo de la ingeniería lingüística a fin de alcanzar una mayor participación en los mismos, así como la realización de estudios de prospectiva orientados tanto al mercado como a la definición de campos estratégicos de investigación.
Hasta la fecha, el OEIL ha participado en proyectos relacionados con la creación de estándares en ingeniería lingüística (EAGLES) y con la promoción del sector (MAP-SPAIN y EUROMAP), y ha recogido y distribuido información sobre recursos lingüísticos y sobre grupos de investigación, en este último caso en colaboración con la Sociedad Española para el Procesamiento del Lenguaje Natural. Mantiene igualmente un servicio de atención a consultas por correo electrónico, una lista de difusión y una serie de páginas web a través de las cuales da a conocer sus actividades, complementadas con la participación en los seminarios y congresos relacionados con su ámbito de actuación.
Esta sucinta reseña histórica lleva a concluir que las industrias de la lengua y la ingeniería lingüística han sido objeto de un interés institucional en España desde 1990, llevándose a cabo actividades de muy diversa naturaleza, tanto en lo que se refiere a la organización de encuentros, el establecimiento de un programa de trabajo y la creación de un centro destinado a difundir información sobre el sector.
Indudablemente, los grupos de investigación y algunas empresas interesadas en la ingeniería lingüística requerían, al igual que sucede en otras especialidades y en otros países, una organización que aglutinara sus esfuerzos y permitiera la realización de actividades conjuntas. Por este motivo, en 1984 se fundó la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), con el objetivo de promover actividades relacionadas con la investigación, el desarrollo y la enseñanza en el ámbito que da nombre a la asociación.
Desde hace trece años la SEPLN celebra un congreso anual de dos o tres días de duración, organizado por una universidad española, en el que tienen lugar tanto conferencias y comunicaciones como mesas redondas y sesiones de demostración. La asociación publica una revista Procesamiento del Lenguaje Natural, que llegó a su número 21 en julio de 1997 y que se distribuye gratuitamente a todos los socios; de los dos volúmenes anuales, uno corresponde a las actas del congreso del año en curso mientras que el otro incluye artículos científicos, información sobre proyectos y tesis y reseñas bibliográficas. Recientemente, la SEPLN ha iniciado una lista electrónica de distribución de información a los socios y un foro de discusión a través de su página en Internet.
Cabe citar también en este apartado el papel de FUNDESCO (Fundación para el Desarrollo Social de las Telecomunicaciones), institución sin ánimo de lucro creada en 1969 por Telefónica de España para impulsar la investigación, el uso y las aplicaciones de las tecnologías de la información y de las comunicaciones. Atendiendo a sus fines, FUNDESCO ha prestado especial atención a la situación de la lengua española como se refleja en el encuentro sobre «la lengua española y las industrias multimedia» organizado en colaboración con la Universidad Internacional Menéndez y Pelayo en Cuenca en 1994 o en la publicación el informe titulado en 1996, realizado para el Gabinete de Estudios de la Presidencia del Gobierno (Ortega, 1996; Rodríguez, 1996).
La Fundación Duques de Soria realiza también actividades en el ámbito de las industrias de la lengua, centradas en sus cursos de verano. Durante los años 1990-1992 tuvieron lugar sucesivas escuelas de verano en colaboración con el Área de Industrias de la Lengua de la Sociedad Estatal Quinto Centenario, y desde 1994 el Seminario de Industrias de la Lengua de la Fundación programa regularmente un curso de lingüística informática y computacional de una o dos semanas de duración.
Entre las actividades más recientes, es preciso mencionar el seminario sobre «El español y las nuevas tecnologías» organizado en abril de 1997 en San Millán de la Cogolla, fruto de los esfuerzos conjuntos de la Agencia EFE y el Gobierno de La Rioja. En este mismo lugar se celebró en 1995 la Escuela Interlatina de Altos Estudios de Lingüística Aplicada con el tema «Lexicografía y tecnologías de la lengua», organizada, entre otras instituciones, por la Real Academia Española. Desde otra perspectiva, la Asociación de Industrias de las Tecnologías Electrónicas y de la Información del País Vasco organizó en septiembre de 1997 el «I Encuentro Internacional de los Multimedia y las Industrias de la Lengua».
Por otra parte, diversos grupos de investigación han organizado en sus universidades respectivas cursos, seminarios o encuentros que tienen como tema la tecnología lingüística o que incluyen actividades en este ámbito.
Puede verse, pues, repasando algunas de las actividades llevadas a cabo fuera del ámbito de la administración, que existe también un interés por la ingeniería lingüística por parte de muy diversos sectores. La SEPLN ha tenido desde 1984, y sigue realizando en la actualidad, un importante papel como nexo de unión de los especialistas españoles y como órgano de difusión a través de los congresos y las publicaciones. Esta labor se ha visto complementada por la de otras instituciones que, de forma más puntual, han contribuido igualmente al desarrollo y al conocimiento de las industrias de la lengua en España.