CINDOC
En este apartado se estudian las principales bases de datos internacionales por áreas temáticas, para intentar evaluar, en lo posible, la presencia de literatura científica en español publicada en revistas científicas, para, posteriormente, compararla con la de otras lenguas de nuestro entorno cultural más próximo.
Se han seleccionado para este estudio algunas de las bases de datos más representativas internacionalmente en diferentes disciplinas (ocho de Ciencia y Tecnología y trece de Ciencias Sociales y Humanas), configurando así una muestra que consideramos significativa para estudiar la presencia de información en lengua española. Mediante la consulta de dichas bases de datos, se han analizado sus contenidos a lo largo del periodo 1992-1996, obteniéndose los datos correspondientes al número de artículos escritos en español que los productores de dichas bases de datos han incluido en las mismas.
Entre las diferentes bases de datos, especialmente las de áreas temáticas afines, debido a la interdisciplinariedad de la ciencia, se dan solapamientos no cuantificados, de manera que los totales aportados no significan el 100 por cien de documentos diferentes. Quiere ello decir que habrá documentos presentes en más de una base de datos. Pero, dado que el objetivo de este estudio es medir en lo posible la presencia del español en la escena internacional, el hecho de que algunos documentos estén en más de una base de datos de las elegidas, no significa otra cosa que una mayor presencia y una mayor visibilidad para estos trabajos. Por esta razón, y en el contexto de este estudio, parece más correcto contabilizar todos los documentos en español presentes en las bases de datos analizadas.
A fin de situar los datos relativos al idioma español en su contexto geográfico y cultural más próximo, se han obtenido también las cifras correspondientes a los artículos publicados en francés y en italiano. Este procedimiento permite, además, atenuar el sesgo producido al analizar la producción a través de ciertas bases de datos internacionales. Las bases de datos más importantes, cuantitativamente hablando, son producidas por los Estados Unidos. Esto conlleva de partida unos sesgos idiomáticos claros, ya que estas bases de datos tienden a recoger sobre todo la bibliografía en lengua inglesa, sea producida en el Reino Unido, en Estados Unidos o en otros países. Una breve descripción de las bases de datos estudiadas, con indicación de su cobertura temática y del volumen aproximado de referencias ofrecidas, puede consultarse en el Anexo.
Para el análisis de la producción en Ciencia y Tecnología en español, se han seleccionado las siguientes bases de datos:
INSPEC CHEMICAL ABSTRACTS (CA) COMPENDEX ENVIROLINE MEDLINE GEOREF BIOSIS AGRICOLA
En dichas bases de datos se han realizado consultas «en línea» obteniéndose las cifras correspondientes a los trabajos publicados en idioma español en el periodo 1992-1996; igualmente se han realizado consultas para los idiomas francés e italiano. Estos valores se han comparado con la producción total contenida en dichas bases de datos, durante el mismo periodo. En la tabla 16 se muestran los valores totales de producción en Ciencia y Tecnología correspondientes a cada una de esas bases de datos.
Puede destacarse el tamaño de la base de datos CA, que representa casi el 30% del total de la muestra. Esta última, junto a BIOSIS, MEDLINE e INSPEC, abarca más del 80% del total de artículos de este periodo. La tabla 17 muestra la correspondiente producción en español.
Una primera observación de los datos recogidos en las dos tablas anteriores pone de relieve que la producción de artículos escritos en español y recogidos en las ocho bases de datos representa aproximadamente el 5 por mil de la producción total y casi la mitad de ellos está concentrada en la base de datos MEDLINE. Esta base de datos, junto a BIOSIS y CA, acumula el 90% de los artículos en español.
En cuanto a la evolución a lo largo del periodo 1992-1996, se observa un descenso en la presencia relativa de artículos en español, pues frente al 5,4 por mil de artículos publicados en los años 1992-1993, se ha pasado al 4,4 por mil en el bienio 1995-1996.
Se muestran, asimismo, los datos correspondientes a la producción en francés (tabla 18) e italiano (tabla 19) en las bases de datos anteriormente citadas.
En la primera de las tablas puede comprobarse que los artículos escritos en francés representan el 11 por mil del total de los incluidos en las 8 bases de datos analizadas, es decir, un poco más del doble que los artículos escritos en español. La producción científica en francés se encuentra concentrada en las bases de datos MEDLINE, BIOSIS y CA que, en conjunto, representan el 87% de la producción total en dicho idioma. En cuanto a la producción científica en italiano, en la tabla 19 se observa que su presencia es más baja que en el caso de los otros idiomas analizados, representando el 3 por mil de la producción total en dichas bases de datos.
El análisis de estos valores permite comprobar que la presencia del francés y del italiano, en el conjunto de la producción recogida en estas bases de datos, experimenta, al igual que el español, un descenso del 12,5 al 10,1 por mil y del 3,3 al 2,2 por mil, respectivamente, entre los bienios 1992-1993 y 1995-1996.
El análisis de todos estos datos nos permite apreciar que destaca la producción en español en el área de la Medicina, seguida por la Biología y la Química, y a mayor distancia por las áreas de Geología y Agricultura; quedan en último lugar la Física y la Tecnología; el área del Medio Ambiente tiene, en la base de datos analizada, una presencia meramente testimonial.
La producción en francés e italiano, al igual que en español, es mayoritaria en el área de la Medicina, seguida por la Biología y la Química. La producción científica en francés duplica a la del español en todas las bases de datos analizadas, a excepción de la base de datos AGRICOLA, en la que la producción en español y en francés alcanza valores similares.
Las bases de datos seleccionadas para el estudio en el ámbito de las Ciencias Sociales y Humanas son las siguientes:
En dichas bases de datos se han realizado consultas «en línea» o en CD-ROM (FRANCIS y MLA) 7 buscando los artículos publicados en lengua española durante los años 1992, 1993, 1994, 1995 y 1996. De la misma manera se ha interrogado por los artículos publicados en francés e italiano para el mismo periodo.
Para poder estimar la presencia del español y compararla luego con la de otros idiomas, es necesario conocer el volumen de información de las bases de datos para los años estudiados. En la tabla 20 se ofrecen los datos relativos a la producción científica en Ciencias Sociales y Humanas a lo largo del periodo 1992-1996.
Estas bases de datos mantienen, como puede observarse en la tabla, una cantidad más o menos constante de información a lo largo de los años estudiados, con un máximo en el año 1994 en el que se sobrepasan los 700.000 registros, entre las 13 bases de datos, y una ligera disminución en 1996, posiblemente debido a la lentitud con que a veces se incorpora la información, en el caso de las Humanidades y las Ciencias Sociales por retrasos en las ediciones de las publicaciones primarias, especialmente las revistas. De todos modos, si se hace un análisis general del periodo estudiado, se observa un incremento entre los años 1992 a 1996 de casi 100.000 registros. Es decir, hay un crecimiento global de la cantidad de información recogida, aunque sea moderado.
Una visión comparativa de la producción en las dos grandes áreas, Ciencias Sociales y Humanas, se muestra en la figura 10. Aquí se representa la producción anual para el periodo estudiado; la producción en Ciencias Sociales es mayor, acrecentándose la diferencia de producción con las Ciencias Humanas a lo largo del periodo considerado. Una interpretación de este hecho puede ser que las Humanidades cuentan con publicaciones no sólo menos numerosas, sino también menos rigurosas en su periodicidad. Los valores correspondientes a 1996 pueden representar un retraso importante en la actualización de las bases de datos y un retraso en la edición de las revistas.
En la tabla 21 se aportan los datos cuantitativos sobre la presencia de referencias bibliográficas en español en cada una de las bases de datos, tanto para cada año de publicación, como para el total del periodo estudiado. Estos datos se han obtenido interrogando en cada base de datos por el campo lengua (la=) y cruzando esta información con cada uno de los años.
Puede observarse que la ausencia de trabajos en español es total en algunas bases de datos y su presencia es muy escasa en otras. Incluso en Delphes y Francis, creadas en Francia, la presencia de nuestro idioma es bajísima, pero esto se aprecia mejor al observar datos porcentuales.
Aportamos, asimismo, datos de la presencia del francés (tabla 22) y del italiano (tabla 23) para las mismas bases de datos y años. Se han escogido estos idiomas por la similitud de los rasgos y de los problemas respecto a la comunicación científica que presumiblemente comparten. Como puede observarse en la tabla, el francés se recoge en las bases de datos con una constancia que decae también en el año 1995 y más en 1996. Es posible que puedan aducirse las mismas causas que se intuían para el caso del español.
Al margen de las bases de datos realizadas en Francia (Delphes y Francis), que obviamente tienen una mayoría de registros en francés, con un gran peso sobre el conjunto, es interesante observar cómo Arts and Humanities tiene en estos años más de 67.000 registros en francés frente a los 12.000 que recoge en español. Este es un dato que merece un análisis detenido, pues el sesgo anglosajón no explica esta diferencia tan notable y tan perjudicial para nuestra lengua.
El italiano es un idioma de gran tradición como comunicador de cultura, civilización, arte, etc. y presenta unas características que lo hacen muy comparable al nuestro, excepto por la extensión de su utilización en el mundo, muchísimo menor que la del español. Parece, por tanto, interesante observar la medida en que está presente como lengua de comunicación científica, para después poder comparar su situación y la del español.
Como puede comprobarse, la presencia del italiano, similar a la del español, está a la misma distancia que éste del francés. Se produce también un descenso acentuado de esta presencia en los dos últimos años, supuestamente por causas parecidas. La base de datos que más información en italiano recoge es Arts and Humanities, con más de 20.000 registros, seguida de Francis. Destaca, al margen de las ausencias absolutas, la escasísima presencia en la base de datos Eric que no se corresponde con las aportaciones italianas al mundo de la educación, en especial a la educación popular y de adultos. Llama también la atención la escasísima presencia en el Social Sciences.
En cuanto a la evolución a lo largo de los años estudiados, se observa un descenso en 1995, más acentuado en 1996, que podría interpretarse, en parte, como consecuencia de la poca regularidad en la publicación de las revistas. No es infrecuente, especialmente en las revistas editadas por instituciones públicas, retrasos de dos o más años, debido muchas veces a problemas de financiación. Se puede observar la evolución de esta presencia en esos años para el conjunto de cada una de las dos áreas temáticas Ciencias Sociales y Humanas, y en los idiomas español, francés e italiano (figura 11 y figura 12).
Así como en las Ciencias Sociales se observa una presencia continuada, e incluso un incremento, del número de artículos en francés, en las Humanidades la tendencia es descendente para los tres idiomas. Cabe preguntarse si este hecho puede explicarse solamente en términos de falta de actualización; probablemente no sea así. La aportación de los países del mundo latino a las Humanidades, además de abundante, siempre ha sido considerada del máximo prestigio. Esta trayectoria no se ve corroborada en los datos analizados. Cabe así preguntarse por las causas del descenso observado de la producción científica en este ámbito: una de las posibles explicaciones sería la tendencia creciente a publicar en inglés.
Si analizamos la distribución de la información por bases de datos, se observa que la de los registros en español es más uniforme que la del italiano o el francés, en el sentido de que no hay concentración de registros en una o dos muy señaladas, como ocurre, por ejemplo, con el italiano (ver tabla 23). Arts and Humanities, Francis y MLA son, casi a partes iguales, las tres bases de datos que más registros en español recogen, a una distancia no muy grande de otras. Por otra parte, es interesante comprobar que Philosopher's Index, que en años anteriores recogía registros en español, francés e italiano, ha dejado de hacerlo en los años estudiados.
Hasta aquí los datos absolutos sobre la presencia o ausencia del español, el francés y el italiano en las principales bases de datos internacionales del ámbito de las Ciencias Sociales y Humanas. Se puede apreciar, con carácter general, la débil presencia del español y el italiano y su ausencia total en algunas bases de datos. Sin embargo, mucho más expresiva se manifiesta la realidad al tratar datos porcentuales. En primer lugar, presentamos datos acumulados de presencia de estos idiomas en las bases de datos (tabla 24).
Existen algunas bases de datos internacionales más abiertas a la producción científica en idiomas diferentes al del país productor de la base. Como ejemplos de ello podemos citar MLA, Historical Abstracts, Francis y Sociological Abstracts. Aun así, la proporción del español en ellas es mínima. Si analizamos, por ejemplo, los datos que ofrecen Citation Index, Social y Arts and Humanities, vemos la escasa representación de la bibliografía no anglosajona, acentuada en el caso del español, que en Ciencias Humanas tiene aún menos presencia que el italiano. El caso de la base de datos Social SciSearch es llamativo por el importante sesgo que sufre el idioma español; este hecho, debería ser objeto de un estudio más detallado.
Un comentario específico merece Delphes, que siendo una base de cobertura internacional, fundamentalmente europea, tiene una definición de base de datos nacional: el 91% de su información está en francés. La información en español está ausente de las grandes bases de datos de Economía con difusión internacional.
El análisis de la presencia de las tres lenguas que nos ocupan revela que la presencia del español supone un 2%, frente a casi un 12% del francés en Arts and Humanities y un 3,6% del italiano. También se observa la falta de internacionalidad de Delphes (91% de francés), al contrario de lo que ocurre en Francis, con sólo un 34% de producción en francés. La presencia porcentual del español es más importante en el MLA (6,61%) que en cualquier otra base de datos.
La tabla 25 muestra los datos porcentuales correspondientes a los contenidos informativos en los años estudiados. Estos datos proporcionan una imagen clara de la evolución del español.
En general, se observa cierta constancia en los niveles de presencia, aunque ésta es mínima. Algunos porcentajes menores en 1995 y 1996 se pueden deber, como en casos anteriores, a una falta de actualización de las bases de datos. Resulta significativo el descenso observado en el Social SciSearch y en Psyc Info, tendencia que agrava la ya precaria situación de la producción científica en español en el área de las Ciencias Sociales, en lo que a difusión internacional se refiere.
Para terminar esta parte del análisis, se aportan los datos relativos correspondientes a la división de la información en dos grandes áreas temáticas: Ciencias Sociales y Ciencias Humanas (tabla 26).
Estos datos reflejan claramente que la producción científica en español, francés e italiano en los ámbitos de las Ciencias Sociales y de las Ciencias Humanas es muy pequeña. También nos indican que las Humanidades están bastante mejor representadas que las Ciencias Sociales. En tercer lugar, se pone de manifiesto, una vez más, que la producción científica que se expresa en lengua francesa está numéricamente mejor representada que la italiana o la española.