Centro Virtual Cervantes
Lengua
El español en el mundo > Anuario 1999 > P. Maestre. Algunos datos...
El español en el mundo

La utilización de las diferentes lenguas en Internet

Pedro Maestre Yenes

2. Algunos datos globales sobre la presencia de las diferentes lenguas en Internet

En una primera aproximación, podemos fijar nuestra atención en los idiomas que cuentan con más de un millón de páginas indizadas en la red: alemán, chino, coreano, español, francés, neerlandés, inglés, italiano, japonés, portugués y sueco 3. En septiembre de 1998, la situación es la siguiente:

Tabla 1
Lengua Número de páginas Porcentaje de páginas sobre el total
Alemán 5.825.015 3,34
Chino 1.240.276 0,71
Coreano 1.185.919 0,68
Español 2.635.928 1,51
Francés 3.418.011 1,96
Neerlandés 1.239.717 0,71
Inglés 122.269.281 70,05
Italiano 2.248.232 1,29
Japonés 8.745.138 5,01
Portugués 1.278.182 0,73
Sueco 1.124.127 0,64

No deja de llamar la atención, a pesar de ser un dato esperado y conocido, el enorme peso del inglés, lengua dominante en Internet hoy. No cabe la menor duda de que este dato se correlaciona con el hecho de que Internet nació en Estados Unidos; que en ese país es donde hay más usuarios y una cultura de Internet más fuerte; que es el país con la tarifa de acceso más barata y, sobre todo, con una tarifa plana; que es la nación donde las autoridades políticas han hecho una apuesta más fuerte por la red —baste prestar atención a las continuas declaraciones del vicepresidente Al Gore y del propio presidente Clinton—, y, finalmente, que el inglés es la lengua franca del presente, a cuya consolidación colabora Internet por el efecto de retroalimentación positiva, con una presencia cada vez más importante de esta lengua en la red.

Como se podrá comprobar más adelante, muchos países con lenguas oficiales diferentes tienen, no obstante, un número significativo de páginas en inglés, lo que indica una voluntad común de poner la información a disposición del internauta en la lengua más universal.

En alemán existen 5.825.015 páginas, de las cuales corresponden a Alemania 4.238.189, es decir, un 72,76 %. Es de resaltar la muy significativa presencia del japonés, pese a que la cultura del ordenador personal no está especialmente implantada en Japón y por tanto el usuario japonés tiene restricciones de uso de la red. La presencia del coreano llama también poderosamente la atención y es un claro índice del vigoroso empuje del pequeño país asiático.

El neerlandés tiene una presencia muy significativa en Internet, igual a la del chino. De 1.240.276 páginas en neerlandés, 878.830 corresponden a los Países Bajos, que con una población de 15.460.000 habitantes tiene una tasa de 56,85 páginas por cada mil habitantes, mientras que las páginas en chino generadas en China son 103.820, lo cual supone que para una población de 1.200.241.000 personas, la tasa de páginas por mil habitantes sea de 0,086. Esto arroja el resultado comparativo de que la tasa de páginas en neerlandés generadas en los Países Bajos es 657,18 veces más alta que la tasa de páginas en chino generadas en China.

El francés, con sus 3.418.011 páginas, representa un 1,96% de las situadas en Internet, de las cuales sólo 1.349.045, un 39,47%, corresponden a Francia. Puede llamar la atención la baja participación del francés en su conjunto y más en concreto de Francia, país con una enorme tradición cultural, científica y con una gran cultura informática en sus ciudadanos. En Canadá hay 706.237 páginas en francés, un 20,66% del total en esta lengua. Si se considera que la población de Canadá es de 29,6 millones, y de ésta, menos de un tercio es francófona, y la de Francia de 58 millones, se puede concluir fácilmente que en Canadá, en comparación con Francia, el número de páginas en francés en Internet es 3 veces superior en términos relativos al número de habitantes francófonos. La razón fundamental de esta situación, por lo que a Francia se refiere, puede ser la apuesta que en su día hizo por el sistema Minitel, al que podríamos considerar como el preludio de Internet. El compromiso con Minitel ha hecho que en Francia Internet no se haya difundido demasiado. En estos momentos, no obstante, Francia se encuentra comprometida en un trasvase del antiguo sistema Minitel a Internet, lo que sin duda provocará que en pocos años la presencia del francés y de Francia en la red de redes se incremente notablemente. Otro factor que redundará en esta evolución será el desarrollo de la red en países africanos francófonos que hoy día apenas tienen presencia en la red.

En italiano el número de páginas alcanza la cifra de 2.248.232, un 1,29% del total. Es un porcentaje bajo, pero en términos comparativos su situación es mejor que la del francés, dado que el italiano se limita casi exclusivamente a Italia y a Suiza. Las páginas en italiano surgidas de Italia alcanzan la cifra de 1.919.988, lo que supone un 85,36 del total. En términos absolutos, el número de páginas de Italia en italiano supera en 570.943 al número de páginas de Francia en francés. Francia tiene mucha más tradición informática que Italia y una población similar —58 y 57 millones de habitantes, respectivamente—; sin embargo, hay un 42% más de páginas en italiano procedentes de Italia que en francés procedentes de Francia. El fenómeno sólo puede deberse, como ya se ha señalado, al efecto Minitel.

En portugués, las 1.278.182 páginas existentes se reparten en un 68% para Brasil, un 16,35 para Portugal y un 15,65% para el resto del mundo. En sueco hay 1.124.127 páginas, de las cuales el 89,86 corresponden a Suecia, que con una población de sólo 8,8 millones de habitantes tiene una tasa de páginas en sueco de 114 por cada mil habitantes. La tasa equivalente en Francia es de 23,26, en Italia de 33,57 y en Alemania de 51,77.

Por lo que respecta al español, existen en la red 2.635.928 páginas, un 1,51% del total de páginas consideradas en este trabajo, de las cuales corresponden a España 894.787, un 33,95%. Esta cantidad arroja una tasa de 22,94 páginas por cada mil habitantes, nivel parecido al de Francia y muy inferior al de Italia o Alemania.

  • (3) En la definición de los datos y la naturaleza del estudio se ha partido de las siguientes premisas:
    1. Se ha considerado fundamental alcanzar la homogeneidad en los datos considerados, por lo que ha parecido aconsejable la unificación de la fuente que ha proporcionado los datos, para evitar los sesgos provocados por la utilización de fuentes diferentes, como puede suceder cuando se toman fuentes distintas para conjuntos de datos de la misma estructura de contenido.
    2. Para dar una visión de conjunto del peso de las diferentes lenguas en Internet, se pueden considerar alguno o varios de los siguientes indicadores:
      • Páginas de información en Internet.

        Este criterio se ha juzgado el más significativo para los fines del estudio, ya que permite dar referencia exacta del uso de las diferentes lenguas en la red. Al igual que para determinar la investigación que se desarrolla en cada lengua se analiza sobre todo la producción científica —artículos, libros, publicaciones, patentes, etcétera—, antes que la procedencia de los investigadores y la de los que utilizan las publicaciones científicas, parece claro que la variable más significativa para establecer la participación de las diferentes lenguas en Internet es la de los contenidos de cada una de ellas en la red.

      • Usuarios de Internet.

        El número de usuarios procedentes de cada país es un indicador que puede dar una idea aproximada de la participación de las lenguas en Internet, desde el punto de vista, bastante razonable, de que la mayoría de los usuarios originarios de un país tendrán como lengua materna la oficial de dicho país. En cualquier caso sería un indicador poco significativo, porque se puede deducir que, efectivamente, su lengua propia es la oficial del país, pero puede que acudan a Internet a consultar páginas en otras lenguas, y especialmente en inglés.

      • Sitios e instituciones en Internet.

        Son indicadores que, en una línea parecida a la de las páginas, pueden dar también una idea del peso de las diferentes lenguas en Internet. En cualquier caso, su precisión será bastante inferior a la que proporciona el número de páginas direccionables, dado que la dimensión de estas últimas, dentro de unos límites, es mucho más parecida que la dimensión de las informaciones ligadas a sitios e instituciones situados en Internet. El recorrido de la variable correspondiente al tamaño de las páginas en Internet es notoriamente más pequeño que el recorrido de la variable de los sitios e instituciones, por lo que las páginas son más significativas a la hora de dar una idea cuantitativa de la presencia de las diferentes lenguas en Internet.

      • Consultas efectuadas a las diferentes páginas de Internet.

        Ésta podría ser una buena variable para determinar la participación de las diferentes lenguas en Internet. No obstante, no se puede seleccionar, porque no hay información sistemática sobre esta variable, y menos si además se quieren conocer las consultas efectuadas a las páginas de cada lengua.

        Por las razones apuntadas, se ha considerado como variable más significativa el número de páginas de cada una de las lenguas, que es la utilizada en este trabajo.

      • Los datos sobre el número de páginas según las diferentes lenguas se han obtenido de los buscadores Altavista y Altavista Magallanes. Los de Altavista se han utilizado exclusivamente para dar informaciones de evolución temporal en las tablas 2 a 5. El resto de los datos se han obtenido de Altavista Magallanes. Al provenir los datos de Altavista Magallanes de Altavista, la homogeneidad queda garantizada.
      • Los datos se han obtenido entre septiembre, octubre y noviembre de 1998. Por este motivo, pueden presentarse ligeras variaciones en las diferentes tablas para el mismo dato, lo que no repercute en la validez de las conclusiones, puesto que los valores son prácticamente los mismos.
      • Las informaciones que se proporcionan hacen referencia exclusivamente a los casi 180 millones de páginas indizadas en Altavista Magallanes. El número de páginas considerado es tan elevado que cabe aventurar que las conclusiones extraídas son válidas para el conjunto de páginas recogido en Internet; si bien los 180 millones de páginas que se han considerado no son una muestra obtenida sistemáticamente del conjunto de páginas de Internet, sino que han sido obtenidas con criterios basados en la idea de seleccionar las páginas más significativas de Internet. Para ello, Altavista, entre otros criterios, ha escogido como el más significativo el de indizar las páginas con más hiperenlaces desde otras páginas. Esto garantiza que los datos obtenidos se refieren, con carácter general, a aquellas páginas con mayor interés, que, por tanto, proporcionan una información de valor especial sobre el peso de las diferentes lenguas en Internet.

        Sin embargo, así como desde el punto de vista de los contenidos los 180 millones de páginas sobre las que se trabaja no son una muestra representativa del conjunto de páginas que hay en Internet —ya que, como se ha dicho, son las páginas más importantes—, desde el punto de vista de la lengua empleada, los 180 millones de páginas son mucho más significativos.

      • Para la determinación de las páginas de las diferentes lenguas provenientes de los distintos países se ha partido del criterio de contabilizar las que están asociadas al concepto de dominio geográfico Internet, y no se han contabilizado las asociadas a los dominios genéricos, dado que no se puede conocer el número de las páginas que proviniendo de un determinado país están asociadas a dominios genéricos. Una excepción imprescindible son las páginas correspondientes a Estados Unidos. En este caso, el criterio no sería válido, pues si se considerasen sólo las páginas correspondientes al dominio «eu» se estaría falseando totalmente la realidad, habida cuenta de que la inmensa mayoría de las páginas provenientes de ese país están asociadas a dominios genéricos como «com», «edu», «org», «mil», etcétera, circunstancia que no se da en el resto de los países, donde la mayor parte de las páginas están asociadas a dominios territoriales. En el caso de Estados Unidos, partiendo de muestras sistemáticas, se ha hecho una estimación de páginas que proceden de este país, asociadas a dominios genéricos.
      • Los datos de población y de renta per cápita se han tomado del Anuario El País 1998 volver
flecha a la izquierda (anterior) flecha hacia arriba (subir) flecha a la derecha (siguiente)
Centro Virtual Cervantes © Instituto Cervantes, . Reservados todos los derechos. cvc@cervantes.es