1. Introducción
2. Los datos básicos
3. El mundo hispánico
4. Conclusiones: el futuro del español en Internet
Referencias bibliográficas
1. Introducción
La rapidísima
evolución de los computadores y, sobre todo, el vertiginoso desarrollo de
Internet ha cambiado profundamente los hábitos y el modo de actuar de una buena
parte de la humanidad en los más diversos aspectos de su vida cotidiana, la
forma de acceder a la información, tanto en aspectos personales como
profesionales, públicos o privados, el ocio, las relaciones con los demás, etc.
Dado que sirve como vehículo para transmitir o recibir información, la
comunicación a través de Internet supone, en cualquiera de sus usos posibles,
el empleo de una lengua, de forma que la presencia que un idioma tiene en la
red deriva fundamentalmente del grado en que la comunidad lingüística
correspondiente tiene acceso a ella y la medida en que la utiliza diariamente.
Además, el empleo de las lenguas en Internet se ha convertido en el índice más
llamativo mediante el cual se mide el peso mundial de un idioma, en sustitución
de los empleados tradicionalmente, con lo que (el estudio de) la mayor o menor
utilización de una determinada lengua en la red se carga inevitablemente de
factores culturales, políticos y económicos. [1] En este trabajo me propongo examinar —de modo forzosamente superficial— los
datos y las cuestiones fundamentales que se relacionan con el uso del español
en Internet.
[^ SUBIR]
2. Los datos básicos
Cuando nos
referimos a 'la red', 'Internet', 'la web',
'la gran malla mundial', etc. no lo hacemos habitualmente para designar el
sistema de comunicación electrónica mediante el cual podemos acceder con gran
rapidez desde un computador a otro, sino al conjunto de varios miles de
millones de documentos de las más variadas características y de aplicaciones de
todos los tipos situados en millones de sedes electrónicas que residen en
cientos de millones de servidores. Con la prudencia exigible cuando se trata de
este tipo de cuantificaciones, y solo para que los lectores puedan hacerse
cargo de la naturaleza de la cuestión que estamos tratando, el Internet Systems Consortium estimaba en
440 millones el número de servidores en funcionamiento en julio de 2006. [2]
Mucho más difícil
de calcular es el número de sedes electrónicas (sites, traducido habitualmente por 'sitios electrónicos' o 'sitios web') y, más interesante para nuestros
propósitos, el número de páginas electrónicas existentes en la actualidad.
Debido a factores en cuyo análisis no podemos detenernos aquí, como la
diferencia entre páginas estáticas y páginas dinámicas (esto es, páginas que se
construyen en el momento en que se hace la consulta y desparecen inmediatamente
después), la existencia de sedes electrónicas reservadas, de sedes electrónicas
que son simples copias (mirrors) de
otras, limitaciones en el acceso de los buscadores generales, etc. resulta
imposible conocer el número real de páginas electrónicas existentes, de modo
que tenemos que conformarnos con estimaciones muy dependientes de la tecnología
utilizada y, como es de esperar, bastante divergentes entre sí. Es bien sabido
que la publicidad de Google señala
que el buscador facilita el acceso al contenido de unos 8000 millones de
páginas que ha indexado previamente. Se trata, sin duda, de un número enorme,
pero está suficientemente demostrado que Google,
como cualquier otro buscador, solo 've' (es decir, indexa) una parte de lo
realmente existente en Internet, de modo que Gulli y Signorini (2005)
calculaban que en 2005 la red estaba constituida por unos 11 500 millones
de páginas. Más sorprendente, sin duda, resultará el dato facilitado por
Aguillo, Ortega y Granadino (2006) según el cual Google contiene en realidad casi 40 000 millones de páginas,
cinco veces más que la estimación del propio sistema. Sería necesario revisar
esta cifra para tener en cuenta enlaces rotos, redondeos de cifras y páginas
repetidas, además de la evidencia de que el buscador no procesa una buena parte
(el 50%, según estos autores) de la parte pública de la red, con lo que podemos
situarnos en una cifra comprendida entre 25 000 y 30 000 millones de
páginas en 2006.
Lamentablemente, no todo el mundo puede
acceder a esta ingente cantidad de información. Según estimaciones de diciembre
de 2006, solo el 16,8% de la población mundial (unos 1100 millones sobre un
total de 6500 millones) tiene actualmente posibilidad de entrar en Internet.
Ese acceso, además, se distribuye de forma muy diferente en función de las
características socioeconómicas de cada zona, de modo que oscila entre el 3,6%
de la población de África y el 70% de la de Estados Unidos y Canadá, pasando
por el 38,7% de la europea. [3]La evolución de los últimos años permite albergar cierta esperanza, ya que el
aumento para África entre 2000 y 2006 se cifra en un 625%, pero es evidente que
las cifras tienen que cambiar mucho para alcanzar una situación mínimamente
satisfactoria.
[^ SUBIR]
3. El mundo hispánico
¿Cuál es la
situación actual de la comunidad hispana en cuanto a su presencia en Internet?
Comenzando por el último dato, tiene acceso a la red el 18,7% de los habitantes
de los países hispanohablantes, [4] lo cual supone una media escasamente superior a la mundial. Naturalmente, hay
también aquí fuertes oscilaciones, que se sitúan entre, por ejemplo, los casos
de Cuba, Honduras o Nicaragua, todos ellos inferiores al 5%, y los de España
(43,3%), Chile (42,8%), Argentina (26,4%), Puerto Rico (25,2%), Costa Rica
(22,7%), Uruguay (20,8%) o la población hispana de Estados Unidos (19,1%), que
son los únicos situados por encima de la media del conjunto de estos países.
Los casos de España o Chile, claramente destacados en este bloque, quedan sin
embargo muy reducidos en importancia si los comparamos con la media de acceso
en, por ejemplo, Suecia (74,9%), Australia (70,7%), Estados Unidos (69,9%),
Japón (67,2%) o
la Unión
Europea de 25 miembros (51,9%). Este último caso es
especialmente significativo para España, que pasa de ocupar el primer puesto
entre los países hispánicos a situarse en los últimos lugares de
la UE de 25 miembros, ya que
únicamente Chipre, Grecia, Hungría, Lituania, Malta y Polonia [5] están por debajo de ella en la tasa de usuarios sobre la población total. El
notable crecimiento experimentado desde el año 2000 (256%) no ha sido
suficiente para nivelar la situación y colocar a nuestro país a la altura media
de los veinticinco que formaban
la
UE en 2006.
A pesar de la
baja tasa de acceso a Internet, el volumen general de la comunidad
hispanohablante la convierte en la cuarta en peso específico de los
internautas, con un 7,5% del total, por detrás únicamente de las comunidades de
lengua inglesa (29,7%), china (13,3%) y japonesa (7,9%). [6] Aunque la relación general es evidente, es claro también que la utilización de
una lengua determinada en Internet no tiene forzosamente que ir en paralelo a
la cantidad de personas conectadas a la red desde países en los que esa lengua
es oficial o una de las oficiales. El dato utilizado más frecuentemente para
medir el peso de un idioma en Internet es el número de páginas electrónicas
escritas en esa lengua. A las dificultades mencionadas anteriormente para llevar
a cabo estudios de este tipo y valorar sus resultados se une ahora la
consistente en la necesidad de detectar automáticamente la lengua en que está
escrito un documento en el interior de un conjunto formado por miles de
millones de páginas. [7]
Para lograr una
primera impresión general del papel que juega el español en la red resulta útil
partir del muy conocido estudio que Funredes ha venido realizando a lo largo de
los últimos años. [8] Los
datos básicos de la proyección realizada figuran en la tabla 1.
| |
inglés |
español |
francés |
italiano |
portugués |
rumano |
alemán |
resto |
Totales |
Sept.1998 |
75,00 |
2,53 |
2,81 |
1,50 |
0,82 |
0,15 |
3,75 |
13,44 |
100,00 |
Ag. 2000 |
60,00 |
5,05 |
4,40 |
2,76 |
2,37 |
0,22 |
3,00 |
22,20 |
100,00 |
Ag. 2001 |
55,00 |
5,20 |
4,34 |
2,71 |
2,44 |
0,18 |
6,29 |
25,45 |
101,61 |
Feb. 2002 |
50,00 |
5,80 |
4,80 |
3,26 |
2,81 |
0,17 |
7,21 |
25,97 |
100,02 |
Feb.
2003 |
49,00 |
5,31 |
4,32 |
2,59 |
2,23 |
0,11 |
6,80 |
29,65 |
100,01 |
May 2004 |
46,30 |
4,72 |
4,93 |
2,85 |
1,86 |
0,14 |
7,12 |
32,09 |
100,01 |
Mar. 2005 |
45,00 |
4,60 |
4,95 |
3,05 |
1,87 |
0,17 |
6,94 |
33,43 |
100,01 |
Tabla 1. Evolución de la distribución del porcentaje del
número de páginas electrónicas en diversas lenguas.
Fuente: Funredes
(http://funredes.org/LC/espanol/medidas/sintesis.htm)
[comprobado 3/1/2007].
Las líneas
generales de la evolución son bastante claras. El inglés, que era la lengua en
la que estaba escrito el 75% de lo que se podía detectar en Internet en 1998,
había bajado hasta el 45% en marzo de 2005. Naturalmente, eso no significa que
el número absoluto de páginas en inglés haya descendido, sino que su aumento ha
sido menor en proporción al experimentado por el conjunto de las demás lenguas,
lo cual es perfectamente esperable a partir de la distribución inicial. El
español crece de forma notable hasta 2002, año en que comienza a descender
hasta llegar a la situación en la que tiene un peso algo inferior al del
francés y muy inferior al del alemán, lenguas que tienen un número
considerablemente menor de hablantes.
Los datos
anteriores resultan de una proyección realizada a partir de la presencia
relativa de las demás lenguas con respecto al inglés. Dada la inseguridad
general que arrastran consigo estos datos y también por su posible
envejecimiento por los casi dos años de antigüedad transcurridos desde la
última recogida, no estará de más contrastarlos con otros más recientes o bien
obtenidos mediante una metodología diferente. La tabla 2 muestra en la primera
columna los resultados del estudio de Aguillo, García y Arroyo (2004)
utilizando los recursos proporcionados por Google y Yahoo para hacer el recuento del
número de páginas existentes en diferentes lenguas a mediados de 2004. La
técnica empleada, que cualquiera puede utilizar, consiste en lanzar al buscador
la petición de páginas que contengan una expresión general (ellos utilizan la
expresión http) y estén, a juicio del
identificador lingüístico del buscador, escritas en una lengua determinada. La
segunda columna contiene, en las casillas correspondientes, los resultados del
estudio de Funredes; la tercera da los datos de otro estudio realizado por
Aguillo con otros colaboradores (Aguillo, Ortega y Granadina (2006)) sobre los
contenidos de Google en mayo de 2006
y la cuarta proporciona los datos que yo mismo obtuve de Google a comienzos de octubre de 2006 utilizando la misma técnica
empleada por Aguillo, García y Arroyo en el trabajo mencionado. Además, para
que se pueda valorar adecuadamente el volumen al que estamos haciendo
referencia, añado en la quinta columna el número absoluto de páginas existentes
en las diferentes lenguas usando también los servicios proporcionados por Google.
Lenguas |
Porcentaje de páginas en diferentes lenguas |
Millones de páginas en Google [11/10/2006] |
Aguillo, García y Arroyo (2004)
[agosto de 2004] |
Funredes: [marzo de 2005]
(proyección) |
Aguillo, Ortega, Granadina (2006) [mayo de 2006] |
Google:
[octubre de 2006] |
Alemán |
6,94 |
6,94 |
5,4 |
1,90 |
123,00 |
Chino (simpl.+ trad.) |
3,21 |
|
4,7 |
2,01 |
130,30 |
Coreano |
1,93 |
|
|
0,85 |
54,70 |
Español |
3,39 |
4,60 |
2,6 |
1,26 |
81,60 |
Francés |
5,14 |
4,95 |
3,8 |
1,79 |
116,00 |
Holandés |
2,16 |
|
1,4 |
0,63 |
40,90 |
Inglés |
57,95 |
45,00 |
64,8 |
47,14 |
3.050,00 |
Italiano |
2,69 |
3,05 |
1,5 |
0,74 |
48,00 |
Japonés |
4,96 |
|
4,8 |
2,95 |
191,00 |
Portugués |
1,98 |
1,87 |
1,0 |
0,61 |
39,50 |
Rumano |
|
0,17 |
|
0,16 |
10,30 |
Ruso |
2,77 |
|
1,9 |
0,75 |
48,60 |
Sueco |
|
|
|
0,39 |
25,40 |
| |
|
|
|
|
|
Total de páginas (en todas las
lenguas) calculado por Google |
|
|
|
|
6.470,00 |
Totales |
93,12 |
66,58 |
91,90 |
61,19 |
|
Tabla 2. Porcentajes
correspondientes al número de páginas en diferentes lenguas según cuatro
recuentos diferentes.
Elaboración propia con datos de Aguillo, García y Arroyo
(2004) (www.csi.ensmp.fr/WebCSI/4S/
download_paper/download_paper.php?paper=aguillo_garcia_arroyo.pdf);
Funredes
(2005), (funredes.org/LC/espanol/medidas/sintesis.htm);
Aguillo, Ortega y
Granadino (2006) y los que yo mismo obtuve en Google a mediados de octubre de 2006.
En la última columna, número
de páginas en diferentes lenguas reconocidas como tales por Google a mediados de octubre de 2006.
La distribución
por países presenta el perfil esperable: España supone, según los diferentes
recuentos, entre el 30% y el 45% de las páginas que los buscadores consideran
escritas en español y los cinco países de mayor peso (Argentina, Chile, España,
Estados Unidos y México) suman en conjunto entre el 75% y el 90%.
Aun con fuertes diferencias entre sí,
los datos que la tabla 2 proporciona para el español son sistemáticamente bajos
en relación con el peso cuantitativo de la comunidad hispanohablante. Todavía
un paso más allá, lo que podríamos considerar el 'índice de productividad' de
los internautas hispanohablantes, esto es, la relación entre la cantidad de
páginas electrónicas y la de usuarios de Internet es de 0,99, mientras que
alcanza 9,55 para los anglófonos, 2,21 para los hablantes de japonés, 2,33 para
los de francés, etc.
A pesar de la incertidumbre que
contienen y las divergencias que muestran, los datos sobre número de
hispanohablantes conectados a la red y de páginas electrónicas en español
dibujan un panorama manifiestamente mejorable. Por supuesto, ni son los únicos
ni, probablemente, los más significativos. Tener la posibilidad de conectarse a
la red no es lo mismo que hacerlo o limitarse a hacerlo una vez al trimestre y
entrar en Internet puede no ir más allá de 'bajar' una canción o un vídeo. Por
otra parte, los recuentos de páginas cuentan con independencia de la calidad,
el número de visitas, la actualización de la información, etc. Todo eso es
cierto, pero también lo es que las cifras generales de acceso, incluso las más
burdas, dan una idea del grado de inserción de la comunidad correspondiente en
la llamada 'sociedad del conocimiento', de modo que han de ser atendidas y las
entidades responsables deberían tomar las medidas oportunas para mejorar la
relación que presentan.
Obtener índices
más elaborados, que apunten a aspectos cualitativamente más elevados, resulta
bastante más difícil. Por ejemplo, da la sensación de que la prensa digital
tiene en el mundo hispánico un peso esperanzador, tanto en el número de
publicaciones con versión electrónica (o versión únicamente electrónica) [9] como en cantidad de consultantes. Para dar únicamente un dato, los diez
periódicos digitales más importantes del mundo hispánico recibían conjuntamente
en octubre de 2006 el 1,1% de todas las visitas a sedes electrónicas de este
tipo. Según Díaz Noci (2006: 309 y sigs.), en 2005 había en España 1274 medios
de comunicación electrónicos (alrededor de un 10% de los existentes) y con
datos de
la OJD,
se situaban, en noviembre de 2005 en, por ejemplo, 35 millones de visitas para El Mundo, casi 30 millones para Marca¸ 17 millones para As o 3 8000 000 para Libertad digital en el mismo período.
Desde un ángulo diferente, la versión de
la Wikipedia en español tenía en esa misma fecha 160 313 artículos y 234 792
usuarios registrados, lo cual supone la décima posición en cuanto a número de
artículos, con el 11% de los artículos existentes en la versión inglesa y el
9,5% de sus usuarios registrados.
[^ SUBIR]
4. Conclusiones: el futuro del español en Internet
Como hemos visto
en los apartados anteriores, la tasa de hispanohablantes con acceso a Internet es
bastante baja, solo ligeramente superior a la media mundial. Incluso los países
hispánicos mejor situados en este aspecto están todavía lejos de alcanzar los
niveles de los más desarrollados. Aunque la evolución de los últimos años ha
sido muy positiva, los contenidos en español presentes en la red están también
a mucha distancia de lo que el peso cuantitativo de los hablantes de esta
lengua podría suponer. También aquí, la situación de los países que ocupan la
cabeza del mundo hispánico resulta muy distante de la que tienen los que ocupan
los primeros puestos.
Sería una actitud
absurda esconder la cabeza y no reconocer la necesidad de mejorar la situación
de nuestra lengua en la red de redes. No se trata, por supuesto, de preocuparse
únicamente por colocar al español en un lugar mejor que el que ocupa
actualmente, sino de actuar en todos los frentes necesarios para cambiar las
causas que dan lugar a esa situación. En el marco general de la situación
económica y cultural del mundo hispánico, hay tres grandes factores a los que
es necesario prestar atención. De un lado, la mejora de las condiciones
técnicas y económicas de acceso a la red. En segundo lugar, un esfuerzo
adicional en la situación de contenidos realmente atractivos para la población
que, en buena parte, es un resultado que se obtiene como consecuencia de la
mayor facilidad de acceso. Por último, en lugar de escudarnos en la idea de que
los buscadores comerciales prestan poca atención a los contenidos procedentes
del mundo hispánico —lo cual puede ser cierto—, es necesario dedicar más medios
a la producción de herramientas y recursos lingüísticos basados en el español
que aporten a la documentación existente en la red y a su recuperación la
'inteligencia' lingüística de la que, en términos generales, carecen en este
momento, lo cual implica tanto la investigación básica como la aplicada. Solo
la conjunción de esfuerzos en las tres direcciones permitirá que la red en
español esté al nivel que la comunidad hispanohablante quiere tener en el
futuro.
[^ SUBIR]
Referencias bibliográficas
Aguillo, Isidro F.
José L. Ortega y Begoña Granadino, 2006. "Contenidos del buscador Google. Distribución por países,
dominios e idiomas", El profesional
de la información, 15/5, 2006, 384-389.
Aguillo, Isidro
F., Ignacio García y Natalia Arroyo, 2004. "Regional
and linguistic patterns in Google positioning",
www.csi.ensmp.fr/WebCSI/4S/download_paper/download_paper.php?paper
=aguillo_garcia_arroyo.pdf.
Díaz Noci, Javier,
2006. "Orígenes y desarrollo del ciberperiodismo en España: balance de una
década", en Informe anual de la
profesión periodística 2006, Madrid: Asociación de
la Prensa de Madrid, 2006,
307-319.
Díaz Nosty,
Bernardo, 1999. "Las ediciones digitales de la prensa diaria en lengua
española", El español en el mundo.
Anuario del Instituto Cervantes 1999, 65-186.
Díaz Nosty,
Bernardo (dir.), 2000. "Cuarto informe sobre la prensa en lengua española
en Internet", VI Foro Eurolatinoamericano de
la Comunicación, Ciudad
de Panamá, 2000, www.infoamerica.org/documentos_pdf/nosty07.pdf.
Gulli, A. & A. Signorini, 2005. "The
Indexable Web is More than 11.5 billion pages", WWW 2005, www.cs.uiowa.edu/~asignori/web-size/.
La difusión del español en Internet, Burgos: Fundación Caja de
Burgos, 2006.
Marcos Marín,
Francisco, 2000. "La lengua española en Internet", El español en el mundo. Anuario del
Instituto Cervantes, 2000, 299-357.
Marcos Marín,
Francisco, 2006. Los retos del español,
Madrid / Frankfurt: Iberoamericana / Vervuert, 2006.
Martín Mayorga,
Daniel (2000): "El español en la sociedad de la información", El español en el mundo. Anuario del
Instituto Cervantes 2000, 359-374.
Millán, José
Antonio, 2001. Internet y el español,
Madrid: Fundación Retevisión, 2001.
Otero, Jaime y
Hermógenes Perdiguero (coords.), 2006: El
porvenir del español en la sociedad del conocimiento, Burgos: Fundación
Caja de Burgos, 2006.
Pimienta, Daniel,
2002. "Presencia de las lenguas neolatinas en la internet", Congreso
internacional sobre lenguas neolatinas en la
comunicación especializada, (México, D.F. 2002), dtil.unilat.org/cong_com_esp/comunicaciones_es/pimienta.htm.
Pimienta, Daniel y
Benoit Lamey, 2001. "Lengua española y culturas hispánicas en
la Internet. Comparación
con el inglés y el francés", II Congreso internacional de la lengua
española, Valladolid, 2001, www.cvc.cervantes.es/obref/congresos/valladolid/
ponencias/el_espanol_en_la_sociedad/4_internet_en_espanol/pimienta_d.htm.
[^ SUBIR]
Páginas electrónicas citadas
Funredes: www.funredes.org
Google: www.google.com
Ethnologue: www.ethnologue.org
Internet
Systems Consortium, Inc. (ISC): www.isc.org
Internet
World Stats: www.internetworldstats.com
Ministerio de Industria, Turismo y Comercio: www.mityc.es
http://observatorio.red.es/indicadores/index.html
Nielsen//NetRatings: www.nielsen-netratings.com
Wikipedia: http://www.wikipedia.org
[^ SUBIR]
[1] Sobre
las muy diversas cuestiones relacionadas con este tema pueden verse, entre
otros, Marcos Marín (2000), Mayorga (2000), Millán (2001), Marcos Marín (2006),
Otero y Perdiguero (2006) y el informe La
difusión del español en Internet (2006).
[3] Cfr. www.internetworldstats.com/stats.htm
[comprobado 3/1/2007]. Según
se hace constar en cada una de las páginas de Internet World Stats, "the
most recent Internet usage information comes from data published by
Nielsen/NetRatings, International Telecommunications Union, Computer Industry
Almanac, and other reliable sources. [...] World population information comes
from the world gazetteer site". En lo sucesivo, indico que tomo los
datos de Internet World Stats, pero debe entenderse que la procedencia última
es la que ellos señalan.
[5] Cfr. www.internetworldstats.com/stats9.htm [comprobado 3/1/2007]. Las estadísticas de
la Unión Europea para
2006, referidas a porcentaje de personas que se habían conectado a Internet al
menos una vez a la semana en los tres meses anteriores a la encuesta, dan una
media del 47% en los 25 miembros y el 39% para España, que queda por encima de
la República checa, Grecia,
Chipre, Lituania, Polonia y Portugal. Cfr. http://epp.eurostat.ec.europa.eu [comprobado 4/1/2007].
[6] Cfr. www.internetworldstats.com/stats7.htm [comprobado 3/1/2007]. Hay que tener en cuenta que estos datos han sido
obtenidos a partir de la adscripción geográfica de los usuarios, por lo que,
además de la inseguridad habitual de estos recuentos, sería necesario, para cada
lengua, deducir los usuarios que la estadística considera dentro del dominio
lingüístico, pero tienen otra lengua de instalación, y añadir los que la usan,
pero residen fuera del dominio lingüístico considerado habitualmente.
[7] Los
buscadores más utilizados permiten llevar a cabo búsquedas referidas únicamente
a documentos escritos en una lengua determinada. Google, por ejemplo, admite búsquedas seleccionadas en 35 idiomas
distintos, que es un pequeñísimo porcentaje de las aproximadamente 6900 lenguas
que los lingüistas creen que se hablan en este momento en el mundo (cfr.
www.ethnologue.org).
[8] Además de la página electrónica del proyecto, con abundante información, vid.,
entre otros, Pimienta y Lamey (2001) y Pimienta (2002).
[9] Cfr. Díaz Nosty (1999 y 2000).
[^ SUBIR]
Resumen:
Aunque la evolución de los últimos años ha
sido muy positiva, la tasa de hispanohablantes con acceso a Internet es
bastante baja. Los contenidos en español presentes en la red están también
a mucha distancia de lo que el peso cuantitativo de los hablantes de esta
lengua podría suponer.
Palabras clave:
Lengua española, español, Internet.
[^ SUBIR]
Abstract:
Although the evolution over recent years has been very positive, the rate of Spanish speakers with access to Internet is still quite low. Contents in Spanish on the Web are also a long way from what one would expect from the quantitative weight of the Spanish-speaking population.
Key Words:
Spanish language, Spanish, Internet.
[^ SUBIR]
|