Centro Virtual Cervantes
Lengua
El español en el mundo > Anuario 2010-2011 > Ignacio Bosque Muñoz. Fuentes de datos
El español en el mundo

La Nueva gramática de la lengua española. Historia del proyecto y características de la obra

Ignacio Bosque Muñoz

5. Fuentes de datos

La NGRALE combina los ejemplos construidos expresamente para ilustrar las pautas morfológicas o sintácticas con los datos obtenidos de fuentes escritas u orales. De hecho, la mitad de los aproximadamente 40.000 ejemplos que contiene proceden de fuentes escritas (y en unos pocos casos, también de corpus orales), mientras que la otra mitad está formada por ejemplos construidos o creados. Es oportuno recordar que las gramáticas clásicas del español combinaban asimismo los datos procedentes de estas dos fuentes, a menudo en proporciones similares a la que la NGRALE muestra. Las gramáticas recientes de otras lenguas hacen escaso uso de las fuentes literarias, lo que obedece en buena medida a que, como sucede con el inglés o el francés, esas lenguas ya cuentan con gramáticas clásicas pormenorizadas construidas a partir de testimonios escritos.

Las fuentes fundamentales de los datos mencionados en la NGRALE son literarias y periodísticas. Se decidió que fuera escaso proporcionalmente el número de textos poéticos citados porque el metro, la rima y, en general, la voluntad de estilo de los autores pueden alterar las pautas gramaticales y dar lugar a construcciones poco representativas de la lengua estándar. Se cita asimismo en la gramática un número reducido de obras científicas, así como un conjunto mayor de ensayos de diversa naturaleza.

La NGRALE contiene casi 20.000 ejemplos procedentes de 3.767 obras (literarias o no). Estos datos proceden mayoritariamente del Corpus de Referencia del Español Actual (CREA), del Corpus Diacrónico del Español (CORDE), del Corpus del Diccionario Histórico (CDH) y del Corpus del Español del Siglo xxi (CORPES). Se citan asimismo algunos textos procedentes de la Biblioteca Virtual Miguel de Cervantes. Fue necesario, por otra parte, digitalizar especialmente para este proyecto un buen número de obras literarias, casi todas de autores americanos.

La nómina de textos citados en la NGRALE, en la que están representados todos los países hispanohablantes, es una de las más nutridas de cuantas se hayan usado en algún proyecto lingüístico sobre la lengua española. Aun así, no ha sido compuesta con la intención de proporcionar un canon literario. Es lógico que figuren en ella los escritores consagrados, sean clásicos o modernos, pero aparecen asimismo en esa relación otros muchos que se eligieron porque en sus textos se documentan ciertos usos (coloquiales, populares o simplemente restringidos en su distribución geográfica) que interesaba documentar.

En la NGRALE se citan asimismo 3.381 ejemplos procedentes de textos periodísticos. Se decidió hacer uso abundante de esta fuente de datos porque se interpretó que la lengua de la prensa representa adecuadamente el español estándar actual (especialmente el no literario) en sus diversas variantes geográficas. Buena parte de estos ejemplos procede de las versiones electrónicas de los periódicos que aparecen en Internet. Se extrajeron estos datos de 307 cabeceras de periódicos o revistas correspondientes a todos los países hispanohablantes. De cada una de esas cabeceras (Excélsior, Clarín, Los Tiempos, El País, etc.) se usaron numerosos ejemplares. Casi todos los ejemplos periodísticos citados en la NGRALE proceden de textos publicados en los últimos veinte años.

A diferencia de lo que suele ser habitual en otras gramáticas construidas con corpus textuales, los ejemplos se citan en la NGRALE como ilustración de usos, por tanto como testimonios que se valoran desde el punto de vista sociolingüístico (y, consiguientemente, también desde el normativo). Los textos citados no se interpretan necesariamente, por consiguiente, como fuentes de autoridad. Se vuelve sobre esta cuestión en el § 7.

flecha a la izquierda (anterior) flecha hacia arriba (subir) flecha a la derecha (siguiente)
Centro Virtual Cervantes © Instituto Cervantes, . Reservados todos los derechos. cvc@cervantes.es