Números del CIDE Anterior #92 Siguiente #94
El tamaño de nuestro acervo
Al llegar a CIDE, dos preguntas que comúnmente se nos plantean son: ¿Sabe usted leer? Y ¿Sabe usted escribir? A lo que de manera general respondemos que sí, luego se nos informa que el entrenamiento que vamos a recibir trata de que aprendamos a hacer precisamente eso, leer y escribir. Con el tiempo y avanzando en nuestra formación es que vamos acumulando horas de lectura y documentos escritos de nuestra autoría individual.
El registro del número de palabras escritas por cada uno de nosotros, nos permite, junto con el tamaño del glosario de nuevos términos que vamos incorporando tanto en español como en inglés a nuestro acervo, nos permite saber cuánto hemos avanzado en la tarea de aprender a leer y a escribir, como se plantea en el número del CIDE 1, donde como recuerdan se señala que al escribir un millón de palabras se habrá alcanzado la formación equivalente al nivel de cultura de un doctor en ciencias y habremos construido un acervo con alrededor de 16 mil palabras.
Para establecer mayor precisión en esta tarea es conveniente responder a la pregunta ¿De cuántas palabras diferentes entre sí se compone el acervo de nuestros escritos?
El crecimiento intelectual de un individuo se expresa en la máxima popular que reza “ningún hombre es mejor que su conversación” El Método Arenas como proyecto educativo basa el desarrollo individual de quienes se atreven a seguirlo en el desarrollo de un nuevo léxico en el que se parte de la definición nominal de las palabras para llegar hasta la construcción de los conceptos que representan, misma que tiene lugar una vez que se han llevado a cabo un grupo de tareas teóricas, lógicas y empíricas.
En su novela: El ingenioso Hidalgo don Quijote de la Mancha, Miguel de Cervantes Saavedra utilizó más de 381,104 palabras (prólogo + novela) con un vocabulario de 22,939 palabras distintas según se señala en la página de Intenet:
http://www.solosequenosenada.com/2009/06/01/%C2%BFcuantas-palabras-tiene-el-libro-don-quijote-de-la-mancha-de-cervantes/
Desde luego que esta cifra es aproximada porque en cada versión del libro, quitan o añaden palabras para que se entienda mejor, ya que el castellano antiguo utiliza palabras que hoy en día sonarían demasiado extrañas. Si consideramos válida la información de esa página de Intenet, estas son las estadísticas para el mencionado libro:
El libro de Don Quijote la Mancha:
Número total de palabras: 381,104
Número de palabras diferentes: 22,939
Número de caracteres utilizados: 2´059,005
Puntos y aparte: 4,046
Puntos y seguido: 4,161
Comas: 40,167
Puntos y comas: 4,800
Exclamaciones (!): 690
Interrogaciones (?): 960
Dos puntos: 2046
Palabras utilizadas sólo una vez: 11,184
Mientras que el individuo común nacido en un país de habla hispana utiliza entre 300 y 1000 palabras para comunicarse y un doctor en ciencias cuya lengua materna es el español, debería contar con un acervo alrededor de 16,000 términos para comunicarse tanto en el lenguaje de la ciencia (inglés) y como su lengua materna.
Para evaluar nuestros logros en el avance de la construcción de acervo escrito se propone el siguiente ejercicio:
Determinación del número de palabras diferentes que usamos en nuestros escritos
1 Haga una compilación de los escritos que ha producido durante toda su formación.
2 Coloque todos los textos en un solo archivo (forme un solo documento) de procesador de textos (por ejemplo Word® de Microsoft Office®) utilice el contador de palabras para determinar el número total de éstas (Para dar un ejemplo, la serie de Los números del CIDE, hasta el número que hoy envío -92- se compone de poco más de 121,000 palabras).
3 Ponga a prueba su equipo de cómputo y el software que está utilizando. Considere que al procesador de palabras Word® de Microsoft Office® le resulta imposible manejar documentos muy grandes, como el que se generará siguiendo el ejemplo de este documento, por lo que requeriremos del uso de otra herramienta, en este caso, la hoja de cálculo de Excel será útil para obtener algunas estadísticas. Una vez que tenga sus textos en un solo documento registre las estadísticas que proporciona su procesador de textos (Número de palabras, Número de caracteres, Número de párrafos) y regístrelos en una hoja de cálculo.
4 Utilice la herramienta “buscar y reemplazar” para registrar y reemplazar los caracteres correspondientes a las siguientes variables: Puntos y aparte, puntos y seguido, comas, puntos y comas, exclamaciones (!), exclamaciones (¡), interrogaciones (¿), interrogaciones (?), dos puntos, paréntesis (, paréntesis ), paréntesis [, paréntesis ], comillas ("), guiones (-), guiones bajos (_), asteriscos (*), signos de pesos $, signos =, signos +, apóstrofes ('), caracteres de espacios múltiplex (desde 16 espacios hasta dos espacios). Registre en su hoja de Excel los valores para cada una de estas variables, al mismo tiempo que procede a sustituirlos (eliminarlos del documento).
5 Ya que ha eliminado los signos que le podrían generar un sesgo en las estadísticas del número de palabra en el documento, proceda a eliminar los espacios excedentes entre palabras, quiero decir, aquellos que tengan más de un espacio, así todas las palabras quedarán separadas por solamente un espacio utilice para ello el mismo comando de “Buscar y reemplazar”.
6 Con el mismo comando de “Buscar y reemplazar”, enseguida reemplace los espacios entre palabras con caracteres de marca de párrafo (^p), al hacer esto el documento crecerá enormemente en cuanto al número de páginas, por lo que el procesador de textos (Word) ya no será útil en los siguientes pasos, a menos de que usted tenga un número de palabras inferior a 100 mil. En el ejemplo de este documento al reemplazar los espacios, nos quedó un documento de 2685 páginas.
7 Seleccione todo el texto y proceda a abrir una hoja de cálculo (en Excel, por ejemplo), una vez abierta esa herramienta, proceda a pegar el texto, cuidando que cada palabra quede en una celda de una línea diferente, como se trata de mucha información, este proceso puede tardar algunos minutos.
8 Una vez que se ha desplegado la información en la hoja de Excel, notará que parte de esa información se ha desplegado en la segunda y tal vez hasta en la tercera columna, proceda a organizar la información que quedó en la columna B utilizando el comando de “ordenar alfabéticamente” eso permitirá hacer visible la información, luego proceda a cortar esa información y pegarla en la columna A, para tener una sola columna con toda la información.
9 Ahora ordene alfabéticamente la información de la columna A. Notará que en primer lugar aparecen números y cantidades, en el ejemplo de este texto, las primeras 3000 celdas corresponden a número y cantidades. Enseguida aparecen algunos signos y después celdas en blanco.
10 Elimine las celdas en blanco y aquellas que contenga cantidades o números y caracteres que no se usarán para el análisis del número de palabras.
11 Al revisar la parte final de la lista se puede encontrar otros caracteres basura que se procede a eliminar manualmente.
12 Recuerde que las letras “sueltas” no se deben eliminar, ya que también cuentan como palabras.
13 Ya que ha refinado la lista en orden alfabético, podrá usted saber en realidad cuantas palabras ha escrito, porque el Procesador de textos (Word) toma como palabras muchos caracteres que no lo son, por ejemplo las cantidades numéricas y otros. Aquí se obtiene el primer resultado de este trabajo, el número total de palabras escritas.
14 Para saber cuántas palabras diferentes ha utilizado en sus escritos, use el menú “Datos” de la hoja de Excel, haga clic en la opción: “Quitar duplicados” de esa manera tendrá una lista de las palabras diferentes que ha empleado para hacer sus escritos.
Con ese dato, usted sabrá cuál es el número de palabras que ha utilizado para comunicarse de forma escrita en su formación hasta hoy. Si los resultados le indican que usa más de 1000 palabras, lo felicito, ya está usted por encima de un bachiller en cuanto a su riqueza de acervo, si ya maneja más de 16,000 palabras diferentes, es usted una persona culta que ya maneja los suficientes términos como para obtener el grado de doctor en ciencias.
Estas son las estadísticas de la serie de: Los números del CIDE hasta el envío anterior, en comparación la novela “El quijote”:
Variable
Número total de palabras:
Número de palabras diferentes:
Número de caracteres utilizados:
Puntos y aparte:
Puntos y seguido:
Comas:
Puntos y comas:
Exclamaciones (!):
Interrogaciones (¿):
Interrogaciones (?):
Dos puntos:
Párrafos
Paréntesis (
Paréntesis )
Paréntesis [
Paréntesis ]
Comillas "
Guiones (-)
Guines bajos ( _ )
Asteriscos (*)
Signos de pesos $
Signos =
Signo +
Apóstrofes ( ' )
Don Quijote
381104
22939
2059005
4046
4161
40167
4800
690
960
960
2046
nd
nd
nd
nd
nd
nd
nd
nd
nd
nd
nd
nd
nd
Números CIDE
121532
12918
757706
2376
3553
6377
134
5
273
593
879
6585
1539
1837
63
63
1985
480
12
13
36
30
22
91
Salud y éxitos
Joel
PD: El compañero Ulises Giovanni Osuna Martínez está desarrollando un software para evaluar nuestro glosario de manera más precisa y con otros índices, como parte de su tesis de maestría, si desean saber más sobre ese trabajo, por favor comuníquense con él.