Palabras clave
Las palabras clave (keywords) son aquellas palabras que se usan con una frecuencia mayor de la esperable en el corpus objeto de estudio, en comparación con otro corpus que se toma como referencia.
Si comparamos el corpus de aprendices con un corpus web de gran tamaño como Spanish Web 2018 (esTenTen18), vemos que las palabras típicas del primero puede agruparse en varias categorías:
Palabras que designan conceptos relacionados con Japón, cuya frecuencia es lógicamente mayor que en corpus generales. Se trata de nombres de lugar (Osaka, Kioto, Kangawa, Aichi, Hirakata, Hyogo, Japón, etc.), comidas (takoyaki, okonomiyaki, miso, sake, udon, sushi) o elementos culturales (kimono, palillo, yen, cerezo).
Palabras relacionadas con el aprendizaje de lenguas: gramática, memorizar, vocabulario, DELE.
Palabras con errores ortográficos típicos entre este grupo de aprendices: ejempro, simpatico, siemple, espanol, amabre, fuí, ingrés, etc.
Algunas palabras relacionadas con el tema de las tareas. Hay dos tareas (Cómo tirar la basura correctamente y Estadística sobre los residentes extranjeros en Japón) que presentan una alta frecuencia de ciertas palabras muy específicas como tirar, basura, combustible, cuerda, bolsa, caja, residentes... Esto sugiere que sería conveniente reducir el tamaño de estas dos tareas o añadir más textos al corpus para reducir su peso total.