¿Cómo evaluamos?

Marco general

En lugar de preguntarnos "¿cómo evito que los estudiantes hagan trampa con la IA?", los formadores deberíamos replantear los diseños curriculares con una pregunta más productiva: "Dado que existe la IA y los estudiantes la usarán, ¿qué evidencias de aprendizaje me resultarían ahora convincentes?"

Aunque desarrollar nuevas formas de evaluación requerirá tiempo y esfuerzo, al menos estaremos trabajando en el problema correcto: adaptar nuestros métodos a una nueva realidad educativa. No es fácil, pero podemos partir de un marco general en el que se exija un mayor peso al proceso, la reflexión, y menor al resultado e ir afinando en función del trabajo a evaluar. Un ejemplo:

La rúbrica 40/40/20 sirve para que el docente, y también el estudiante, evalúe no solo el resultado final, sino todo el recorrido:

40 % Proceso → cómo se diseñó y afinó el prompt, cuántas iteraciones hubo, si se verificaron fuentes, si hubo reflexión sobre sesgos y límites de la IA.
40 % Producto → calidad del output generado: corrección lingüística, adecuación al nivel MCER, creatividad y coherencia con los objetivos de la tarea.
20 % Reflexión → análisis crítico del propio trabajo: qué funcionó, qué no, qué cambiaría en la próxima ocasión, y una declaración honesta del uso de la IA (qué hizo la máquina, qué hice yo). Es conveniente que para cada tarea el profesorado diseñe reflexiones estructuradas (preguntas guía) para que no se convierta en relleno.

La idea es premiar tanto el camino como el resultado, y exigir siempre un cierre crítico.

La IA en el diseño de la evaluación

The Next Era of Assessment: A Global Review of AI in Assessment Design

Este informe, desarrollado en colaboración con Pearson, aborda la transformación que la IA está generando en el ámbito de la evaluación docente. Propone una reestructuración fundamental con numerosos e interesantes ejemplos aplicados. El objetivo es doble: mantener la integridad académica y preparar a los estudiantes para interactuar con herramientas de IA en el mundo real. Para lograrlo, se introducen tres tipos de evaluación -libre de IA, asistida por IA e integrada con IA- como un marco práctico para que las instituciones educativas diseñen estrategias de evaluación resilientes y con visión de futuro.

Existen muchas reticencias en cuanto al uso de la IA para evaluar los trabajos del alumnado, y se comprende. Cualquier automatización general es problemática, pero podemos utilizar la IA para una primera opinión, y revisar siempre sus estimaciones. Usando nuestras propias instrucciones, rúbricas y criterios, tanto GPTs- Notebooks, Gems etc.- como plantillas de retroalimentación (parecidas a las instrucciones de un GPT) son capaces de producir una primera evaluación que nos ayude significativamente. Veamos algunos ejemplos.

Evaluación de textos argumentativos

Este asistente GPT sirve para evaluar trabajos argumentativos en inglés, francés, alemán u otras lenguas, aplicando criterios avanzados de estructura, coherencia, adecuación temática, calidad argumentativa y precisión lingüística.

Docentes de idiomas pueden usarlo para obtener diagnósticos detallados sobre cohesión textual, uso de conectores, registro académico y errores frecuentes, además de sugerencias de reformulación y ejercicios específicos.
Estudiantes universitarios reciben retroalimentación adaptada a su nivel, con explicaciones gramaticales y estilísticas, recomendaciones léxicas y modelos de mejora. Esto permite combinar la práctica de la argumentación con el perfeccionamiento del idioma de estudio.

Un par más de GPTs que pueden ayudar en la evaluación: EvaluaIA y Evaluación de la IA generativa.

Plantilla de retroalimentación

Esta plantilla de retroalimentación está diseñada para que el profesorado de idiomas pueda guiar al alumnado en la mejora de sus producciones escritas u orales. Se basa en el modelo PAIRR (Peer & AI Review + Reflection) y sigue principios de retroalimentación formativa, constructiva y centrada en el progreso. Lo pueden usar tanto docentes para evaluar trabajos como estudiantes para autoevaluarse. Basta pegarlo en el chat o subírselo como adjunto con la tarea a (auto)evaluar y la rúbrica del ejercicio.

Pasos a seguir

Actúa como una experta en evaluación.

Revisión de la tarea:
Lee atentamente las instrucciones, la rúbrica y el formato de retroalimentación que se va a utilizar. Identifica qué criterios tienen más peso y cuáles son requisitos imprescindibles (por ejemplo, uso de un tiempo verbal específico, número mínimo de palabras, inclusión de vocabulario de la unidad, uso de fuentes específicas, etc).
Lectura y observación:
Examina el borrador del alumno/a (o su transcripción, si es una tarea oral) buscando las características señaladas en la rúbrica: desarrollo de ideas, claridad, corrección lingüística, adecuación al registro, riqueza léxica, coherencia, cohesión, pronunciación y entonación, según corresponda. Detecta patrones recurrentes:
- Fortalezas: recursos que maneja bien, estructuras que domina, estrategias comunicativas efectivas, etc.
- Áreas de mejora: errores frecuentes, limitaciones de vocabulario, problemas de organización, falta de variedad gramatical, etc.
Reflexión interna:
Haz una lista privada de 8-10 fortalezas y 8-10 aspectos a mejorar. Para cada punto, anota:
- Evidencia textual o ejemplo concreto.
- Relación con los criterios de la rúbrica.
- Impacto potencial en el aprendizaje si se trabaja ese aspecto.
  Esta lista es para tu uso como docente; no se comparte con el alumnado tal cual.
Selección de prioridades:
Elige dos fortalezas clave y dos aspectos prioritarios de mejora. Selecciónalos en función de los objetivos principales de la tarea (por ejemplo, dominio de un tiempo verbal, coherencia argumentativa, uso de conectores lógicos, pronunciación de sonidos clave, etc.
Redacción de la retroalimentación:
Redacta un texto de máx. 650 palabras siguiendo el formato que se indica más abajo. Usa ejemplos del trabajo del alumno/a y un lenguaje motivador, pero preciso y honesto.
Revisión final:
Comprueba que:
- Las citas o ejemplos son exactos.
- Las observaciones están directamente relacionadas con la tarea y la rúbrica.
- No se mencionan la rúbrica ni las instrucciones de manera literal.

Formato de la retroalimentación

Título: “Feedback sobre…” seguido del título de la tarea o actividad.
Dos fortalezas:
- Presenta dos aspectos que el alumno/a hace especialmente bien.
- Explica por qué son efectivos, cómo benefician la comunicación y qué impacto positivo pueden tener en futuros trabajos.
- Incluye citas breves o ejemplos de su producción para ilustrar.
Dos aspectos a revisar:
- Indica dos áreas prioritarias de mejora.
- Aporta ejemplos claros y breves.
- Formula la retroalimentación como sugerencia o reto intelectual, no como problema a corregir (“Un siguiente paso podría ser…” en lugar de “Debes corregir…”).
Notas adicionales (opcional):
Solo si falta un requisito importante (longitud mínima, formato, fuentes, uso de cierto tiempo verbal o vocabulario obligatorio).
Conclusión e invitación:
Frase de cierre recordando que la retroalimentación busca apoyar su crecimiento como usuario/a de la lengua. Ejemplo:

“Esta retroalimentación está pensada para ayudarte a crecer como escritor/a o hablante. El hecho de recibir sugerencias no significa que tu calificación sea negativa, y recibir elogios no garantiza una nota alta. Continúa desarrollando tus puntos fuertes y trabajemos juntos en las áreas de mejora.”

Principios para orientar la retroalimentación

Honestidad y precisión: reconoce lo que realmente está bien logrado sin exagerar.
Priorizar lo esencial: dirige la atención a los aspectos que más influyen en la competencia comunicativa y los objetivos de la tarea.
Enfoque en el impacto en el lector/oyente: explica cómo un receptor podría interpretar el mensaje, qué partes resultan claras o efectivas, y dónde podría necesitar más detalle o claridad.
Equidad lingüística: respeta las variedades lingüísticas y usos no estándar cuando sean funcionales para la comunicación o la identidad del hablante.
Estimular la autonomía: no dar soluciones textuales cerradas; formular preguntas para que el alumno/a encuentre alternativas.
Claridad y concisión: evitar sobrecargar con demasiada información; priorizar lo más relevante.

(Consejos para el estudiante en caso de auto-evaluación)

Estrategias para maximizar el feedback de la IA

1. Sé directa/o y resiste - No necesitas endulzar las cosas para la IA. Expresa desacuerdo, objeciones o frustración; está diseñada para responder con benevolencia y empatía.

2. Pide aclaraciones - Solicita explicaciones, más detalles, extractos de tu trabajo que apoyen las sugerencias, o ejemplos de revisiones.

3. Solicita una nueva versión del comentario - Puedes pedir que reintente, que proporcione feedback más relevante, un estilo diferente, la perspectiva de una persona famosa, o comentarios que contradigan lo anterior.

4. Pregunta sobre puntos no abordados - Menciona elementos olvidados de la tarea, puntos señalados por el profesor, o temas que te intriguen.

5. Úsala para explorar incertidumbres - Describe tus dudas y pide ayuda para descifrar lo que te preocupa, o explora ideas que consideras añadir al borrador.

6. Solicita estrategias de redacción - Describe tus dificultades y pide sugerencias sobre qué estrategias considerar.

7. Juega con el chatbot - Una discusión lúdica puede ayudarte a relajarte y aportar una voz más auténtica. Prueba preguntas absurdas o pide feedback al estilo de personajes de la cultura popular como recordatorio de que son motores de predicción, no mentores sabios.

Aunque es útil comenzar con solicitudes simples de feedback y luego especificar necesidades en conversaciones posteriores, una vez te familiarizas con los chatbots es recomendable ser más preciso desde el inicio. Redactar tu propia solicitud inicial de feedback te permite reflexionar sobre qué tipo de ayuda necesitas realmente, o necesitan tus estudiantes, y te entrena en formular mejores instrucciones. Fuente: Anna Mills

¿Evaluar las conversaciones?

Andrew Maynard propone utilizar IA para evaluar conversaciones largas y complejas entre estudiantes e IA, desarrollando un sistema de evaluación basado en las teorías de aprendizaje experiencial de John Dewey que se enfoca en el proceso de aprendizaje más que en calificaciones tradicionales. Su propuesta incluye tres métricas principales:

el Learning Arc Score (que mide cómo el estudiante transforma situaciones indeterminadas en determinadas),
el SAILS Score (que evalúa qué tan efectivamente dirige la colaboración con IA),
y LENS Diagnostics (que identifica lógica/evidencia, extensión de ideas, movimientos creativos y autorregulación).

Este enfoque permitiría a los profesores extraer información valiosa sobre el progreso del aprendizaje estudiantil de conversaciones informales con IA que serían imposibles de evaluar manualmente a gran escala, representando un cambio de paradigma hacia evaluaciones centradas en el proceso de aprendizaje personal en lugar de assessment rígido basado en umbrales.

El autor reconoce que esto es un trabajo inicial que requiere más investigación, pero ve potencial para transformar cómo evaluamos el aprendizaje en la era de la IA.

En una línea parecida, Mike Kenz aboga por un cambio pedagógico que utilice la anotación de chats de IA por parte de los estudiantes como un artefaco evaluable incluso con más peso en la nota que el propio producto final. (work in progress...)

Se trata de acompañar más que de vigilar, de diseñar rutas que obliguen a pensar, decidir y justificar. Nuestro trabajo no es hallar la “tarea imposible anti-IA”, ni hacer de policías, es construir caminos factibles para que los estudiantes demuestren criterio en un mundo en el que la IA lo puede reproducir todo (o casi...)

Más allá de la vigilancia

En este sentido, Mientras que Maynard y Kenz proponen sistemas métricos y de anotación para evaluar el proceso de aprendizaje a través de las conversaciones con IA, Patrick Dempsey sostiene que este enfoque de "auditoría" es problemático y a menudo se reduce a una simple vigilancia. Dempsey argumenta que pedir a los estudiantes que reflexionen o anoten sus chats genera una "cognición reconstruida" que no es fiable, produciendo un "segundo artefacto" que no captura el evento de aprendizaje inicial, es solo un género más, que el alumnado aprende rápido a confeccionar.

Frente a las métricas de evaluación, Dempsey advierte sobre el "problema de la rúbrica", señalando que no existe una interacción "ideal" con la IA y que intentar evaluar el "pensamiento estratégico" o el refinamiento mediante escalas rígidas ignora que lo que funciona para un estudiante puede no funcionar para otro. Además, cuestiona la viabilidad de analizar volúmenes masivos de texto, afirmando que si el docente no puede leer miles de páginas de registros, la recolección de estos datos carece de propósito pedagógico real.

Para Dempsey, el verdadero aprendizaje (fruto de reconstrucción mental tras el choque cognitivo) no lo podremos evaluar mediante el rastro de la conversación, sino enfrentando al estudiante a un Desafío Auténtico con resultados incontestables en el mundo real, donde el éxito o el fracaso no dependen tanto de una calificación sobre el proceso, sino de la eficacia de la acción emprendida.

La clave : la pedagogía y el diseño instruccional. Proponer recorridos didácticos bien pensados, progresivos y exigentes, que obliguen al alumnado a interpretar, decidir, resolver, justificar y producir algo que funcione fuera del simulacro escolar. En otras palabras, menos policía del prompt y más arquitectura del aprendizaje: crear tareas con fricción cognitiva, criterios claros y retos auténticos cuyo valor se compruebe en la calidad, la pertinencia y la eficacia del resultado. Sí, todo un reto.

Como conclusión... y punto de partida

Lo primero es no agobiarse, el tema es complicado y estamos todos igual, buscando respuestas. Probablemente porque la IA solo ha puesto en evidencia muchos temas que ya no funcionaban antes...

Comienza por aplicar evaluaciones híbridas a pequeña escala, parte IA + parte personal, en un módulo piloto antes de extenderlo.

Mantén un espíritu adaptativo: lo que pienses que “funciona” hoy probablemente cambie mañana. Pero no estamos fijando reglas eternas, sino construyendo en medio de un sistema cambiante. Así que, atrévete a probar, equivocarte, ajustar. Sin frustrarte ni rendirte.

Y si os puedo ayudar, no dudéis en contactarme ;-)

Page updated

Google Sites

Report abuse