Saltar a contenido

Capítulo 7. Evaluación formativa con Inteligencia Artificial

La evaluación formativa es uno de los pilares de la Nueva Escuela Mexicana y del Plan de Estudios 2022.1 Más que un conjunto de instrumentos, se concibe como una práctica viva de diálogo, reflexión y acompañamiento continuo de los procesos de desarrollo de aprendizaje de las y los estudiantes.

En este contexto, la IA puede apoyar el diseño de instrumentos, la organización de evidencias y la generación de retroalimentaciones, pero nunca reemplazar el juicio profesional del docente ni la dimensión ética de la evaluación. Este capítulo propone una metodología para integrar la IA en sistemas de evaluación formativa coherentes con la NEM, respetando siempre la centralidad del docente y de los procesos humanos de aprendizaje.

Nota
La IA no “evalúa” a tus estudiantes; te ayuda a ver mejor, organizar mejor y expresar mejor lo que tú observas y decides desde tu práctica pedagógica.

Al finalizar este capítulo habrás:

  • revisado el sentido de la evaluación formativa en la NEM;
  • entendido cómo la IA puede apoyar sin sustituir tu juicio;
  • diseñado ejemplos de rúbricas, listas de cotejo y escalas contextualizadas;
  • explorado formas de generar retroalimentación personalizada;
  • organizado un Banco de Evaluación dentro de tu Asistente Docente IA.

Reflexión
Evaluar formativamente con IA no es automatizar decisiones, sino fortalecer tu capacidad para acompañar el aprendizaje con más información, más claridad y más tiempo para el diálogo.

7.1 ¿Qué es la evaluación formativa?

Los documentos de la SEP y la literatura reciente describen la evaluación formativa como un proceso sistemático, continuo y contextualizado que se integra al quehacer pedagógico para acompañar los procesos de aprendizaje, ofrecer retroalimentación y ajustar la intervención docente. En la NEM, se vincula estrechamente con los Procesos de Desarrollo de Aprendizaje (PDA) y con proyectos de aula, escuela y comunidad.1

Propósito y características

Su propósito central es:

  • identificar avances y dificultades en los procesos de aprendizaje, más allá de resultados finales;
  • ofrecer retroalimentación cualitativa y dialógica que ayude a mejorar;
  • ajustar actividades, materiales y estrategias en función de lo observado;
  • fomentar la autoevaluación, la coevaluación y la metacognición en estudiantes.

Entre sus características destacan:

  • continuidad: se realiza a lo largo de todo el proyecto o secuencia;
  • contextualización: se vincula con situaciones reales y con el contexto escolar y comunitario;
  • participación activa: involucra estudiantes en prácticas de reflexión sobre su propio aprendizaje;
  • cualitatividad: privilegia descripciones y criterios sobre simples calificaciones numéricas.

Diferencias con la evaluación sumativa

La evaluación sumativa se centra en certificar resultados al final de un periodo (por ejemplo, calificaciones, informes), mientras que la evaluación formativa:

  • se integra al proceso diario de enseñanza;
  • registra avances parciales, errores y reajustes;
  • busca apoyar el aprendizaje, no solo registrarlo;
  • abre espacios para que los estudiantes participen en la valoración.

Evaluación continua y retroalimentación

La SEP enfatiza que la evaluación formativa implica seguimiento sistemático de actividades, proyectos y procesos, con retroalimentación constante. La retroalimentación:

  • se orienta a procesos, no solo productos;
  • reconoce logros, identifica áreas de mejora y propone caminos concretos;
  • se ofrece de manera respetuosa, motivadora y específica.

Dato relevante
Documentos como La evaluación formativa en la NEM describen la evaluación formativa como “práctica viva” que vincula observación sistemática, diálogo, autorreflexión y co-reflexión.

Reflexión
Evaluar formativamente es reconocer que el aprendizaje no es una foto final, sino una película llena de decisiones, errores, avances y ajustes compartidos.

7.2 La IA como apoyo para evaluar

Las orientaciones de UNESCO y la OCDE sobre IA en educación coinciden en que los sistemas de IA pueden apoyar la evaluación formativa al analizar datos, generar retroalimentación y organizar evidencias, siempre dentro de modelos híbridos donde el docente mantiene el control.

Ámbitos de apoyo

En el trabajo docente cotidiano, la IA puede ayudar a:

  • diseñar instrumentos: proponer estructuras de rúbricas, listas de cotejo y escalas, que luego se ajustan al contexto;45
  • organizar evidencias: clasificar trabajos, proyectos y registros según criterios definidos;
  • redactar retroalimentaciones: generar borradores de comentarios personalizados que el docente revisa y adapta;
  • analizar información: detectar patrones en avances, dificultades y tipos de errores;
  • identificar áreas de oportunidad: sugerir posibles focos de trabajo a partir de datos de desempeño, siempre bajo supervisión humana.

Decisión final del docente

Los marcos éticos de UNESCO y las recomendaciones de la OCDE insisten en que el uso de IA en evaluación debe respetar la centralidad del docente y la agencia del estudiante. La decisión final sobre:

  • qué instrumentos usar;
  • cómo interpretar evidencias;
  • qué retroalimentación ofrecer;
  • qué ajustes hacer en la planeación;

corresponde siempre al docente y al colectivo escolar.

Error común
Pensar que la IA puede “calificar” automáticamente y sin revisión, reduciendo la evaluación a números. Esto va contra la lógica formativa y contra los principios de la NEM.

Tabla: Ventajas y limitaciones del uso de IA en evaluación

Aspecto Ventajas potenciales Limitaciones y riesgos
Diseño de instrumentos Ahorra tiempo, propone estructuras y ejemplos.45 Puede generar criterios genéricos o descontextualizados.
Organización de evidencias Facilita clasificación y síntesis de datos. Riesgo de confiar en patrones sin revisarlos.
Retroalimentación Apoya la redacción de comentarios personalizados. Puede usar lenguaje inadecuado si no se revisa.
Análisis de información Identifica tendencias y áreas de oportunidad. No comprende matices emocionales, contextuales o culturales.

Buenas prácticas
Utiliza la IA para preparar borradores y análisis, pero reserva un espacio de revisión personal y, cuando sea posible, colectiva antes de incorporar esos resultados a tu práctica evaluativa.

Reflexión
La IA puede ver patrones que tú no alcanzas por falta de tiempo, pero solo tú puedes decidir qué significan esos patrones en la vida real de tus estudiantes.

7.3 Diseñando instrumentos de evaluación

Los instrumentos son herramientas que ayudan a concretar la evaluación formativa. El Plan de Estudios 2022 y diversos materiales oficiales mencionan rúbricas, listas de cotejo, escalas de valoración, registros y portafolios como opciones válidas.

Rúbricas

Una rúbrica describe niveles de desempeño en relación con criterios específicos. En la NEM, se recomienda que las rúbricas:

  • estén vinculadas con PDA y productos de proyectos;
  • describan cualitativamente momentos de avance, no solo etiquetas;
  • sean compartidas y discutidas con estudiantes para fomentar autoevaluación y coevaluación.

Ejemplo de rúbrica básica (síntesis)

# Rúbrica: Relatos comunitarios escritos

Criterios:
- Comprensión del relato comunitario
- Estructura narrativa
- Uso de lenguaje respetuoso y claro
- Reflexión sobre el significado del relato

Niveles de desempeño (descripción cualitativa):
- En inicio
- En proceso
- Logro esperado
- Logro sobresaliente

La IA puede apoyar proponiendo descripciones iniciales para cada nivel, que luego se ajustan al grupo y al contexto.45

Listas de cotejo

Las listas de cotejo registran presencia o ausencia de elementos clave. Son útiles para tareas concretas o productos específicos.

Ejemplo (síntesis):

# Lista de cotejo: Observación del entorno

Elementos:
- Registro de fecha y lugar
- Descripción del fenómeno observado
- Dibujo o esquema
- Preguntas planteadas

Marcar: Sí / No / Parcial

La IA puede sugerir elementos adicionales o reorganizar la lista, pero es el docente quien define qué es esencial según los contenidos y PDA.23

Escalas de valoración

Las escalas de valoración permiten graduar la frecuencia o calidad de ciertos comportamientos, procesos o productos (por ejemplo, “nunca, algunas veces, casi siempre, siempre”).

Registros anecdóticos y diarios de observación

Son notas cualitativas donde el docente registra situaciones significativas, avances, dificultades y comportamientos relevantes.

La IA puede ayudar a:

  • sintetizar registros extensos;
  • agrupar notas por categorías;
  • sugerir temas recurrentes.

Portafolios

Un portafolio reúne evidencias de aprendizaje (productos, reflexiones, revisiones) a lo largo de un periodo. En la NEM, pueden vincularse con proyectos y PDA.

Tabla: Rúbrica vs lista de cotejo vs escala de valoración

Instrumento Función principal Ventajas Limitaciones
Rúbrica Describir niveles de desempeño según criterios. Favorece evaluación cualitativa y retroalimentación específica. Requiere tiempo de construcción y explicación.
Lista de cotejo Registrar presencia/ausencia de elementos clave. Simple, rápida, útil para tareas concretas. Menos profundidad en procesos.
Escala de valoración Graduar frecuencia o calidad de comportamientos. Útil para observar procesos y actitudes. Puede tender a simplificar si no se acompaña de registros cualitativos.

Consejo
Elige el instrumento según lo que quieres observar: productos específicos, procesos, actitudes, trayectorias. Después, usa la IA para ayudar a redactar y organizar criterios y niveles.

Reflexión
Un instrumento bien diseñado no responde solo a “qué hizo el estudiante”, sino a “cómo está avanzando en el proceso de aprendizaje que queremos acompañar”.

7.4 Retroalimentación personalizada

La retroalimentación es el corazón de la evaluación formativa. La OCDE destaca que el feedback de calidad tiene impacto significativo en el aprendizaje cuando es específico, oportuno y orientado a la mejora. En la NEM, se enfatiza la retroalimentación dialógica y contextualizada.

Características de una buena retroalimentación

Una retroalimentación formativa suele ser:

  • clara: el estudiante entiende qué se le está diciendo;
  • respetuosa: reconoce esfuerzos y evita etiquetas negativas;
  • motivadora: anima a seguir trabajando;
  • específica: señala aspectos concretos, no generalidades;
  • orientada a la mejora: incluye sugerencias o preguntas que muestran caminos posibles.

Uso de IA para redactar retroalimentación

La IA puede ayudar a:

  • generar borradores de comentarios personalizados a partir de descripciones de desempeño;
  • proponer distintas maneras de decir lo mismo con más claridad o empatía;
  • sugerir preguntas de reflexión que acompañen la retroalimentación.

Ejemplo de prompt para retroalimentación:

Rol: Asistente para retroalimentación formativa.

Contexto:
- 4.º de primaria.
- Proyecto de relatos comunitarios.

Desempeño observado:
- El estudiante comprende el relato pero su escritura tiene poca organización.
- Muestra interés y respeto por la historia.

Instrucciones:
1. Redacta una retroalimentación breve y respetuosa.
2. Reconoce logros.
3. Señala un aspecto a mejorar.
4. Propón una sugerencia concreta.

La IA generará un texto base que el docente ajusta según su estilo y el conocimiento del estudiante.

Error común
Copiar la retroalimentación generada por IA sin revisar el tono, las referencias culturales o la pertinencia para el estudiante concreto.

Ejemplos de retroalimentación

  • “Reconozco el cuidado con el que recuperaste la historia de tu comunidad. Para mejorar, podrías organizar tu relato en párrafos que separen el inicio, el desarrollo y el final. En la próxima versión, intenta marcar estos momentos con frases que indiquen cuándo empieza y cuándo termina cada parte.”

  • “Me gusta cómo participas en las discusiones sobre el proyecto. Para seguir avanzando, te invito a escribir una breve reflexión sobre qué aprendiste de los relatos de tus compañeros y cómo se relacionan con tu propia experiencia.”

La IA puede sugerir formulaciones similares, pero tú eliges las más adecuadas.

Buenas prácticas
Considera construir bancos de frases y estructuras de retroalimentación (apoyados por IA) que puedas adaptar rápidamente según cada estudiante y contexto.

Reflexión
Una buena retroalimentación no se limita a decir “bien” o “mal”; abre una conversación sobre el proceso y ofrece caminos para seguir aprendiendo.

7.5 Análisis de evidencias

La evaluación formativa requiere recoger y analizar evidencias de aprendizaje: productos, proyectos, exposiciones, trabajos escritos, registros de participación.

Tipos de evidencias

  • Productos escritos: textos, informes, relatos, cuadernos.
  • Proyectos: resultados de ABP, prototipos, campañas, exposiciones.
  • Presentaciones y exposiciones: orales, visuales, digitales.
  • Trabajos prácticos: experimentos, prácticas de campo, actividades comunitarias.
  • Observaciones de participación: registros anecdóticos, diarios de clase.

Relación con los PDA

El análisis debe vincular evidencias con los PDA seleccionados en la planeación. Documentos sobre evaluación formativa en el Plan 2022 señalan que es deseable que los estudiantes conozcan los PDA y los criterios de evaluación para participar en auto y coevaluación.

La IA puede ayudar a:

  • agrupar evidencias según PDA (por ejemplo, todas las relacionadas con “interpretar fenómenos naturales”);
  • sintetizar observaciones en cuadros o tablas;
  • identificar patrones de mejora o de dificultad.

Tabla: Tipos de evidencias y análisis con apoyo de IA

Tipo de evidencia Ejemplo Apoyo de IA posible
Producto escrito Relato comunitario, informe de experimento. Resumir textos, sugerir categorías de análisis.
Proyecto Campaña de cuidado del ambiente, exposición. Organizar descripciones, sintetizar logros y desafíos.
Presentación Exposición oral sobre tema local. Extraer puntos clave, sugerir preguntas de reflexión.
Trabajo práctico Registro de prácticas agrícolas, experimentos. Agrupar observaciones, identificar patrones.
Observaciones Diario de clase, registros anecdóticos. Clasificar notas por tema o PDA, generar resúmenes.

Consejo
Usa la IA para ayudarte a ver el conjunto: qué evidencias tienes, cómo se relacionan con los PDA, qué patrones aparecen. Después, toma decisiones de ajuste y retroalimentación.

Reflexión
Las evidencias no son solo “papeles” acumulados: son historias del aprendizaje de tus estudiantes. La IA puede ayudarte a leer esas historias con más detalle, pero tú decides qué significan.

7.6 Casos reales

Para concretar la metodología, se presentan ejemplos de evaluación formativa con apoyo de IA en distintos niveles y contextos.

Caso 1: preescolar urbano

Contexto: jardín de niños con alta participación familiar.

Proyecto: cuidado del jardín escolar.

Evidencias: dibujos, fotos, relatos orales, observaciones de participación.

Instrumentos: lista de cotejo para registrar participación en tareas de cuidado y rúbrica sencilla para interpretar dibujos y relatos.

IA como apoyo: organizar notas de observación en categorías (participación, colaboración, expresión emocional) y sugerir frases de retroalimentación breve para compartir con familias.

Caso 2: primaria rural multigrado

Contexto: primaria rural con proyecto sobre conservación de suelos.

Evidencias: cuadernillos de observación, entrevistas con agricultores, propuestas de prácticas de cuidado.

Instrumentos: rúbrica para valorar calidad de propuestas (comprensión del problema, uso de saberes locales, viabilidad) y portafolio con evidencias de campo.

IA como apoyo: sintetizar textos de entrevistas, organizar las propuestas en tablas, sugerir categorías de análisis para la rúbrica.

Caso 3: secundaria urbana

Contexto: secundaria general, proyecto sobre ciudadanía digital.

Evidencias: infografías, debates, reflexiones escritas.

Instrumentos: rúbrica para valorar infografías (claridad, relevancia, diseño, respeto) y registros de participación en debates.

IA como apoyo: proponer descripciones de niveles para la rúbrica, sugerir preguntas de reflexión sobre derechos digitales, agrupar comentarios de estudiantes según temas.

Caso 4: escuela indígena

Contexto: primaria indígena bilingüe, proyecto sobre relatos en lengua originaria.

Evidencias: fichas bilingües, grabaciones de narraciones, reflexiones sobre identidad.

Instrumentos: rúbrica que valore respeto a la lengua, claridad del relato y reflexión sobre identidad; diarios de observación sobre participación comunitaria.

IA como apoyo: sugerir estructuras de rúbrica y formatos de registro, sin intervenir en la lengua originaria, que corresponde al docente y a la comunidad.

Caso 5: primaria multigrado

Contexto: primaria multigrado con proyecto sobre fenómenos meteorológicos.

Evidencias: tablas de observación, dibujos, explicaciones orales.

Instrumentos: listas de cotejo diferenciadas por grado, escala de valoración para participación en registros.

IA como apoyo: organizar tablas, proponer versiones de listas adaptadas a distintos niveles.

Tabla: Evaluación según contexto

Contexto Instrumentos principales Uso de IA
Preescolar urbano Listas de cotejo, rúbricas sencillas, registros de participación. Clasificar observaciones, redactar feedback breve.
Primaria rural multigrado Rúbricas de proyectos, portafolios, diarios de campo. Sintetizar entrevistas, organizar propuestas.
Secundaria urbana Rúbricas de infografías y debates, registros de reflexión. Sugerir descriptores, agrupar comentarios.
Escuela indígena Rúbricas bilingües, diarios de identidad, registros comunitarios. Proponer estructuras, apoyar síntesis (sin sustituir la lengua).
Primaria multigrado Listas y escalas diferenciadas, tablas de observación. Ajustar instrumentos por grado, organizar datos.

Consejo
Documenta cada caso en tu Asistente Docente IA indicando: contexto, instrumentos usados, tipo de evidencias, rol de la IA y aprendizajes sobre la práctica evaluativa.

Reflexión
La evaluación formativa se ve distinta en cada contexto, pero comparte una intención: acompañar el aprendizaje con respeto, claridad y sentido comunitario.

7.7 Construcción del Banco de Evaluación

En continuidad con el proyecto, este capítulo propone crear la carpeta Evaluacion/ dentro del Asistente Docente IA.

Estructura propuesta

Evaluacion/

├── Rubricas/
├── Listas-Cotejo/
├── Escalas-Valoracion/
├── Retroalimentacion/
├── Evidencias/
├── Instrumentos/
├── Seguimiento/
├── Reportes/
└── Banco-Evaluacion.md

Finalidad de cada carpeta

Carpeta / archivo Finalidad
Rubricas/ Guardar rúbricas por campo formativo, proyecto, grado y contexto.
Listas-Cotejo/ Almacenar listas de cotejo por tareas y productos específicos.
Escalas-Valoracion/ Contener escalas para observar procesos y actitudes.
Retroalimentacion/ Reunir ejemplos y plantillas de retroalimentación personalizada.
Evidencias/ Registrar tipos de evidencias y ejemplos organizados por PDA.
Instrumentos/ Documentar otros instrumentos (diarios, portafolios, registros anecdóticos).
Seguimiento/ Guardar reportes de seguimiento a proyectos, procesos y grupos.
Reportes/ Contener formatos de informes para estudiantes y familias.
Banco-Evaluacion.md Integrar índice general, criterios y notas sobre uso de IA en evaluación.

Ciclo de uso del Banco de Evaluación

flowchart TD
    PL[Planeación] --> INS[Selección/diseño de instrumentos]
    INS --> REC[Recopilación de evidencias]
    REC --> ANA[Análisis y reflexión]
    ANA --> RET[Retroalimentación]
    RET --> AJ[Ajunte de planeación]
    AJ --> PL

En este diagrama, la evaluación formativa se integra como ciclo continuo. La IA puede aparecer en cada fase como apoyo a la selección de instrumentos, organización de evidencias, análisis y redacción de retroalimentación, pero el Banco de Evaluación se mantiene como sistema de trabajo profesional.

Ilustración sugerida

[Ilustración: Un docente sentado con una carpeta digital abierta en su laptop, donde se ve la estructura “Evaluacion/Rubricas/”, “Evaluacion/Listas-Cotejo/”, “Evaluacion/Retroalimentacion/”. Sobre la mesa hay trabajos de estudiantes, algunas rúbricas impresas y notas de observación. El docente escribe comentarios en un cuaderno mientras consulta breves textos generados por IA en la pantalla, que luego adapta antes de compartirlos con los estudiantes.]

La escena refleja la combinación de instrumentos, evidencias, apoyo tecnológico y reflexión docente.

Buenas prácticas
Mantén tu Banco de Evaluación como repositorio vivo: revisa, actualiza y mejora instrumentos y retroalimentaciones a la luz de la experiencia y del diálogo con tu colectivo.

Reflexión
Un buen Banco de Evaluación no solo organiza documentos, sino que refleja tu manera de entender el aprendizaje y de acompañar a tus estudiantes.

7.8 Resumen

Este capítulo ha presentado una metodología para integrar la evaluación formativa y la IA en la práctica docente dentro de la Nueva Escuela Mexicana. Se explicó que la evaluación formativa es un proceso continuo, dialógico y contextualizado, vinculado con los PDA, los proyectos y la vida real de los estudiantes.1 Se describió cómo la IA puede apoyar el diseño de instrumentos, la organización de evidencias, la redacción de retroalimentaciones y el análisis de información, siempre bajo la decisión final del docente.

Se trabajaron ejemplos de instrumentos (rúbricas, listas de cotejo, escalas, registros, portafolios), se mostraron casos contextualizados en distintos niveles y tipos de escuela, y se propuso la construcción de la carpeta Evaluacion/ y del archivo Banco-Evaluacion.md dentro del Asistente Docente IA. Este banco se convierte en un sistema profesional organizado para acompañar el aprendizaje a lo largo del ciclo escolar.

Dato relevante
Informes recientes de la OCDE sobre IA y evaluación insisten en modelos híbridos donde la IA refuerza la evaluación formativa y la personalización, sin reemplazar el juicio profesional ni la agencia de estudiantes.

En el siguiente capítulo, el foco se desplazará hacia el uso de IA para apoyar la investigación docente: análisis de datos, sistematización de experiencias y construcción de conocimiento profesional a partir de la práctica.

Reflexión
Evaluar formativamente con IA no es automatizar resultados, sino aprender a usar la tecnología para ver mejor y acompañar mejor los procesos de aprendizaje que importan en tu contexto.

Notas


  1. Secretaría de Educación Pública (SEP). (2022). Plan de Estudios 2022 de la Educación Básica: Preescolar, Primaria y Secundaria. Recuperado de https://educacionbasica.sep.gob.mx/wp-content/uploads/2024/06/Plan-de-Estudio-ISBN-ELECTRONICO.pdf 

  2. Fuente 119 Recuperado de https://educacionbasica.sep.gob.mx/wp-content/uploads/2024/06/Programa_Sintetico_Fase-2.pdf 

  3. Fuente 129 Recuperado de https://www.dof.gob.mx/2023/SEP/ANEXO_ACUERDO_080823_FASES_2_A_6.pdf 

  4. OpenAI, Anthropic, Microsoft. (2023–2026). Guías de diseño de prompts y uso de IA para apoyo en análisis y redacción. Recuperado de https://developers.openai.com/api/docs/guides/prompt-engineering 

  5. OpenAI, Anthropic, Microsoft. (2023–2026). Guías de diseño de prompts y uso de IA para apoyo en análisis y redacción. Recuperado de https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/prompt-engineering