Rol, Instrucción Directa, Aprendizaje Autónomo y LOMLOE (I)

Hay un mito muy extendido y bastante aceptado que dice que los juegos de rol son cosa de adolescentes con camisetas negras, dados de veinte caras y una cantidad envidiable de tiempo libre. El mito es comprensible y viene de las mismas personas que en 1980 pensaban que D&D era una puerta de entrada al satanismo y que en 2003 pensaban que World of Warcraft era una puerta de entrada al desempleo. Pero vamos a ver si podemos hacer algo para desmitifcarlo, todo menos lo de las camisetas negras.

Resulta que un niño de tres años lleva con juegos de rol (ampliando muchísimo su significado pero sin pasarnos) desde que aprendió a hablar. La diferencia entre ir corriendo por el pasillo, perseguido por tu tío Antonio gruñendo como si se hubiera atragantado con una nuez, y tú gritando "¡el dragón me persigue!" y una sesión de D&D es básicamente la cantidad de manuales en la estantería. El sustrato es el mismo: ficción compartida, toma de decisiones bajo restricciones y reglas, gestión del turno, decodificación de la perspectiva ajena. El juego simbólico es, según la educación contemporánea, el modo en que el cerebro preescolar construye sus funciones ejecutivas.

Acepto que no se tiran dados. Concedido. Pero detengámonos un momento antes de descartar la analogía por nimios detalles de producción.

Un niño de cuatro años no tiene una personalidad monolítica. Tiene un repertorio completo de personalidades o roles. Con papá hay un personaje. Con la abuela, otro, probablemente más rentable en términos de chucherías. Con los iguales en el patio, otro distinto, calibrado al milímetro en tiempo real según quién manda esa semana. Con el perro, uno donde él manda, lo cual es probablemente el único contexto social donde eso ocurre con consistencia. Con la profesora, otro. La psicología del desarrollo lleva décadas documentando esto: el yo no es una entidad fija que se desplaza entre contextos, que sería patológico, es un sistema de respuestas situacionales que se construye, precisamente, a través de la interacción con esos contextos. Lo que el niño aprende negociando con la abuela no es lo mismo que aprende negociando con el perro, aunque en ambos casos esté aprendiendo a leer intenciones, a calibrar la respuesta del otro y a ajustar su conducta en consecuencia.

Añádele el juego simbólico, "yo soy el pirata y tú eres un tiburón", "ahora soy el maestro y vosotros atendéis", que es, con perdón de la nomenclatura, un TTRPG sin un sistema de resolución. Añádele la ficción narrativa compartida en el recreo, la negociación implícita de reglas que nadie ha escrito, la gestión de turnos que nadie ha formalizado. Y te das cuenta de que no estamos introduciendo el juego de rol en la infancia temprana. Estamos dándole estructura y dirección a algo que ya está pasando.

Porque de facto, y más cuando estamos dando nuestros primeros pasos en eso que el sistema llama "escolarización", que es básicamente la institucionalización de la vida social, existir ya es jugar un rol. Varios roles, simultáneamente, con mecánicas distintas para cada mesa. Lo que cambia cuando diseñamos un juego de rol explícito para preescolares no es la naturaleza de la actividad. Es que dejamos de fingir que no sabemos lo que está pasando y empezamos a aprovecharlo.

El Real Decreto 95/2022, que regula el segundo ciclo de Educación Infantil en España, ese tramo de tres a seis años que el sistema trata a veces como sala de espera del colegio de verdad, tiene la honestidad de no hablar de asignaturas. Habla de competencias y de habilidades transversales. Tres áreas: Crecimiento en Armonía, Descubrimiento del Entorno, y Comunicación y Representación. Y dentro de ellas, de forma explícita o apenas disimulada bajo la terminología de rigor, tres capacidades que la neurobiología lleva dos décadas diseccionando con fruición: el control inhibitorio, la flexibilidad cognitiva y la teoría de la mente.

El problema, que cualquier docente de infantil reconocerá, es que esas capacidades son notoriamente difíciles de operativizar en el aula. No porque los niños no las tengan en potencia. Las tienen. Sino porque la corteza prefrontal de un preescolar de cuatro años es, sin ánimo de ofender, una obra en construcción con el cartel de "disculpen las molestias" todavía pegado en la puerta. El andamiaje importa. El entorno importa. La mecánica importa.

Lo que vamos a explorar en esta entrada es si un juego de rol puede funcionar para entrenar esas habilidades transversales que la LOMLOE exige y que el aula convencional tiene dificultades para sistematizar. Y si la respuesta es que sí, qué teoría de respaldo lo sostiene, qué sustrato neurobiológico lo justifica, y por qué hay dos filosofías diferentes que llegan a respuestas muy distintas sobre cómo construir esa mesa.

Porque no todas las mesas funcionan igual. Y no todos los niños necesitan el mismo tipo de mesa.

Hay dos modelos en la literatura que son, en el mejor sentido posible, irreconciliables entre sí. El primero es la Instrucción Directa (ID), heredera del conductismo operante y de la Teoría de la Carga Cognitiva de Sweller, que confía en el adulto como andamiaje externo, en la guía explícita como acelerador del aprendizaje y en el refuerzo contingente como arquitecto de la conducta. El segundo es el Modelo de Autoaprendizaje por Entorno Preparado (MAEP), enraizado en el constructivismo sensorio-motor de Piaget y en la idea de que el cerebro preescolar aprende mejor cuando tropieza con el entorno que cuando un adulto le explica cómo no tropezar.

Ambos tienen evidencia de respaldo sólida. Ambos tienen efectos secundarios documentados que su literatura tiende a mencionar en letra pequeña. Y ambos generan, cuando se traducen en mecánicas de juego de rol, experiencias de mesa distintas para el mismo niño de cuatro años.

Epistemología

Antes de entrar en harina conviene aclarar una decisión que va a irritar a más de un lector: no vamos a juntar peras con manzanas. No vamos a buscar el punto medio, el enfoque integrador que tome lo mejor de cada casa y que construya una síntesis superadora. No porque no existan personas que lo intenten, existen, y tienen buenas intenciones y tienen bastantes éxitos, sino porque los quiero abordar como extremos de un continuo para mostrar sus ventajas e inconvenientes.

La ID descansa sobre tres pilares teóricos que se refuerzan mutuamente: el conductismo operante de Skinner, el Análisis de Conducta Aplicado y la Teoría de la Carga Cognitiva de Sweller. La lógica interna es coherente: el cerebro preescolar tiene una memoria de trabajo limitada y frágil, la atención es un recurso escaso, y el error no supervisado genera ruido que interfiere con la consolidación del aprendizaje. La solución es reducir la ambigüedad al mínimo. El adulto estructura el entorno, modela la respuesta correcta, dice cuándo actuar y cuándo frenar, y administra las consecuencias, contingentes y predecibles. El niño aprende porque el sistema le dice exactamente qué tiene que hacer y le confirma inmediatamente si lo ha hecho bien. El mecanismo de retroalimentación es externo, rápido y explícito. Maravilloso.

El MAEP parte de un axioma opuesto. Enraizado en el constructivismo sensorio-motor de Piaget y en la tradición del aprendizaje por descubrimiento, sostiene que el conocimiento genuino, incluyendo el conocimiento procedimental de "cómo controlo mi propio cuerpo" o "cómo entiendo lo que siente el otro" no se transmite. Se construye. Y se construye a través del conflicto: el momento en que la acción del niño choca con la resistencia del entorno, el plan falla, y el cerebro tiene que reorganizarse para dar cuenta de la discrepancia. El mecanismo de retroalimentación aquí es interno, diferido y físico. No hay adulto que corrija.

Cuando un niño opera bajo el paradigma ID, su cerebro aprende a leer el entorno buscando señales externas: ¿qué me indica el profesor que tengo que hacer ahora? La atención se orienta hacia afuera, hacia la figura de autoridad que administra las contingencias. Ese es exactamente el modo en que el sistema funciona, y funciona bien mientras se mantiene consistente. Pero si en mitad de esa sesión el adulto retira la guía y convierte el entorno en un puzle autocorrectivo, porque "ahora vamos a explorar libremente", el niño se queda buscando una señal. La ausencia de instrucción explícita no se lee como invitación a la autonomía: se lee como ambigüedad, y la ambigüedad en un sistema entrenado sobre certezas genera ansiedad, conducta de búsqueda de aprobación o parálisis.

El proceso inverso es igualmente destructivo. Un niño que ha estado construyendo autorregulación endógena a través del conflicto con el entorno, aprendiendo a leer sus propios errores propioceptivos como información, ve ese proceso cortocircuitado en el momento en que el adulto interviene para corregirle. La corrección externa no añade información: la sustituye. Y al sustituirla, interrumpe el bucle de retroalimentación interna que es, precisamente, lo que el modelo MAEP está intentando construir.

Dos sistemas de retroalimentación. Dos arquitecturas de atención. Dos modos distintos de procesar errores.

Ingrediente Extra: Cognición corporizada

Hay una imagen mental muy arraigada de cómo funciona el pensamiento. El cerebro arriba, procesando símbolos de forma abstracta y limpia. El cuerpo abajo, ejecutando las órdenes que le bajan por la médula. Un ordenador central y sus periféricos. Es una imagen intuitivamente razonable, y bastante equivocada.

La teoría de la cognición corporizada lleva tres décadas desmantelando esa metáfora con una paciencia admirable. El argumento central, respaldado ahora por neuroimagen funcional y por estudios de desarrollo cognitivo en preescolares, es que las representaciones mentales no flotan en un espacio abstracto desconectado del cuerpo. Se construyen sobre experiencia sensorio-motora. Son el sedimento de millones de interacciones físicas con el entorno, comprimidas y reutilizadas por un cerebro que aprendió a pensar moviéndose.

Para un adulto con córtex prefrontal maduro esto puede sonar a matiz filosófico. Para un preescolar de cuatro años es una descripción bastante literal de cómo funciona su cabeza.

El concepto de "esperar", por ejemplo. Para un adulto es una representación abstracta con connotaciones temporales, sociales y emocionales bien integradas. Para un niño de tres años, "esperar" es fundamentalmente una experiencia corporal: la tensión muscular de refrenarse, la propiocepción del cuerpo contenido, la sensación física de la inacción. 

Lo mismo ocurre con la comprensión del otro. La teoría de la mente, esa capacidad de representarse que el otro tiene estados mentales distintos a los propios, no emerge de la nada como una destreza puramente computacional. Tiene raíces propioceptivas: la imitación motriz involuntaria, la resonancia postural, la sincronización gestual. Cuando un niño pequeño inclina el cuerpo en la misma dirección que el adulto que mira algo con interés, no está ejecutando una instrucción aprendida. Está usando su sistema motor como herramienta de decodificación del estado mental ajeno. El cuerpo es el primer traductor de la mente del otro.

Esto tiene sus consecuencias en el diseño de cualquier actividad que pretenda entrenar funciones ejecutivas en preescolares. Si el control inhibitorio y la toma de perspectiva se construyen sobre experiencia física, entonces una mesa de juego que trabaje esas capacidades de forma efectiva necesita componentes físicos que ofrezcan interacción real: fichas que manipular, mapas, límites espaciales que el cuerpo puede tocar.

Dicho de otra manera: no es que el cuerpo acompañe al aprendizaje. Es que sin el cuerpo, en estas edades y para estas habilidades, no hay aprendizaje que acompañar.

Control Inhibitorio y Autorregulación

Instrucción Directa

Empecemos por lo que funciona, porque funciona. La evidencia sobre la efectividad a corto plazo de la ID en el entrenamiento del control inhibitorio en preescolares es sólida y consistente. Vandenbroucke y colaboradores (2018) documentaron que los entornos de aula con alta estructuración docente y interacción directa profesor-alumno aceleran significativamente la adquisición del control conductual en niños de tres a seis años. No es un efecto marginal ni dependiente de condiciones especiales: cuando hay un adulto que estructura explícitamente qué hacer, cuándo hacerlo y qué consecuencias tiene no hacerlo, los errores por impulsividad caen de forma inmediata y cuantificable.

La pregunta no es si funciona. Es por qué funciona, y la respuesta es bastante elegante.

La corteza prefrontal de un preescolar de cuatro años no está operativa al nivel que requiere la autorregulación autónoma. Las conexiones entre el córtex prefrontal dorsolateral y los circuitos de control motor están incompletas, la mielinización sigue en proceso, y la capacidad del niño para generar por sí mismo las señales de freno que necesita para inhibir una respuesta impulsiva es, en el mejor de los casos, intermitente. Lo que hace el adulto con la ID es, en términos funcionales, prestar su propio córtex prefrontal al niño mientras el del niño termina de construirse.

El mecanismo es el siguiente. El profesor emite un estímulo claro: una señal visual, un gesto, una instrucción verbal precisa que el niño aprende a asociar con "para". Ese estímulo activa la vía de los ganglios basales, el circuito de respuesta más rápida del sistema de control motor. La señal viaja desde la corteza hasta el núcleo subtalámico, que manda una orden de inhibición global descendente sobre la corteza motora primaria antes de que la respuesta impulsiva tenga tiempo de ejecutarse. Es un freno de emergencia, y es extraordinariamente eficaz en el corto plazo precisamente porque no requiere que el niño lo genere desde dentro: viene de fuera, es rápido y es unívoco.

Sostener ese foco atencional en la señal del docente tiene un coste. Requiere una disponibilidad elevada de acetilcolina en las vías colinérgicas del prosencéfalo basal, el neurotransmisor que regula la atención sostenida y la selectividad del foco. El niño que está mirando al profesor y esperando la señal está gastando recursos para mantener ese estado de atención. Lo cual, entre otras cosas, explica por qué estas sesiones no pueden ser indefinidamente largas y por qué el agotamiento atencional es uno de los límites prácticos del modelo.

El gestural prompting, la variante que combina instrucción verbal con modelado físico gestual, añade una capa extra de efectividad porque recluta simultáneamente el sistema de neuronas espejo de la corteza premotora. El niño no solo escucha "para", sino que ve al adulto adoptar una postura de quietud que su propio sistema motor empieza a copiar antes de que la instrucción verbal haya terminado de procesarse. La imitación motriz involuntaria trabaja a favor de la inhibición.

Los Costes Ocultos de la Instrucción Directa

La literatura de Instrucción Directa tiene una tendencia comprensible pero irritante a medir los resultados justo cuando los andamios y todavía están puestos y los obreros no han terminado de recoger. El niño inhibe, el niño espera, el niño sigue la señal. Éxito. Lo que ocurre cuando se retira la señal inequívoca es, con frecuencia, un problema de otra persona en otro paper.

Empecemos por el mecanismo más inmediato. Cuando el sistema de control inhibitorio de un preescolar se construye exclusivamente sobre estímulos externos, el cerebro aprende exactamente lo que le enseñan: a buscar una señal. No a generar el freno, sino a esperar que llegue desde fuera. La autorregulación endógena, ese circuito interno de monitorización del propio error que debería estar madurando durante estos años, no se ejercita porque no hace falta. El adulto lo hace por él. El resultado es lo que el análisis de conducta aplicado llama dependencia del estímulo: la conducta de inhibición existe mientras existe el estímulo que la provoca, y se extingue con una velocidad proporcional a cuánto tiempo lleva sin necesitar generarse de forma autónoma.

Hay un segundo coste que la literatura menciona menos. La corrección explícita constante, el feedback evaluativo continuo que es parte estructural del modelo, eleva de forma crónica los niveles de cortisol salival por estrés evaluativo. No hablamos de trauma, no nos pasemos. Hablamos de la activación sostenida del eje hipotálamo-hipófisis-adrenal ante la posibilidad constante de ser evaluado y corregido. Zelazo (2020) documenta cómo esa elevación crónica de cortisol interfiere directamente con la plasticidad sináptica prefrontal: el cerebro que está en modo alerta evaluativa no está en modo consolidación de aprendizaje. Son estados fisiológicamente incompatibles. A nivel motor, ese estrés sostenido produce rigidez propioceptiva, una reducción de la variabilidad en la ejecución motora que hace al niño menos capaz, no más, de generalizar la conducta de frenado a contextos nuevos donde las señales son distintas o están ausentes.

Hay además un tercer fenómeno que el esquema de ID reconoce pero raramente coloca a la vista: la extinción de la variabilidad operante. Un repertorio conductual sano no es solo inhibición: es inhibición más flexibilidad, más capacidad de generar respuestas nuevas ante situaciones no previstas. El entrenamiento bajo ID intensiva estrecha ese repertorio. El niño aprende a ejecutar respuestas específicas ante señales específicas, y aprende también a no improvisar, porque la improvisación en un entorno de control estricto suele ser un error. El resultado es un perfil conductual eficiente dentro del contexto estructurado y poco adaptable fuera de él.

Hasta aquí los costes a corto y medio plazo. Los de largo plazo son donde la cosa se pone un poco más seria.

Diamond y Ling (2020) son explícitos al respecto: las funciones ejecutivas entrenadas bajo andamiaje externo muestran un déficit de transferencia clínica. La habilidad no se generaliza. El niño que aprendió a inhibirse con una señal explícita tiene dificultades para inhibirse en el recreo, en casa, en cualquier contexto donde las contingencias no están estructuradas de la misma manera. Eso en el corto plazo es un problema de generalización. En el largo plazo es algo más preocupante.

Ryan y Deci (2020) llevan décadas documentando qué le pasa a la motivación y a la autonomía cuando el aprendizaje ocurre bajo control externo. El perfil que emerge no es el de un adulto autónomo que en algún momento internalizó las normas y ya no necesita que nadie se las recuerde. Es el de un adulto con motivación predominantemente extrínseca: que funciona bien cuando hay estructura, supervisión y consecuencias explícitas, y que se desorganiza o paraliza cuando esas condiciones desaparecen. Que necesita que le digan que lo está haciendo bien para seguir haciéndolo. Que interpreta la ausencia de feedback como fracaso. Que tiene dificultades genuinas para actuar desde la iniciativa propia en entornos ambiguos.

No es un perfil disfuncional en todos los contextos. En entornos laborales muy jerarquizados y procedimentales funciona razonablemente bien, que es probablemente porque el sistema educativo que lo produce y el mercado laboral que lo absorbe han coexistido sin demasiadas fricciones durante siglos. Pero es un perfil con un techo bajo en todo lo que requiere autonomía, tolerancia a la ambigüedad y generación de soluciones no previstas.

Dicho sin eufemismos: un niño al que le hemos puesto el córtex prefrontal de repuesto durante demasiado tiempo puede llegar a la vida adulta sin haber construido del todo el suyo propio.

La mesa bajo Instrucción Directa

Suficiente teoría por ahora. Veamos cómo se traduce todo esto en madera, cartón y niños de cuatro años sentados alrededor de una mesa.

La mecánica que ilustra con más limpieza el paradigma ID aplicado al control inhibitorio es lo que llamaremos el Estado de Estatua. La escena narrativa es sencilla: el grupo de héroes en miniatura tiene que cruzar sigilosamente la cueva donde duerme un dragón.  La ficción importa porque engancha la motivación del niño al objetivo.

El DJ controla los tiempos. Cuando la escena requiere silencio e inmovilidad, levanta físicamente un objeto de color llamativo, el estímulo discriminativo de la sesión, que los niños han aprendido a asociar con "congela". La respuesta es corporal y precisa: brazos cruzados sobre el pecho, respiración pausada, silencio absoluto.

En ese momento se activa un cronómetro visible, por ejemplo, un reloj de arena de quince segundos colocado en el centro de la mesa. El objetivo es completarlo sin que el DJ detecte el más mínimo micro-movimiento, una emisión verbal incidental o una alteración postural. Si detecta cualquiera de esas cosas, interviene: detiene la acción, modela físicamente la postura correcta frente al niño que ha fallado, y reinicia el cronómetro desde cero. Sin reproches, sin dramatismo, sin negociación.

Cuando el grupo completa el tiempo, cada niño recibe una ficha recompensa que se deposita en un recipiente transparente y visible en la mesa. La economía de fichas es parte del diseño: la acumulación visible actúa como reforzador, mantiene la motivación entre ensayos y permite al DJ administrar consecuencias diferidas vinculadas al avance narrativo. Al final de la sesión, las fichas acumuladas desbloquean el siguiente capítulo de la historia, por ejemplo.

Todo en esta mecánica está haciendo exactamente lo que se describió en términos neurobiológicos. El marcador físico es el estímulo discriminativo de alta saliencia que activa la vía hiperdirecta. El modelado postural del DJ recluta el sistema de neuronas espejo. El cronómetro externaliza la representación temporal que el córtex prefrontal del niño todavía no puede generar de forma autónoma. La ficha cierra el bucle de refuerzo contingente.

Es un sistema bien construido. Funciona. Y como ya hemos visto, tiene una fecha de caducidad que conviene no ignorar.

El entorno como maestro

El argumento central del MAEP para el control inhibitorio es deceptivamente simple: si quieres que un niño aprenda a frenarse, diseña un entorno que se frene solo cuando él no lo hace. Sin adulto que corrija, sin señal externa que avise, sin economía de fichas. Solo la resistencia del mundo físico devolviendo exactamente la consecuencia proporcional al error cometido.

La evidencia longitudinal que respalda este enfoque viene principalmente de la tradición de investigación sobre entornos de aprendizaje autónomo. Lillard y colaboradores (2017) demostraron en un estudio longitudinal con más de quinientos niños que los entornos con feedback estructurado y sin intervención del adulto producen un desarrollo superior y más duradero de las funciones ejecutivas y el control inhibitorio que los modelos convencionales de instrucción directa. El efecto no era marginal y, lo que es más relevante para nuestro argumento, se mantenía en el tiempo y generalizaba a contextos fuera del entorno de aprendizaje original.

Cuando un preescolar ejecuta un movimiento impulsivo y el entorno responde con resistencia se produce una discrepancia: el plan motor del niño y la respuesta del mundo no coinciden. Esa discrepancia activa la corteza cingulada anterior, la región cerebral especializada en la detección de conflicto y en la señalización de que algo no ha salido como se esperaba.

Si el niño, en lugar de frustrarse y abandonar, reduce la fuerza, ralentiza el movimiento y ajusta su ejecución de forma autónoma hasta que el entorno responde correctamente, se activa la vía dopaminérgica nigroestriada. El estriado ventral libera dopamina contingente a la corrección autónoma del error, no a la aprobación del adulto. El reforzador no es la ficha plástica ni la sonrisa del DJ: es la sensación interna de competencia, el momento en que la figura se desliza porque el niño ha aprendido a calibrar su propio sistema motor contra la resistencia del entorno.

Ese bucle, detección somatosensorial de error, activación del cingulado anterior, corrección autónoma, liberación dopaminérgica contingente, es exactamente el circuito que la neuroeducación identifica como sustrato de la atención ejecutiva intrínseca. No se construye escuchando instrucciones. Se construye tropezando con el mundo de una forma suficientemente bien diseñada como para que el tropiezo sea informativo.

La ID entrena la inhibición a través de un circuito que depende de señales externas para activarse. El MAEP entrena la inhibición a través de un circuito que, una vez consolidado, se activa desde dentro. El primero es más rápido. El segundo, si funciona, es más duradero y transfiere mejor.

Si funciona. Porque, como veremos, no está garantizado para todos los niños ni en todas las condiciones.

El Colapso del MAEP

Aquí es donde la literatura favorable al aprendizaje autónomo empieza silbar y a mirar hacia otro lado.

El modelo funciona sobre un supuesto que raramente se declara de forma explícita: que el niño tiene suficiente maduración prefrontal de partida como para sostener el bucle de ensayo y error sin desintegrarse en el intento. Para ese niño, el entorno preparado es exactamente lo que promete. Para el niño que no cumple ese supuesto, el entorno preparado es una fuente inagotable de frustración sin resolución.

Zelazo (2020) es claro al respecto: la variabilidad en la maduración prefrontal entre niños de tres a seis años es enorme, y esa variabilidad determina la capacidad de beneficiarse de entornos de aprendizaje autónomo. Un niño con baja maduración prefrontal, con sospecha de TDAH o simplemente en el extremo inferior de la curva de desarrollo normal para su edad, no tiene la memoria de trabajo ni la tolerancia a la frustración necesarias para convertir el error en información útil.

El bucle de ensayo y error sin un andamiaje externo genera en ese perfil una sobrecarga progresiva de la memoria de trabajo. Cada intento fallido consume recursos cognitivos sin producir aprendizaje. El cortisol sube, no por estrés evaluativo como en la ID, sino por frustración: la sensación repetida de que no consigue lo que intenta y de que nada en el entorno le dice qué está haciendo mal ni cómo corregirlo. Es un estrés distinto al de la ID pero igual de real en términos de interferencia con la plasticidad prefrontal.

Las consecuencias son predecibles y están bien documentadas. En un extremo, la desorganización activa: el niño lanza las piezas, barre el tablero, destruye el componente que no responde como debería. Es la respuesta conductual a un sistema de retroalimentación que ha dejado de ser informativo y se ha convertido en arbitrario. En el otro extremo, el repliegue apático: el niño deja de intentarlo, se desconecta de la mesa, responde con mutismo a cualquier invitación a continuar. La indefensión aprendida de Seligman.

Y aquí llegamos al punto que mencionamos antes y que la literatura del MAEP prefiere no poner por escrito: el MAEP puro no existe en ninguna implementación real precisamente porque sus propios practicantes saben que hay un subconjunto de niños para los que el modelo sin intervención directa produce exactamente estos resultados. Nadie espera a que un niño descubra las matemáticas por conflicto cognitivo con el entorno. Nadie implementa control de esfínteres por aprendizaje autónomo sin una cantidad considerable de instrucción explícita y refuerzo contingente. Lo que la literatura evalúa como MAEP es siempre, en la práctica, MAEP con intervención discreta no registrada, lo cual contamina los resultados en ambas direcciones y hace que la comparación directa con ID sea metodológicamente más complicada de lo que los metaanálisis suelen admitir.

Dicho esto, y asumiendo implementación razonablemente fiel al modelo, el MAEP tiene un perfil de riesgo concentrado: funciona bien para niños con desarrollo prefrontal típico o avanzado, y produce resultados significativamente peores que la ID para niños con perfiles atencionales o ejecutivos por debajo de la media. La ID, irónicamente, tiene el perfil de riesgo inverso: funciona para casi todos a corto plazo, y también cobra sus costes de forma más democrática y diferida.

Eso, en términos de decisión clínica o pedagógica, no es un detalle menor.

La Mesa  MAEP

Antes de describir la mesa, conviene hacer el inventario completo de los problemas. Porque el MAEP y los juegos de rol tienen tres incompatibilidades.

La primera ya la conocemos: el MAEP puro no tiene DJ. Cualquier figura de autoridad que emita señales, corrija o valide cortocircuita el bucle de retroalimentación interna que el modelo intenta construir. Sin DJ no hay ficción compartida. Sin ficción compartida sostenida no hay TTRPG. Punto muerto.

La segunda es más divertida. La fundadora de la corriente principal del Aprendizje Autónomo desaconsejaba activamente exponer a los niños de cero a seis años a personajes y mundos fantásticos, argumentando que están construyendo su modelo mental de la realidad y que la fantasía interfiere con ese proceso. Recomendaba situaciones cotidianas, objetos reales, imágenes del mundo conocido. Un dragón durmiente, un rey duende, un monstruo de las sombras, todo el andamiaje narrativo natural de un TTRPG para preescolares, es exactamente lo que la doctrina canónica rechaza antes de los seis años.

La tercera incompatibilidad es consecuencia de las dos anteriores: el único juego simbólico que el MAEP canónico acepta en este rango de edad es el de imitación de situaciones reales. Jugar a hacer la cama, a la compra, a trabajar en una oficina, a médicos y a papás y a mamás. No aventuras en mundos inventados.

Dicho todo esto, la evidencia experimental tiene algo que decir sobre la segunda y la tercera incompatibilidad. Y lo que dice es bastante incómodo para la doctrina y bastante cómodo para mí.

Thibodeau y cols. (2016) asignaron aleatoriamente a 110 niños de tres a cinco años a tres condiciones:  juego de ficción fantástica, juego no imaginativo, y control sin intervención. El resultado fue: sólo los niños del grupo de ficción fantástica mostraron mejoras en funciones ejecutivas. Los otros dos grupos no mostraron cambios significativos. Pero lo que importa para nuestro argumento no es solo el resultado sino el diseño de la intervención: los investigadores enfatizaron su objetivo de hacer el juego lo más dirigido por el niño posible, permitiendo que los propios niños generaran sus scripts de juego, resultando en ficción de naturaleza fantástica surgida de forma autónoma. Aprendizaje autónomo. Dirigido por el niño. Con ficción fantástica. Mejora de funciones ejecutivas. Exactamente el cruce que se descartaba antes de los seis años. Y algo que he discutido hasta el aburrimiento.

El mecanismo que explica el resultado es el mismo que describimos con otros componentes: la ficción fantástica exige que el niño alterne constantemente entre el mundo real y el mundo imaginario, usando la memoria de trabajo para sostener las reglas del juego de ficción, inhibiendo esos scripts fuera del contexto de juego y desplazando la atención entre ambos planos de forma autónoma. No es un efecto secundario y agradable del juego. Es justo la habilidad que se busca entrenar. Y dentro de los niños que participaron en la condición fantástica, los que mostraron mayor implicación en el juego y aquellos cuyo juego fue más fantástico demostraron las mayores ganancias en funciones ejecutivas. Más dragones, mejor inhibición. Se veía venir.

Hay un pequeño pecado que conviene confesar: el estudio no encontró efectos significativos sobre la inhibición o la flexibilidad cognitiva de forma aislada, solo sobre las funciones ejecutivas. Lo mencionamos porque si no lo mencionamos nosotros lo mencionará alguien en los comentarios.

Así que usamos ficción fantástica y usamos rol. Con el respaldo de la evidencia experimental, aunque parcial y quizás torticera, y sin complejos respecto a los padres fundadores. Los principios de diseño del MAEP, el control del error incorporado al material, la retroalimentación sin intermediario, la autonomía del aprendiz para detectar y corregir sus propios errores, son herramientas válidas con independencia de que la señora Montessori tuviera una relación tensa con los dragones.

En el universo de los juegos de rol de adultos los referentes más cercanos a esta filosofía son Ironsworn de Shawn Tomkin, donde los oráculos y las tablas generan las consecuencias sin árbitro humano, y Archipelago de Matthijs Holter, donde la autoridad narrativa se distribuye entre todos los jugadores y los principios de mesa resuelven los conflictos sin DJ central. En ambos casos el principio es idéntico al de los cilindros con botón de los materiales Montessori clásicos: el sistema gestiona las consecuencias, no las personas.

Pero la traslación a preescolar requiere un DJ. Pero un DJ de soporte mínimo. Un DJ cuya función es mantener la ficción en pie mientras los componentes y las consecuencias mecánicas hacen el trabajo de retroalimentación. Un DJ que habla para que haya historia y se calla para que haya aprendizaje. La diferencia entre un DJ motorizado y un DJ de soporte no es cuantitativa. Es de principalmente cualitativa: en el modelo ID el DJ es el origen de las consecuencias; en el modelo MAEP-able el DJ es el altavoz por el que habla la narrativa.

La mesa concreta funcionaría así. Hay un mapa con zonas, cada una con una pila de cartas ilustradas boca abajo con consecuencias prediseñadas (Erase una vez, por ejemplo): iconografía clara, sin texto, resultados que el niño puede leer visualmente sin que el DJ los interprete, obstáculos, premios, enemigos o armas... Cuando la acción del personaje en la ficción produce un resultado, el niño roba carta. La consecuencia la decide el sistema, no el DJ. El DJ la traduce a narración en voz alta, igual que un notario lee un documento que no ha redactado.

Si el personaje actúa con impulsividad y el niño roba una carta de obstáculo, el obstáculo existe en la historia con independencia de si el DJ lo habría puesto o no. No hay corrección verbal. No hay reinicio de cronómetro. Hay una consecuencia narrativa que el sistema ha generado y que el niño tiene que resolver con los recursos que tiene.

El DJ está en la mesa, observa, narra lo mínimo imprescindible y no interviene cuando el niño está bloqueado. Y es casi con toda seguridad lo más difícil de ejecutar en toda esta arquitectura, porque va contra todos los instintos que la formación docente convencional lleva años construyendo con mucho esmero.

¿Funciona para todos los niños? No. Ya sabemos con qué perfiles se desintegra y por qué. Pero para el niño con maduración prefrontal suficiente, esta mesa entrena exactamente el bucle de autorregulación endógena que el MAEP promete, dentro de los límites honestos de lo que un juego de rol puede ser.

Entre modelos

Si hemos llegado hasta aquí esperando una respuesta del tipo "los de tres años van con ID y los de cinco con MAEP", la evidencia nos va a decepcionar. Los datos tienen más matices de lo que cualquier manual de pedagogía es capaz de manejar..

Lo que sí dice la evidencia con suficiente solidez como para apoyarse en ella es lo siguiente.

El juego semi-guiado, la versión MAEP-able que describimos, supera a la instrucción directa en dominios específicos: matemáticas tempranas, conocimiento de formas geométricas y cambio de tarea, con tamaños de efecto moderados pero consistentes en un metaanálisis de 39 estudios publicado en Child Development por Skene y colaboradores en 2022. No supera a la ID en todos los dominios. Supera en esos. La instrucción directa transmite información declarativa con más velocidad y menos ambigüedad. Por eso no supera en todos.

Para niños con ADHD o perfil ejecutivo por debajo de la media, el panorama se inclina hacia otro lado. El metaanálisis de Pauli-Pott y cols. (2020) sobre intervenciones cognitivas en preescolares con ADHD encuentra que las intervenciones con andamiaje externo estructurado son las más efectivas para reducir síntomas y mejorar funciones ejecutivas en ese perfil. No el juego libre. No el entorno sin guía. El andamiaje externo y estructurado. Para ese niño, la ID no es solo más rápida: es la única que funciona con consistencia suficiente como para recomendarla.

La diferenciación por edad pura, tres años ID y seis años MAEP, es una heurística razonable que se concluye de lo que sabemos sobre maduración prefrontal, pero no he encontrado ningún paper que la establezca como regla. Lo que sí tiene respaldo es la lógica subyacente: a menor maduración prefrontal, menor capacidad para generar el bucle de autorregulación endógena que requiere el MAEP, y por tanto mayor necesidad de andamiaje externo. A los tres años la variabilidad en maduración prefrontal entre niños del mismo grupo es enorme. A los cinco y seis años esa variabilidad se reduce y la mayoría puede beneficiarse de entornos con menos guía externa. Pero "la mayoría" no es "todos", y el perfil con baja maduración prefrontal sigue necesitando ID a los seis años igual que a los tres.

La decisión de qué modelo usar, por tanto, no es una decisión de edad. Es una decisión individualizada, de perfil. Y dentro del perfil, de objetivo: si el objetivo es la implantación rápida de una conducta específica, ID. Si el objetivo es la consolidación autónoma y transferencia a largo plazo, MAEP-able. Si el niño tiene sospecha de TDAH o perfil ejecutivo bajo, ID con fading programado hacia más autonomía conforme el perfil lo permita.

Para el diseñador de TTRPG que está leyendo esto con la esperanza de que le digamos qué sistema construir, la respuesta es: diseña los dos. No los mezcles en la misma sesión, porque ya explicamos por qué juntarlos produce ruido. Pero ten ambos en el cajón y decide cuál usar y para quién.


Comentarios