8.12 Conjuntos de reserva, Enmascaramiento, Controles nulos y Replicación entre flujos de análisis: cómo impedir que EFT sea una «teoría que solo sabe contar historias» | Teoría del filamento de energía

I. Conclusión de este apartado

Este apartado no añade nuevas líneas de juicio a nivel de objeto; lo que aporta es un conjunto de reglas de examen más frío, más duro y menos complaciente. Si EFT quiere seguir contabilizando como «apoyo» los residuos de corrimiento al rojo de 8.4 a 8.11, el cierre del Mapa base compartido, la estratificación estructural, las texturas finas cerca del horizonte, los umbrales de los Dispositivos de frontera y las salvaguardas cuánticas, antes debe aceptar cuatro salvaguardas unificadas: los Conjuntos de reserva no permiten reajustar el criterio mirando el resultado; el Enmascaramiento no permite mirar la respuesta; los Controles nulos no pueden ser significativos al mismo tiempo que el resultado principal; y la Replicación entre flujos de análisis no permite que una sola ruta monopolice la verdad. Sin esas cuatro puertas, por brillante que sea el volumen 8, puede seguir siendo una narración de alto poder explicativo; al cruzarlas, empieza a parecerse a una teoría candidata dispuesta a ser examinada.

II. Después de la capa de objeto, hace falta una compuerta metodológica general

Los apartados 8.4 a 8.11 ya han puesto sobre la mesa todos los campos de batalla a nivel de objeto en los que EFT más desea ganar y donde también puede sufrir más: el Término común sin dispersión entre sondas, el eje TPR y los residuos PER, el Mapa base compartido entre rotación, lentes y fusiones, la génesis estructural, la placa de fondo y la tomografía ambiental, las Señales distintivas cerca del horizonte y de frontera, los Dispositivos de frontera y el Vacío de campo fuerte, así como la propagación cuántica y la salvaguarda de no comunicación. Pero no basta con escribir «qué se mide», «qué resultado cuenta como apoyo» y «qué resultado causaría daño estructural». Precisamente porque el lenguaje de EFT tiene una gran fuerza explicativa, el mayor peligro de una teoría con gran capacidad explicativa no es quedarse sin casos, sino poder hacer que demasiados casos suenen convincentes después de verlos.

Todavía faltaba una compuerta general: todo resultado que quiera puntuar debe preguntarse primero si ha ganado bajo la misma familia de salvaguardas metodológicas. Solo si esa compuerta queda clara podrá el balance posterior distinguir con legitimidad entre «apoyo directo», «ajuste» y «daño estructural»; de lo contrario, se deslizará con facilidad hacia un libro de méritos construido con ejemplos escogidos a posteriori.

III. Este apartado no añade una nueva familia experimental; añade disciplina de examen

Este apartado no debe convertirse en un manual de estadística. Eso enfriaría de golpe el volumen 8 y lo apartaría de su verdadera tarea. El 8.12 no viene a enseñar qué son los conjuntos de entrenamiento, los conjuntos de prueba, la significación estadística, los factores de Bayes o el promediado de modelos; hace algo más severo: explicar cómo impedir que EFT se engañe a sí misma.

Por eso, las cuatro reglas de 8.12 no son maniobras técnicas aisladas. Todas giran alrededor de una misma disciplina general: congelar el criterio antes, y después limitarse a contabilizar, sin cambiar la versión. Cómo se eligen las muestras, qué objetos entran en la muestra principal, qué bandas o capas de corrimiento al rojo quedan reservadas, qué indicadores ambientales entran en el análisis principal, qué reglas de exclusión son válidas y qué reglas de puntuación cuentan como acierto: todo debe escribirse antes de mirar el resultado principal. Sin este paso, los Conjuntos de reserva se consumen a escondidas, el Enmascaramiento se vuelve una puesta en escena, los Controles nulos se eligen entre los más débiles y la Replicación entre flujos de análisis se reduce a «correr dos veces el mismo sesgo».

Igual de importante es separar los papeles. Muchos experimentos y observaciones del volumen 8 encajan de forma natural en una misma arquitectura: un grupo de predicción previa publica tarjetas de predicción solo a partir del entorno, la geometría y variables proxy ya congeladas; un grupo de medición extrae las lecturas sin conocer el contenido de esas tarjetas; y un grupo de arbitraje alinea predicciones y resultados solo al final, de acuerdo con una tabla de puntuación prerregistrada. No todas las líneas tienen que copiar mecánicamente esos tres grupos, pero esta arquitectura recuerda el punto más importante de este apartado: la predicción debe preceder a la imagen bonita, y las reglas deben preceder a la historia brillante.

IV. Primera salvaguarda: Conjuntos de reserva - no reajustar el criterio con el resultado

En 8.12, los Conjuntos de reserva no son una amable «comprobación de generalización», sino una cuchilla diseñada para impedir el reajuste retrospectivo. El error más fácil para EFT no consiste en no ver señal alguna, sino en ver una dirección inicial y, a partir de ahí, seguir ajustando muestras, particiones ambientales, umbrales, criterios de fondo y familias de ajuste hasta que esa pequeña dirección se convierta en una figura elegante. Los Conjuntos de reserva existen para cerrar esa salida: se puede fijar el criterio en la parte de entrenamiento, pero no se puede traer de vuelta la parte reservada para reparar lo que ya se dijo.

En los bloques cosmológicos, un conjunto de reserva puede ser una ventana de corrimiento al rojo, una clase de fuente, una región del cielo, una versión de una campaña de sondeo o incluso una cadena de distancias independiente completa. En el universo extremo puede consistir en ciertos objetos, épocas, segmentos azimutales, cúmulos en fusión o niveles ambientales. En el laboratorio y en las plataformas cuánticas puede ser una ventana de parámetros, una clase de materiales, un dispositivo entero o un grupo de posiciones de escaneo cercanas a un umbral con etiquetas aún no reveladas. La forma puede variar, pero la disciplina es una sola: la reserva verifica; no reajusta parámetros hacia atrás.

Lo que realmente suma a favor de EFT en un conjunto de reserva no es que una tendencia ya vista en el entrenamiento vuelva a parecerse «un poco» en la reserva, sino que la dirección no se invierta, el orden no se deshaga y el criterio no cambie. Por ejemplo, si el término común de 8.4 es de verdad un fondo común sin dispersión, al pasar a bandas, ventanas de evento o estaciones reservadas debería conservar al menos la misma dirección y la misma ventana. Si el eje TPR de 8.5 realmente absorbe el color de fondo, al cambiar a clases de fuente o regiones del cielo reservadas el α universal no debería cambiar de discurso al instante. Si el Mapa base compartido de 8.6 no es un collage de casos, al llevar el mapa congelado a objetos reservados no debería exigir de inmediato una nueva capa de parches. En cambio, si una tendencia se invierte, se desordena o exige volver a seleccionar la muestra apenas entra en la reserva, ya no es una conclusión principal; debe bajar a la categoría de indicio.

Conviene añadir algo más: los Conjuntos de reserva no pueden limitarse a guardar «la parte más fácil de aprobar». Si una teoría deja para el final las muestras más limpias, familiares y cómodas, mientras somete a ensayo y error, dentro del entrenamiento, las zonas de alto riesgo, las bandas difíciles de calibrar, los objetos complejos y las ventanas de parámetros cercanas al umbral, la reserva ya está contaminada. Una reserva real debe incluir activamente las unidades con más capacidad de desmentir la teoría, porque el objetivo del volumen 8 no es elevar la probabilidad de victoria, sino endurecer las condiciones de victoria y derrota.

V. Segunda salvaguarda: Enmascaramiento - dejar que la predicción hable antes que la imagen bonita

El valor del Enmascaramiento no está en parecer formalmente «más científico», sino en obligar a la teoría a declarar por adelantado la parte en la que realmente arriesga. EFT tiene demasiados lugares donde resulta fácil añadir una explicación después de mirar una figura: el término común parece reforzarse con el entorno, así que se dice que ese refuerzo ambiental ya se esperaba; cierto sesgo parece ser más fuerte en entornos nodales, así que se dice que el esqueleto debía funcionar así; una plataforma aparece después del umbral en cierto dispositivo, así que se dice que eso encaja con la discretización por umbral. Si esas frases no estaban escritas antes de ver el resultado, no cuentan como predicciones, sino como retórica retrospectiva.

Por eso, el Enmascaramiento exigido por 8.12 no consiste simplemente en ocultar nombres de archivo o barajar etiquetas de muestra. Para EFT es más importante una forma estructurada de enmascaramiento en tres tiempos: predicción previa, medición y arbitraje. En la fase de predicción previa, la teoría solo puede usar indicadores ambientales, información geométrica, parámetros materiales o libros históricos ya congelados para escribir una tarjeta de predicción: qué categoría debe ser más fuerte, cuál más débil, si se espera la misma dirección o la contraria, si debe mantenerse sin dispersión y si debe aparecer dentro de la misma ventana. En la fase de medición, quien extrae la señal no puede conocer lo que dice esa tarjeta. En la fase de arbitraje, un tercero cuenta aciertos, direcciones erróneas y disparos en vacío según reglas congeladas. Solo así EFT está poniendo de verdad su propio cuello en juego.

La forma concreta del Enmascaramiento puede variar mucho entre bloques. En 8.4 y 8.5 pueden enmascararse la estratificación ambiental y las etiquetas de clase de fuente; de 8.6 a 8.9 pueden enmascararse el campo direccional del esqueleto, la fase de fusión, los niveles de la mancha fría, las plantillas de orientación cerca del horizonte o la clasificación de objetos; en 8.10 y 8.11 conviene más enmascarar lotes de material, posiciones de umbral, orden de accionamiento, niveles de limpieza del enlace e incluso si una ventana de parámetros pertenece o no a la reserva. La clave no es que todas las formas sean idénticas, sino que la disciplina sea la misma: primero decir qué debe ocurrir y después comprobar si ocurrió, no mirar primero qué aparece y luego afirmar que se sabía desde el principio.

El Enmascaramiento tiene además un valor que suele pasarse por alto: obliga a EFT a distinguir entre lo que puede predecirse hacia adelante y lo que puede explicarse después. Sobre el papel ambas cosas pueden sonar como «acertar», pero su estatus científico es completamente distinto. La primera arriesga antes de que aparezca el resultado; la segunda busca una sintaxis que lo acomode después de verlo. Lo que 8.12 protege es precisamente la primera, porque solo ella puede cambiar de verdad la probabilidad de acierto de la teoría.

VI. Tercera salvaguarda: Controles nulos - no confundir artefactos con nueva física

Muchas líneas de juicio de EFT buscan estructuras «débiles pero disciplinadas»: un Término común sin dispersión, monotonía ambiental, escalado co-localizado, plataformas posteriores al umbral, aciertos de predicción previa o Mapas base compartidos entre sondas. Precisamente porque esas señales no siempre son magnitudes abrumadoras, sino más bien ordenamientos, signos, ventanas comunes, residuos y estratos, también pueden ser falsificadas silenciosamente por sistemáticas, funciones de selección, derivas de calibración, sesgos de plantilla y hábitos de la cadena de análisis. Los Controles nulos existen para construir un tribunal específico para esos artefactos.

Un Control nulo realmente duro debe incluir, como mínimo, dos tipos.

Controles nulos de ruptura estructural: permutación de etiquetas, inversión temporal, permutación de bandas de frecuencia, permutación de estaciones, rotación del cielo, aleatorización del campo direccional del esqueleto, mezcla de identidades de objetos y reordenamiento de umbrales. Preguntan esto: si se rompe la relación estructural de la que depende EFT, ¿el supuesto resultado principal vuelve al azar?
Controles nulos de contaminación de cadena: perturbaciones de banda pasante, desplazamientos de escala temporal, inyección de plantillas, máscaras aleatorias, ventanas de control falsas, materiales sustitutos, barridos de seudoumbral, polaridad inversa y geometría fuera de eje. Preguntan esto: ¿existe algún factor no físico conocido capaz de reproducir, dentro del flujo de trabajo, una significación del mismo orden que el resultado principal?

Los Controles nulos no son secundarios ni deberían quedar como trámite de apéndice. Para 8.4, si la inversión temporal, la permutación de bandas y el control de dispersión también producen un «término común de retardo cero», el resultado principal no se sostiene. Para 8.6 y 8.7, si al rotar aleatoriamente el esqueleto o perturbar el mapa base la supuesta colinealidad y el supuesto Mapa base compartido siguen funcionando, el resultado se parece más a un sesgo algorítmico. Para 8.9, si las texturas finas cerca del horizonte resultan igualmente significativas al cambiar el calibre de imagen o la dirección de plantilla, las Señales distintivas están alimentándose de la cadena de procesado. Para 8.10 y 8.11, si configuraciones sustitutas, cargas falsas, cavidades vacías, desconexiones de la contabilidad clásica o controles de seudoumbral producen también «señales nuevas», la supuesta nueva física no ha salido del instrumento. Un resultado principal que no conserve especificidad frente a los Controles nulos no tiene derecho a subir a la categoría de apoyo.

Además de los Controles nulos, hacen falta controles positivos. Es decir, el flujo no solo debe fracasar correctamente cuando no hay estructura EFT; también debe acertar cuando se inyecta una estructura conocida o cuando una física conocida debe aparecer. Si una cadena de análisis no puede romper artefactos ni recuperar señales conocidas, su resultado principal no tiene derecho a puntuar. Los Controles nulos del volumen 8, por tanto, no son puro sabotaje: fijan a la vez que el procedimiento debe tener éxito cuando debe tenerlo y fracasar cuando debe fracasar.

VII. Cuarta salvaguarda: Replicación entre flujos de análisis - no permitir que una sola ruta monopolice la verdad

Una de las victorias más peligrosas del volumen 8 es la que deja de existir en cuanto cambia la ruta de tratamiento de los datos. Muchas magnitudes relevantes para EFT dependen de cadenas de extracción complejas: cómo se sustrae el fondo, cómo se extrae el esqueleto, cómo se invierte una lente, cómo se reconstruye una imagen de anillo, cómo se identifica un umbral, cómo se sincronizan flujos brutos y cómo se reparte la contabilidad entre ruido y posselección. Si cualquiera de esos pasos depende en exceso de los hábitos por defecto de un equipo, un resultado bonito dentro de una sola cadena de análisis nunca puede ascender automáticamente a conclusión física.

Por eso, la Replicación entre flujos de análisis de 8.12 no significa correr dos veces el mismo código con otra semilla aleatoria. Exige independencia real: cadenas de preprocesamiento independientes, modelos de fondo independientes, métodos independientes de reconstrucción de esqueleto o imagen, familias de ajuste independientes y rutas de calibración independientes; idealmente, también equipos, instituciones y versiones de hardware independientes. En datos astronómicos, esto significa que distintos productos de sondeo, distintas cadenas de imagen o inversión y distintos conjuntos de macromodelos deben poder dar conclusiones de la misma dirección. En datos de laboratorio, significa que distintos dispositivos, programas de control y cadenas de adquisición y posprocesado no deben poder invertir arbitrariamente el resultado.

EFT no necesita aquí que todas las cadenas de análisis den números idénticos. Lo que realmente necesita es algo más sencillo y más difícil de falsificar: consistencia en el signo principal, en el orden principal y en la estructura principal. Si una señal solo se sostiene con una forma concreta de sustraer el fondo, una regularización concreta de reconstrucción, una base concreta de plantillas o una ventana concreta de posselección, y se deshace en cuanto llega otra cadena razonable, lo más honesto que debe escribir el volumen 8 no es «controvertido pero prometedor», sino «por ahora, un indicio dependiente de una cadena de procesamiento».

La Replicación entre flujos de análisis debe desembocar, al final, en libros de cuentas abiertos y recálculo posible. No todos los equipos tienen que publicar de una vez y sin reservas cada archivo intermedio, pero al menos deben permitir que los revisores externos vean los puntos de decisión críticos: qué muestras se excluyeron, qué parámetros se congelaron, qué unidades de reserva no se tocaron, qué Controles nulos fallaron y qué flujos de análisis independientes no estuvieron de acuerdo. Si esos libros de cuentas permanecen solo en manos del equipo original, al mundo exterior le costará distinguir entre «esto es un fenómeno complejo» y «esto es un flujo de trabajo complejo».

VIII. Por qué las cuatro salvaguardas deben funcionar en paralelo, no como trámites separados

Hacer solo reserva sin Enmascaramiento permite mirar primero la tendencia y escoger después una reserva «razonable». Hacer solo Enmascaramiento sin Controles nulos impide mirar la respuesta, pero no impide confundir un artefacto sistemático con una sorpresa. Hacer solo Controles nulos sin Replicación entre flujos de análisis permite que una ruta de análisis comparta el mismo sesgo tanto en el resultado principal como en los controles. Hacer solo Replicación entre flujos de análisis sin Conjuntos de reserva permite que varios equipos sobreajusten juntos el conjunto de entrenamiento hasta rozar el oráculo. Las cuatro salvaguardas no son cuatro adornos; son una cadena.

Por eso, 8.12 debe rechazar explícitamente una lógica compensatoria muy común: «aunque no hicimos reserva, sí hubo Enmascaramiento; aunque los Controles nulos fueron mediocres, la Replicación entre flujos de análisis fue bastante coherente; aunque aún no hay replicación independiente, el conjunto de entrenamiento se ve espectacular». Esa forma de puntuar puede ser útil en la comunicación pública, pero en auditoría es una infracción. El volumen 8 no busca una «impresión global» favorable; pregunta si algo se sostiene bajo las reglas menos favorables. Si una puerta clave no se ha cruzado, no se compensa con el buen aspecto de otra.

IX. Cómo estas cuatro salvaguardas se aplican a 8.4-8.11

En 8.4 y 8.5, la tarea central de las cuatro salvaguardas es impedir que el «término común» y la contabilidad TPR/PER se cosan a posteriori. Aquí conviene reservar clases de fuente, regiones del cielo, bandas de frecuencia y ventanas de evento; el Enmascaramiento exige congelar la tarjeta de predicción ambiental y las reglas de separación entre magnitud principal y residuos; los Controles nulos deben priorizar sustitutos de ley de dispersión, inversión temporal, permutación de etiquetas y permutación de estaciones; y la Replicación entre flujos de análisis debe cubrir, como mínimo, cadenas de corrimiento al rojo, cadenas de retardo temporal, cadenas de distancia independientes y cadenas de modelado de lentes. Sin estas salvaguardas, 8.4 y 8.5 vuelven con facilidad a «esta figura también se parece, aquella figura también se puede contar».

De 8.6 a 8.9, las cuatro salvaguardas buscan impedir que el Mapa base compartido, la dirección del esqueleto, las texturas finas cerca del horizonte y las Señales distintivas de frontera se conviertan en interpretación de imágenes. Aquí los Conjuntos de reserva deben usar con más frecuencia objetos reservados, épocas reservadas, capas de corrimiento al rojo reservadas, fases de fusión reservadas y unidades de línea de visión reservadas. El Enmascaramiento puede recaer en campos direccionales del esqueleto, niveles ambientales, plantillas de orientación, clasificación de objetos y tarjetas de predicción de marca. Los Controles nulos deben insistir especialmente en rotación de plantillas, esqueletos aleatorios, máscaras aleatorias, controles fuera de eje, falsos puntos calientes y fríos, traslaciones y remuestreos. La Replicación entre flujos de análisis requiere que algoritmos de esqueleto distintos, reconstrucciones de masa distintas, esquemas de imagen distintos y cadenas de extracción de retardo distintas lleguen a conclusiones de la misma dirección.

En 8.10 y 8.11, las cuatro salvaguardas no pueden relajarse. El bloque de laboratorio es precisamente el más propenso a una falsa victoria de este tipo: «la señal es preciosa, pero en realidad solo existe en este dispositivo y con este guion de tratamiento». Aquí los Conjuntos de reserva pueden ser ventanas de parámetros completas, clases enteras de materiales, un dispositivo completo o lotes completos de chips; el Enmascaramiento puede aplicarse a posiciones de umbral, etiquetas de material, orden de excitación y grados de limpieza del enlace; los Controles nulos deben incluir configuraciones sustitutas, cavidades vacías, cargas falsas, polaridad inversa, controles con cadena rota, desajustes temporales e inyección-recuperación; y la Replicación entre flujos de análisis debería avanzar hacia replicación entre instituciones, hardware y programas de control, con doble apertura del libro bruto y del libro de posselección. Solo así el volumen 8 evitará escribir una contingencia de ingeniería como nueva credencial de EFT.

X. Qué resultado metodológico apoyaría de verdad a EFT

Desde el punto de vista de 8.12, lo que de verdad apoya a EFT no es que cierta clase de objetos «se parezca más a EFT», sino que EFT acepte las reglas más desfavorables y aun así consiga aciertos estructurales en varias líneas de juicio. En concreto, deberían aparecer al menos varias cosas a la vez:

en los Conjuntos de reserva, la dirección, el orden y la estructura principal son coherentes con la parte de entrenamiento, sin sobrevivir gracias a reajustes retrospectivos;
la tasa de acierto de las tarjetas de predicción enmascaradas es establemente superior al azar y a los controles por permutación, no solo parece «obvia» después del desenmascaramiento;
el resultado principal vence de forma significativa a los Controles nulos de ruptura estructural y a los de contaminación de cadena;
dos o más cadenas de análisis y equipos verdaderamente independientes obtienen conclusiones de la misma dirección sin reinventar nuevas reglas.

Si estas condiciones no se cumplen en una única línea aislada, sino en varias familias entre 8.4 y 8.11, entonces EFT empieza por primera vez a escapar de su evaluación más peligrosa: la de ser una teoría que sabe contar historias. Eso significaría que no solo puede explicar objetos, sino que acepta que su autoridad explicativa sea comprimida por la metodología; y, más importante aún, que después de esa compresión todavía queda algo.

También hay que escribir con dureza que el apoyo metodológico tiene niveles. La capa más débil consiste en que un resultado simplemente no se caiga ante las salvaguardas. Una capa más fuerte aparece cuando no solo no se cae, sino que muestra de forma activa un cierre cuádruple: acierto de predicción previa, robustez en reserva, separación frente a Controles nulos y misma dirección entre equipos. El volumen 8 no necesita de verdad la primera capa, sino la segunda. La primera solo dice que EFT todavía no ha sido atrapada en un error de procedimiento; la segunda empieza a darle crédito procedimental.

XI. Qué resultados solo cuentan como ajuste, no como salida inmediata

No todas las dificultades metodológicas mandan a EFT directamente a la zona de reescritura. Algunos resultados se parecen más a un ajuste que a una demolición.

El primer tipo de ajuste aparece cuando los Conjuntos de reserva solo funcionan en algunas ventanas. Es decir, ciertas afirmaciones pasan las cuatro salvaguardas en una clase de fuente, un entorno, una plataforma o una ventana de parámetros concretos, pero se debilitan al salir de ahí. Ese resultado significa que EFT quizá haya captado algo real, pero su dominio de validez debe estrecharse.
El segundo tipo de ajuste aparece cuando hay acierto en el Enmascaramiento, pero solo en dirección y no en amplitud; solo en estratificación y no en escala unificada. En ese caso, EFT conserva predictividad, pero pierde una sintaxis demasiado universal. El tercer tipo de ajuste aparece cuando los Controles nulos se superan en conjunto, pero algunas subregiones de alto riesgo siguen siendo sensibles: una región del cielo concreta, el borde de una banda concreta, una configuración de imagen concreta o un lote de material concreto. El cuarto tipo aparece cuando la Replicación entre flujos de análisis conserva la misma dirección, pero necesita bandas de error sistemático más amplias para converger. Nada de esto debe maquillarse como apoyo completo, pero tampoco equivale a expulsión inmediata; obliga a EFT a escribir sus ambiciones más pequeñas y sus frases más duras.

XII. Qué resultados causarían daño estructural directo

El primer resultado que dañaría de verdad la columna metodológica de EFT sería una inversión sistemática en los Conjuntos de reserva. Es decir, direcciones, ordenamientos y cierres que parecían estables en el entrenamiento desaparecen, se invierten o solo sobreviven si se vuelve a seleccionar la muestra al entrar en la reserva. Eso no es «generalización algo débil»; indica que la conclusión principal probablemente dependía de reajustes retrospectivos.
El segundo tipo es el Enmascaramiento que no acierta de forma persistente, mientras que después del desenmascaramiento siempre se puede añadir una explicación bonita. Si las tarjetas de predicción, bajo criterios congelados, aciertan casi como el azar, acumulan direcciones erróneas o exigen reescribir umbrales, estratos y variables proxy después de ver la figura, EFT ya no puede presentar esas explicaciones como sintaxis predictiva.
El tercer tipo es que los Controles nulos y el resultado principal sean significativos a la vez. Si la permutación de etiquetas, la inversión temporal, la rotación de plantillas, los materiales sustitutos, las ventanas de control falsas, las perturbaciones de banda pasante o los esqueletos aleatorios producen una «señal de apoyo» de intensidad parecida, lo que el volumen 8 debe admitir no es que «el resultado es complejo», sino que «el flujo de trabajo está fabricando la señal».
El cuarto tipo es que solo una cadena de análisis o un equipo pueda ver a EFT. Si al cambiar de modelo de fondo, método de inversión, ruta de imagen, cadena de calibración o versión de hardware el resultado se deshace, o si el recálculo entre instituciones no logra durante mucho tiempo conclusiones de la misma dirección, EFT pierde la legitimidad para exigir reconocimiento externo. El quinto tipo, y el más severo, aparece cuando las cuatro salvaguardas se contradicen entre sí: la reserva pasa, pero el Enmascaramiento no acierta; el resultado principal es significativo, pero los Controles nulos también; un equipo es estable, pero varios equipos no reproducen. Si esa fractura persiste en varias familias de juicio, 8.12 no debe escribirse como un punto metodológico a favor, sino como una herida dura en la credibilidad de todo el volumen.

Hay además una forma de daño metodológico que suele subestimarse: las reglas siempre se actualizan después de que aparece el resultado. Hoy se dice que basta con la misma dirección; mañana, que hay que mirar el orden; pasado, que solo cuenta el subgrupo de entorno fuerte. Hoy dos cadenas de análisis parecen suficientes; mañana, al no coincidir, se decide creer solo en una. Hoy se reserva una región del cielo; mañana, porque se invierte, se redefine la reserva como banda de frecuencia. Mientras las reglas persigan al resultado de esta manera, 8.12 debe juzgarlo como daño grave, porque significa que EFT aún no ha aprendido a entregarse a reglas fijas.

XIII. Qué situaciones aún no pueden juzgarse hoy

Este apartado también conserva, por supuesto, la categoría «aún no juzgado», pero sus fronteras deben ser muy estrechas. El primer caso razonable es que el libro bruto y los metadatos críticos aún no estén suficientemente abiertos. Si la cadena temporal, la cadena de banda pasante, la cadena de calibración, la definición de las unidades de reserva o las variables proxy ambientales siguen siendo opacas, forzar un veredicto solo empujaría la discusión hacia una zona de más ruido.
El segundo caso es que la cobertura muestral aún no alcance para formar una verdadera estructura de reserva. Algunas predicciones de marca tienen, por ahora, tan pocos objetos que reservar uno equivale casi a quedarse sin muestra; y ciertas plataformas extremas aún no tienen condiciones de replicación interinstitucional. En ese escenario, dejar el juicio en suspenso es una forma de prudencia.
El tercer caso es que las cuatro salvaguardas aún no tengan una regla común. Si distintos equipos no comparten todavía un mínimo acuerdo sobre qué cuenta como cadena de análisis independiente, qué cuenta como Control nulo válido, qué cuenta como acierto enmascarado o qué cuenta como unidad de reserva, hoy quizá no convenga dictar un veredicto pesado. Pero este tipo de «aún no juzgado» no puede convertirse en prórroga infinita. Cuando el libro bruto esté abierto, el criterio esté congelado, las reservas y los Controles nulos se hayan ejecutado y los flujos de análisis independientes estén completos, si el resultado sigue yendo en contra, ya no pertenece a «aún no juzgado». Está debilitando a EFT, no esperando una excusa mejor.

Existe otra forma razonable pero peligrosa de «aún no juzgado»: objetos demasiado raros, plataformas demasiado costosas o ciclos de replicación demasiado largos. Algunas texturas finas cerca del horizonte, fusiones extremas o enlaces cuánticos de alto coste no pueden completar una replicación multiinstitucional con la rapidez de un experimento ordinario. En esos casos, 8.12 puede permitir temporalmente «densidad insuficiente de evidencia», pero nunca permitir que eso se convierta en «por tanto, contemos primero como apoyo». En la gramática del volumen 8, la rareza y el coste solo pueden ralentizar el veredicto; no pueden elevar la probabilidad de victoria.

XIV. No confundir «poder explicar» con «resistir un examen»: el giro más importante de este apartado

Lo que este apartado añade no son unos cuantos requisitos técnicos más, sino un cambio de postura para todo el volumen: de la hermenéutica de la explicación a la ciencia del examen. La hermenéutica es experta en encontrar, para cada objeto nuevo, una frase que lo acomode. El examen hace lo contrario: primero se ata las manos y luego pregunta qué le queda. Para una teoría como EFT, que intenta reescribir el mapa base, este giro es especialmente importante. Cuanto mejor sabe hablar, más debe aprender a callar primero; cuanto más capaz es de hacerlo encajar todo, más debe aceptar las reglas menos favorables antes de hablar.

Esta es la capa de sentido que más debe recordarse: lo verdaderamente temible de la falsación no es la fuerza del adversario, sino la disposición de la propia teoría a examinarse bajo las reglas menos favorables. Si EFT no acepta hacerlo, aunque nadie pueda refutarla por el momento, seguirá siendo una teoría que cuenta historias. En cambio, aunque solo gane algunas ventanas bajo las reglas menos favorables, esas victorias pesarán más que todo un volumen de explicaciones hermosas sin salvaguardas.

XV. Resumen del apartado

Que el volumen 8 se sostenga no depende solo de lo que vea, sino de si EFT está dispuesta a ponerse en desventaja ante las cuatro puertas: Conjuntos de reserva, Enmascaramiento, Controles nulos y Replicación entre flujos de análisis. Solo cuando EFT acepte primero estas reglas incómodas, cualquier apoyo que obtenga después dejará de ser el eco de su propia narración.