Marco de gravedad media de la Teoría del filamento de energía (Energy Filament Theory, EFT), frente a una línea base mínima NFW para la materia oscura fría (DM)
0 Resumen ejecutivo (Executive Summary)
Este informe es una edición completa de nivel publicable archivada en Zenodo (edición de archivo). Proporciona una cadena integrada y auditable que va desde los datos, el registro de modelos, la comparación justa y la prueba de cierre hasta los materiales de reproducción. El apéndice B (P1A) actúa como complemento de robustez: concentra una prueba de presión con una línea base DM más estándar y una sistemática clave de lente, para comprobar la sensibilidad de las conclusiones principales ante una modelización DM más realista y ante el tratamiento de errores sistemáticos de lente.
Conclusiones principales (cuatro frases citables directamente; véase la sección 2.4):
(1) En el ajuste de curvas de rotación (RC), la familia EFT supera claramente a DM_RAZOR en todas las combinaciones de núcleos y priors; la mejora típica es Δlog𝓛_RC ≈ 10^3 (véase la tabla S1a).
(2) En la prueba de cierre RC→GGL, EFT ofrece una transferibilidad predictiva entre sondas más fuerte: la intensidad de cierre Δlog𝓛_closure (True−Perm) es significativamente superior a la de DM_RAZOR, y la diferencia es robusta frente a los barridos de shrinkage de covarianza, R_min y σ_int (véanse la figura S3 y la tabla S1b).
(3) En el ajuste conjunto (RC+GGL), EFT mantiene una ventaja estable y, bajo el control negativo que destruye la correspondencia compartida, esa ventaja se colapsa; esto respalda que el «efecto de gravedad media» procede de una correspondencia compartida y no de una casualidad de ajuste (véase la figura S4).
(4) El apéndice B (P1A), sin aumentar de forma significativa la dimensionalidad, somete el lado DM a una prueba de presión con módulos de línea base más estándar y un parámetro nuisance que representa una sistemática clave de lente; estas mejoras no eliminan la ventaja de cierre de EFT (véanse la tabla B1 y la figura B1).
Disponibilidad de datos y código: informe Concept DOI 10.5281/zenodo.18526334; paquete completo de reproducción Concept DOI 10.5281/zenodo.18526286. Las etiquetas correspondientes al apéndice B (P1A) son run_tag=20260213_151233, closure_tag=20260213_161731 y joint_tag=20260213_195428.
1 Resumen
Comparamos cuantitativamente, de forma reproducible, dos marcos teóricos bajo los mismos datos y el mismo protocolo estadístico: el modelo de «corrección de gravedad media» propuesto por la Teoría del filamento de energía (Energy Filament Theory, EFT; distinto del uso habitual de la sigla Effective Field Theory), y el modelo de línea base de halo NFW de materia oscura fría (DM_RAZOR). DM_RAZOR se elige deliberadamente como «línea base DM mínima»: halo NFW + relación c–M fija, sin dispersión halo a halo, con el fin de ofrecer una comparación auditable y verificable. También conviene subrayar que este artículo trata EFT como una parametrización fenomenológica, de tipo MOND, de un Campo efectivo o de una respuesta efectiva, destinada a ser contrastada bajo un protocolo estadístico unificado, no como una derivación de primeros principios microfísicos dentro de este manuscrito.
Los datos incluyen: curvas de rotación SPARC (RC), preprocesadas y binadas de manera uniforme, con 2.295 puntos de velocidad (104 galaxias, 20 RC-bin), y la densidad superficial equivalente ΔΣ(R) de la lente gravitacional débil galaxia-galaxia KiDS-1000 (GGL), con 4 bins de masa estelar × 15 puntos R por bin, es decir, 60 puntos en total, usando la covarianza completa.
Ejecutamos sucesivamente la inferencia RC-only, la prueba de cierre RC→GGL (closure), la inferencia GGL-only y la inferencia conjunta RC+GGL, y aplicamos auditorías de coherencia para garantizar que todos los valores citados sean trazables. Bajo un registro estricto de parámetros y una restricción de correspondencia compartida (DM: 20 parámetros log M200_bin; EFT: 20 parámetros log V0_bin + 1 parámetro global log ℓ), la familia EFT supera de forma clara a DM_RAZOR en el ajuste conjunto: ΔlogL_total = 1155–1337 respecto de DM_RAZOR. Más importante aún, la prueba de cierre muestra que el posterior RC tiene una potencia predictiva no trivial sobre GGL: la intensidad de cierre de EFT, ΔlogL_closure = 172–281, supera el valor 127 de DM_RAZOR; cuando la correspondencia RC-bin→GGL-bin se baraja aleatoriamente por grupos, la señal de cierre se colapsa hasta 6–23, lo que verifica que no se trata ni de una casualidad estadística ni de un sesgo de implementación. En los barridos sistemáticos de σ_int, R_min y shrinkage de covarianza, la ventaja relativa de EFT permanece positiva y de escala estable. Para responder a objeciones frecuentes como «la línea base DM es demasiado débil» o «las sistemáticas se están leyendo como física», el apéndice B (P1A) ofrece una prueba de presión DM más estándar, aunque todavía de baja dimensión y auditable, con dispersión jerárquica c–M + prior, un proxy de core de un parámetro, un m de lente y el modelo combinado DM_STD; bajo el mismo protocolo de cierre, estas mejoras no eliminan la ventaja de cierre de EFT (véanse la tabla B1 y la figura B1).
Palabras clave: curvas de rotación; lente gravitacional débil galaxia-galaxia; prueba de cierre; EFT; materia oscura fría; inferencia bayesiana
2 Introducción y panorama de resultados
Las curvas de rotación (RC) y la lente gravitacional débil galaxia-galaxia (GGL) son dos sondas gravitacionales complementarias: las RC acotan el potencial dinámico en el plano del disco y la relación de aceleración radial (RAR), mientras que GGL mide la distribución de masa proyectada y la respuesta gravitacional a escala de halo. Para cualquier teoría candidata, lo decisivo no es si puede ajustar por separado ambos conjuntos de datos, sino si puede explicarlos de forma coherente bajo una misma correspondencia entre datos y unas mismas restricciones compartidas.
Por ello, este artículo toma la «prueba de cierre» (closure test) como protocolo estadístico central: primero se usa el posterior RC-only para predecir GGL hacia delante, y después se compara con un control negativo en el que se permuta la correspondencia RC-bin→GGL-bin (permutation / shuffle). Así se evalúa la transferibilidad predictiva entre datos y se excluyen señales espurias debidas a sesgos de implementación o a ajustes fortuitos.
Posicionamiento teórico y alcance: este manuscrito no pretende ofrecer una derivación microfísica de primeros principios de EFT (Teoría del filamento de energía), ni una formulación relativista completa. Al contrario, tratamos EFT como una parametrización efectiva de baja dimensión, de tipo MOND, de un campo o una respuesta efectiva, descrita por una función núcleo f(x) y una escala global ℓ; a continuación, bajo un registro estricto de parámetros, usamos la prueba de cierre RC→GGL para contrastar su coherencia entre datos y su transferibilidad predictiva.
Plan de investigación y declaración de alcance: este trabajo forma parte de un programa observacional P-series en curso. En los datos disponibles a escala galáctica buscamos dos posibles contribuciones efectivas de fondo: (i) una «base de gravedad media» (mean gravity floor), describible mediante una respuesta gravitacional media tras un promediado grueso; y (ii) un «suelo de ruido» (stochastic/noise floor) vinculado a fluctuaciones de procesos microscópicos. En este artículo (P1) nos centramos solo en la primera: sin introducir hipótesis sobre ningún mecanismo microfísico de producción, buscamos indicios observacionales de una base de gravedad media mediante la prueba de cierre RC→GGL, y los comparamos con una línea base DM auditable bajo un protocolo unificado. Como imagen física heurística, si existen grados de libertad de vida corta, su decaimiento o aniquilación puede convertir masa en reposo en energía-momento transportada por otros grados de libertad; en la capa efectiva, esto se corresponde de forma natural con una descomposición en «contribución media + contribución fluctuante». Este artículo, sin embargo, no modeliza cuantitativamente esa imagen microfísica.
Para evitar una interpretación excesiva, delimitamos el alcance del artículo de la siguiente manera:
• Qué hace este artículo: mide la transferibilidad predictiva entre datos mediante una prueba de cierre, bajo un registro estricto de parámetros y una correspondencia compartida, y compara de forma reproducible la respuesta de gravedad media de EFT con una línea base DM.
• Qué no hace este artículo: no discute mecanismos microfísicos de producción, abundancias, vidas medias ni restricciones cosmológicas; tampoco modeliza el término aleatorio correspondiente al «suelo de ruido».
• Qué no afirma este artículo: no tiene como objetivo refutar la materia oscura; P1 no emite un veredicto final sobre si la «base» existe, sino que presenta evidencia de etapa: dentro del dominio de medición robusto elegido aquí, los datos prefieren un modelo que incluye respuesta de gravedad media.
Al mismo tiempo, dejamos claro que DM_RAZOR representa únicamente una línea base NFW mínima y auditable (c–M fija y sin scatter; sin contracción adiabática, Adiabatic Contraction, sin core de feedback, sin términos no esféricos ni ambientales). Por tanto, la conclusión principal del texto queda estrictamente limitada a esto: bajo esa línea base mínima y bajo restricciones estrictas de registro de parámetros y correspondencia, EFT muestra una coherencia entre datos más fuerte. Para responder a una pregunta habitual (si una línea base ΛCDM más estándar y una modelización de sistemáticas de lente modificarían de forma significativa la conclusión), reunimos en el apéndice B (P1A: prueba de presión estandarizada de la línea base DM) mejoras DM aún de baja dimensión y auditables, junto con un nuisance del lado de lente, manteniendo exactamente la misma correspondencia compartida y el mismo protocolo de cierre que en el texto principal (véanse la tabla B1 y la figura B1).
2.1 Tab S1a-S1b: resumen de indicadores clave (Strict)
La tabla S1a presenta los indicadores principales de comparación del ajuste conjunto (RC+GGL): logL, ΔlogL, AICc y BIC. La tabla S1b muestra los indicadores de la prueba de cierre y de los barridos de robustez: closure, control negativo shuffle y rangos de barrido de σ_int / R_min / cov-shrink. Todos los valores proceden de la tabla maestra estricta Tab_Z1_master_summary y pueden rastrearse elemento por elemento en el paquete archivado de publicación.
Tabla S1a | Indicadores principales del ajuste conjunto (RC+GGL, Strict).
Modelo (workspace) | Núcleo W | k | logL_total conjunto (best) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Tabla S1b | Indicadores de cierre y robustez (Strict).
Modelo (workspace) | Cierre ΔlogL (true-perm) | ΔlogL tras shuffle del control negativo | Rango ΔlogL del barrido σ_int | Rango ΔlogL del barrido R_min | Rango ΔlogL del barrido cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 Fig S3: intensidad de cierre (RC-only → predicción de GGL)
La intensidad de cierre se define como ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: sobre muestras posteriores RC-only se predice GGL hacia delante y se compara con el control negativo en el que se permuta la correspondencia RC-bin→GGL-bin.

Figura S3 | Intensidad de cierre (mayor es mejor): ventaja media de log-verosimilitud en la predicción RC-only → GGL.
2.3 Fig S4: comparación principal del ajuste conjunto (RC+GGL)
La ventaja del ajuste conjunto se define como ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Con los mismos datos, la misma correspondencia y una escala de parámetros prácticamente igual, la familia EFT obtiene una log-verosimilitud conjunta significativamente más alta.

Figura S4 | Ventaja del ajuste conjunto (mayor es mejor): best logL_total de RC+GGL relativo a DM_RAZOR.
2.4 Cuatro conclusiones (citables directamente)
(1) En el análisis conjunto unificado de curvas de rotación SPARC + lente gravitacional débil KiDS-1000, los modelos del marco de gravedad media de EFT superan sistemáticamente a DM_RAZOR bajo un protocolo de comparación estricto: ΔlogL_total = 1155–1337 respecto de DM_RAZOR.
(2) La prueba de cierre RC→GGL indica que EFT tiene mayor coherencia predictiva: ΔlogL_closure = 172–281, frente a 127 para DM_RAZOR; además, al barajar aleatoriamente por grupos la correspondencia RC-bin→GGL-bin, la señal de cierre se colapsa hasta 6–23, lo que muestra que la señal depende de la correspondencia correcta entre datos y no de un ajuste casual.
(3) Los barridos sistemáticos de σ_int, R_min y shrinkage de covarianza no alteran ni el signo ni la escala de la ventaja «EFT sobre DM_RAZOR», lo que muestra que la conclusión es robusta frente a perturbaciones sistemáticas habituales.
(4) En el apéndice B (P1A), bajo el mismo protocolo de cierre, se refuerza la línea base DM de forma «estandarizada y auditable»: se conservan tres mejoras legacy de un parámetro (SCAT/AC/FB), y se añaden dispersión jerárquica c–M + prior, un proxy de core de un parámetro y la calibración de shear m del lado de lente (más su combinación DM_STD). Los resultados muestran que solo la rama feedback/core aporta una pequeña mejora neta de intensidad de cierre (122.21→129.45, ΔΔlogL_closure≈+7.25), mientras que las demás mejoras no contribuyen de forma significativa o lo hacen negativamente; por tanto, la conclusión principal no depende de que DM_RAZOR sea una línea base demasiado débil.
3 Datos y preprocesamiento
Este estudio utiliza dos tipos de datos públicos, descargados, verificados (sha256) y preprocesados dentro del proyecto mediante scripts trazables. Para garantizar una comparación justa entre modelos, todos los workspaces (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) comparten exactamente los mismos productos de datos y la misma correspondencia de binado.
3.1 Curvas de rotación (RC, SPARC)
Los datos RC proceden de los Rotmod_LTG de la base SPARC (175 archivos rotmod). Tras el preprocesamiento, la muestra incorporada al modelado del proyecto incluye 104 galaxias, con 2.295 puntos (r, V_obs) en total, divididos en 20 RC-bin según reglas como la masa estelar. Cada punto de datos contiene el radio r (kpc), la velocidad observada V_obs (km/s), su error σ_obs, y las velocidades de los componentes gas/disco/bulbo (V_gas, V_disk, V_bul).
3.2 Lente débil (GGL, KiDS-1000 / Brouwer+2021)
Los datos GGL usan la densidad superficial equivalente ΔΣ(R) presentada por Brouwer et al. (2021) en la Fig. 3 de KiDS-1000: 4 bins de masa estelar, 15 puntos R por bin, junto con la covarianza completa proporcionada. En la ingeniería del proyecto, la covarianza original en formato long-form se reconstruye como una matriz 15×15 para cada bin, y una auditoría Stage-B verifica su dimensionalidad y razonabilidad numérica.
3.3 Correspondencia RC-bin → GGL-bin y tamaño total de muestra
Los 4 bins de masa de GGL se conectan con los 20 bins de RC mediante una correspondencia fija: cada GGL-bin corresponde a 5 RC-bin, y las contribuciones de RC-bin se promedian de forma ponderada por el número de galaxias. Esta correspondencia se mantiene invariable en todos los modelos y constituye la restricción central para una comparación justa en la prueba de cierre y en el ajuste conjunto. El número final de puntos de datos conjuntos es n_total = 2355 (RC=2295, GGL=60).
4 Modelos y método estadístico
4.1 Especificación matemática mínima de EFT y DM (auditable / contrastable)
Esta sección ofrece la especificación matemática mínima que se corresponde directamente con la implementación.
(a) Modelo de curvas de rotación (RC)
Para cada punto RC (r, V_obs, σ_obs), usamos una superposición de componentes: V_mod²(r) = V_bar²(r) + V_extra²(r). Aquí V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). En los resultados principales de este manuscrito adoptamos Υ_d = Υ_b = 0.5, en línea con la recomendación empírica de SPARC y también para reducir grados de libertad innecesarios.
(b) Corrección de gravedad media de EFT (EFT)
El término adicional de EFT se parametriza como una «velocidad cuadrada media»: V_extra²(r) = V0_bin² · f(r/ℓ). Aquí V0_bin es el parámetro de amplitud de cada RC-bin (20 en total), ℓ es una escala global (1 parámetro), y f(x) es una función núcleo adimensional. Las formas de núcleo comparadas en este artículo, todas sin introducir grados de libertad continuos adicionales, son:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (control opcional) gaussian: f(x)=erf(x/√2) (no incluido en el conjunto de conclusiones principales)
Motivación física (ampliada): EFT interpreta la respuesta gravitatoria adicional a escala galáctica como una respuesta efectiva tras el promediado grueso o promedio de escala de interacciones más microscópicas que operan en escalas finitas. En este artículo no preestablecemos un mecanismo microscópico concreto, sino que adoptamos una parametrización mínima y auditable para realizar comparaciones y pruebas controladas bajo un protocolo estadístico unificado.
Para facilitar la intuición, el término adicional puede escribirse en forma de aceleración: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Cuando r≫ℓ, f→1 y V_extra→V0_bin, lo que produce una contribución adicional de velocidad aproximadamente plana en la región externa; cuando r≪ℓ y f(x)≈x, puede introducirse una escala característica de aceleración a0,bin≈V0_bin²/ℓ (salvo un factor O(1) dependiente del núcleo), que ofrece una intuición de transición interna-externa de tipo MOND.
La familia discreta de núcleos usada aquí (none/exponential/yukawa/powerlaw_tail) puede verse como un conjunto de proxies de baja dimensión para distintas «pendientes iniciales / velocidades de transición / colas de largo alcance»; por ejemplo, un apantallamiento de tipo Yukawa frente a una respuesta de cola más larga. Se usa como prueba de presión de robustez, no como exploración exhaustiva del espacio de modelos. En la parte de lente gravitacional débil, construimos a partir de V_avg(r) una masa y una densidad de envolvente equivalentes y las proyectamos para obtener ΔΣ(R); esta densidad efectiva debe entenderse como una descripción efectiva del potencial de lente bajo supuestos de simetría esférica y campo débil (los detalles completos se trasladan al apéndice A).
Todas las formas de núcleo anteriores satisfacen f(x)→1 cuando x→∞, es decir, V_extra²→V0² se satura; en cambio, para x≪1 producen crecimiento lineal o sublineal: por ejemplo, exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Por tanto, los distintos núcleos generan diferencias observables en la «pendiente inicial», la rapidez de transición y la cola externa a radios pequeños, diferencias que pueden distinguirse mediante el ajuste conjunto RC+GGL y la prueba de cierre.
La predicción EFT de la lente gravitacional débil ΔΣ(R) se obtiene invirtiendo V_avg(r) para derivar la masa y densidad de envolvente y proyectándolas después: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). La implementación numérica usa una malla logarítmica y refinamiento adaptativo en casos anómalos, a fin de garantizar estabilidad y reproducibilidad.
(c) DM_RAZOR: línea base de halo NFW de materia oscura fría
Reiteramos que DM_RAZOR representa únicamente una línea base NFW mínima y auditable (c–M fija y sin scatter; sin contracción adiabática, Adiabatic Contraction, sin core de feedback, sin términos no esféricos ni ambientales). Para reducir el riesgo de una strawman baseline, este artículo no afirma que esos efectos no existan; al contrario, los incorpora de forma baja dimensional y auditable en el apéndice B (P1A) como prueba de presión: tratamiento jerárquico de c–M scatter, proxy de core y nuisance de calibración de shear del lado de lente, entre otros.
4.2 Registro de modelos y comparación justa (parámetros compartidos = definición de cierre)
El número de parámetros del conjunto de comparación principal es: DM_RAZOR k=20; familia EFT k=21, donde el parámetro adicional es el log ℓ global. Todos los modelos comparten los mismos datos RC, los mismos datos GGL y su covarianza, la misma correspondencia RC-bin→GGL-bin, los mismos términos bariónicos y las mismas conversiones de unidades. Además, las formas de núcleo (none / exponential / yukawa / powerlaw_tail) son elecciones discretas y no introducen parámetros continuos adicionales, lo que evita obtener una ventaja por «un grado de libertad más».
4.3 Verosimilitud, priors y muestreador
La verosimilitud RC usa una gaussiana diagonal: σ_eff² = σ_obs² + σ_int²; los resultados principales fijan σ_int=5 km/s y en Run-5 se barre σ_int. La verosimilitud GGL usa, bin a bin, una gaussiana con covarianza completa: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). El objetivo conjunto es logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Los priors reflejan sobre todo fronteras de factibilidad física, mediante intervalos para log ℓ, log V0 y log M200; al activar Υ y σ_int libres se usan priors débilmente informativos (véanse los detalles en la implementación y en la configuración del paquete de release).
El muestreador es un paseo aleatorio Metropolis por bloques adaptativos: en cada paso solo actualiza un subbloque aleatorio del espacio de parámetros para mejorar la tasa de aceptación en alta dimensión, y ajusta ligeramente el tamaño de paso mediante la tasa de aceptación por ventanas (objetivo cercano a 0,25). Los resultados principales usan modo quick (n_steps=800 y ajustes similares), y cada workspace exporta trace, residuos y gráficos PPC para revisión humana y auditoría por script.
4.4 Prueba de cierre y control negativo (definición)
La prueba de cierre (Run-2) comprueba, sin reajustar GGL, si el posterior RC-only puede predecir GGL. Concretamente: sobre muestras del posterior RC-only se generan hacia delante los ΔΣ(R) de los 4 GGL-bin y se calcula logL_true con la covarianza completa; después se aplica una permutación aleatoria a la correspondencia de grupos RC-bin→GGL-bin para obtener logL_perm. La intensidad de cierre se define como ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Además, Run-10 reagrupa aleatoriamente los 20 RC-bin en 4×5 (shuffle) y recalcula el cierre, con el fin de comprobar la dependencia de la señal de cierre respecto a la correspondencia correcta.
5 Resultados principales e interpretación
5.1 Resultados principales del ajuste conjunto (RC+GGL)
La best logL_total del ajuste conjunto y la ventaja relativa ΔlogL_total respecto de DM_RAZOR se muestran en la tabla S1a y en la figura S4. En el conjunto principal de comparación, EFT_BIN obtiene la mayor ventaja conjunta (ΔlogL_total=1337.210), y las demás formas de núcleo EFT mantienen también ventajas significativas (1154.827–1294.442). En los criterios de información (AICc/BIC), la familia EFT también supera claramente a DM_RAZOR, lo que indica que la ventaja no procede de un sesgo por número de parámetros.
Nota: la contribución principal a ΔlogL_total≈1337 procede del término RC (en la descomposición joint, ΔlogL_RC≈1065, alrededor del 80%). Esto puede entenderse como una mejora moderada, de Δχ²≈0.90 por punto, acumulada de forma natural hasta escala 10^3 bajo una verosimilitud gaussiana diagonal sobre N=2295 puntos RC. A la vez, GGL y la prueba de cierre aportan una restricción independiente entre conjuntos de datos, y el orden relativo se mantiene estable bajo las pruebas de presión de σ_int, R_min y cov-shrink (véanse la sección 6 y la tabla S1b).
5.2 Resultados de la prueba de cierre (RC-only → GGL)
La magnitud clave de la prueba de cierre, ΔlogL_closure, se muestra en la tabla S1b y en la figura S3. La intensidad de cierre de la familia EFT es 171.977–280.513, superior al 126.678 de DM_RAZOR. Esto significa que, sin permitir ningún grado de libertad adicional entre datos, las muestras posteriores obtenidas por EFT a partir de los datos RC tienen una capacidad predictiva más transferible hacia los datos GGL.
El control negativo respalda aún más la relevancia física de la señal de cierre: al barajar aleatoriamente la agrupación RC-bin→GGL-bin, la intensidad de cierre de EFT cae a 6–15 (con pequeñas diferencias entre núcleos), mientras que la intensidad de cierre de referencia era 172–281. Este «colapso de señal» descarta una ventaja espuria originada por la implementación numérica, errores de unidades o un tratamiento inadecuado de la covarianza.

Figura R1 | Control negativo: la señal de cierre disminuye de forma marcada tras el shuffle de grupos (trazado a partir de los indicadores Tab_Z1).
5.3 Significado y límites de los resultados
La conclusión de este estudio es que, «en este conjunto de datos y bajo este protocolo, la corrección de gravedad media de EFT supera la línea base DM_RAZOR probada». Debe subrayarse que el lado DM solo utiliza una línea base NFW mínima con una relación c(M) fija, sin introducir core, no esfericidad, términos ambientales ni modelos más complejos de conexión galaxia-halo. Por tanto, este manuscrito no afirma que descarte todas las familias de modelos DM; más bien ofrece una línea base de comparación reproducible y centrada en la prueba de cierre, destinada a evaluar si RC y GGL pueden explicarse de forma coherente con una misma familia de parámetros y correspondencias entre datos.
Para responder a esta duda habitual, completamos una extensión independiente P1A (véase el apéndice B). Sin modificar la correspondencia compartida RC-bin→GGL-bin ni el marco de auditoría, refuerza la línea base DM de forma «estandarizada y auditable»: además de tres mejoras legacy de un parámetro (SCAT/AC/FB), incorpora (i) dispersión jerárquica c–M + prior de masa-concentración (DM_HIER_CMSCAT), (ii) un proxy de core bariónico de un parámetro (DM_CORE1P), y (iii) un nuisance de calibración de shear de lente gravitacional débil m (DM_RAZOR_M), además del modelo combinado DM_STD; EFT_BIN se conserva como referencia de comparación.
• DM_RAZOR_SCAT (c–M scatter): introduce el parámetro de dispersión de concentración halo a halo σ_logc, para comprobar si una c(M) fija subestima de forma sistemática la capacidad explicativa de DM;
• DM_RAZOR_AC (Adiabatic Contraction): usa un parámetro α_AC para interpolar continuamente entre «sin contracción» y «contracción estándar», con el mínimo coste, capturando la tendencia de contracción interna inducida por bariones;
• DM_RAZOR_FB (Feedback / core): usa una escala de core, como log r_core, para describir el efecto de core interno que suprime las curvas de rotación, manteniendo una aproximación NFW a escala de lente gravitacional débil.
El scoreboard cuantitativo de P1A se presenta en la tabla B1 y la figura B1 del apéndice B, generadas automáticamente a partir de Tab_S1_P1A_scoreboard. En el indicador de cierre, DM_RAZOR_FB aporta una pequeña mejora neta (122.21→129.45, +7.25); las demás mejoras no contribuyen de forma significativa o lo hacen negativamente a la intensidad de cierre. En el lado del ajuste conjunto, añadir el prior jerárquico de c–M scatter (DM_HIER_CMSCAT) o el modelo combinado (DM_STD) puede mejorar de manera notable joint logL, pero no aumenta la intensidad de cierre; esto sugiere que lo que se añade es principalmente flexibilidad de ajuste conjunto, no transferibilidad predictiva entre sondas. Por ello, la conclusión nuclear del texto debe entenderse así: bajo una correspondencia compartida estricta y una prueba de cierre, la ventaja de coherencia entre datos de EFT no procede de haber elegido una línea base DM «demasiado débil». El paquete de publicación P1A correspondiente al apéndice B (tablas y figuras suplementarias y full_fit_runpack) se integrará como archivo adicional en el mismo Zenodo Concept DOI del full_fit_runpack de este artículo: https://doi.org/10.5281/zenodo.18526286.
6 Robustez y experimentos de control
6.1 Barrido de σ_int (Run-5)
Realizamos un barrido sistemático de la dispersión intrínseca σ_int de RC. Para cada valor de σ_int repetimos la inferencia conjunta y calculamos ΔlogL_total relativo a DM_RAZOR. Los valores mínimo y máximo de ΔlogL_total de cada modelo en el rango barrido se muestran en la tabla S1b.

Figura R2 | Rango de ΔlogL_total bajo el barrido de σ_int (mayor es mejor).
6.2 Barrido de R_min (Run-6)
Para comprobar el efecto de errores sistemáticos en la región central -por ejemplo, movimientos no circulares, resolución o modelización bariónica insuficiente-, recortamos los datos RC con un umbral R_min y repetimos la inferencia conjunta. La ventaja de la familia EFT se mantiene positiva y de escala estable bajo el barrido de R_min.

Figura R3 | Rango de ΔlogL_total bajo el barrido de R_min (mayor es mejor).
6.3 Barrido de cov-shrink (Run-7)
Para comprobar la incertidumbre de la covarianza GGL, aplicamos shrinkage a la matriz de covarianza de cada bin de masa: C_α=(1−α)C+α·diag(C), y barremos α. Los resultados muestran que la ventaja de la familia EFT es insensible a este tratamiento.

Figura R4 | Rango de ΔlogL_total bajo el barrido de cov-shrink (mayor es mejor).
6.4 Escalera de ablación (Run-8)
Dentro de EFT_BIN realizamos una ablación anidada: desde el modelo mínimo (sin parámetros libres), pasando por modelos con pocos grados de libertad, hasta el modelo completo de 20 amplitudes de bin + escala global. AICc/BIC muestran que el EFT_BIN completo es claramente necesario para explicar los datos.

Figura R5 | Escalera de ablación de EFT_BIN (AICc; menor es mejor).
6.5 Predicción leave-one-bin-out (Run-9)
Ejecutamos además una prueba leave-one-bin-out (LOO): entre los 4 bins de masa de GGL, se deja fuera un bin en cada iteración, se reestima con los bins restantes (y con todos los datos RC), y se evalúa la log-verosimilitud de prueba sobre el bin reservado. Los indicadores resumidos aparecen en la tabla suplementaria Tab_R3_leave_one_bin_out (producto de Run-9; en la sección 8.2 se indica el patrón de ruta de los productos clave). La familia EFT sigue superando claramente a DM_RAZOR incluso en el peor caso de bin reservado.

Figura R6 | LOO: distribución de log-verosimilitud del bin reservado (procedente de los productos Run-9).
6.6 Control negativo: RC-bin shuffle (Run-10)
Run-10 reagrupa aleatoriamente los 20 RC-bin en 4×5 y, manteniendo inalterado el posterior RC-only, recalcula el cierre. Los resultados muestran que, frente a la correspondencia original, el shuffle reduce de forma clara el mean logL_true y ΔlogL_closure del cierre (véanse la tabla S1b y la figura R1), lo que refuerza la interpretabilidad de la señal de cierre.

Figura R7 | Control negativo: la correspondencia shuffle produce una caída marcada de la mean logL_true de cierre (procedente de los productos Run-10).
7 Trazabilidad y auditoría de coherencia (Provenance)
Todos los valores citados en este artículo pueden rastrearse, elemento por elemento, en las tablas estrictas de resumen y en los registros de auditoría archivados para publicación. Para que la lectura del texto principal sea más fluida, la cadena completa de trazabilidad (lista de tags, tablas de auditoría, listas de checksum y métodos de comprobación) se traslada al apéndice A.
8 Reproducibilidad y archivo Zenodo (Reproducibility & Archive)
Declaración de disponibilidad de datos y código: las curvas de rotación SPARC y los datos de lente gravitacional débil KiDS-1000 usados en este artículo son públicos. El informe de nivel publicable se ha archivado en Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), y el paquete completo de reproducción también se ha archivado en Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Los pasos de ejecución detallados, el entorno de dependencias, el inventario de archivo y la información de verificación por hash se recogen en el apéndice A; el diseño, las etiquetas de ejecución y los productos de la prueba de presión estandarizada de la línea base DM (P1A) se recogen en el apéndice B.
Bajo el mismo paquete completo de reproducción Concept DOI (https://doi.org/10.5281/zenodo.18526286), ofrecemos dos entradas reproducibles según el uso:
• P1 (texto principal) full_fit_runpack: reproduce los análisis RC-only / closure / joint de EFT vs DM_RAZOR, así como los barridos de robustez, y genera activos como las tablas S1a/S1b y las figuras S3/S4 del texto principal;
• P1A (apéndice B) full_fit_runpack: reproduce la prueba de presión estandarizada de la línea base DM (SCAT/AC/FB + dispersión jerárquica c–M + prior + core1p + lensing m + DM_STD; con EFT_BIN como control), y genera la tabla B1 y la figura B1 del apéndice.
Las tablas y figuras suplementarias de P1A, junto con el full_fit_runpack, se incorporarán como archivos adicionales al mismo Concept DOI, para mantener una única entrada de archivo.
9 Agradecimientos y declaraciones
9.1 Agradecimientos
Agradecemos a los equipos SPARC y KiDS-1000 que hayan proporcionado datos y documentación públicos; agradecemos asimismo a quienes participaron en el proceso de reconstrucción y auditoría de este proyecto.
9.2 Contribución del autor
Guanglin Tu se encargó de la concepción del estudio, el diseño del plan, la implementación técnica, la organización de los datos, el análisis formal, la implementación del flujo de reproducción y auditoría, y la redacción del artículo.
9.3 Financiación
Financiación personal del autor Guanglin Tu (sin financiación externa / sin número de proyecto).
9.4 Conflictos de intereses
El autor Guanglin Tu mantiene una relación con el «Grupo de trabajo EFT, Shenzhen Energy Filament Science Research Co., Ltd. (China)»; no existen otros conflictos de intereses.
9.5 Asistencia de IA
Se usaron OpenAI GPT-5.2 Pro y Gemini 3 Pro para pulido lingüístico, edición estructural y organización del flujo de reproducción; no se usaron para generar ni modificar datos, resultados, figuras ni código; tampoco para generar referencias. El autor asume plena responsabilidad por todo el contenido y por la exactitud de las citas.
10 Referencias
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- Teoría del filamento de energía. Zenodo (repositorio de ciencia abierta). DOI: https://doi.org/10.5281/zenodo.18517411
Apéndice A: detalles de trazabilidad y reproducibilidad
Este apéndice reúne la información de trazabilidad y reproducibilidad destinada al archivo a largo plazo (etiquetas de ejecución, resultados de auditoría, inventario de archivo y puntos clave de verificación), para que el lector pueda comprobar y reproducir lo necesario.
A.1 Detalles de trazabilidad y auditoría
Para garantizar la trazabilidad a largo plazo, el proyecto asigna un tag temporal a cada ejecución y a cada salida, y conserva los productos históricos sin sobrescribirlos. Los valores principales citados en este manuscrito proceden del resumen estricto (compile_tag=20260205_035929) y han superado las siguientes auditorías de coherencia:
• Todas las tablas intermedias incluyen run_tag y tag de fase; el script de resumen estricto selecciona, dentro de report/tables, las fuentes de tablas canonical «completas y coherentes».
• Los valores de Tab_Z1_master_summary y Tab_Z2_conclusion_highlights se comparan elemento por elemento con las tablas canonical seleccionadas.
• Al generar el PDF se realiza una auditoría de tags de las tablas y figuras citadas, para garantizar que no se mezclen productos antiguos.
Etiquetas clave (para localizar todos los productos intermedios): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.
Resultado de la auditoría de coherencia: Tab_AUDIT_checks_strict muestra pass=9, fail=0, skip=0 (véase el paquete de release).
A.2 Pasos de reproducción y inventario de archivo
Este estudio adopta un sistema de reproducción compuesto por «informe de nivel publicable + suplemento de tablas y figuras + paquete completo de ejecución reproducible». El lector puede consultar directamente el Tables & Figures Supplement para comprobar todas las tablas y figuras citadas; si necesita reproducir desde cero los valores y la cadena de auditoría, puede usar el full_fit_runpack para descargar los datos y volver a ejecutar el flujo completo. Al finalizar, las tablas pueden validarse con el script de comparación incluido frente a las tablas reference.
A.2.1 Quickstart de reproducción (RUN_FULL, Windows PowerShell)
Esta sección ofrece una ruta de reproducción más breve (Windows PowerShell). Para una comprobación rápida se recomienda consultar directamente el Tables & Figures Supplement y verificar una a una las tablas y figuras citadas. Si se desea una reproducción de extremo a extremo que genere todas las tablas, figuras y productos de auditoría, debe utilizarse full_fit_runpack: seguir el README/ONE_PAGE_REPRO_CHECKLIST del paquete y ejecutar verify_checksums.ps1 y RUN_FULL.ps1 (se recomienda Mode=full).
Entrada de archivo Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Etiquetas de la cadena principal de este artículo: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.
A.2.2 Materiales archivados y puntos clave de comprobación (Packages & checks)
El archivo Zenodo proporciona 3 tipos de materiales complementarios: (1) informe de nivel publicable (este artículo, v1.1; con apéndice B: prueba de presión estandarizada de la línea base DM P1A); (2) Tables & Figures Supplement (suplemento de tablas y figuras: cubre todos los activos de tablas y figuras citados en este artículo; separado para P1 y P1A); (3) full_fit_runpack (paquete completo de reproducción: descarga datos desde cero y reejecuta el flujo completo; separado para P1 y P1A). Los materiales (1) y (2) sirven para lectura rápida y comprobación independiente; el material (3) proporciona reproducción completa de extremo a extremo.
Categoría de material | Nombre de archivo (ejemplo) | Uso y posicionamiento (orden recomendado) |
Informe de nivel publicable (chino e inglés) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | Informe completo archivado en Zenodo; el texto principal presenta las conclusiones y auditorías de robustez, y el apéndice B presenta P1A (prueba de presión estandarizada de la línea base DM). |
Suplemento de tablas y figuras (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Todas las tablas (CSV) y figuras (PNG) citadas en el texto principal, incluidos scripts de generación y archivos de etiquetas. |
Suplemento de tablas y figuras (P1A) | P1A_supplement_figs_tables_v1.zip | Todas las tablas y figuras citadas en el apéndice B (P1A), incluidas Tab_S1_P1A_scoreboard y Fig_S1_P1A_scoreboard. |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | Reproducción completa de extremo a extremo: descargar los datos desde cero y volver a ejecutar RC-only/closure/joint y los barridos de robustez. |
full_fit_runpack (P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | Reproducción completa de extremo a extremo (apéndice B): volver a ejecutar DM 7+1 + DM_STD (con control EFT_BIN) y generar los activos del apéndice; el paquete incluye un script de comparación con tablas reference para verificar la coherencia numérica de las tablas. |
Cita recomendada: al citar este artículo o los materiales de reproducción asociados, indique el Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).
Entre los productos clave que deben aparecer tras la reproducción y que pueden compararse figuran:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (resumen de cierre)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (resumen del ajuste conjunto)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (barrido de σ_int)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (barrido de R_min)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (barrido de cov-shrink)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablación)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (control negativo)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (tabla maestra Strict; corresponde a las tablas S1a/S1b y a los valores del texto)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (PDF final de nivel publicable; útil para consulta rápida y cita)
Apéndice B: P1A - prueba de presión estandarizada de la línea base DM (DM 7+1 + DM_STD; incluye control EFT)
Este apéndice documenta una extensión P1A de «prueba de presión estandarizada de la línea base DM» coherente con el protocolo de cierre del texto principal. Su función es elevar la DM_RAZOR mínima usada en el texto (NFW + c–M fija, sin dispersión, sin contracción y sin core) a un conjunto de líneas base DM más cercano a la práctica astrofísica y más resistente a objeciones habituales, sin introducir muchos grados de libertad ni alterar la correspondencia compartida RC-bin→GGL-bin ni el marco de auditoría. P1A cubre y amplía las tres ramas de presión anteriores: mantiene SCAT/AC/FB, añade dispersión jerárquica c–M + prior, un proxy de core de un parámetro y una calibración de shear de lente m, y ofrece el modelo combinado DM_STD; EFT_BIN se conserva como referencia de comparación.
Nota complementaria: las intensidades de cierre y otros valores del apéndice B (P1A) se calculan con un presupuesto Monte Carlo más alto (por ejemplo, ndraw=400, nperm=24) que el presupuesto quick usado en el texto principal para cubrir toda la familia de núcleos EFT (por ejemplo, ndraw=60, nperm=12). Por ello, los valores absolutos pueden presentar un desplazamiento de muestreo de orden O(10); aun así, las comparaciones entre modelos dentro de la misma tabla y bajo el mismo presupuesto son justas, y el signo y la escala de la ventaja permanecen estables con presupuestos distintos.
B.1 Objetivo y posicionamiento (Why P1A, and why as an Appendix)
P1A no intenta agotar todas las posibilidades de modelización de halos ΛCDM, como no esfericidad, dependencia ambiental, conexiones galaxia-halo complejas o física bariónica de alta dimensión. Al contrario, P1A sigue el principio de «baja dimensión, auditabilidad y reproducibilidad»: cada módulo de mejora introduce como máximo un parámetro efectivo clave y continúa sometido a las tres restricciones rígidas de este artículo:
(i) registro de parámetros: todo parámetro nuevo debe contabilizarse explícitamente y reportarse junto con los criterios de información (AICc/BIC);
(ii) correspondencia compartida: se mantiene la misma agrupación RC-bin→GGL-bin, sin permitir ‘ajustar la correspondencia’ para un único conjunto de datos;
(iii) prueba de cierre: toda mejora debe producir una ganancia real en la predicción transferida RC→GGL, no solo mejorar el ajuste RC-only.
B.2 DM 7+1 + DM_STD: definición de módulos, parámetros y entrada al posterior conjunto
P1A, como runpack independiente, proporciona 8 workspaces DM (DM 7+1) y 1 control EFT: toma DM_RAZOR como baseline, construye tres mejoras legacy de un parámetro (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), añade tres módulos defensivos más estándar (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) y finalmente ofrece el modelo combinado DM_STD. Estos módulos comparten un objetivo: cubrir, con el menor aumento dimensional posible, las tres clases de objeciones más habituales: (a) cómo entran en un modelo jerárquico la dispersión y el prior de la relación c–M; (b) si el efecto principal del baryonic feedback puede aproximarse mediante un proxy de core de un parámetro; (c) si una sistemática clave del lado de lente podría confundirse con una señal física.
Workspace | dm_model | Nuevo parámetro | Motivo físico | Implementación (audit.) |
DM_RAZOR | NFW (fixed c–M, no scatter) | — | Baseline mínima y auditable de halo ΛCDM; contraste estricto con EFT | Mapeo fijo; registro estricto; solo comparación relativa |
DM_RAZOR_SCAT | NFW + c–M scatter (legacy) | σ_logc | La relación c–M presenta dispersión; se aproxima con scatter log-normal de un parámetro | ≤1 parámetro; mapeo fijo; ganancia de cierre como criterio |
DM_RAZOR_AC | NFW + Adiabatic Contraction (legacy) | α_AC | La caída bariónica puede inducir contracción adiabática del halo; se aproxima con una intensidad | ≤1 parámetro; mapeo fijo; se reportan AICc/BIC y cierre |
DM_RAZOR_FB | NFW + feedback core (legacy) | log r_core | El feedback puede formar un core interno; se aproxima con una escala de core | ≤1 parámetro; mismo cierre/control negativo; no optimiza solo RC-only |
DM_HIER_CMSCAT | Hierarchical c–M scatter + prior | σ_logc (hier) | Modelo jerárquico c_i∼logN(c(M_i), σ_logc), que afecta al posterior conjunto RC+GGL | Prior explícito; c_i latente marginalizado; baja dimensión y auditable |
DM_CORE1P | Proxy core 1P (coreNFW/DC14) | log r_core | Proxy de core para baryonic feedback; evita detalles de formación estelar de alta dimensión | Citas estándar; ≤1 parámetro; ligado a cierre |
DM_RAZOR_M | NFW + shear-calibration nuisance | m_shear (GGL) | Absorbe una sistemática clave de lente gravitacional débil mediante un parámetro efectivo | Nuisance contabilizado; sin efecto inverso sobre RC; prioriza robustez de cierre |
DM_STD | Baseline DM estandarizada (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core + m_shear | Integra las tres objeciones frecuentes en una baseline estándar de baja dimensión | Registro de parámetros + criterios de información; cierre como indicador principal; contraste DM fuerte |
Nota: la nomenclatura de los parámetros se rige por la implementación de ingeniería (por ejemplo, σ_logc, α_AC, log r_core, m_shear). El diseño de P1A pretende «fortalecer algo la línea base DM, pero mantenerla auditable», no convertir el lado DM en un ajustador de alta dimensión incontrolable. En particular, DM_HIER_CMSCAT introduce c–M scatter de forma jerárquica: la concentración c_i de cada halo se modela como una dispersión log-normal alrededor de c(M_i), limitada por el σ_logc global y por el prior c(M). Esta estructura jerárquica afecta simultáneamente al posterior conjunto RC y GGL.
B.3 Protocolo estadístico y productos coherentes con el texto principal
P1A reutiliza todos los productos de datos, la correspondencia compartida y el marco de auditoría del texto principal, manteniendo el mismo orden de ejecución y el mismo vocabulario de productos:
(1) Run-1: inferencia RC-only (salidas posterior_samples.npz y metrics.json);
(2) Run-2: prueba de cierre RC→GGL (salidas closure_summary.json y baseline permutada);
(3) Run-3: ajuste conjunto RC+GGL (salida joint_summary.json).
Todos los números citados proceden de la tabla de resumen automática Tab_S1_P1A_scoreboard y pueden verificarse, tras una reejecución completa, mediante el full_fit_runpack P1A y su script interno de comparación con la tabla reference.
B.4 Resultados principales, entrada de tablas/figuras y plan de archivo (mismo DOI)
Esta sección presenta las conclusiones cuantitativas principales de P1A. La tabla B1 resume los indicadores clave de RC-only, cierre RC→GGL y ajuste conjunto RC+GGL; los valores entre paréntesis son relativos a la baseline DM_RAZOR. La intensidad de cierre se define como ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (mayor es mejor). La figura B1 visualiza el mismo scoreboard. Los puntos principales son:
• Entre las tres ramas legacy, solo DM_RAZOR_FB (feedback/core) aporta una pequeña ganancia neta de intensidad de cierre: 122.21→129.45 (+7.25); SCAT y AC no aportan ganancia neta.
• Los nuevos DM_HIER_CMSCAT y DM_RAZOR_M tienen un efecto muy pequeño sobre la intensidad de cierre (~0), y DM_CORE1P tampoco muestra una ganancia neta significativa.
• El modelo combinado DM_STD puede mejorar significativamente joint logL, acercándose más al óptimo del ajuste conjunto, pero su intensidad de cierre disminuye; esto indica que la mejora proviene sobre todo de flexibilidad de ajuste conjunto y no de transferibilidad predictiva entre sondas.
• EFT_BIN, como control de comparación, mantiene una ventaja clara tanto en intensidad de cierre como en ajuste conjunto; por tanto, la conclusión principal del texto es robusta ante la introducción de una línea base DM más fuerte y de un nuisance de lente.
Para facilitar la comparación directa con el texto principal, las tablas S1a-S1b resumen los resultados estrictos de la familia EFT frente a DM_RAZOR: los modelos EFT mejoran el ajuste conjunto en ΔlogL_total≈1155–1337 respecto de DM_RAZOR y alcanzan ΔlogL_closure=172–281 en la prueba de cierre. P1A solo hace que el lado DM sea un adversario más exigente; su función es reducir objeciones del tipo «strawman baseline» o «systematics-as-physics», no reemplazar la comparación principal.
Tabla B1 | Scoreboard P1A (mayor es mejor; los paréntesis indican la diferencia respecto a la baseline DM_RAZOR).
Rama de modelo (workspace) | Δk | best logL_RC RC-only (Δ) | Intensidad de cierre ΔlogL_closure (Δ) | best logL_total conjunto (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Figura B1 | Scoreboard P1A: ΔlogL de cierre y conjunto respecto a la baseline (mayor es mejor).

Las etiquetas de una serie ya completada de ejecuciones de este apéndice son las siguientes (sirven para localizar productos intermedios, tablas y figuras de P1A):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.5 Forma de cita recomendada (Appendix citation note)
Cuando el lector necesite citar la «prueba de presión estandarizada de la línea base DM» además de las conclusiones principales del texto, se recomienda añadir a la cita principal: ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’