Problema
Los modelos suelen omitir transiciones geométricas válidas en razonamiento multi-paso.
ICP
Equipos que estudian representaciones intermedias para mejorar confiabilidad.
Capacidades
- Experimentos de estructura intermedia
- Comparación de estrategias de prompting
- Evaluación con datasets de restricciones
Ahora
Evaluaciones de calidad de transición simbólica a nivel de proceso.
Siguiente paso
Transferir hallazgos validados a productos y benchmarks principales.