Un adolescente de California encontró un tesoro cósmico mientras exploraba datos olvidados de la NASA. Lo que comenzó como un proyecto de verano se convirtió en un descubrimiento revolucionario con IA, ahora publicado en una revista científica líder.
En lo que podría ser uno de los avances más inesperados de la astronomía moderna, un estudiante de secundaria de California ha utilizado inteligencia artificial para detectar más de 1,5 millones de objetos espaciales previamente no identificados, todo a partir de datos recopilados por una misión retirada de la NASA. Su trabajo ahora ha sido revisado por pares y publicado en The Astronomical Journal, otorgándole una base sólida en la comunidad científica.
Un pipeline de IA construido por un adolescente
Matteo Paz, un adolescente de Pasadena, se unió al Planet Finder Academy de Caltech en el verano de 2022, un programa de investigación diseñado para dar a los estudiantes de secundaria exposición a desafíos astronómicos del mundo real. Bajo la orientación de Davy Kirkpatrick, científico senior del Infrared Processing and Analysis Center (IPAC) de Caltech, Paz comenzó a trabajar con un inmenso archivo de datos del telescopio NEOWISE de la NASA.
Originalmente lanzado en 2009 para detectar asteroides cercanos a la Tierra, NEOWISE terminó recopilando mucho más que eso: específicamente, más de una década de datos infrarrojos de cielo completo, capturando no solo objetos cercanos sino fenómenos cósmicos distantes y a menudo pasados por alto.
El desafío era el tamaño: como dijo Kirkpatrick, estaban «acercándose hacia 200 mil millones de filas» de observaciones. Inicialmente, el equipo consideró analizar una pequeña porción manualmente. Pero Paz tenía otras ideas.
Armado con experiencia en matemáticas teóricas, programación y análisis de dominio temporal, comenzó a desarrollar un modelo de IA para automatizar toda la búsqueda. En solo seis semanas, construyó un pipeline de machine learning capaz de detectar fuentes de luz débiles y variables: objetos que cambiaban de brillo a lo largo del tiempo de maneras que los ojos humanos o las herramientas convencionales podrían pasar por alto.
«El modelo comenzó a mostrar algo de promesa casi inmediatamente», dijo Kirkpatrick a Phys.org. «Mientras Paz lo refinaba, los resultados seguían siendo más interesantes».
El avance llegó al identificar objetos que parpadeaban, pulsaban o se atenuaban: comportamientos que a menudo indican quásares, estrellas binarias eclipsantes o supernovas.
Big data se encuentra con un gran cielo
El modelo de IA utilizó una combinación de transformadas de Fourier y análisis wavelet, dos técnicas matemáticas bien adaptadas para estudiar cambios en señales a lo largo del tiempo. Estos métodos permitieron la detección de variaciones sutiles en el espectro infrarrojo, que son difíciles de aislar debido a las limitaciones del muestreo temporal de NEOWISE.
Algunas de las variables que el sistema de Paz detectó cambiaron tan lentamente, o tan brevemente, que habían escapado completamente de la atención anteriormente. Esto es especialmente importante para fenómenos como transitorios lentos o variables cataclísmicas, que no siguen patrones predecibles.
Durante el verano y los meses siguientes, Paz colaboró con investigadores de Caltech incluyendo Shoubaneh Hemmati, Daniel Masters, Ashish Mahabal y Matthew Graham, refinando el algoritmo para trabajar a través de todo el conjunto de datos del cielo. Lo que descubrieron no fue solo una anomalía o dos, sino un catálogo de más de 1,5 millones de fuentes variables, ahora documentado en su artículo publicado en The Astronomical Journal.
Se espera que el catálogo completo sea liberado en 2025 y podría informar observaciones de seguimiento por telescopios como el Vera Rubin Observatory o JWST, ofreciendo pistas frescas sobre los ciclos de vida de las estrellas, galaxias distantes y otros procesos energéticos a través del universo.
De la escuela a la nómina de Caltech
La historia no termina con el descubrimiento. Paz, que aún está terminando la secundaria, ahora es un asistente de investigación pagado en IPAC, continuando desarrollando el pipeline de IA y entrenando a nuevos estudiantes en el Planet Finder Academy.
Lo que hace esto especialmente convincente es que las habilidades que utilizó—desarrollo de algoritmos, modelado de series temporales, astrofísica computacional—se encuentran típicamente a nivel de posgrado. Sin embargo, Paz las desarrolló a través de la Math Academy del Pasadena Unified School District, un riguroso programa público diseñado para empujar a estudiantes matemáticamente dotados más allá del currículo estándar.
«Si veo su potencial, quiero asegurarme de que lo estén alcanzando», dijo Kirkpatrick. «Haré todo lo que pueda para ayudarlos».
Paz mismo ve posibilidades más amplias. Debido a que el pipeline de IA está construido para analizar cualquier tipo de datos temporales, podría ser adaptado para campos como finanzas, monitoreo de contaminación, o incluso neurociencia, donde las fluctuaciones a lo largo del tiempo a menudo señalan insights críticos.
Su enfoque muestra cómo las herramientas desarrolladas para descubrimiento astronómico pueden ser útiles a través de dominios completamente diferentes, algo que los investigadores exploran cada vez más bajo el paraguas del machine learning interdisciplinario.
Una nueva era para la astronomía ciudadana
Este descubrimiento marca un punto de inflexión significativo en la forma en que los jóvenes pueden contribuir a la ciencia de vanguardia. La combinación de acceso a grandes conjuntos de datos, herramientas de IA democratizadas y programas educativos innovadores está creando oportunidades sin precedentes para que estudiantes de secundaria realicen investigaciones a nivel profesional.
El trabajo de Paz demuestra que con la orientación adecuada y las herramientas correctas, las barreras tradicionales entre la educación y la investigación científica de primera línea están comenzando a desmoronarse. Su éxito no solo ha identificado millones de objetos cósmicos previamente desconocidos, sino que también ha establecido un nuevo estándar para lo que los estudiantes jóvenes pueden lograr en el campo de la astronomía computacional.
El catálogo completo, una vez liberado, representará una de las contribuciones más significativas a la astronomía infrarroja de los últimos años, todo gracias a la curiosidad y determinación de un estudiante de secundaria que se negó a conformarse con métodos convencionales.