Un equipo internacional de científicos, incluido el de la Universidad de Cambridge, ha lanzado una nueva colaboración de investigación que aprovechará la misma tecnología detrás de ChatGPT para construir una herramienta impulsada por inteligencia artificial para el descubrimiento científico.
Mientras ChatGPT se ocupa de palabras y oraciones, la IA del equipo aprenderá de datos numéricos y simulaciones físicas de todos los campos científicos para ayudar a los científicos a modelar todo, desde estrellas supergigantes hasta el clima de la Tierra.
El equipo lanzó la iniciativa, llamada Polymathic AI, a principios de esta semana, junto con la publicación de una serie de artículos relacionados en el repositorio de acceso abierto arXiv .
“Esto cambiará completamente la forma en que las personas usan la IA y el aprendizaje automático en la ciencia”, dijo la investigadora principal de Polymathic AI, Shirley Ho, líder de grupo en el Centro de Astrofísica Computacional del Instituto Flatiron en la ciudad de Nueva York.
La idea detrás de Polymathic AI “es similar a cómo es más fácil aprender un nuevo idioma cuando ya sabes cinco idiomas”, dijo Ho.
Comenzar con un modelo grande previamente entrenado, conocido como modelo básico, puede ser más rápido y más preciso que construir un modelo científico desde cero. Esto es cierto incluso si los datos de entrenamiento claramente no son relevantes para el problema en cuestión.
“La potencia computacional requerida ha dificultado la realización de investigaciones académicas sobre modelos fundamentales a gran escala”, dijo el coautor Miles Cranmer del Departamento de Matemáticas Aplicadas y Física Teórica y del Instituto de Astronomía de Cambridge. “A través de nuestra colaboración con la Fundación Simons, recibimos un recurso único para comenzar a crear prototipos de estos modelos para su uso en ciencia básica, y los investigadores de todo el mundo ahora pueden aprovecharlos. “La IA polimática nos muestra puntos en común y conexiones entre diferentes campos que han sido “Se pasa por alto”, dijo el co-investigador Siavash Golkar, académico visitante en el Centro de Astrofísica Computacional del Instituto Flatiron. Es uno de los científicos más influyentes con amplios conocimientos en diversos campos. Esto les permitió ver las conexiones que inspiraron su trabajo. A medida que cada campo científico se vuelve más especializado, resulta cada vez más difícil mantenerse a la vanguardia de múltiples campos. “Creo que aquí es donde la IA puede ayudarnos agregando información de diferentes campos”.
El equipo de Polymathic AI incluye a la Fundación Simons y su Instituto Flatiron, la Universidad de Nueva York, Cambridge e incluye investigadores de las universidades, la Universidad de Princeton y la Universidad de Lawrence. Laboratorio Nacional de Berkeley. El equipo incluye expertos en los campos de la física, la astrofísica, las matemáticas, la inteligencia artificial y la neurociencia.
Los científicos ya están utilizando herramientas de inteligencia artificial, pero principalmente se desarrollan y entrenan específicamente utilizando datos relevantes.
“A pesar de los rápidos avances del aprendizaje automático en diversos campos científicos en los últimos años, en la mayoría de los casos las soluciones de aprendizaje automático se desarrollan para casos de uso específicos y se entrenan en datos muy específicos”, afirma el coinvestigador François Lanous. centro. Agencia Nacional Francesa de Investigaciones Científicas (CNRS).
“Esto crea límites tanto dentro como entre disciplinas, lo que significa que los científicos que utilizan la IA en su investigación no pueden beneficiarse de información que puede existir en diferentes formatos o en áreas completamente diferentes.
El proyecto Polymathic AI entrena utilizando los siguientes datos: Reunimos diversas fuentes de la física y la astrofísica (eventualmente también de campos como la química y la genómica) y aplicamos este conocimiento interdisciplinario a una amplia gama de problemas científicos. El proyecto “conectará muchos subcampos aparentemente dispares en algo mayor que la suma de sus partes”, dijo Mariel, miembro del proyecto y becario postdoctoral en el Laboratorio Nacional Lawrence Berkeley.
“No está claro hasta qué punto podemos saltar entre disciplinas”, dijo Ho. “Eso es lo que queremos hacer. Intenta que esto suceda.”
ChatGPT tiene limitaciones conocidas en términos de precisión (por ejemplo, dice el chatbot) en lugar de la respuesta correcta de 2.496.382. 2.023 por 1.234 es 2.497.582). El proyecto Polymathic AI evitará muchos de estos errores al tratar los números como números reales en lugar de caracteres del mismo nivel que las letras y los signos de puntuación, dijo Ho. Los datos de entrenamiento también utilizan conjuntos de datos científicos reales que capturan la física fundamental del universo.
La transparencia y la apertura son una parte importante del proyecto, dijo Ho. “Queremos democratizar la IA para la ciencia y, dentro de unos años, poder ofrecer a la comunidad modelos listos para usar que puedan ayudar a mejorar el análisis científico en una variedad de problemas y disciplinas”.




