Predecir los resultados de la reacción: Las máquinas aprenden química

Las máquinas aprenden quiímica - Dalgar

Los químicos e informáticos desarrollan la inteligencia artificial

Fuente: Quimica.es

La vida cotidiana sin inteligencia artificial es apenas concebible en el mundo actual. Innumerables aplicaciones en áreas como la conducción autónoma, traducciones de idiomas extranjeros o diagnósticos médicos han encontrado su camino en nuestras vidas. También en la investigación química se están haciendo grandes esfuerzos para aplicar la inteligencia artificial (IA), también conocida como aprendizaje automático, de manera efectiva. Estas tecnologías ya se han utilizado para predecir las propiedades de las moléculas individuales, facilitando a los investigadores la selección del compuesto a producir.

Esta producción, conocida como síntesis, suele implicar un esfuerzo considerable, ya que hay muchas rutas de síntesis posibles para producir una molécula objetivo. Dado que el éxito de cada reacción individual depende de numerosos parámetros, no siempre es posible, ni siquiera para los químicos experimentados, predecir si se producirá una reacción, y mucho menos lo bien que funcionará. Para remediar esta situación, un equipo de químicos e informáticos de la Universidad de Münster ha unido sus fuerzas y ha desarrollado una herramienta de IA que se ha publicado en la revista «Chem».

 

También te puede interesar: EN EL COMIENZO DE 2020 LA PRODUCCIÓN DE LA INDUSTRIA QUÍMICA Y PETROQUÍMICA MOSTRÓ UN INCREMENTO DEL 4 POR CIENTO

Antecedentes y método

«Una reacción química es un sistema muy complejo», explica Frederik Sandfort, estudiante de doctorado en el Instituto de Química Orgánica y uno de los principales autores de la publicación. «En contraste con la predicción de las propiedades de los compuestos individuales, una reacción es la interacción de muchas moléculas y, por lo tanto, un problema multidimensional», añade. Además, no hay «reglas de juego» claramente definidas que, como en el caso de las modernas computadoras de ajedrez, simplifiquen el desarrollo de los modelos de IA. Por esta razón, los enfoques anteriores para predecir con precisión los resultados de las reacciones, como los rendimientos o los productos, se basan en su mayor parte en una comprensión previamente adquirida de las propiedades moleculares. «El desarrollo de tales modelos implica un gran esfuerzo. Además, la mayoría de ellos son altamente especializados y no pueden ser transferidos a otros problemas», añade Frederik Sandfort.

El trabajo presentado se centró, por lo tanto, en la aplicabilidad general del programa, de modo que otros químicos puedan utilizarlo fácilmente para su propio trabajo. Para asegurar esto, el modelo se basa directamente en las estructuras moleculares. «Cada compuesto orgánico puede representarse como un gráfico, en principio como una imagen», explica Marius Kühnemund, otro autor, del campo de la informática. «En tales gráficos, se pueden hacer simples consultas estructurales – comparables a la cuestión de los colores o las formas en la foto – para captar el llamado entorno químico con la mayor precisión posible».

La combinación de muchas de estas consultas sucesivas da como resultado la llamada huella digital molecular. Estas sencillas secuencias numéricas se han utilizado durante mucho tiempo en la quimioinformática para encontrar similitudes estructurales y son muy adecuadas para las aplicaciones asistidas por ordenador. En su enfoque, los autores utilizan un gran número de esas huellas dactilares para representar la estructura química de cada molécula con la mayor precisión posible. «De esta manera, hemos podido desarrollar un sistema robusto que puede utilizarse para predecir resultados de reacción completamente diferentes», añade Marius Kühnemund, «El mismo modelo puede utilizarse para predecir tanto los rendimientos como las estereoselectividades, lo cual es único».

Los autores demostraron que su programa puede aplicarse fácilmente y permite hacer predicciones precisas, especialmente en combinación con la robótica moderna, utilizando un conjunto de datos que no fue creado originalmente para el aprendizaje automático. «Este conjunto de datos contiene sólo ventas relativas de los materiales de partida y no rendimientos exactos», explica Frederik Sandfort. «Para obtener rendimientos exactos, hay que crear calibraciones. Sin embargo, debido al gran esfuerzo que implica, esto rara vez se hace en la realidad».

El equipo seguirá desarrollando su programa y lo dotará de nuevas funciones en el futuro. El profesor Frank Glorius está seguro: «Cuando se trata de evaluar grandes cantidades de datos complejos, las computadoras son fundamentalmente superiores a nosotros. Sin embargo, nuestro objetivo no es sustituir a los químicos sintéticos por máquinas, sino apoyarlos de la manera más eficaz posible. Los modelos basados en la inteligencia artificial pueden cambiar significativamente la forma en que abordamos las síntesis químicas. Pero todavía estamos en el principio».

Publicación original: