Oil & Gas Science and Technology (Mar 2013)
Graph Machine Based-QSAR Approach for Modeling Thermodynamic Properties of Amines: Application to CO2 Capture in Postcombustion Approche QSAR Graph Machines pour la modélisation des propriétés thermodynamiques des amines : application au captage du CO2 en postcombustion
Abstract
Amine scrubbing is usually considered as the most efficient technology for CO2 mitigation through postcombustion Carbon Capture and Storage (CCS). However, optimization of the amine structure to improve the solvent properties requires to sample a large number of possible candidates and hence to gather a large amount of experimental data. In this context, the use of QSAR (Quantitative Structure Activity Relationship) statistical modeling is a powerful tool as it performs a mapping of a set of input vectors (i.e. the characteristics or the properties of the molecules under consideration) to a set of output vectors (i.e. their targeted properties). In this work, we used a high throughput screening experimental device to measure CO2 solubility data on a set of 46 amine aqueous solutions. Absorption isotherms are represented using a thermodynamic model based on two thermodynamic constants, pKa* and pKc* , accounting for the main chemical reactions occurring in the liquid phase between amine and CO2. Then, we used a statistical approach named Graph Machines at the same time to cluster the molecules and to model the variation of the acidity constant pKa* as a function of the molecular structure. The originality of our approach is the use of graphs to represent molecules in multidimensional spaces and simultaneously construct predictive models of their physicochemical properties based on these graphs. This approach is applied in this paper to predict the thermodynamic properties of a set of 5 new molecules. Le procédé d’absorption aux amines est considéré comme la technologie la plus efficace pour limiter les rejets de CO2 dans le cadre du captage en postcombustion puis du stockage du CO2. Cependant, l’optimisation des propriétés du solvant nécessite d’évaluer un grand nombre de candidats potentiels et donc de collecter une quantité importante de propriétés expérimentales. Dans ce contexte, l’utilisation de méthodes de modélisation statistique de type QSAR (Quantitative Structure Activity Relationship) s’avère être un outil très précieux puisqu’elles permettent d’établir une relation entre un ensemble de vecteurs d’entrées (i.e. les caractéristiques ou les propriétés des molécules étudiées) et un ensemble de vecteurs de sorties (i.e. les propriétés ciblées). Dans ce travail, nous avons utilisé un équipement d’expérimentation à haut débit pour mesurer la solubilité du CO2 dans un ensemble de 46 solutions aqueuses d’amines. Les isothermes d’absorption sont modélisées en utilisant une approche thermodynamique basée sur l’évaluation de deux constantes d’équilibres, pKa* et pKc* caractéristiques des principales réactions chimiques intervenant dans la phase liquide. Nous avons ensuite utilisé une approche statistique baptisée graph machines à la fois pour classifier les molécules et modéliser la variation de la constante d’acidité pKa* en fonction de la structure moléculaire. L’originalité de notre approche réside dans l’utilisation des graphes associés aux molécules afin de les représenter dans des espaces multidimensionnels et construire, en même temps, un modèle prédictif de leurs propriétés physico-chimiques. Cette approche est appliquée dans cet article pour prédire les propriétés thermodynamiques d’un ensemble de 5 nouvelles molécules.