Coupling of quantum chemistry models and high-performance algorithms for the global exploration of the energy landscape of atomic and molecular systems - Équipe Robotique et InteractionS
Thèse Année : 2024

Coupling of quantum chemistry models and high-performance algorithms for the global exploration of the energy landscape of atomic and molecular systems

Couplage de modèles de chimie quantique et d'algorithmes haute performance pour l'exploration globale du paysage énergétique de systèmes atomiques et moléculaires

Valentin Milia

Résumé

The primary aim of this thesis is to develop efficient methods for characterizing molecular conformations at a quantum level. Various methods devoted to the computation of molecular potential energy are reviewed, as well as the most popular potential energy surfaces (PES) global exploration schemes. In this context, a key contribution of this thesis is the coupling of the robotics-inspired Iterative Global exploration and LOcal Optimization (IGLOO) method, implemented in the MoMA software, with the quantum Density-Functional based Tight-Binding (DFTB) potential, implemented in the deMonNano software. The IGLOO algorithm integrates the motion planning Rapidly-exploring Random Trees (RRT) algorithm with local optimization and structural filtering. A proof of concept has been done through the identification of low-energy conformations of the alanine dipeptide.The IGLOO/DFTB coupling has been applied to the mapping of the PES of three close-sized molecules of the phthalate family (dibutyl phthalate DBP, benzyl butyl phthalate BBP and di-2-ethylhexyl phthalate DEHP), providing detailed insights into their different conformational landscapes. Various geometrical descriptors have been used to analyze their structure-energy relationships. Coulomb interactions, steric hindrance, and dispersive interactions have been found to drive the geometric properties and a strong correlation has been evidenced between the two dihedral angles describing the side-chains orientation of the phthalate molecules. The results demonstrate the method's capability to identify low-energy minima without prior knowledge of the PES.Furthermore, an innovative algorithm for the large-scale generation of molecular structures, including a conformational variety, is presented. It combines molecular graph generation with atom or fragment addition techniques. It is applied to provide an extensive database of 3D structures of hydrogenated amorphous carbon (a-CH) molecules. The analysis of the database generated in this study provides a comprehensive understanding of the relationship between the geometrical and electronic descriptors of a-C:H structures. These properties are compared with those of compact Polycyclic Aromatic Hydrocarbons and linear chains, representing limit cases.Finally, a review is given on methods aiming at identifying saddle points and transition paths between low-energy conformations on the PES. A first step toward the identification of transition paths between low-energy conformations using a motion planning algorithm, known as Transition-based Rapidly-exploring Random Trees (T-RRT), is presented. A similarity measure, designated as the Symmetrized Segment-Path Distance (SSPD), is used to compare the generated trajectories. Subsequently, a clustering technique, namely the Hierarchical Clustering Analysis (HCA), is employed to group similar trajectories in order to identify the common pathways, thereby providing valuable insights into the dynamics of conformational changes. The methodology has been successfully applied to the identification of low-energy paths between two minima of the alanine dipeptide PES.Overall, the research presents significant advancements in the exploration of complex molecular PES at a quantum level including (i) the IGLOO/DFTB coupling (ii) a novel algorithm for 3D structure generation of large-scale molecules and (iii) an original scheme allowing for the identification of multiple transition paths. Correlations between the structural, energetic and electronic properties have been evidenced for the polluting phthalate molecules and astrophysically relevant hydrogenated amorphous carbon (a-CH) molecules. These contributions pave the way for future research, aiming to extend these methods to larger and more complex systems.
L'objectif principal de cette thèse est de développer des méthodes efficaces pour caractériser les conformations des molécules à un niveau quantique. Différentes méthodes dédiées au calcul de l'énergie potentielle d’une molécule sont examinées, ainsi que les schémas d'exploration globale des surfaces d'énergie potentielle (SEP) les plus populaires sont présentés. Une contribution clé de cette thèse est le couplage de la méthode IGLOO (Iterative Global exploration and LOcal Optimization), inspirée de la robotique, mise en œuvre dans le logiciel MoMA, avec le potentiel basé sur la “Density-Functional based Tight-Binding” (DFTB), implémenté dans le logiciel deMonNano. IGLOO intègre l'algorithme de planification de mouvement “Rapidly-exploring Random Trees” (RRT) avec des optimisations locales de l’énergie et un filtrage des structures. Une preuve de concept a été réalisée par l'identification des conformations de basse énergie de la molécule de d'alanine dipeptide.Le couplage IGLOO/DFTB a été appliqué à la cartographie des SEP de trois molécules de taille proche de la famille des phtalates (dibutyl phtalate DBP, benzyl butyl phtalate BBP et di-2-éthylhexyl phtalate DEHP), donnant un aperçu détaillé de leurs différents paysages conformationnels. Divers descripteurs géométriques ont été utilisés pour analyser leurs relations structure-énergie. Les interactions de Coulomb, l'encombrement stérique et les interactions dispersives sont à l'origine des propriétés géométriques et une forte corrélation a été mise en évidence entre les deux angles diédraux décrivant l'orientation des chaînes latérales des molécules de phtalate.En complément, un algorithme innovant pour la génération à grande échelle de molécules, incluant une variété de conformations, est présenté. Il combine la génération de graphes de molécules avec des techniques d'ajout d'atomes ou de fragments. Il est appliqué pour fournir une vaste base de données de structures 3D de molécules de carbone amorphe hydrogéné (a-CH). L'analyse de la base de données générée dans cette étude permet de comprendre la relation entre les descripteurs géométriques et électroniques des structures a-C:H. Ces propriétés sont comparées à celles des hydrocarbures aromatiques polycycliques (HAP) compacts et des chaînes linéaires, qui représentent des cas limites.Enfin, une revue des méthodes visant à identifier les points de selle et les chemins de transition entre les conformations de faible énergie sur la SEP est présentée. Une première étape pour l'identification des chemins de transition entre les conformations de faible énergie à l'aide d'un algorithme de planification de mouvement, connu sous le nom de Transition-based RRT (T-RRT), est présentée. Une mesure de similarité, désignée sous le nom de Symmetrized Segment-Path Distance (SSPD), est utilisée pour comparer les trajectoires générées. Ensuite, une technique de regroupement, à savoir Analyse de regroupement hiérarchique (HCA), est employée pour regrouper les trajectoires afin d'identifier les classes de chemin donnant la dynamique des changements de conformation. La méthodologie a été appliquée avec succès à l'identification de chemins à faible énergie entre deux minima de la SEP de l’alanine dipeptide.Dans l'ensemble, les travaux présentent des avancées significatives dans l'exploration de SEP de molécules complexes au niveau quantique, y compris (i) le couplage IGLOO/DFTB (ii) un nouvel algorithme pour la génération de structures 3D de molécules à grande échelle et (iii) un schéma original permettant l'identification de multiples chemins de transition. Des corrélations entre les propriétés structurelles, énergétiques et électroniques ont été mises en évidence pour les molécules polluantes de la famille des phtalates ainsi que pour les a-CH ayant une importance du point de vue astrophysique. Ces contributions ouvrent la voie à de futures recherches visant à étendre ces méthodes à des systèmes plus grands et plus complexes.
Fichier principal
Vignette du fichier
137555_MILIA_2024_archivage.pdf (39.93 Mo) Télécharger le fichier
Origine Version validée par le jury (STAR)

Dates et versions

tel-04771034 , version 1 (07-11-2024)

Identifiants

  • HAL Id : tel-04771034 , version 1

Citer

Valentin Milia. Coupling of quantum chemistry models and high-performance algorithms for the global exploration of the energy landscape of atomic and molecular systems. Data Structures and Algorithms [cs.DS]. Université de Toulouse, 2024. English. ⟨NNT : 2024TLSEP095⟩. ⟨tel-04771034⟩
102 Consultations
17 Téléchargements

Partager

More