Advanced computational techniques to aid the rational design of small molecules targeting RNA - Thèses de Sorbonne Université Accéder directement au contenu
Thèse Année : 2024

Advanced computational techniques to aid the rational design of small molecules targeting RNA

Techniques computationnelles avancées pour aider la conception rationnelle de petites molécules ciblant l'ARN

Résumé

RNA molecules have recently gained huge relevance as therapeutic targets. The direct targeting of RNA with small molecule drugs emerges for its wide applicability to different classes of RNAs. Despite this potential, the field is still in its infancy and the number of available RNA-targeted drugs remains limited. A major challenge is constituted by the highly flexible and elusive nature of the RNA targets. Nonetheless, RNA flexibility also presents unique opportunities that could be leveraged to enhance the efficacy and selectivity of newly designed therapeutic agents. To this end, computer-aided drug design techniques emerge as a natural and comprehensive approach. However, existing tools do not fully account for the flexibility of the RNA. The project of this PhD work aims to build a computational framework toward the rational design of compounds targeting RNA. The first essential step for any structure-based approach is the analysis of the available structural knowledge. However, a comprehensive, curated, and regularly updated repository for the scientific community was lacking. To fill this gap, I curated the creation of HARIBOSS ("Harnessing RIBOnucleic acid - Small molecule Structures"), a database of all the experimentally-determined structures of RNA-small molecule complexes retrieved from the PDB database. HARIBOSS is available via a dedicated web interface (https://hariboss.pasteur.cloud), and is regularly updated with all the structures resolved by X-ray, NMR, and cryo-EM, in which ligands with drug-like properties interact with RNA molecules. Each HARIBOSS entry is annotated with physico-chemical properties of ligands and RNA pockets. HARIBOSS repository, constantly updated, will facilitate the exploration of drug-like compounds known to bind RNA, the analysis of ligands and pockets properties and, ultimately, the development of in silico strategies to identify RNA-targeting small molecules. In coincidence of its release, it was possible to highlight that the majority of RNA binding pockets are unsuitable for interactions with drug-like molecules, attributed to the lower hydrophobicity and increased solvent exposure compared to protein binding sites. However, this emerges from a static depiction of RNA, which may not fully capture their interaction mechanisms with small molecules. In a broader perspective, it was necessary to introduce more advanced computational techniques for an effective accounting of RNA flexibility in the characterization of potential binding sites. In this direction, I implemented SHAMAN, a computational technique to identify potential small-molecule binding sites in RNA structural ensembles. SHAMAN enables the exploration of the target RNA conformational landscape through atomistic molecular dynamics. Simultaneously, it efficiently identifies RNA pockets using small probe compounds whose exploration of the RNA surface is accelerated by enhanced-sampling techniques. In a benchmark encompassing diverse large, structured riboswitches as well as small, flexible viral RNAs, SHAMAN accurately located experimentally resolved pockets, ranking them as preferred probe hotspots. Notably, SHAMAN accuracy was superior to other tools working on static RNA structures in the realistic drug discovery scenario where only apo structures of the target are available. This establishes SHAMAN as a robust platform for future drug design endeavors targeting RNA with small molecules, especially considering its potential applicability in virtual screening campaigns. Overall, my research contributed to enhance our understanding and utilization of RNA as a target for small molecule drugs, paving the way for more effective drug design strategies in this evolving field.
Les molécules d'ARN sont devenues des cibles thérapeutiques majeures, et le ciblage par petites molécules se révèle particulièrement prometteur. Cependant, malgré leur potentiel, le domaine est encore en développement, avec un nombre limité de médicaments spécifiquement conçus pour l'ARN. La flexibilité intrinsèque de l'ARN, bien qu'elle constitue un obstacle, introduit des opportunités thérapeutiques que les outils computationnels actuels ne parviennent pas pleinement à exploiter malgré leur prédisposition. Le projet de cette thèse est de construire un cadre computationnel plus complet pour la conception rationnelle de composés ciblant l'ARN. La première étape pour toute approche structure-based est l'analyse des connaissances structurales disponibles. Cependant, il manquait une base de données complète, organisée et régulièrement mise à jour pour la communauté scientifique. Pour combler cette lacune, j'ai créé HARIBOSS, une base de données de toutes les structures expérimentalement déterminées des complexes ARN-petites molécules extraites de la base de données PDB. Chaque entrée de HARIBOSS, accessible via une interface web dédiée (https://hariboss.pasteur.cloud), est annotée avec les propriétés physico-chimiques des ligands et des poches d'ARN. Cette base de données constamment mise à jour facilitera l'exploration des composés drug-like liées à l'ARN, l'analyse des propriétés des ligands et des poches, et en fin de compte, le développement de stratégies in silico pour identifier des petites molécules ciblant l'ARN. Lors de sa sortie, il a été possible de souligner que la majorité des poches de liaison à l'ARN ne conviennent pas aux interactions avec des molécules drug-like. Cela est dû à une hydrophobicité moindre et une exposition au solvant accrue par rapport aux sites de liaison des protéines. Cependant, cela résulte d'une représentation statique de l'ARN, qui peut ne pas capturer pleinement les mécanismes d'interaction avec de petites molécules. Il était nécessaire d'introduire des techniques computationnelles avancées pour une prise en compte efficace de la flexibilité de l'ARN. Dans cette direction, j'ai mis en œuvre SHAMAN, une technique computationnelle pour identifier les sites de liaison potentiels des petites molécules dans les ensembles structuraux d'ARN. SHAMAN permet d'explorer le paysage conformationnel de l'ARN cible par des simulations de dynamique moléculaire atomistique. Dans le même temps, il identifie efficacement les poches d'ARN en utilisant de petits fragments dont l'exploration de la surface de l'ARN est accélérée par des techniques d'enhanced sampling. Dans un ensemble de données comprenant divers riboswitches structurés ainsi que de petits ARN viraux flexibles, SHAMAN a précisément localisé des poches résolues expérimentalement, les classant les régions d’interaction préférées. Notamment, la précision de SHAMAN est supérieure à celle d'autres outils travaillant sur des structures statiques d'ARN dans un scénario réaliste de découverte de médicaments où seules les structures apo de la cible sont disponibles. Cela confirme que SHAMAN est une plateforme robuste pour les futures initiatives de conception de médicaments ciblant l'ARN avec de petites molécules, en particulier compte tenu de sa pertinence potentielle dans les campagnes de criblage virtuel. Dans l'ensemble, ma recherche contribue à améliorer notre compréhension et notre utilisation de l'ARN en tant que cible pour les médicaments à petites molécules, ouvrant la voie à des stratégies thérapeutiques plus efficaces dans ce domaine en évolution.
Fichier principal
Vignette du fichier
142671_PANEI_2024_archivage.pdf (47.34 Mo) Télécharger le fichier
Origine Version validée par le jury (STAR)

Dates et versions

tel-04649350 , version 1 (16-07-2024)

Identifiants

  • HAL Id : tel-04649350 , version 1

Citer

Francesco Paolo Panei. Advanced computational techniques to aid the rational design of small molecules targeting RNA. Bioinformatics [q-bio.QM]. Sorbonne Université, 2024. English. ⟨NNT : 2024SORUS106⟩. ⟨tel-04649350⟩
0 Consultations
0 Téléchargements

Partager

Gmail Mastodon Facebook X LinkedIn More