Le séquençage de l’ADN est le processus consistant à déterminer l’ordre précis des nucléotides dans une molécule d’ADN. Il comprend tout procédé ou technologie utilisés pour déterminer l’ordre des quatre bases (Adénine, Guanine, Cytosine, Thymine) le long de la molécule d’ADN. Cette technologie est particulièrement intéressante pour des virus inconnus ou encore des souches virales divergentes. L’activité de séquençage des acides nucléiques d’agents infectieux a été initiée dès 1993 dans les laboratoires de diagnostic et de recherche actuellement regroupés au sein de l’IHU Méditerranée Infection. La plateforme actuelle de séquençage de nouvelle génération et génomique utilise les technologies Illumina et Oxford Nanopore. Elle est le support d’un nombre important de projets de recherches comprenant le séquençage de génomes complets ou partiels de virus, bactéries, champignons et parasites, et de métagénomes (séquençage de tous les acides nucléiques) à partir d’échantillons cliniques ou de cultures virales ou microbiennes.

Fondements technologiques et méthodologies du NGS
Le séquençage de nouvelle génération (NGS), également appelé séquençage à haut débit, a révolutionné le domaine de la génomique en permettant une analyse rapide et rentable de l’ADN et de l’ARN à des échelles sans précédent. Cette technologie a évolué à partir des méthodes traditionnelles de séquençage Sanger, offrant des capacités de séquençage massivement parallèles capables de générer des millions à des milliards de lectures en une seule exécution.
Parmi les méthodes employées, le pyroséquençage est notable : après fragmentation, l’ADN subit une amplification par ePCR (PCR en émulsion). Cette technique permet de réaliser dans un seul tube plusieurs millions de réactions indépendantes. Le mélange est ensuite déposé sur une plaque où chaque emplacement contient une seule molécule d’ADN amplifiée. Le séquençage est initié base par base. Une autre approche repose sur le séquençage à l’aide de terminateurs réversibles : la réaction de séquençage a lieu sur un support solide. Un mélange contenant toutes les bases associées chacune à un fluorophore différent est incorporé. L’extrémité des bases est protégée pour bloquer la PCR de manière réversible. Enfin, le séquençage par ligation utilise une stratégie différente : la première étape d’amplification est identique à celle du pyroséquençage, mais la réaction de séquençage repose sur un système complexe de cycles de ligation séquentielle d’oligonucléotides et de clivage.
Les plateformes Illumina utilisent le séquençage par synthèse (SBS) avec des nucléotides marqués par fluorescence. Les systèmes tels que NovaSeq et NextSeq produisent des milliards de courtes lectures avec une grande précision. Parallèlement, le RNA-Seq quantifie l’expression génique, détecte les épissages alternatifs et identifie les ARN non codants, redéfinissant notre compréhension de la vie au niveau moléculaire.
Processus opérationnel : de l’échantillon à l’analyse
Le séquençage de nouvelle génération a révolutionné la capacité des scientifiques à démêler les subtilités génétiques des virus. Dans ce domaine, il est indispensable de suivre un processus pointu, méthodique et rigoureux, de la préparation des échantillons à l’analyse bio-informatique, afin de mettre en lumière la présence ou l’absence de certaines séquences d’ADN viral dans un échantillon complexe.
La préparation des échantillons est la base d’un séquençage précis. Le processus débute par une préparation méticuleuse des échantillons, étape cruciale pour assurer l’intégrité et la pureté du matériel génétique. Dans le séquençage d’ADN viral, le point de départ peut aller de prélèvements cliniques à des échantillons environnementaux. Des protocoles spécifiques sont ainsi mis en œuvre pour extraire l’ADN ou l’ARN viral, afin de garantir que les étapes de séquençage ultérieures reflètent fidèlement la composition génétique du prélèvement ou de l’échantillon, et donc du virus recherché ou étudié.
Ensuite, la préparation des librairies est une étape où la précision est essentielle. Le matériel génétique isolé est transformé en une librairie prête pour le séquençage NGS. Ceci implique la fragmentation de l’ADN ou de l’ARN, l’ajout d’adaptateurs spécifiques et l’amplification des séquences résultantes. La précision dans la préparation des librairies influence directement la profondeur du séquençage. Le séquençage lui-même permet de séquencer en parallèle des millions de fragments d’ADN, offrant une couverture exhaustive inégalée, identifiant les variations, les mutations ponctuelles, les insertions et les délétions avec une précision exceptionnelle.
Les données brutes de séquençage sont enfin soumises à une analyse bioinformatique sophistiquée. Cette étape implique l’alignement des séquences sur un génome de référence, l’identification des variants et la création d’un profil détaillé du génome du virus étudié. Les algorithmes utilisés visent non seulement à identifier les variants génétiques de virus connus, mais aussi à détecter des virus inconnus avec une sensibilité exceptionnelle.
Séquençage Nouvelle Génération (NGS) 🧬: Illumina | Principe
Applications cliniques et sécurité biologique
La puissance du séquençage de nouvelle génération, associée à des outils bioinformatiques de pointe, permet de révéler la présence de virus, même en très petite quantité, dans un échantillon complexe. Le NGS peut être utilisé pour caractériser et confirmer l’identité de stocks de semences virales et bactériennes, ainsi que des vecteurs d’expression utilisés dans les produits de vaccins ou de thérapie génique. Une telle identification est une exigence des agences de réglementation pour les produits biologiques destinés à l’usage humain.
La sécurité virale des produits biologiques est assurée par des tests tout au long de la chaîne de production. Suivant les principes des 3R (remplacement, réduction et raffinement) de l’utilisation des animaux, ces techniques sont progressivement remplacées. Nous avons comparé la limite et la gamme de sensibilité des tests in vivo avec un essai transcriptomique basé sur le NGS. Les cultures cellulaires ont été infectées par un panel de neuf virus, dont seulement cinq ont été détectés par les tests in vivo. L’essai transcriptomique a pu détecter une cellule infectée parmi 103 à 107 cellules non infectées pour tous les virus évalués. Le NGS étend ainsi l’étendue de la détection des contaminants viraux par rapport aux tests traditionnels.
Il a été démontré que l'utilisation du NGS pour les tests d'agents adventices permet une détection sensible et impartiale des contaminants viraux, bactériens et fongiques dans une gamme de types d'échantillons, des matières premières aux produits biopharmaceutiques finaux.
Enjeux réglementaires et surveillance génomique
Le développement des nouvelles techniques de sélection des plantes (NBT) et de brevets sur les traits édités conduit à un renforcement des questions liées à l’acceptabilité sociétale et à la propriété intellectuelle. Dans ce contexte, la Commission européenne a annoncé en 2021 une initiative sur les plantes issues de certaines nouvelles techniques génomiques. Le ministère chargé de l’agriculture a saisi le Comité scientifique du CTPS en 2021 pour éclairer l’incidence des NBT sur l’évaluation des variétés. Le rapport conclut que l’utilisation des techniques d’édition du génome ne remet pas en cause les principes majeurs de l'évaluation des variétés, mais souligne les difficultés de coexistence sur le marché, du fait notamment des limites liées à la détection.
Parallèlement, la surveillance génomique est cruciale. Plus le séquençage des échantillons est rapide, plus l’aperçu exhaustif des variants en circulation est rapide. Des solutions compactes et ultra-rapides permettent d’accroître l’efficacité et d’assurer une couverture supérieure pour accélérer la détection des variants. Par exemple, l’utilisation combinée de kits spécifiques, comme le QIAseq DIRECT SARS-CoV-2, permet de simplifier le flux de travail, d’améliorer la couverture et de réduire les quantités de départ nécessaires.

Recherche scientifique et diagnostic moderne
Le séquençage de l’ADN viral permet d’apporter de nombreuses informations complémentaires : identifier les variations génétiques, localiser les altérations structurelles, profiler des communautés de virus, identifier les différentes souches avec précision pour comprendre les schémas épidémiologiques, ou encore surveiller la composition génétique du pathogène.
Les travaux menés à l’IHU Méditerranée Infection illustrent cette diversité d’applications. Des études ont permis l’analyse métagénomique et culturomique de la dysbiose du microbi