Evo 2 : L’IA révolutionnaire qui crée des gènes fonctionnels, la biologie n’en revient pas !

Quand l’intelligence artificielle se prend pour Darwin (et lui met une raclée !)

L’intelligence artificielle nous avait déjà bluffés en créant des images de chats mutant ou en rédigeant des poèmes dignes des meilleures dissertations. Mais aujourd’hui, elle joue dans la cour des grands : celle du vivant !

Avec Evo 2, un modèle d’IA open source développé par une dream team de chercheurs de Stanford, NVIDIA, UC Berkeley et plus encore, l’IA vient littéralement d’apprendre à lire, comprendre… et écrire de l’ADN fonctionnel. Non, ce n’est pas un scénario de science-fiction. C’est la vraie vie.

Evo 2, c’est le modèle qui fait passer vos cours de SVT pour un lointain souvenir. Grâce à sa capacité à générer de nouvelles protéines qui n’existent même pas dans la nature, il pourrait bien révolutionner la biologie synthétique, la médecine ou encore l’environnement. Et ce que Mère Nature n’a pas eu le temps d’inventer en quelques millions d’années, Evo 2 l’imagine en une poignée de calculs !

Dans les coulisses : des teraoctets de génomes, une armée de GPU et un monde open source

Pour entraîner ce Frankenstein du bio-IA, les chercheurs ont gavé Evo 2 de 9,3 trillions de nucléotides issus de 128 000 génomes (oui, ça fait beaucoup de A, T, G et C). Humains, bactéries, virus, plantes… rien n’a échappé à son appétit génomique. Evo 2 existe d’ailleurs en deux versions musclées : 7 milliards et 40 milliards de paramètres.

Pour ce tour de force, il a fallu mobiliser 2 000 GPU NVIDIA H100 pendant des mois. Oui, le genre de puissance de calcul qui ferait pleurer d’envie n’importe quel gamer ou mineur de cryptomonnaie.

Mais le vrai super-pouvoir d’Evo 2, c’est sa fenêtre de contexte géante d’un million de paires de bases. Pour situer : il peut digérer un chromosome de levure EN ENTIER d’un seul coup. K.O. technique pour la concurrence !

Génétique augmentée : des performances à donner le tournis

Première démonstration de force : Evo 2 a prévu, sans entraînement spécifique, quelles mutations du gène BRCA1 étaient pathogènes ou bénignes.

Précision ? Plus de 90 %. Certains professionnels de santé ne diraient pas non à une telle boule de cristal dans leur labo.

Et Evo 2 ne s’arrête pas là : il excelle dans la prédiction de mutations dans les régions « non-codantes » de l’ADN, ces parties jadis qualifiées injustement d’ »ADN poubelle ». Pour ce terrain de jeu, il est numéro un mondial, rien que ça.

Pour vérifier que l’IA n’était pas juste une bête à recracher ce qu’on lui a appris, les chercheurs l’ont testée avec le génome du mammouth laineux. L’animal était bel et bien absent des bases de données, mais Evo 2 a identifié la structure génétique de la bestiole disparue !

L’art de générer l’inédit : design sémantique et protéines Frankenstein

Imaginez : au lieu d’écrire un texte à l’IA, vous lui proposez une séquence d’ADN… et elle vous complète le génome ! C’est le concept révolutionnaire du design sémantique appliqué à l’ADN. L’IA génère des gènes inédits et des protéines sur mesure, qui n’existent nulle part dans la nature.

Exemple bluffant : les chercheurs ont demandé à Evo 2 de générer une antitoxine pour neutraliser une toxine bactérienne.

Résultat ? Sur dix propositions, la moitié neutralisaient partiellement la toxine, et deux d’entre elles l’ont désactivée à 95-100 %. Le truc fou, c’est qu’elles n’avaient que 21 à 27 % de similarité avec des protéines naturelles, autant dire que l’IA a accouché de solutions complètement nouvelles, dignes du Docteur Frankenstein mais version utile !

Plus fort encore : certaines de ces antitoxines marchent simultanément contre plusieurs toxines différentes, alors que l’antitoxine “originale” se contente d’une seule. L’IA, plus polyvalente que la nature elle-même ? On commence à se demander si elle ne va pas nous apprendre deux-trois trucs sur l’évolution…

ARN, anti-CRISPR et séquences hors-normes : rien ne l’arrête

Après avoir joué avec les protéines, les chercheurs ont testé Evo 2 sur l’invention d’antitoxines… en version ARN. Boum : encore une réussite, avec 88 % de survie cellulaire !

Mais le clou du spectacle, c’est la génération de toxines ou de protéines qui… ne ressemblent à rien. Aucune équivalence trouvée dans les bases connues, même avec les méthodes de détection dernier cri. Ce sont de vrais OVNI du vivant !

Pour pousser la démonstration à l’extrême, ils l’ont fait bosser sur des anti-CRISPR (ces protéines qui sabotent l’immunité bactérienne). Et là, 17 % des protéines inventées par l’IA montraient une activité anti-CRISPR réelle, certaines sans aucun cousin connu parmi les protéines recensées.

Génomes mitochondriaux, chromosomes de levure et séquences Morse : l’IA se lâche !

Evo 2 ne se contente pas de concevoir une protéine à la fois. Elle est capable de créer des génomes entiers, mitochondriaux, bactériens, et même de la levure, avec toutes les structures attendues : introns, promoteurs, ARNt, complexes protéiques validés par AlphaFold 3… Un festival de créativité génétique !

Pour pimenter l’expérience, les chercheurs ont même encodé des messages en code Morse (“EVO2”, “LO”) dans le profil d’accessibilité de la chromatine. Oui, on parle bien de l’ADN, pas d’un escape game science-fiction !

Open source, outillage et communauté : la révolution partagée

Grande nouvelle pour les chercheurs, biohackers et curieux du vivant : tout est ouvert !

  • Les modèles Evo 2 (7B et 40B) sont dispo sur Hugging Face
  • Le code d’entraînement / inférence est sur GitHub
  • Le dataset OpenGenome2 se télécharge librement
  • Et pour explorer tout ça finger-in-the-browser, l’API hébergée par NVIDIA et l’interface Evo Designer sont là pour vous !

Pour les bidouilleurs du dimanche ou les curieux avancés, NVIDIA propose même des tutos de fine-tuning via BioNeMo, et l’outil d’interprétabilité Goodfire pour visualiser comment Evo 2 voit ses séquences.

Limites et défis : la vie n’est pas encore coachée 100 % IA

Bon, avant de vous précipiter pour créer un dinosaure dans votre garage, sachez que tout n’est pas encore parfait. Evo 2 peut parfois inventer des séquences qui semblent biologiques… mais pourraient bien planter en vrai. Il peut y avoir de la « fantaisie » dans l’air. D’ailleurs, certains génomes générés n’étaient pas fonctionnels, et il reste un gros travail de validation expérimentale.

Il reste aussi des challenges : l’IA excelle chez les prokaryotes (bactéries et compagnie), mais pour l’instant, les fonctions complexes des eucaryotes lui échappent encore un peu… jusqu’à la prochaine mise à jour, qui sait !

Mais la collaboration est déjà en marche : des experts de l’Université du Maryland travaillent à valider ces génomes en conditions réelles. Peut-être que la prochaine étape, ce sera une enzyme capable de recycler le plastique à la demande ?

Pourquoi c’est une révolution pour la biologie, la médecine et la tech ?

Jamais une IA n’avait proposé autant d’innovations d’un coup. Avec Evo 2, le design sémantique de protéines et de génomes passe d’un rêve de chercheurs à une réalité open source. On peut imaginer demain des médicaments conçus sur mesure, des thérapies adaptées à des mutations rares, des microbes-ouvriers capables de booster l’environnement, ou même la création d’organismes totalement inédits pour des applications encore inimaginables.

Cerise sur le brin d’ARNm : la base SynGenome propose déjà 120 milliards de paires de bases d’ADN synthétique en libre accès, avec des outils de recherche hyper puissants (par fonction, domaine, espèce…). Les chimères protéiques attendent d’être explorées, et le terrain de jeu n’a jamais été aussi grand.

Un monde ouvert et responsable : la bio-IA, pour tous (et avec vigilance)

Evo 2 incarne une nouvelle ère : la biologie générative, au service de tous. Les modèles sont open source, l’accès est libre, et la communauté s’apprête à tout bouleverser… avec prudence (oui, il faut bien valider tout ça dans la vraie vie) !

Si l’on n’est pas encore en train de créer, façon Jurassic Park, un « zoo génétique », le fait qu’une IA puisse générer, valider et même prédire l’utilité de nouvelles protéines, c’est tout simplement saisissant. Et d’ici peu, qui sait ce que les bio-hackers, chercheurs ou grandes industries vont imaginer ?

Gardez un œil sur Evo 2 : la révolution génétique se passe maintenant, et elle est… open source !

Source : Evo 2 : L’IA révolutionnaire qui écrit l’ADN, la biologie n’en revient pas !