• Beink

Comment j'en suis venue à stocker des données dans de l'ADN

Sommaire:

1- Rencontres et projets

a- Qu'est-ce que l'ADN ?

b- Que signifie "encoder dans de l'ADN" ?

c- Pourquoi stocker de l'information numérique dans de l'ADN ?

2- Encoder la Déclaration des Droits de l'Homme et du Citoyen

a- Un projet d'une grande dimension philosophique et historique

b- Un projet alliant la biologie avec la physique, la chimie et l'informatique

3- Et la suite de cette grande aventure, c'est quoi ?

a- Remise des capsules d'ADN aux Archives Nationales : une première mondiale

b- Création de Biomemory pour valoriser le brevet d'encodage de données numériques dans l'ADN



Rencontres et projets


Janvier 2018, je suis étudiante en 3ème année d'école d'ingénieur en agronomie (ENSAIA), spécialisée en biotechnologies. Tandis que je serai diplômée dès octobre, je souhaite poursuivre mes études par une thèse. Mais pas n'importe quelle thèse, je cherche un sujet suffisamment original complet pour m'inspirer et me donner l'envie d'y investir toutes mes compétences. Alors plutôt que de répondre à des appels d'offre qui ne m'inspiraient qu'à moitié, j'ai pris le problème dans l'autre sens, selon moi, le vrai sens, et je suis partie à la rencontre d'équipes de recherche qui travaillent sur des sujets qui me passionnent. Pour les contacter, j'envoyais un mail racontant qui j'étais, quel était mon parcours, ce que je cherche et leur demandant s'ils seraient disponibles pour une rencontre, afin d'échanger à propos de leurs recherches. Et bien sûr, mon but sous-jacent était de me créer un réseau de contact suffisamment vaste pour dénicher le poste qui me ferait vibrer. C'est dans ce contexte que j'ai rencontré Stéphane Lemaire, directeur de recherche et chef de l'équipe de recherche Biologie de Synthèse et des Systèmes des Microalgues au CNRS. Dans son équipe, pas de poste à pourvoir pour une doctorante, en revanche... une opportunité incroyable, et joliment amenée : apparemment mon CV est celui qu'on attendait pour lancer un projet hors du commun : stocker des données dans l'ADN, il faut bien reconnaitre qu’à ce moment-là, je suis flattée et carrément enthousiaste, vous vous en doutez : j’accepte.


Me voilà donc pas du tout en thèse mais ingénieur d'étude, seule personne travaillant à plein temps sur un projet hors du commun : encoder la Déclaration des Droits de l'Homme et du Citoyen (1789) et la Déclaration des Droits de la Femme et de la Citoyenne (1791) dans de l'ADN.


"Ok c'est bien gentil, on dirait qu'on parle d'un truc de fou, mais qu'est-ce que ça veut dire "encoder dans de l'ADN" en fait ?"


Qu'est-ce que l'ADN ?

JeanneLePeillet©

L'ADN est une jolie molécule, en forme de double hélice, qui se trouve être le support de notre information génétique (c'est une sorte de bibliothèque dans laquelle est rangée chacun de nos gènes). ADN est un acronyme, pour Acide DésoxyRibonucléique, autrement dit : un acide auquel il manque un oxygène ("désoxy") sur une molécule de sucre (le ribose) L'ADN varie d'un individu à un autre (surtout si ceux-ci n'appartiennent pas à la même espèce), en revanche il est le même pour chacune de nos cellules. Chaque cellule de notre corps lit le même ADN.


Mais du coup, vous allez me dire "Comment ça se fait que chacune de nos cellules lise la même information génétique, alors qu'on a plein de cellules différentes ?". Effectivement, une cellule d'oeil n'est pas une cellule de cuir chevelu, car on n'a jamais vu quelqu'un avoir des cheveux qui lui poussent dans les yeux. Et bien l'existence de types de cellules différentes au sein d'un même individu s'explique par le fait que chaque type de cellule lit un chapitre dédié de l'ADN, et non pas tous les chapitre. Une cellule d'oeil lira donc le chapitre "Comment être une bonne cellule d'oeil", mais ne lira pas le chapitre "Quels sont mes droits et mes devoirs en tant que cellule du cuir chevelu".


"Ok, les cellules lisent un gros bouquin appelé ADN donc... Mais elles le lisent dans quelle langue ?". Le langage génétique ne repose pas sur 26 lettres comme l'alphabet français ou anglais, mais juste de 4 lettres, chaque lettre désignant en fait une petite molécule appelée base de l'ADN : A pour adénine, T pour thymine, G pour guanine et C pour cytosine. (Petite précision: on a dit précédemment que l'ADN était une double hélice : aussi, en face de chaque base, se trouve une autre base qui lui fait face. Cette correspondance base-base n'est pas hasardeuse : en face d'un A on trouvera toujours un T et en face d'un C toujours un G !). C'est la juxtaposition de ces lettres qui forme la molécule d'ADN. A certains endroits, cette juxtaposition de lettres formes un "mot génétique" qui a du sens pour la cellule, c'est-à-dire qu'en lisant cette partie là de l'ADN, la cellule sera capable de produire une protéine associée, comme si elle lisait le mode d'emploi de la construction d'un édifice de LEGO par exemple. Ces parties particulières de l'ADN sont appelées les gènes. Il y en a plusieurs répartis le long de l'ADN, séparés par de longues suites de A, T, G et C qui elles en revanche n'ont pas de signification particulière pour la cellule.

JeanneLePeillet©

Que signifie "encoder dans de l'ADN" ?


L'ADN a donc un langage quaternaire, de 4 lettres. Les données numériques (par exemple, cet article de blog que vous êtes en train de lire) sont lues par l'ordinateur dans un langage binaire, constitué uniquement de 0 et de 1. Encoder des données numériques dans l'ADN, c'est donc trouver une correspondance entre le langage numérique et le langage génétique. Plusieurs correspondances ont été imaginées, par exemple :


- Exemple de correspondance compacte : A