Table des matières:
- Un champ qui avance rapidement
- Redondance intégrée et nécessité de corriger les erreurs
- Encaissement - n'importe quel jour maintenant
Vidéo: Lou | "Besoin d'air" - Vidéo officielle (Novembre 2024)
Les ingénieurs ont réussi à augmenter la capacité de stockage dans des espaces plus restreints depuis des décennies, mais cela ne peut pas durer éternellement. Le prochain grand bond en matière de stockage de données pourrait prendre la forme de l’ADN contenu dans toutes les matières organiques: des scientifiques travaillant dans des laboratoires du pays expérimentent l’ADN synthétique en tant que support de stockage.
"Si vous regardez où vont l'électronique, la technologie du silicium, une grande partie de la technologie de base que nous utilisons aujourd'hui pour construire des ordinateurs, nous approchons de la limite dans presque toutes", a déclaré Luis Henrique Ceze, professeur agrégé en informatique. et ingénierie à l'Université de Washington. "L'ADN est très dense, très durable et sa maintenance nécessite très peu d'énergie. Il est donc extrêmement avantageux d'utiliser l'ADN pour le stockage de données."
Ceze collabore avec Karin Strauss, chercheuse en architecture informatique chez Microsoft Research, dans le cadre d’une collaboration entre les deux institutions, un projet qui relie l’informatique à la biologie. L'université fournit les biologistes moléculaires à une équipe d'une vingtaine de personnes et les informaticiens à Microsoft.
Pour comprendre comment l’ADN pourrait être utilisé pour le stockage, considérez que toutes les données informatiques sont binaires ou en base 2. L'ADN est la base 4, composée d'adénine, de cytosine, de guanine et de thymine (abrégé en A, C, G et T). La première étape consiste à convertir les informations de base 2 en base 4, de sorte que A correspond à 00, C à 01, G à 10 et T à 11 (cela simplifie un peu mais fait passer à l’idée).
Les scientifiques utilisent ensuite une machine appelée synthétiseur d’ADN pour combiner les quatre produits chimiques dans le bon ordre. Le résultat stocke les informations plusieurs fois sous forme de grappe ressemblant à du sel plus petite que la pointe d'un crayon. La lecture de ces informations nécessite un séquenceur d’ADN.
Bien que cela puisse sembler fragile, comme si quelque chose pouvait exploser lorsqu'une porte s'ouvre soudainement, l'ADN est le support de stockage de données le plus puissant que nous ayons vu. Les scientifiques ont lu avec succès un ADN vieux de plusieurs centaines de milliers d'années.
Le séquençage de l'ADN implique de retirer une infime partie du matériel stocké et le processus épuise cet échantillon. Par conséquent, un enregistrement d'ADN peut être lu un nombre fini de fois. Ce n'est pas un problème, cependant, car le matériel stocké contient beaucoup de données redondantes; il peut être échantillonné à plusieurs reprises. De plus, les supports de stockage actuels ont également un nombre limité de cycles d'écriture et de lecture avant qu'ils n'échouent. Ce n'est donc pas nouveau.
Comme le souligne Ceze, l'ADN ne sera jamais obsolète. Alors que beaucoup d’entre nous ont des disquettes au dos d’un tiroir que nous ne pouvons plus lire, ce ne sera pas le destin de l’ADN. "Nous allons toujours nous soucier de l'ADN pour les sciences de la vie et pour des raisons de santé, vous aurez donc toujours un moyen de lire les informations stockées dans l'ADN", a déclaré Ceze.
En juillet 2016, Microsoft et l'Université de Washington ont codé avec succès 200 Mo de données sous forme d'ADN, dépassant ainsi le record précédent de 22 Mo. Selon Strauss, en utilisant l'ADN, il sera possible de stocker 1 exaoctet de données, soit 1 milliard de Go, dans un cube de 1 pouce.
"Nous avons fait une estimation de la quantité de données que vous pourriez mettre dans un volume particulier", déclare Strauss. "Nous avons essayé d'estimer le volume si nous décidions aujourd'hui d'archiver l'intégralité de l'Internet accessible, c'est-à-dire tout ce qui ne se trouve pas derrière un mot de passe ou un mur électronique, et nous avons imaginé la taille d'une grande boîte à chaussures."
Cela peut sembler lointain, mais Ceze pense que les systèmes commerciaux de stockage d’ADN seront commercialisés dans une décennie. Ils ne fonctionneront pas exactement comme le stockage sur microprocesseur, dans la mesure où l'ADN requiert un environnement chimique humide pour la création, mais ils fourniront une capacité énorme et un accès aléatoire à la même vitesse que celle offerte par les systèmes de bande d'entreprise.
Un champ qui avance rapidement
L’ADN existe depuis des milliards d’années, mais les démonstrations de l’ADN en tant que technologie de stockage utilisable ont commencé en 1986 lorsque le chercheur du MIT, Joe Davis, a codé une image binaire simple en 28 paires de bases d’ADN.
George Church est un autre pionnier dans ce domaine. Il est professeur de génétique à la Harvard Medical School depuis 1977 et dirige son propre laboratoire depuis 1986. Church est intéressée à réduire le coût de la lecture et de l'écriture d'ADN depuis les années 1970. Il est persuadé qu'un jour ils se réuniraient pour créer un stockage de données pratique. Vers 2000, il s’intéresse à la recherche sur l’ADN et effectue des tests critiques de séquençage et de synthèse en 2003 et 2004. En 2012, il est capable de réunir les deux domaines et de créer un système de codage des données. Il a écrit ce travail dans un article influent de 2012 dans Science .
"Avant 2003 et 2004, le séquençage et la synthèse étaient effectués essentiellement dans des capillaires, ou de petits tubes, dans lesquels vous disposiez d'un tube par séquence", explique Church. "C’était plutôt manuel et non évolutif. L’enseignement que nous avions appris de l’industrie des semi-conducteurs de microfabrication était de trouver un moyen de les placer essentiellement dans un plan bidimensionnel, puis de réduire la taille de la fonctionnalité. les méthodes basées sur les colonnes étaient compatibles avec cela, et en 2003, nous avons montré comment répartir les séquences dans un plan bidimensionnel, puis les imager avec une imagerie fluorescente, qui constitue désormais le mode de séquençage dominant. vous pouvez fabriquer de l'ADN dans un avion, puis le glisser et le transformer en un objet encore plus compact; cet avion n'était donc qu'un endroit temporaire pour les synthétiser, puis vous pouvez le compacter en un objet tridimensionnel qui était des millions de fois plus compact que le stockage de données normal.
"C'étaient des exercices de validation de principe en 2003 et 2004. En 2012, nous avions, avec d'autres, perfectionné les méthodes de lecture et d'écriture de l'ADN. Je les ai rassemblées dans une expérience au cours de laquelle j'ai codé un livre que je venais d'écrire, y compris des images, montrant que tout ce qui est numérique peut être encodé avec de l'ADN."
Bien que le coût soit un obstacle majeur au stockage de l’ADN, Church note que le prix a fortement chuté au cours de la courte période de recherche. Le coût de la lecture de l'ADN s'est amélioré d'environ 3 millions de fois, tandis que le coût de l'écriture s'est amélioré d'un milliard de fois. Il peut voir les deux s'améliorer encore d'un million de fois en moins de temps. Il souligne également que le coût de la copie de matériel ADN est presque gratuit, tout comme le coût du stockage à long terme. Pour le stockage d'archives, le coût de la lecture des données ne constitue pas un obstacle majeur, car une grande partie des documents archivés n'est jamais lue et certains éléments sont lus de manière sélective. Regardez les coûts de l'ensemble du système, conseille-t-il. Les méthodes de stockage traditionnelles évoluent à la vitesse de la loi de Moore et se stabiliseront bientôt. Mais la technologie de stockage d'ADN évolue plus rapidement que la loi de Moore et ne montre aucun signe de plateau.
Les archives et le stockage en nuage sont les domaines où Church voit le stockage de données ADN adopté en premier Des entreprises telles que IBM, Microsoft et Technicolor ont leurs propres équipes de recherche et développement qui étudient le secteur, a-t-il noté. Il a collaboré avec Technicolor en 2015 pour stocker A Trip to the Moon , un film classique de 1902 que l'on croyait perdu, à l'ADN. Maintenant, Technicolor a de nombreuses copies d’ADN qui, combinées, ne sont pas plus grosses qu’un grain de poussière.
Church a un laboratoire de 93 personnes travaillant sur le stockage de l'ADN et se concentrant actuellement sur deux objectifs. La première consiste à améliorer radicalement la vitesse par cycle. Les informations sont stockées dans des centaines de couches, chacune aussi épaisse qu'une molécule. Chaque ajout prend actuellement trois minutes, mais Church pense que cela peut être ramené à moins d’une milliseconde. C'est 200 000 fois plus rapide, note-t-il, et signifie un passage de la chimie organique à la biochimie. Il souhaite également changer la façon dont les instruments utilisés pour la lecture et l'écriture sont fabriqués pour les rendre beaucoup plus petits. Actuellement, ils sont de la taille de grands réfrigérateurs. Il veut que cela soit réduit.
Redondance intégrée et nécessité de corriger les erreurs
La chercheuse Olgica Milenkovic de l'Université de l'Illinois, Urbana-Champaign, a influencé l'article de Science dans l' édition de 2012 de Science . L'article mentionnait la nécessité de coder, ce qui a immédiatement suscité son intérêt. Le codage dans la recherche sur le stockage est une technique permettant d’ajouter de la redondance aux données, une redondance qui peut ensuite être utilisée pour corriger les erreurs survenues au cours du processus de lecture et d’écriture. Pour un exemple de pourquoi c'est important, voyez les deux images du Citizen Kane ici. Les deux ont été encodés dans l'ADN par l'équipe de Milenkovic, puis lus. Devinez lequel a utilisé la redondance.
Vous avez raison: l'image de gauche était codée avec redondance et l'image de droite ne l'était pas.
Un moyen simple d’ajouter de la redondance consiste à répéter chaque caractère un nombre de fois défini. Plutôt que d'écrire un 0, écrivez-le quatre fois. C'est l'approche de la force brute - simple mais terriblement inefficace. Le travail de Milenkovic consiste à obtenir la même correction d'erreur de manière plus sophistiquée. Il fait appel à des techniques appelées contrôles de parité ou contrôles de congruence linéaires pour fournir des moyens de vérification des données.
«L’ensemble du domaine consiste essentiellement à vous aider à corriger les erreurs éventuelles ou, mieux encore, à éviter les erreurs susceptibles de survenir», a déclaré Milenkovic. "Nous introduisons la redondance contrôlée pour éliminer les erreurs, et cette redondance contrôlée ne consiste pas en une simple répétition, car elle est très inefficace."
C'est ce qui a amené Milenkovic sur le terrain, mais ses recherches portent maintenant sur la réduction du coût énorme de la synthèse de l'ADN.
"Mon élève, H. Tabatabae Yazdi, qui était très actif sur ce sujet, et j'ai vraiment essayé de trouver un moyen intelligent d'éviter la synthèse d'ADN. La synthèse d'ADN est absolument un goulot d'étranglement pour cette technologie en raison de son coût élevé ", Dit Milenkovic.
Bien que Milenkovic soit réticente à trop en révéler sur des recherches non publiées, sa solution implique des "approches mathématiques rusées" et concerne le timing, dans lequel la taille de l'intervalle entre les bits d'information est significative.
"Si vous renoncez à la formalité voulant que vous souhaitiez utiliser des codes ATGC pour vraiment coder des symboles binaires à un endroit donné, vous pouvez proposer des moyens de stockage des informations beaucoup plus intelligents et plus efficaces, car vous n'avez pas besoin de synthétiser des éléments de manière répétée encore une fois ", explique Milenkovic. "Vous pouvez les synthétiser une fois d'une certaine manière, puis réutiliser cet ADN synthétisé d'une manière combinatoire intelligente."
Grâce à son travail, Milenkovic espère réduire le coût de la synthèse de l’ADN d’au moins trois ordres de grandeur. Cela ne suffit toujours pas, note-t-elle, mais c'est un progrès. Cela contribue également à une ligne de recherche qu'elle trouve fascinante.
"Pour être honnête, c'est très excitant de jouer à Dieu et de coder vos propres informations dans l'ADN", a déclaré Milenkovic. "Cela donne à une personne un sentiment d'excitation de savoir que vous jouez avec une molécule choisie de la nature et que vous la faites faire ce que vous voulez pour stocker, encoder et transmettre des informations à l'avenir."
Encaissement - n'importe quel jour maintenant
Ce n'est pas toutes les recherches académiques poussiéreuses et sèches avec stockage d'ADN. Helixworks, une société basée en Irlande, tente déjà de gagner de l'argent. Il a un produit sur Amazon - en quelque sorte.
"Nous avons lancé sur Amazon afin que vous puissiez obtenir 512 Ko de données numériques encodées dans l'ADN", explique Nimesh Pinnamaneni, cofondateur de la société. "C'est quelque chose de très petit. Peut-être une image ou peut-être un poème, quelque chose comme ça."
C'est un achat inhabituel, mais ce pourrait être le gage d'amour parfait pour la personne qui a tout, surtout si cette personne est un scientifique:
"Je me souviens d'un client qui nous avait téléphoné. Il voulait offrir à sa femme - tous deux biotechnologues - il voulait offrir à sa femme pour son anniversaire de mariage. Il voulait mettre un message dans l'ADN et lui offrir un ADN", se souvient Pinnamaneni. "Elle devrait séquencer l'ADN pour lire le message. C'est une façon assez compliquée d'envoyer un message d'amour, mais c'est peut-être mignon pour les biotechnologistes, vous savez?"
Mais Helixworks a pris un peu d'avance sur son produit en publiant son produit sur Amazon en août 2016, avant d'être prêt à honorer ses commandes. Deux personnes ont acheté le DNADrive à 199 USD de la société, une capsule en or de 14 carats contenant un groupe d’ADN, avant que Helixworks ne soit contraint de retirer son produit de la cote. DNADrive est toujours sur Amazon, mais ce n’est pas achetable.
Cela ne signifie pas qu'Helixworks est terminé, mais trop impatient. C'est venu trop loin pour arrêter maintenant. La société a débuté à l'Université de Borås en Suède, où Pinnamaneni (photo ci-dessus, à gauche) et Sachin Chalapati (à droite), l'autre cofondateur de la société, obtenaient une maîtrise en biotechnologie. Ils ont collecté des fonds pour la recherche sur le stockage de l'ADN, ont poursuivi leurs travaux une fois de retour chez eux à Bangalore, en Inde, et ont mis au point une preuve de concept.
En cherchant des fonds supplémentaires, ils ont rejoint le programme d'accélération IndieBio de SOSV, une société de capital-risque en phase de démarrage établie à San Francisco, en Californie. Sélectionné par le programme, Helixworks a gagné 50 000 USD en argent et la possibilité de travailler dans un laboratoire situé dans le comté de Cork, où il se trouve depuis six mois. Le programme comprend un tutorat sur la présentation d'un produit, que Helixworks mettra en œuvre lors du festival South by Southwest de cette année, où elle participera à un événement de présentation.
Pinnamaneni affirme que l'avenir de son entreprise réside dans les imprimantes d'ADN compactes pour la maison et le bureau en cours de développement. Il souhaite rendre le stockage de l’ADN facile et abordable, à la portée de tous.
"Nous avons compris qu'il fallait quelque chose qui fonctionne comme une cartouche dans une imprimante", explique Pinnamaneni. "Vous ne disposez que de quatre couleurs, et ces quatre couleurs peuvent se combiner pour former toutes les couleurs possibles, n'est-ce pas? C'est ainsi que fonctionne votre imprimante à encre. Nous avons pensé qu'il fallait que ce système soit doté de ce type. peuvent être combinés pour former toute séquence d’ADN possible ".
Alors que d'autres laboratoires paient environ 30 000 dollars chaque fois qu'ils ont besoin de synthétiser leur ADN, opération qui prend des semaines, Pinnamaneni affirme que son invention peut réduire considérablement le coût et le temps. Helixworks travaille avec Opentrons, une société qui fabrique des équipements de laboratoire automatisés, pour créer l’imprimante. C’est ce que cela va faire chez SXSW.
«Ce que nous allons démontrer sur le sol de l’exposition, c’est l’écriture d’ADN sous vos yeux», déclare Pinnamaneni.
La société ne prendra pas encore de commande. Et c’est bien, car ce biotechnologue romantique attend toujours son cadeau d’anniversaire.