Ученые хранят фильмы, компьютерные вирусы и операционные системы внутри молекул ДНК

Ученые из Нью-Йорского Геном-Центра (New York Genome Center, NYGC) и Института Информатики при Колумбийском Университете (Data Science Institute at Columbia University) опубликовали новое исследование, подробно описывающее новую технологию хранения данных, которая использует молекулы ДНК для хранения цифровой информации.

Дезоксирибонуклеиновая кислота, известная под аббревиатурой ДНК это макромолекула вокруг которой вращается вся жизнь. В природе ДНК работает путем хранения информации о разных формах жизни и ее характеристиках с использованием четырех нуклеотидов: Аденин (А), Гуанин (G), Цитозин (С) и Тимин (Т).

В сущности, ДНК работает также как и жесткий диск Вашего компьютера, только в отличии от двоичной системы (1 и 0), она использует четверичную систему для хранения и воспроизведения информации о генах живого организма.

Предыдущие исследования показали, что ДНК можно создать практически с нуля используя метод секвенирования ДНК при помощи которого ученные собирают последовательность геномной ДНК, которая им необходима.

Также ученые показали, что ДНК можно использовать для хранения бинарной информации. Работа ученных во время своих исследований, заключалась в том, что бы уточнить методику преобразования двоичных цифровых данных в молекулярные последовательности и оптимизировать емкость хранения ДНК.

В ходе эксперимента ученые показали, что могут успешно хранить шесть файлов внутри молекул ДНК:

  1. компьютерную операционную систему KolibriOS,
  2. французский фильм 1896 года «Прибытие поезда на вокзал Ла-Сьота»,
  3. код 50-долларовой подарочной карты Amazon,
  4. компьютерный вирус,
  5. изображения спластинок «Пионера»
  6. исследование Клода Шеннона в области теории информации 1948 года.

Согласно этому исследованию, опубликованному в журнале Science, ученные взяли указанные 6 файлов и сжали их в архив. Затем используя алгоритм, названный «фонтанный код», что бы случайным образом упаковать строки двоичных данных в «капли», после чего сопоставили двоичный код каждой капли с четырьмя нуклеотидами ДНК. Далее был использован алгоритм коррекции для удаления буквенных комбинаций (A, G, C, T), а также добавления штрих-кода каждой капле, который впоследствии служил для восстановления двоичного кода в правильном порядке. Таким образом, исследователи создали свои «собственные виртуальные молекулы» для хранения данных. В завершении эксперимента шесть архивных файлов были преобразованы в 7200 нитей ДНК, каждая из которых состояла из 200 пар оснований ДНК. Эта информация хранилась в цифровом формате. После чего ученные из Лаборатории Секвенирования ДНК (Сан-Франциско) получили реальные биологические молекулы ДНК.

Исследовательская группа, используя технологию секвенирования и специальное программное обеспечение, написанное на Python, смогли успешно восстановить файлы на компьютере.

В качестве примера ученные опубликовали видео, на котором ученные вначале запускают операционную систему. А затем играют в «Сапера» (Minesweeper).

Данные полученные из молекул ДНК доступны для скачивания. При этом ученые бросили вызов другим коллегам, удалив информацию про расшифровку кода для подарочной карты Амазон. Таким образом, любой ученный который сможет повторить процесс сможет получить 50 долларов.

В настоящее время такой способ хранения информации делает только первые шаги, но мы уже можем говорить о его потенциальных возможностях. 1 грамм ДНК может хранить 215 петабайт данных.

При этом на сегодняшний день стоимость хранения и передачи данных является достаточно дорогостоящей. В частности для синтеза ДНК емкостью 2 МВ ученные затратили 2 недели и 7000 долларов, а затем еще 2000 долларов. Что бы ее расшифровать.

Не смотря на это ученные достаточно оптимистичны. Один грамм ДНК (размером с песчинку) может хранить данные на уровне среднего дата-центра.

Другим преимуществом метода, является срок хранения данных, в то время как срок службы современных носителей исчисляется несколькими десятилетиями, ДНК в замороженном состоянии способно хранить данные сотни тысяч лет.

Поскольку ученые смогли добиться 89% емкости ДНК, дальнейшие работы будут направлены в первую очередь на снижение стоимости записи и считывания данных.


Комментарии:

No Comments

Post a Comment