Искусственная ДНК как носитель цифровой информации
8 февраля 2013 г.На протяжении своей истории человечество использовало немало самых разных физических носителей информации - от камня, глины, кости, древесины, папируса и пергамента до бумаги, пластмасс, магнитных и полупроводниковых материалов. Научно-технический прогресс налицо, однако принес он не только преимущества. Если речь идет о емкости носителей информации или скорости ее регистрации, то ясно, что никакие шумерские писари со своими глиняными табличками не смогли бы тягаться с современными жесткими дисками и флэш-картами. Но вот в том, что касается долговечности…
Цифровые данные хранятся либо вечно, либо пять лет
И сами носители цифровой информации, и программное обеспечение, и аппаратные средства выходят из строя или стареют - и морально, и физически, - с устрашающей быстротой. Скажем, памятники угаритской письменности, датируемые 2 тысячелетием до нашей эры и обнаруженные в 1929 году при раскопках холма Рас-Шамра на территории сегодняшней Сирии, прекрасно сохранились, а главное - ученые смогли их прочесть и расшифровать. Но едва ли можно ожидать, что такой же уровень сохранности информации способны обеспечить нынешние цифровые носители: ведь сегодня даже восковые валики Эдисона, не говоря уже про шеллаковые грампластинки, изготовленные на заре эпохи звукозаписи, воспроизвести куда легче, чем расшифровать информацию на иных цифровых носителях начала ХХI века. Недаром среди информатиков бытует шутка: цифровые данные хранятся либо вечно, либо пять лет - в зависимости от того, что наступит раньше.
Биологическая эволюция не ошибается
Между тем существует более древний, более компактный и, очевидно, более надежный, прочный и долговечный носитель информации - нуклеиновые кислоты. Не зря же зарождение и развитие жизни на Земле, вся биологическая эволюция связаны именно с этим носителем. Поэтому вполне понятно, что ученые пытаются теперь использовать молекулы ДНК для записи и хранения не природной, а рукотворной информации. Последние достижения в этой сфере группа европейских и американских исследователей представила в авторитетном британском научном журнале Nature.
Благодаря современным высокопроизводительным методам секвенирования прочитать закодированную в ДНК информацию сегодня особого труда не составляет. Гораздо труднее такую информацию записать, поскольку ученые умеют пока синтезировать лишь относительно короткие цепочки из четырех азотистых оснований, составляющих молекулу ДНК - аденина (А), гуанина (G), тимина (Т) и цитозина (С). Кроме того, при этом синтезе очень высок процент ошибок, особенно связанных с многократными повторами одного и того же основания.
Речь Мартина Лютера Кинга в формате mp3 и прочие файлы
И все же Нику Голдмену (Nick Goldman, на титульной фотографии) и его коллегам из Европейского института биоинформатики при Европейской лаборатории молекулярной биологии в Хинкстоне близ Кембриджа удалось разработать методику высокоточного перевода двоичного компьютерного кода, состоящего из нулей и единиц, на язык ДНК с его алфавитом из четырех букв. Далее британские ученые связались со специалистами американской компании Agilent Technologies со штаб-квартирой в Санта-Кларе, штат Калифорния, и отправили им через интернет несколько различных файлов и инструкцию, как на их основе синтезировать молекулы ДНК.
Собственно, файлов было четыре: аудиозапись знаменитой речи Мартина Лютера Кинга "У меня есть мечта" в формате mp3, фотография здания Европейского института биоинформатики в формате jpg, сборник сонетов Шекспира в формате txt и, наконец, в формате pdf текст известной публикации Джеймса Уотсона и Фрэнсиса Крика в журнале Nature о том, что молекула ДНК имеет структуру двойной спирали. "Мы загрузили из интернета эти файлы и на их основе синтезировали несколько сотен тысяч фрагментов ДНК. Выглядело все это как щепотка пыли", - рассказывает Эмили Лепруст (Emily LeProust), глава отдела прикладных и биохимических исследований калифорнийской фирмы.
Публикация научной книги в форме биомолекул
А затем эта щепотка пыли отправилась обратно в Хинкстон, где тамошним ученым удалось биомолекулы секвенировать и безошибочно декодировать заложенную в них информацию. "В своей публикации мы показываем, что молекулы ДНК могут применяться в качестве надежного носителя цифровой информации, - говорит Ник Голдмен. - Единственное, что такую возможность пока ограничивает, - это высокая стоимость синтеза ДНК".
Попытки перевода текстовых файлов в код ДНК предпринимались и раньше: не далее как в августе прошлого года один из видных американских исследователей - Джордж Чак (George Chuck), биолог Гарвардской высшей медицинской школы в Бостоне, - опубликовал свою книгу "ReGenesis" в форме молекул ДНК. Но новый метод, предложенный теперь британскими учеными, выгодно отличается от метода их американского коллеги чрезвычайно высокой точностью. "Мы предусмотрели специальную программу корректировки ошибок, - говорит Ник Голдмен. - Типичные ошибки, возникающие при перекодировке, тотчас распознаются и исправляются".
Главное - найти место, где холодно, сухо и темно
ДНК как носитель информации имеет ряд важных преимуществ. Прежде всего, это компактность. Суммарная масса молекул, содержащих весь текст довольно объемистой книги Джорджа Чака, составила менее одного пикограмма, то есть менее одной триллионной доли грамма. Если же тексты всех книг, хранящихся в библиотеке Конгресса, закодировать в виде молекул ДНК, их масса не превысит и нескольких миллиграммов. Да что там книги, все существующие в мире кино- и телефильмы, причем оцифрованные в высоком разрешении, легко поместятся в виде молекул ДНК в одной чайной чашке.
"Еще одно важное преимущество ДНК - долговечность, - говорит Ник Голдмен. - Причем для обеспечения сохранности информации никакого электропитания не требуется. Нужно только поместить ДНК в такое место, где холодно, сухо и темно. Ведь смогли же мы реконструировать генетическую информацию из останков мамонта, пролежавших несколько десятков тысяч лет в вечной мерзлоте".
Вот и получается, что препятствуют широкому применению ДНК в качестве носителя информации, действительно, только цены. Сегодня они и впрямь очень высоки: одна лишь перекодировка речи Мартина Лютера Кинга обошлась в пятизначную сумму в долларах. Но опыт показывает, что цены в области генной инженерии и синтетической биологии имеют склонность стремительно падать...