Новости    Библиотека    Энциклопедия    Биографии    Карта сайта    Ссылки    О проекте




18.09.2012

Математики придумали архиватор для ДНК

Математики из Массачусетского технологического института предложили новый способ хранения и обработки данных о последовательностях ДНК. Он должен помочь справиться с наплывом данных от все большего числа прочитанных геномов. Работа с описанием нового алгоритма опубликована в журнале Nature Biotechnology, а ее краткое содержание можно прочитать на сайте института.

Скорость роста вычислительных мощностей компьютеров (зеленый) и новых последовательностей ДНК. Изображение из статьи Loh et al
Скорость роста вычислительных мощностей компьютеров (зеленый) и новых последовательностей ДНК. Изображение из статьи Loh et al

Алгоритм основан на том, что последовательности ДНК между всеми организмами в той или иной степени схожи, а наибольший интерес для ученых представляют различия. Поэтому, по словам авторов, хранить и обрабатывать следует не сами последовательности, а их отличия друг от друга.

Если, например, поиск определенной последовательности в геноме некоторого организма уже проводился, то поиск той же последовательности в новом геноме следует проводить не по всей последовательности, а только в тех местах, где новый геном отличается от старого. Это позволяет существенно снизить время поиска последовательностей и нагрузку на вычислительные центры. Разница в длительности вычислений между старым и новым алгоритмом зависит от количества уже прочитанных геномов - чем их больше, тем труднее искать по-старому и тем очевиднее преимущества нового алгоритма.

Упор на поиск различий в близких геномах соответствует современному развитию биологии. С одной стороны, в последнее десятилетие резко уменьшается стоимость секвенирования. Из-за этого скорость роста данных о последовательностях ДНК уже превышает экспоненциальную. С другой стороны, по мере увеличения количества прочитанных геномов доля совершенно уникальных последовательностей уменьшается. Прочитанные геномы все больше походят друг на друга. Например, в ближайшее время биоинформатики ожидают массового наплыва данных от проектов по секвенированию ДНК тысяч отдельно взятых людей, позвоночных, насекомых.


Источники:

  1. Lenta.Ru



ИНТЕРЕСНО:

Найдено самое длинное простое число Мерсенна, состоящее из 22 миллионов цифр

Как математик помог биологам совершить важное открытие

Математические модели помогут хирургам

Почему в математике чаще преуспевают юноши

Физики-практики откровенно не любят математику
Пользовательского поиска

© Злыгостев Алексей Сергеевич, статьи, подборка материалов, оформление, разработка ПО 2001-2017
При копировании материалов проекта обязательно ставить ссылку на страницу источник:
http://mathemlib.ru/ 'MathemLib.ru: Математическая библиотека'
Рейтинг@Mail.ru