Новая система halSynteny облегчит работу генных инженеров
Группа специалистов создала программу, позволяющую идентифицировать и сопоставлять участки генома животных. Благодаря этой разработке станет возможным отслеживать близость одного вида животных к другим в общей структуре иерархии, а также анализировать изменения, произошедшие в представителях разных видов в процессе эволюции.
Миллионы самых разных видов животных обитают на планете Земля. Такие ключевые факторы, как внешний облик, образ жизни, пищевые привычки определяются преимущественно набором заложенных генов. При этом вариативность этих наборов существенно отличается от количества видов, всего специалисты насчитывают порядка 20 000 комбинаций различных генов. Таким образом, получается, что виды различаются между собой не только и не столько самими генами, сколько параметрами их расположения относительно друг друга. В науке есть специальный термин «синтетия», который обозначает определенную последовательность расположения отдельных элементов генома.
Один из разработчиков проекта инженер Ксения Крашенинникова приводит в пример гориллу и шимпанзе, которые, обладая идентичным набором генов, отличаются друг от друга именно из-за различной их последовательности.
Для того, чтобы найти, в чем именно заключается разница между структурами генома, специалистам требуется, в первую очередь, найти эти непохожие друг для друга участки. Вручную это сделать невозможно, так как приходится иметь дело со слишком большим объемом данных. Именно поэтому ученые пробуют создавать специальные программы, облегчающие и оптимизирующие процесс отбора.
Новая разработка, получившая название halSynteny, по заверению разработчиков, отличается более высокой скоростью обработки данных в сравнении с предшествующими системами. Кроме того, программа может работать сразу в двух форматах.
Повышению скорости способствует принципиально иной подход к поиску синтенных последовательностей. Обычно в методиках используется предварительная аннотация, в случае с halSynteny привлекают технологию выравнивания, при которой разные участки одного из генных наборов сопоставляются с другими. В результате выделяются схожие последовательности, и уже на их основании, выстраиваются выводы относительно различий.
Благодаря использованию языка программирования C++, программа обладает повышенной производительностью, поэтому все расчеты производятся в несколько раз быстрее, чем при остальных методиках.