Связанные понятия
De novo сборка транскриптома – метод сборки последовательностей транскриптома, который осуществляется без картирования на референсный геном. Из коротких фрагментов (ридов или прочтений), полученных при секвенировании, воссоздаются отдельные последовательности РНК или транскрипты.
Секвенирование спаренных концов — один из методов секвенирования ДНК нового поколения, основанный на получении и секвенировании библиотеки спаренных концевых фрагментов (англ. paired-end tags, PET), в которой короткие 5’- и 3’- концевые участки фрагментов ДНК/кДНК соединены друг с другом.
Сборка генома — процесс объединения большого количества коротких фрагментов ДНК (ридов) в одну или несколько длинных последовательностей (контигов и скаффолдов) в целях восстановления последовательностей ДНК хромосом, из которых возникли эти фрагменты в процессе секвенирования.
Метод дробовика (англ. Shotgun sequencing) — метод, используемый для секвенирования длинных участков ДНК. Суть метода состоит в получении случайной массированной выборки клонированных фрагментов ДНК данного организма, на основе которых может быть восстановлена исходная последовательность ДНК.
Секвенирование нового поколения (англ. next generation sequencing, NGS) — техника определения нуклеотидной последовательности ДНК и РНК для получения формального описания её первичной структуры. Технология методов секвенирования нового поколения (СНП) позволяет «прочитать» единовременно сразу несколько участков генома, что является главным отличием от более ранних методов секвенирования. СНП осуществляется с помощью повторяющихся циклов удлинения цепи, индуцированного полимеразой, или многократного...
Ионное полупроводниковое секвенирование (англ. Ion Semiconductor Sequencing) является методом определения последовательности ДНК, основанным на обнаружении ионов водорода, которые выделяются во время полимеризации ДНК. Это метод «секвенирования при синтезе», в ходе которого комплементарная цепь строится на основе последовательности матричной цепи.
Нанотехнологии на основе ДНК (англ. DNA nanotechnology) — разработка и производство искусственных структур из нуклеиновых кислот для технологического использования. В этой научной области нуклеиновые кислоты используются не как носители генетической информации в живых клетках, а в качестве материала для нужд небиологической инженерии наноматериалов.
Транскрипто́мные техноло́гии (англ. transcriptomics technologies) — методы, разработанные для изучения транскриптома (то есть совокупности всех РНК-транскриптов) организма. В состав транскриптома входят все транскрипты, которые присутствовали в клетке на момент выделения РНК. Исследуя транскриптом, можно установить, какие клеточные процессы были активны в тот или иной момент времени.
Предсказание генов — это определение кодирующих и регулирующих последовательностей ДНК в геноме: белковых генов и генов функциональной РНК, промоторов, энхансеров и прочее.
Нанопоровое секвенирование — семейство высокоэффективных методов определения последовательности молекул ДНК или РНК с использованием белковых или твердотельных пор диаметром в несколько нанометров.
Кэп-анализ экспрессии генов (англ. CAGE, cap analysis gene expression) — это технология, используемая в молекулярной биологии, в результате которой получают профили экспрессии генов эукариот с одновременным определением специфических для клетки/ткани/условий транскрипционных стартовых сайтов (TSS), включая данные о задействованных промоторах. Метод заключается в получении и прочтении коротких (обычно длиной 27 нуклеотидов) участков последовательности 5’-конца кэпированных РНК эукариот. Далее проводится...
ФАНТОМ (Функциональная Аннотация геномов Млекопитающих) (англ. FANTOM — Functional Annotation of the Mammalian Genome) — международный исследовательский консорциум, основанный доктором Хаяшизаки и его коллегами в 2000 году с целью функционального аннотирования полноразмерных кДНК, которые были собраны в ходе проекта The Mouse Encyclopedia в научном центре RIKEN. С тех пор ФАНТОМ стал самостоятельным и развитым проектом, который затрагивает разные сферы анализа траскриптомов. Объект проекта изменяется...
Метод Сэнгера — метод секвенирования (определения последовательности нуклеотидов) ДНК, также известен как метод обрыва цепи. Впервые этот метод секвенирования был предложен Фредериком Сэнгером в 1977 году, за что он был удостоен Нобелевской премии по химии в 1980 году. Данный метод был наиболее распространенным на протяжении 40 лет.
Выравнивание последовательностей — биоинформатический метод, основанный на размещении двух или более последовательностей мономеров ДНК, РНК или белков друг под другом таким образом, чтобы легко увидеть сходные участки в этих последовательностях. Сходство первичных структур двух молекул может отражать их функциональные, структурные или эволюционные взаимосвязи. Выровненные последовательности оснований нуклеотидов или аминокислот обычно представляются в виде строк матрицы. Добавляются разрывы между...
Визуализа́ция да́нных секвени́рования РНК — способ визуального представления данных, полученных с помощью РНК-секвенирования (RNA-seq) в наглядной форме, с помощью которого можно увидеть картирование полученных чтений на геном и анализировать уровень экспрессии гена. Существует множество программ, позволяющих осуществить визуализацию.
Секвенирование биополимеров (белков и нуклеиновых кислот — ДНК и РНК) — определение их аминокислотной или нуклеотидной последовательности (от лат. sequentum — последовательность). В результате секвенирования получают формальное описание первичной структуры линейной макромолекулы в виде последовательности мономеров в текстовом виде. Размеры секвенируемых участков ДНК обычно не превышают 100 пар нуклеотидов (next-generation sequencing) и 1000 пар нуклеотидов при секвенировании по Сенгеру. В результате...
Простра́нственное выра́внивание — способ установления гомологии между двумя или более полимерными структурами на основании их трёхмерной структуры. Этот процесс обычно применяется к третичной структуре белков, но может также использоваться и для больших молекул РНК. В противоположность простому наложению структур, когда известно по крайней мере несколько эквивалентных аминокислотных остатков, пространственное выравнивание не требует никаких предварительных данных, кроме координат атомов.
Сплайсосо́ма — структура, состоящая из молекул РНК и белков и осуществляющая удаление некодирующих последовательностей (интронов) из предшественников мРНК. Этот процесс называется сплайсингом (от англ. splicing — сращивание).
Транспортная РНК, тРНК — рибонуклеиновая кислота, функцией которой является транспортировка аминокислот к месту синтеза белка. Имеет типичную длину от 73 до 93 нуклеотидов и размеры около 5 нм. тРНК также принимают непосредственное участие в наращивании полипептидной цепи, присоединяясь — будучи в комплексе с аминокислотой — к кодону мРНК и обеспечивая необходимую для образования новой пептидной связи конформацию комплекса.
Пиросеквени́рование — это метод секвенирования ДНК (определение последовательности нуклеотидов в молекуле ДНК), основанный на принципе «секвенирование путём синтеза». При включении нуклеотида происходит детекция высвобождающихся пирофосфатов. Технология была разработана Полом Ниреном (швед. Pål Nyrén) и его студентом Мустафой Ронаги англ. Mostafa Ronaghi) в Королевском технологическом институте (Стокгольм) в 1996 году.
Открытая рамка считывания (англ. Open Reading Frame, ORF) — последовательность нуклеотидов в составе ДНК или РНК, потенциально способная кодировать белок. Основным признаком наличия ORF служит отсутствие стоп-кодонов (в случае РНК — обычно UAA, UGA и UAG) на достаточно длинном участке последовательности после стартового кодона (в подавляющем большинстве случаев — AUG). Поскольку в некоторых случаях стартовый и терминирующие кодоны отличаются от канонических, а также ввиду возможности супрессии (подавления...
Предсказа́ние втори́чной структу́ры РНК — метод определения вторичной структуры нуклеиновой кислоты по последовательности её нуклеотидов. Вторичную структуру можно предсказывать для единичной последовательности или анализировать множественное выравнивание семейства родственных РНК.
Мно́жественное выра́внивание после́довательностей (англ. multiple sequence alignment, MSA) — выравнивание трёх и более биологических последовательностей, обычно белков, ДНК или РНК. В большинстве случаев предполагается, что входной набор последовательностей имеет эволюционную связь. Используя множественное выравнивание, можно оценить эволюционное происхождение последовательностей, проведя филогенетический анализ.
Предсказа́ние фу́нкции белка ́ — определение биологической роли белка и значения в контексте клетки. Предсказание функций проводится для плохо изученных белков или для гипотетических белков, предсказанных на основе данных геномных последовательностей. Источником информации для предсказания могут служить гомология нуклеотидных последовательностей, профили экспрессии генов, доменная структура белков, интеллектуальный анализ текстов публикаций, филогенетические и фенотипические профили, белок-белковые...
Гено́мная библиоте́ка представляет собой набор ДНК всего генома одного организма. Эта ДНК хранится в популяции идентичных векторов, каждый из которых содержит различные вставки ДНК.
Виртуальная полимеразная цепная реакция (ПЦР in silico, цифровая ПЦР, электронная ПЦР, е-ПЦР) — математический метод компьютерного анализа теоретической полимеразной цепной реакции, использующий данные о нуклеотидных последовательностях праймеров (или ДНК-зондов) для предсказания потенциальной амплификации фрагментов исследуемого генома, хромосомы, или любого другого участка ДНК.
Укладка Россманна — структурный мотив в третичной структуре белка, который связывает нуклеотиды (в частности, кофактор НАД). Структура, состоящая из двух идентичных частей, содержит шесть почти параллельных β-листов, соединённых между собой двумя парами α-спиралей, следующих в порядке β-α-β-α-β. Поскольку каждая укладка Россманна может связать один нуклеотид, связывающий домен для динуклеотидов, таких как НАД, состоит из двух параллельных укладок Россманна. Одиночная укладка Россманна может связать...
Промотор в генетике — последовательность нуклеотидов ДНК, узнаваемая РНК-полимеразой как стартовая площадка для начала транскрипции. Промотор играет одну из ключевых ролей в процессе инициации транскрипции.
Эволюционная дистанция — величина, характеризующая генетические различия между двумя организмами. Находится путём сравнения нуклеотидных последовательностей гомологичных генов. Мерой генетических различий считается процент несовпадений нуклеотидов в соответствующих позициях гена.
Ксенобиология (от др.-греч. ξενος — «чужой, гость», сокращенно КБ) — подраздел синтетической биологии, изучающий создание и управление биологическими устройствами и системами. КБ описывает форму биологии, которая (пока) не знакома науке и не встречается в природе. На практике это обозначает новые биологические и биохимические системы, которые отличаются от канонической системы ДНК-РНК-20 аминокислот (см. классическую центральную догму в молекулярной биологии). Например, вместо ДНК или РНК, КБ исследует...
Искусственный геном — направление в биологических исследованиях, связанное с генетической модификацией существующих организмов с целью создания организмов с новыми свойствами. В отличие от генной инженерии, искусственный геном состоит из генов, синтезированных химическим путём.
Модель замен (в биологии) - набор теоретических или эмпирических правил, описывающих процесс замещения нуклеотидов или аминокислот в ходе эволюции последовательности ДНК или белка.
Микросателли́ты , или короткие тандемные (простые) повторы, — варьирующие участки (локусы) в ядерной ДНК и ДНК органелл (митохондрий и пластид), состоящие из тандемно повторяющихся мономеров длиной меньше 9 пар оснований и образующие поля менее 1 тысячи пар оснований. Являются широко распространёнными молекулярными маркерами в генетических и геномных исследованиях.
Моти́в в молекулярной биологии — относительно короткая последовательность нуклеотидов или аминокислот, слабо меняющаяся в процессе эволюции и, по крайней мере предположительно, имеющая определённую биологическую функцию.
Космиды (Cosmides) — плазмиды, содержащие фрагмент ДНК фага лямбда включая cos-участок. Вместе с системами упаковки в фаговые частицы in vitro используются как векторные молекулы для клонирования генов и при построении геномных библиотек. Космиды были впервые сконструированы Коллинсом и Брюнингом в 1978 году. Их название происходит от сокращения двух терминов: cos-участок (сам термин в свою очередь происходит от англ. cohesive ends — липкие концы) и плазмида.
Протеоформы (англ. proteoforms) - белковые группы или белковые виды, возникающие за счет модификаций белка: аминокислотных замен (полиморфизм единичных аминокислот) (SAP), альтернативного сплайсинга (AS) и посттрансляционных модификаций (PTM), например фосфорилирования. Термин “белковый вид” или “протеоформа” относится к самой малой единице протеома, то есть полипептиду, имеющему уникальную последовательность и несущему уникальный набор посттрансляционных модификаций .
Белковая инженерия (англ. Protein engineering) — раздел биотехнологии, который занимается разработкой полезных или ценных белков. Это относительно новая дисциплина, которая направлена на исследование фолдинга белков и принципов модификации и создания белков.
Синтез искусственных генов — метод в области синтетической биологии, который используется для создания искусственных генов в лаборатории. В настоящее время основывается на синтезе ДНК в твёрдой фазе. Его отличие от молекулярного клонирования (рекомбинантная ДНК) и полимеразной цепной реакции (ПЦР) в том, что для метода нет необходимости использовать существовавшие ранее последовательности ДНК. Таким образом, можно сделать полностью синтетические двухцепочечные молекулы ДНК без каких-либо ограничений...
Ро-фактор действует на РНК-субстрате. Ключевая функция ро-фактора заключается в его геликазной активности, энергия для которой обеспечивается с помощью РНК-зависимого АТФ-гидролиза. Первичным сайтом связывания ро-фактора является расширенный одноцепочечный регион (~ 70 нуклеотидов, иногда 80-100 нуклеотидов), богатый цитозином и бедными в гуанином, называемый ро-утилизационным сайтом (rut), синтезируемым в РНК, выше фактической последовательности терминатора. Были выявлены несколько связывающих последовательностей...
Секвенирование экзома — технология секвенирования всех белок-кодирующих генов в геноме (то есть экзома). Она состоит из двух шагов: первый шаг — выбор участков ДНК, кодирующих белки. Эти участки известны как экзоны. У человека насчитывается около 180 000 экзонов, что составляет примерно 1 % от размера генома, или приблизительно 30 миллионов пар нуклеотидов. Второй шаг — секвенирование экзонов с использованием любой платформы высокопроизводительного секвенирования ДНК.
Репарация ошибочно спаренных нуклеотидов — система обнаружения и репарации вставок, пропусков и ошибочных спариваний нуклеотидов, возникающих в процессе репликации и рекомбинации ДНК, а также в результате некоторых типов повреждений ДНК.
Эндонуклеазы рестрикции , рестриктазы (от лат. restrictio — ограничение) — группа ферментов, относящихся к классу гидролаз, катализирующих реакцию гидролиза нуклеиновых кислот.
Однонуклеотидный полиморфизм (ОНП, англ. Single nucleotide polymorphism, SNP, произносится как снип) — отличия последовательности ДНК размером в один нуклеотид (A, T, G или C) в геноме (или в другой сравниваемой последовательности) представителей одного вида или между гомологичными участками гомологичных хромосом.
Логотип последовательностей (англ. Sequence logo) (в биоинформатике) — метод графического представления консервативности нуклеотидов (в цепи РНК или ДНК) или аминокислот (в белках). Логотип строится по набору выровненных последовательностей. Этот метод позволяет на одном графике отразить следующие характеристики анализируемого участка...
Сигна́л я́дерной локализа́ции (англ. nuclear localization signal, NLS) — участок молекулы белка, необходимый и достаточный для его локализации в ядре клетки. Сигнал ядерной локализации — это место узнавания белка транспортными факторами — кариоферинами (транспортинами), которые осуществляют его перенос в ядро.
Кинетопла́ст (англ. kinetoplast) — сеть молекул кольцевых ДНК (кДНК), находящаяся в гигантских митохондриях и содержащая множество копий митохондриального генома. Чаще всего кинетопласт имеет форму диска, хотя из этого правила известны и исключения. Кинетопласт имеется только у простейших класса кинетопластиды. Вариации структуры кинетопласта могут отражать филогенетические связи внутри кинетопластид. Кинетопласт обычно находится вблизи базального тельца жгутика, поэтому, вероятно, прочно связан...
Картирование коротких прочтений (англ. Short-Read Sequence Alignment, Short-Read Sequence Mapping) — биоинформатический метод анализа результатов секвенирования нового поколения, состоящий в определении позиций в референсном геноме или транскриптоме, откуда с наибольшей вероятностью могло быть получено каждое конкретное короткое прочтение. Обычно является первой стадией в обработке данных в случае, если известен геном исследуемого организма.