Связанные понятия
Предсказание генов — это определение кодирующих и регулирующих последовательностей ДНК в геноме: белковых генов и генов функциональной РНК, промоторов, энхансеров и прочее.
Интеракто́м (англ. Interactome) — термин молекулярной биологии, обозначающий полный набор взаимодействий между молекулами в отдельной клетке. Интерактом включает как непосредственные физические контакты между белками (белок-белковые взаимодействия), так и непрямые взаимодействия генов (например, эпистаз).
Предпочте́ние кодо́нов — понятие, описывающее явление неравных частот встречаемости синонимичных кодонов в кодирующих областях генома.
Транскрипто́мные техноло́гии (англ. transcriptomics technologies) — методы, разработанные для изучения транскриптома (то есть совокупности всех РНК-транскриптов) организма. В состав транскриптома входят все транскрипты, которые присутствовали в клетке на момент выделения РНК. Исследуя транскриптом, можно установить, какие клеточные процессы были активны в тот или иной момент времени.
Транскриптомика отдельных клеток (англ. single-cell transcriptomics) — область биологических исследований, в которой основным инструментом служат методы количественного анализа экспрессии генов в индивидуальных клетках. Эти методы сочетают в себе современные технологии секвенирования РНК отдельных клеток (scRNA-Seq от англ. single-cell RNA sequencing) и последние достижения микрогидродинамики. Они позволяют решить проблему «усреднённых» данных, получаемых при традиционном секвенировании массовых...
Выравнивание последовательностей — биоинформатический метод, основанный на размещении двух или более последовательностей мономеров ДНК, РНК или белков друг под другом таким образом, чтобы легко увидеть сходные участки в этих последовательностях. Сходство первичных структур двух молекул может отражать их функциональные, структурные или эволюционные взаимосвязи. Выровненные последовательности оснований нуклеотидов или аминокислот обычно представляются в виде строк матрицы. Добавляются разрывы между...
Наследуемость (в генетике) — доля фенотипической изменчивости в популяции, обусловленная генетической изменчивостью (в отношении к определённому качественному или количественному признаку). Различия между индивидуумами могут быть обусловлены генетическими факторами и/или окружающей средой. Наследуемость анализирует примерное отношение влияния генетических и негенетических факторов на общие отклонение фенотипа в популяции.
Модель замен (в биологии) - набор теоретических или эмпирических правил, описывающих процесс замещения нуклеотидов или аминокислот в ходе эволюции последовательности ДНК или белка.
Позиционная весовая матрица (ПВМ) — биоинформатический метод, который применяется для поиска мотивов в биологических последовательностях.
Картирование коротких прочтений (англ. Short-Read Sequence Alignment, Short-Read Sequence Mapping) — биоинформатический метод анализа результатов секвенирования нового поколения, состоящий в определении позиций в референсном геноме или транскриптоме, откуда с наибольшей вероятностью могло быть получено каждое конкретное короткое прочтение. Обычно является первой стадией в обработке данных в случае, если известен геном исследуемого организма.
Секвенирование спаренных концов — один из методов секвенирования ДНК нового поколения, основанный на получении и секвенировании библиотеки спаренных концевых фрагментов (англ. paired-end tags, PET), в которой короткие 5’- и 3’- концевые участки фрагментов ДНК/кДНК соединены друг с другом.
Полногено́мный по́иск ассоциа́ций (англ. genome-wide association studies, GWA study, GWAS) — направление биологических (как правило, биомедицинских) исследований, связанных с исследованием ассоциаций между геномными вариантами и фенотипическими признаками. Часто под полногеномным поиском ассоциаций подразумевают только поиск связей между однонуклеотидными полиморфизмами (англ. single-nucleotide polymorphism, SNP) и заболеваниями человека, однако термин употребим и к другим организмам. Основная цель...
Мно́жественное выра́внивание после́довательностей (англ. multiple sequence alignment, MSA) — выравнивание трёх и более биологических последовательностей, обычно белков, ДНК или РНК. В большинстве случаев предполагается, что входной набор последовательностей имеет эволюционную связь. Используя множественное выравнивание, можно оценить эволюционное происхождение последовательностей, проведя филогенетический анализ.
Предсказа́ние фу́нкции белка ́ — определение биологической роли белка и значения в контексте клетки. Предсказание функций проводится для плохо изученных белков или для гипотетических белков, предсказанных на основе данных геномных последовательностей. Источником информации для предсказания могут служить гомология нуклеотидных последовательностей, профили экспрессии генов, доменная структура белков, интеллектуальный анализ текстов публикаций, филогенетические и фенотипические профили, белок-белковые...
Двоичная, бинарная или дихотомическая классификация — это задача классификации элементов заданного множества в две группы (предсказание, какой из групп принадлежит каждый элемент множества) на основе правила классификации. Контекст, в котором требуется решение, имеет ли объект некоторое качественное свойство, некоторые специфичные характеристики или некоторую типичную двоичную классификацию, включает...
Молекулярный докинг (или молекулярная стыковка) — это метод молекулярного моделирования, который позволяет предсказать наиболее выгодную для образования устойчивого комплекса ориентацию и положение одной молекулы по отношению к другой.
Предсказа́ние втори́чной структу́ры РНК — метод определения вторичной структуры нуклеиновой кислоты по последовательности её нуклеотидов. Вторичную структуру можно предсказывать для единичной последовательности или анализировать множественное выравнивание семейства родственных РНК.
Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.
Эволюция вирусов — раздел эволюционной биологии и вирусологии, который посвящён именно эволюции вирусов. Множество вирусов, в частности РНК-вирусы, имеют маленький период размножения и повышенную частоту мутаций (одна точечная мутация или более на геном за один раунд репликации РНК вируса). Такая повышенная частота мутаций, в случае комбинации с естественным отбором, позволяет вирусам быстро адаптироваться к изменениям в окружающей среде.
Петлевая изотермическая амплификация (Loop mediated isothermal amplification, LAMP) — техника амплификации ДНК в одной пробирке. Метод LAMP позволяет проводить молекулярную диагностику существенно дешевле и быстрее, по сравнению с ПЦР. При диагностике РНК-вирусов метод LAMP позволяет проводить обратную транскрипцию и амплификацию в одной пробирке, без переноса жидкости.
Сборка генома — процесс объединения большого количества коротких фрагментов ДНК (ридов) в одну или несколько длинных последовательностей (контигов и скаффолдов) в целях восстановления последовательностей ДНК хромосом, из которых возникли эти фрагменты в процессе секвенирования.
Секвенирование экзома — технология секвенирования всех белок-кодирующих генов в геноме (то есть экзома). Она состоит из двух шагов: первый шаг — выбор участков ДНК, кодирующих белки. Эти участки известны как экзоны. У человека насчитывается около 180 000 экзонов, что составляет примерно 1 % от размера генома, или приблизительно 30 миллионов пар нуклеотидов. Второй шаг — секвенирование экзонов с использованием любой платформы высокопроизводительного секвенирования ДНК.
Локусы количественных признаков, сокращённо — ЛКП (от англ. Quantitative Trait Loci — QTLs), являются участками ДНК, либо содержащими гены, либо сцепленными с генами, которые отвечают за тот или иной количественный признак. Количественные признаки относятся к характеристикам, которые различаются по степени своего выражения и могут быть отнесены к полигенным эффектам, то есть являются продуктом двух или более генов.
De novo сборка транскриптома – метод сборки последовательностей транскриптома, который осуществляется без картирования на референсный геном. Из коротких фрагментов (ридов или прочтений), полученных при секвенировании, воссоздаются отдельные последовательности РНК или транскрипты.
Бисульфи́тное секвени́рование — общее название группы методов, направленных на изучение паттерна метилирования ДНК посредством обработки её бисульфитом.
Предсказа́ние структу́ры белка ́ (англ. protein structure prediction) — направление молекулярного моделирования, предсказание по аминокислотной последовательности трёхмерной структуры белка (вторичной, третичной или четвертичной). Существенно отличается от проблемы дизайна белка (англ. protein design). Предсказание структуры белка — одна из самых важных целей биоинформатики и теоретической химии. Оно применяется в медицине (например, в фармацевтике) и биотехнологии (например, при создании новых ферментов...
Пиросеквени́рование — это метод секвенирования ДНК (определение последовательности нуклеотидов в молекуле ДНК), основанный на принципе «секвенирование путём синтеза». При включении нуклеотида происходит детекция высвобождающихся пирофосфатов. Технология была разработана Полом Ниреном (швед. Pål Nyrén) и его студентом Мустафой Ронаги англ. Mostafa Ronaghi) в Королевском технологическом институте (Стокгольм) в 1996 году.
Секвенирование нового поколения (англ. next generation sequencing, NGS) — техника определения нуклеотидной последовательности ДНК и РНК для получения формального описания её первичной структуры. Технология методов секвенирования нового поколения (СНП) позволяет «прочитать» единовременно сразу несколько участков генома, что является главным отличием от более ранних методов секвенирования. СНП осуществляется с помощью повторяющихся циклов удлинения цепи, индуцированного полимеразой, или многократного...
Генная конверсия представляет собой процесс, посредством которого одна последовательность ДНК заменяется гомологичной последовательностью, так что последовательности становятся идентичными. Конверсия гена может быть либо аллельной, что означает, что один аллель гена заменяет другой аллель того же гена, либо неаллельной/эктопической, при которой одна паралогичная ДНК-последовательность преобразует другую.Паралогичными называют такие последовательности, которые присутствуют в одном и том же геноме...
Ме́тод максима́льного правдоподо́бия или метод наибольшего правдоподобия (ММП, ML, MLE — англ. maximum likelihood estimation) в математической статистике — это метод оценивания неизвестного параметра путём максимизации функции правдоподобия. Основан на предположении о том, что вся информация о статистической выборке содержится в функции правдоподобия.
Логотип последовательностей (англ. Sequence logo) (в биоинформатике) — метод графического представления консервативности нуклеотидов (в цепи РНК или ДНК) или аминокислот (в белках). Логотип строится по набору выровненных последовательностей. Этот метод позволяет на одном графике отразить следующие характеристики анализируемого участка...
Гено́мная библиоте́ка представляет собой набор ДНК всего генома одного организма. Эта ДНК хранится в популяции идентичных векторов, каждый из которых содержит различные вставки ДНК.
Амплификация (лат. amplificatio — усиление, увеличение), в молекулярной биологии — процесс образования дополнительных копий участков хромосомной ДНК, как правило, содержащих определённые гены либо сегменты структурного гетерохроматина. Амплификация может быть ответом клеток на селективное воздействие (например, при действии метотрексата). Амплификация — один из механизмов активации онкогенов в процессе развития опухоли, например, онкогена N-myc при развитии нейробластомы. Также амплификация — накопление...
Откры́тый хромати́н (англ. open chromatin) — небольшие участки хроматина, свободные от нуклеосом. Посадке нуклеосом, как правило, препятствуют связанные с хроматином белковые факторы, узнающие определённые последовательности ДНК. К числу таких белков относятся транскрипционные факторы, ДНК- или РНК-полимеразы. Открытый хроматин часто совпадает с цис-регуляторными последовательностями, а именно: промоторами, энхансерами, инсуляторами, сайленсерами, участками начала репликации ДНК. Размер открытых...
Гены «домашнего хозяйства » (англ. housekeeping genes) — это гены, необходимые для поддержания важнейших жизненных функций организма, которые экспрессируются практически во всех тканях и клетках на относительно постоянном уровне. Гены домашнего хозяйства функционируют повсеместно, на всех стадиях жизненного цикла организма.
Дисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий в средних значениях. В отличие от t-критерия, позволяет сравнивать средние значения трёх и более групп. Разработан Р. Фишером для анализа результатов экспериментальных исследований. В литературе также встречается обозначение ANOVA (от англ. ANalysis Of VAriance).
Сайт рестрикции (участок узнавания) — короткая последовательность нуклеотидов в молекуле ДНК, которая распознаётся ферментом эндонуклеазой рестрикции-модификации (рестриктазой). Рестриктаза связывается с молекулой ДНК в точке расположения сайта рестрикции и перерезает цепочку нуклеотидов внутри сайта или в непосредственной близости от него.
Статистика — измеримая числовая функция от выборки, не зависящая от неизвестных параметров распределения элементов выборки.
Энциклопедия элементов ДНК (англ. The Encyclopedia of DNA Elements, ENCODE) — международный исследовательский консорциум, созданный в сентябре 2003 года. Организован и финансируется американским Национальным институтом исследований генома человека (англ. National Human Genome Research Institute, NHGRI). Задуманный как продолжение проекта «Геном человека», ENCODE ставит целью проведение полного анализа функциональных элементов генома человека. Все результаты, получаемые в ходе реализации проекта...
Некодирующая
ДНК или Мусорная ДНК (англ. Non-coding DNA англ. junk DNA) — части геномной ДНК организмов, которые не кодируют последовательности белков. Некоторые некодирующие ДНК переводятся в функциональные некодирующие РНК-молекулы. Другие функции некодирующей ДНК включают регуляцию последовательностей кодирующих белки, центромер и теломер.
Метод дробовика (англ. Shotgun sequencing) — метод, используемый для секвенирования длинных участков ДНК. Суть метода состоит в получении случайной массированной выборки клонированных фрагментов ДНК данного организма, на основе которых может быть восстановлена исходная последовательность ДНК.
Эпигенетические часы – это совокупность эпигенетических меток ДНК, позволяющая определить биологический возраст ткани, клетки или органа. Наиболее известным примером эпигенетических часов являются часы Стива Хорвата, учитыващие 353 эпигенетических маркера человеческого генома. Разработаны и другие версии эпигенетических часов: часы К. Вейднер, основанные на метилировании трёх CpG динуклеотидов, часы И. Флорат, сложные часы Г. Ханнума и часы К. Джулиани, показатель которых рассчитываются по метилированию...
Сантиморган (сокращенно: сМ) в генетике — единица измерения генетических расстояний между полиморфными фрагментами генома (локусами или маркерами), которая определена как расстояние, на котором вероятность рекомбинации генов в мейозе составляет 1 %.
Секрето́мика — раздел протеомики, изучающий все секретируемые белки клетки, ткани или организма. Секретируемые белки не только вовлечены во множество различных физиологических процессов, включая передачу клеточного сигнала и ремоделирование внеклеточного матрикса, но и являются неотъемлемой частью инвазии и метастазирования злокачественных клеток. Секретомика, таким образом, важна в выявлении биомаркеров рака.
Двугибридный анализ — молекулярно-биологический метод для исследования белок-белковых и ДНК-белковых взаимодействий.
Дрейф ге́нов или гене́тико-автомати́ческие проце́ссы — явление ненаправленного изменения частот аллельных вариантов генов в популяции, обусловленное случайными статистическими причинами.
Эволюционная дистанция — величина, характеризующая генетические различия между двумя организмами. Находится путём сравнения нуклеотидных последовательностей гомологичных генов. Мерой генетических различий считается процент несовпадений нуклеотидов в соответствующих позициях гена.
В математической статистике
семплирование — обобщенное название методов манипулирования начальной выборкой при известной цели моделирования, которые позволяют выполнить структурно-параметрическую идентификацию наилучшей статистической модели стационарного эргодического случайного процесса.