Связанные понятия
Обилие видов — количество особей вида на единице площади или объёма; в геоботанике, в широком смысле, — группа показателей (количественных или балльных), характеризующих роль вида в фитоценозе.
Дескриптивное множество — конечное множество, каждому элементу которого поставлено в соответствие неотрицательное число («вес»). Не стоит путать с дескриптивной теорией множеств.
Коэффициент сходства (также мера сходства, индекс сходства) — безразмерный показатель сходства сравниваемых объектов. Также известен под названиями «мера ассоциации», «мера подобия» и др.
Описательная статистика или дескриптивная статистика (англ. descriptive statistics) занимается обработкой эмпирических данных, их систематизацией, наглядным представлением в форме графиков и таблиц, а также их количественным описанием посредством основных статистических показателей.
Таблица сопряжённости , или таблица контингентности, факторная таблица в статистике — средство представления совместного распределения двух переменных, предназначенное для исследования связи между ними. Таблица сопряжённости является наиболее универсальным средством изучения статистических связей, так как в ней могут быть представлены переменные с любым уровнем измерения. Таблицы сопряжённости часто используются для проверки гипотезы о наличии связи между двумя признаками с использованием точного...
Упоминания в литературе
Данные табл. 1.15 отражают тенденцию увеличения короткоголовости в направлении с юго-востока на северо-запад Рославльского уезда. Среди белорусов, обследованных разными авторами, не встречалось максимума частоты
встречаемости короткоголового элемента, зафиксированного у крестьян Рославльского уезда, где он доходил до 72,0 %. На юго-востоке значение этого показателя уменьшалось и приближалось к значениям распределения среди белорусов, полученным Н. А. Янчуком в Минской губернии, а на северо-западе – Ю. Д. Талько-Гринцевичем для крестьян, обследованных в западных белорусских губерниях. В то время о меньшей или большей смешанности народности судили о размахе вариаций головного указателя. По полученным пределам признака Е. Р. Эйхгольц сделал вывод, что «из всех сравниваемых славянских народностей наименьшую величину вероятного колебания головного указателя имели крестьяне Рославльского уезда, и поэтому они являются среди всех наименее смешанной группой» [610, с. 148].
3) оценка результатов исследования и формулирование выводов. Основной критерий оценки идентификационной значимости общих и частных признаков папиллярных узоров – частота их
встречаемости . Чем реже признаки встречаются, тем больше их идентификационная значимость. Варианты выводов:
По данным наблюдений в околополюсном районе СЛО, средняя толщина льда в период максимального развития составила 177.1 см ? 13.2 (n = 133), 181.4 см ? 13.3 (n = 203) и 183,1 ? 12.4 см (n = 40) см соответственно в 2007 г., 2008 г. и 2009 гг. (табл. 1). Отмечено увеличение
встречаемости сезонных льдов (группы льдов толщиной 180–200 см) с 37 % в 2007 до 68 % в 2008 г. и уменьшение встречаемости многолетнего льда (группа льдов 240–300 см): так, в 2007 г. керны льда толщиной более 240 см были встречены 6 раз в 133 измерениях, а в 2008 г. совсем не отмечены в 203 измерениях (рис. 2).
Основные различия между конституциональными признаками и расовыми заключаются в том, что расовые признаки связаны с определенной территорией, в то время, как разные конституции представлены у самых разнообразных популяций земного шара, хотя частота
встречаемости у них различна.
В 1-й группе с нормой развития ВПФ и речи достоверно чаще (при р < 0,05) среди незрелых ЭЭГ встречались высокоамплитудные (в диапазоне 50–100 мкВ) типы – синхронизированная ЭЭГ и ЭЭГ с замедлением основного ритма: соответственно 42,3 и 37,2 % (от общего числа незрелых ЭЭГ в группе) против асинхронного неорганизованного ритма низкой амплитуды (менее 50 мкВ – 20,5 %) (табл. 2.6). Межгрупповые различия частоты
встречаемости высокоамплитудного синхронизированного типа были недостоверны. Но в 3-й группе дошкольников с сочетанными нарушениями развития ВПФ и речи доминирующим был низкоамплитудный асинхронный тип (57 %) как в своей группе, так и в сравнении с вышеупомянутой 1 группой с нормой развития (при р < 0,05).
Связанные понятия (продолжение)
Признаковое описание объекта (англ. feature vector) — это вектор, который составлен из значений, соответствующих некоторому набору признаков для данного объекта. Значения признаков могут быть различного, не обязательно числового, типа. Является одним из самых распространённых в машинном обучении способов ввода данных.
В статистике метод оценки с помощью апостериорного максимума (MAP) тесно связан с методом максимального правдоподобия (ML), но дополнительно при оптимизации использует априорное распределение величины, которую оценивает.
Подробнее: Оценка апостериорного максимума
Статистический параметр или параметр совокупности — это величина, которая индексирует семейство распределений вероятностей. Его можно расценивать как числовую характеристику совокупности или статистической модели.
Матрица расстояний — это квадратная матрица типа «объект-объект» (порядка n), содержащая в качестве элементов расстояния между объектами в метрическом пространстве.
Гистогра́мма в математической статистике — это функция, приближающая плотность вероятности некоторого распределения, построенная на основе выборки из него.
В математической статистике
критерий знаков используется при проверке нулевой гипотезы о равенстве медианы некоторому заданному значению (для одной выборки) или о равенстве нулю медианы разности (для двух связанных выборок). Это непараметрический критерий, то есть он не использует никаких данных о характере распределения, и может применяться в широком спектре ситуаций, однако при этом он может иметь меньшую мощность, чем более специализированные критерии.
Статистическая мощность в математической статистике — вероятность отклонения основной (или нулевой) гипотезы при проверке статистических гипотез в случае, когда конкурирующая (или альтернативная) гипотеза верна. Чем выше мощность статистического теста, тем меньше вероятность совершить ошибку второго рода. Величина мощности также используется для вычисления размера выборки, необходимой для подтверждения гипотезы с необходимой силой эффекта.
Для определения средних или наиболее типичных значений совокупности используются показатели центра распределения. Основные из них — математическое ожидание, среднее арифметическое, среднее геометрическое, среднее гармоническое, среднее степенное, взвешенные средние, центр сгиба, медиана, мода.
Подробнее: Показатели центра распределения
Ме́тод моме́нтов — метод оценки неизвестных параметров распределений в математической статистике и эконометрике, основанный на предполагаемых свойствах моментов (Пирсон, 1894 г.). Идея метода заключается в замене истинных соотношений выборочными аналогами.
Фиктивная переменная (англ. dummy variable) — качественная переменная, принимающая значения 0 и 1, включаемая в эконометрическую модель для учёта влияния качественных признаков и событий на объясняемую переменную. При этом фиктивные переменные позволяют учесть влияние не только качественных признаков, принимающих два значения, но и несколько возможных. В этом случае добавляются несколько фиктивных переменных. Фиктивная переменная может быть также индикатором принадлежности наблюдения к некоторой...
Выборочная дисперсия в математической статистике — это оценка теоретической дисперсии распределения, рассчитанная на основе данных выборки. Виды выборочных дисперсий...
То́чечная оце́нка в математической статистике — это число, оцениваемое на основе наблюдений, предположительно близкое к оцениваемому параметру.
Матрица мер конвергенции — матрица содержащая в качестве элементов меры сходства объектов. Матрица отражает попарное сходство объектов. Сходство является показателем, измеренном в порядковой шкале и, следовательно, возможно лишь определение отношений вида: «больше», «меньше» или «равно».
Функция приспособленности (англ. fitness function) — вещественная или целочисленная функция одной или нескольких переменных, подлежащая оптимизации в результате работы генетического алгоритма, направляет эволюцию в сторону оптимального решения. Является одним из частных случаев целевой функции.
Интегрированный временной ряд — нестационарный временной ряд, разности некоторого порядка от которого являются стационарным временным рядом. Такие ряды также называют разностно-стационарными (DS-рядами, Difference Stationary). Примером интегрированного временного ряда является случайное блуждание, часто используемое при моделировании финансовых временных рядов.
Структурная индукция — конструктивный метод математического доказательства, обобщающий математическую индукцию (применяемую над натуральным рядом) на произвольные рекурсивно определённые частично упорядоченные совокупности. Структурная рекурсия — реализация структурной индукции в форме определения, процедуры доказательства или программы, обеспечивающая индукционный переход над частично упорядоченной совокупностью.
Усло́вное распределе́ние в теории вероятностей — это распределение случайной величины при условии, что другая случайная величина принимает определённое значение.
Формула полной вероятности позволяет вычислить вероятность интересующего события через условные вероятности этого события в предположении неких гипотез, а также вероятностей этих гипотез.
Алгоритм Баума — Велша используется в информатике и статистике для нахождения неизвестных параметров скрытой марковской модели (HMM). Он использует алгоритм прямого-обратного хода и является частным случаем обобщённого EM-алгоритма.
Коэффицие́нт асимметри́и в теории вероятностей — величина, характеризующая асимметрию распределения данной случайной величины.
Причинность по Грэнджеру (англ. Granger causality) — понятие, используемое в эконометрике (анализе временных рядов), формализующее понятие причинно-следственной связи между временными рядами. Причинность по Грэнджеру является необходимым, но не достаточным условием причинно-следственной связи.
Модель системы аксиом — какой-либо математический объект, который отвечает данной системе аксиом. Истинность системы аксиом можно доказать, только построив модель в рамках другой системы аксиом, которая считается «истинной». Кроме того, модель позволяет наглядно продемонстрировать некоторые особенности данной аксиоматической теории.
Тест отноше́ния правдоподо́бия (англ. likelihood ratio test, LR) — статистический тест, используемый для проверки ограничений на параметры статистических моделей, оценённых на основе выборочных данных. Является одним из трёх базовых тестов проверки ограничений наряду с тестом множителей Лагранжа и тестом Вальда.
В обучении машин вероятностный классификатор — это классификатор, который способен предсказывать, если на входе заданы наблюдения, распределение вероятностей над множеством классов, а не только вывод наиболее подходящего класса, к которому наблюдения принадлежат. Вероятностные классификаторы обеспечивают классификацию, которая может быть полезна сама по себе или когда классификаторы собираются в ансамбли.
Модели дискретного выбора — экономические (эконометрические) модели, позволяющие описывать, объяснять и прогнозировать выбор между, двумя или более альтернативами (то есть когда множество альтернатив не более чем счетно). Модели дискретного выбора позволяют на основе некоторых характеристик (атрибутов) экономического субъекта или ситуации оценить вероятность выбора той или иной альтернативы.
Подробнее: Дискретный выбор
Количество степеней свободы — это количество значений в итоговом вычислении статистики, способных варьироваться. Иными словами, количество степеней свободы показывает размерность вектора из случайных величин, количество «свободных» величин, необходимых для того, чтобы полностью определить вектор.
В математической статистике
семплирование — обобщенное название методов манипулирования начальной выборкой при известной цели моделирования, которые позволяют выполнить структурно-параметрическую идентификацию наилучшей статистической модели стационарного эргодического случайного процесса.
Структурное прогнозирование или структурное обучение является собирательным термином для техник обучения машин с учителем, которые вовлекают предвидение структурных объектов, а не скалярных дискретных или вещественных значений.
Двоичная, бинарная или дихотомическая классификация — это задача классификации элементов заданного множества в две группы (предсказание, какой из групп принадлежит каждый элемент множества) на основе правила классификации. Контекст, в котором требуется решение, имеет ли объект некоторое качественное свойство, некоторые специфичные характеристики или некоторую типичную двоичную классификацию, включает...
Многозна́чная зави́симость (тж. МЗЗ) — обобщение понятия функциональной зависимости, широко использующееся в теории баз данных. В концепции нормальных форм вводится для формального определения четвертой нормальной формы...
Статистика — измеримая числовая функция от выборки, не зависящая от неизвестных параметров распределения элементов выборки.
Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.
Байесовский подход в филогенетике позволяет получить наиболее вероятное филогенетическое дерево при заданных исходных данных, последовательностях ДНК или белков рассматриваемых организмов и эволюционной модели замен. Для снижения вычислительной сложности алгоритма расчёт апостериорной вероятности реализуется различными алгоритмами, использующими метод Монте-Карло для марковских цепей. Главными преимуществами байесовского подхода по сравнению с методами максимального правдоподобия и максимальной экономии...
Модель мозга — любая теоретическая система, которая стремится объяснить физиологические функции мозга с помощью известных законов физики и математики, а также известных фактов нейроанатомии и нейрофизиологии . Существуют по меньшей мере два основных положения, играющих фундаментальную роль в теории функционирования мозга, в отношении которых сходится мнение большинства современных теоретиков...
Квазиньютоновские методы — методы оптимизации, основанные на накоплении информации о кривизне целевой функции по наблюдениям за изменением градиента, чем принципиально отличаются от ньютоновских методов. Класс квазиньютоновских методов исключает явное формирование матрицы Гессе, заменяя её некоторым приближением.
Коэффицие́нт эксце́сса (коэффициент островершинности) в теории вероятностей — мера остроты пика распределения случайной величины.
Семплирование по Гиббсу — алгоритм для генерации выборки совместного распределения множества случайных величин. Он используется для оценки совместного распределения и для вычисления интегралов методом Монте-Карло. Этот алгоритм является частным случаем алгоритма Метрополиса-Гастингса и назван в честь физика Джозайи Гиббса.
Двухшаговый метод наименьших квадратов (Двухшаговый МНК, ДМНК,TSLS, 2SLS — англ. Two-Stage Least Squares ) — метод оценки параметров эконометрических моделей, в частности систем одновременных уравнений, состоящий из двух этапов (шагов), на каждом из которых применяется метод наименьших квадратов.
Робастность (англ. robustness, от robust — «крепкий», «сильный», «твёрдый», «устойчивый») — свойство статистического метода, характеризующее независимость влияния на результат исследования различного рода выбросов, устойчивости к помехам. Выбросоустойчивый (робастный) метод — метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки.
Дисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий в средних значениях. В отличие от t-критерия, позволяет сравнивать средние значения трёх и более групп. Разработан Р. Фишером для анализа результатов экспериментальных исследований. В литературе также встречается обозначение ANOVA (от англ. ANalysis Of VAriance).
В статистике под латентными или скрытыми переменными понимают такие переменные, которые не могут быть измерены в явном виде, а могут быть только выведены через математические модели с использованием наблюдаемых переменных. Скрытые переменные используются во многих областях, включая психологию, экономику, машинное обучение, биоинформатику, обработку естественного языка и социальные науки.
Подробнее: Скрытая переменная
Упоминания в литературе (продолжение)
Онкологическая заболеваемость легких находится в прямой зависимости от загрязнения канцерогенными веществами вдыхаемого атмосферного воздуха (Талаев М.И., 1995; Gazzero M., 1995; Yablokov A., 1993), способного вызывать серьёзные нарушения структуры ДНК. Многочисленные исследования показали возможность использования хромосомных аберраций (ХА) в лимфоцитах крови в качестве биомаркера риска развития рака легкого (РЛ) (Randa A., 2002; Wong MP., 2003; Ashman JN., 2002). В связи с этим целью настоящего исследования явился анализ частоты и спектра ХА в лимфоцитах крови людей больных РЛ, проживающих на территории Кемеровской области. Материалы и методы. Было обследовано 35 больных РЛ, не проходивших ранее химиотерапевтического или радиологического лечения и 61 человек из группы сравнения. В группу сравнения вошли здоровые люди, которые в течение последних трех месяцев не проходили рентгенологического обследования. Частоту ХА определяли в лимфоцитах периферической крови в соответствии со стандартными методиками (Бочков Н.П., 1971). Результаты и обсуждение. Было проанализировано 3500 клеток в исследуемой группе и 6100 в контрольной группе. Установлено, что частота
встречаемости клеток с ХА у обследованных больных – 3,72 ? 1,22 %. Этот показатель значимо выше, чем среднее значение, в группе сравнения – 1,97 ? 0,19 % (р<0,05). Данное повышение реализуется преимущественно за счет одиночных фрагментов и дицентриков. Обнаруженное накопление в клетках крови больных РЛ хромосомных аберраций, возможно, отражает биологические эффекты воздействия генотоксических канцерогенов.
На стадии сравнительного анализа сравниваются идентификационные признаки исследуемого объекта и образцов, чтобы получить ответ на вопрос, каких признаков больше – совпадающих или отличающихся, при этом эксперт руководствуется не количеством совпадающих или отличающихся признаков, а частотой
встречаемости .
Поэтому его проводят ежегодно в самое короткое время на всей площади посева культуры и заканчивают за 2–3 дня до оптимального срока выполнения намеченных мероприятий. Для оценки засоренности используют показатели обилия (численность, масса, объем, проективное покрытие), а также
встречаемость и ярусность сорняков в посевах. В зависимости от поставленных целей используют количественные или глазомерные методы учета засоренности посевов. Количественные методы учета по своему исполнению очень трудоемки и используются главным образом в научно-исследовательской работе.
Пожалуй, наиболее замечательным результатом классификации астероидов является обнаружение зависимости частоты
встречаемости различных классов от большой полуоси орбиты, или среднего расстояния астероида от Солнца. Так, астероиды класса Е во много раз чаще встречаются вблизи внутреннего края Главного пояса, на расстояниях около 1,9 а.е. от Солнца, чем в районе внешнего края пояса, на расстояниях около 3 а.е. Пик встречаемости астероидов класса S приходится на 2,2–2,3 а.е., класс С многочисленнее всего на внешнем краю Главного пояса, а примитивные классы P и D обильнее всего представлены соответственно астероидами группы Гильды и троянцами (рис. 3.28 а).
✓ Есть фундаментальная проблема с «научными» расчетами времен жизни общего предка, где расчеты, основаны на частотах
встречаемости мутаций разных маркеров. Эти частоты – просто оценки, основанные на встречаемости мутаций в современных гаплотипах. Но когда я смотрю на гаплотипы людей, общий предок которых известен и жил 400–500 лет назад, и я не вижу в их гаплотипах никаких мутаций, то у меня возникают резонные сомнения о надежности расчетов, основанных на мутациях.
Гестоз возникает преимущественно во второй половине беременности. Частота
встречаемости гестоза (по отношению к общему числу беременных и рожениц), по данным литературы, значительно варьирует, что зависит от качества статистических данных, от охвата медицинским наблюдением беременных и рожениц, от уровня профилактической работы с беременными и от климатогеографических условий. Согласно современным данным, частота случаев гестоза в среднем колеблется от 2 до 14 %. В России, несмотря на наблюдающееся в последнее десятилетие снижение абсолютного числа родов, частота гестоза из года в год увеличивается и достигает 16 – 21 %. Необходимо отметить, что гестоз значительно чаще развивается у женщин, страдающих различными соматическими заболеваниями (свыше 40 %), у беременных и рожениц старше 35 лет, а также у первородящих (особенно у юных, до 18 лет). Известно, что эта патология наблюдается при перерастяжении матки во время беременности (многоплодие, многоводие, крупный плод), а также у женщин с признаками изогемоконфликта между матерью и плодом, при артериальной гипотонии, пузырном заносе и ожирении.
ГЕНОФО́НД, совокупность всех генов или генотипов в популяции или группе популяций какого-либо вида организмов. Генофонд достаточно большой популяции, в которой происходит свободное скрещивание организмов, обладает определённой целостностью и устойчивостью: частоты
встречаемости тех или иных генов (аллелей) и генотипов поддерживаются в популяции в относительном равновесии. Вместе с тем, если популяция подвергается действию т. н. элементарных факторов эволюции (мутаций, изоляции,естественного отбора и др.), происходит нарушение этого равновесия. Со временем устойчивое изменение частот генов (микроэволюция) может дать толчок видообразованию.
ГЕНОФО́НД, совокупность всех генов или генотипов в популяции или группе популяций какого-либо вида организмов. Генофонд достаточно большой популяции, в которой происходит свободное скрещивание организмов, обладает определённой целостностью и устойчивостью: частоты
встречаемости тех или иных генов (аллелей) и генотипов поддерживаются в популяции в относительном равновесии. Вместе с тем, если популяция подвергается действию т.н. элементарных факторов эволюции (мутаций, изоляции,естественного отбора и др.), происходит нарушение этого равновесия. Со временем устойчивое изменение частот генов (микроэволюция) может дать толчок видообразованию.