Связанные понятия
Коэффициент сходства (также мера сходства, индекс сходства) — безразмерный показатель сходства сравниваемых объектов. Также известен под названиями «мера ассоциации», «мера подобия» и др.
Проблема Гальтона , названная в честь сэра Фрэнсиса Гальтона, представляет собой проблему выведения заключений из кросс-культурных данных на основании статистического феномена, известного на сегодняшний день как сетевая автокорреляция. В настоящее время проблема признается проблемой общего характера, которая применяется ко всем неэкспериментальным исследованиям, а также к экспериментальному проектированию. Ее можно наиболее просто описать как проблему внешних зависимостей при проведении статистических...
Закон Парето (принцип Парето, принцип 80/20) — эмпирическое правило, названное в честь экономиста и социолога Вильфредо Парето, в наиболее общем виде формулируется как «20 % усилий дают 80 % результата, а остальные 80 % усилий — лишь 20 % результата». Может использоваться как базовая установка в анализе факторов эффективности какой-либо деятельности и оптимизации её результатов: правильно выбрав минимум самых важных действий, можно быстро получить значительную часть от планируемого полного результата...
Среднее усечённое представляет собой статистическую меру центральной тенденции, рассчитанную как среднее значение для имеющегося набора данных, из которого исключены k % наибольших и k % наименьших значений. Как правило, процент удаляемых значений устанавливается в диапазоне от 5 % до 25 %.
Качественная, дискретная, или категорийная переменная — это переменная, которая может принимать одно из ограниченного и, обычно, фиксированного числа возможных значений, назначая каждую единицу наблюдения определённой группе или номинальной категории на основе некоторого качественного свойства. В информатике и некоторых других ветвях математики качественные переменные называются перечислениями или перечисляемыми типами. Обычно (хотя не в этой статье), каждое из возможных значений качественной переменной...
Отношение шансов — характеристика, применяемая в математической статистике (на русском обозначается аббревиатурой «ОШ», на английском «OR» от odds ratio) для количественного описания тесноты связи признака А с признаком Б в некоторой статистической популяции.
Закон необходимого разнообразия (англ. The Law of Requisite Variety) — кибернетический закон, сформулированный Уильямом Россом Эшби и формально доказанный в работе «Введение в кибернетику».
Временно́й ряд (или ряд динамики) — собранный в разные моменты времени статистический материал о значении каких-либо параметров (в простейшем случае одного) исследуемого процесса. Каждая единица статистического материала называется измерением или отсчётом, также допустимо называть его уровнем на указанный с ним момент времени. Во временном ряде для каждого отсчёта должно быть указано время измерения или номер измерения по порядку. Временной ряд существенно отличается от простой выборки данных, так...
Синтетический контроль (англ. Synthetic control method, SCM) — эконометрический метод анализа данных в рамках причинно-следственной модели Рубина, позволяющий проводить каузальную инференцию в сравнительных кейс-стади. Метод направлен на оценку эффектов исследуемого воздействия (например, экономической реформы) на примере небольшого числа кейсов с помощью моделирования их количественных показателей в гипотетической ситуации, где воздействие не было оказано, на основе ограниченного круга похожих контрольных...
В статистике
степенной закон (англ. power law) - это такая функциональная зависимость между двумя величинами, при которой относительное изменение одной величины приводит к пропорциональному относительному изменению другой величины, независимо от исходных значений этих величин: зависимость одной величины от другой представляет собой степенную функцию. Например, рассмотрим зависимость площади квадрата от длины его стороны. Если длина будет увеличена вдвое, то площадь увеличится вчетверо.
Робастность (англ. robustness, от robust — «крепкий», «сильный», «твёрдый», «устойчивый») — свойство статистического метода, характеризующее независимость влияния на результат исследования различного рода выбросов, устойчивости к помехам. Выбросоустойчивый (робастный) метод — метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки.
Коли́чество — категория, выражающая внешнее, формальное взаимоотношение предметов или их частей, а также свойств, связей: их величину, число, степень проявления того или иного свойства.
Двоичная, бинарная или дихотомическая классификация — это задача классификации элементов заданного множества в две группы (предсказание, какой из групп принадлежит каждый элемент множества) на основе правила классификации. Контекст, в котором требуется решение, имеет ли объект некоторое качественное свойство, некоторые специфичные характеристики или некоторую типичную двоичную классификацию, включает...
Анализ выживаемости (англ. survival analysis) — класс статистических моделей, позволяющих оценить вероятность наступления события.
Для того, чтобы оценить программу, необходимо собрать информацию о результатах её реализации. Наиболее убедительными и наглядными являются результаты проведения реального эксперимента: наблюдатель сразу собственными глазами может опознать произошедшие изменения. Однако в число серьёзных недостатков этого метода входят дороговизна проведения серьёзных полномасштабных экспериментов, а также сложность их проведения, ведь подчас качественное оценивание политических программ требует получения экспериментальных...
Подробнее: Эконометрические методы в оценивании
Нормальная форма — свойство отношения в реляционной модели данных, характеризующее его с точки зрения избыточности, потенциально приводящей к логически ошибочным результатам выборки или изменения данных. Нормальная форма определяется как совокупность требований, которым должно удовлетворять отношение.
Феномен Уилла Роджерса — кажущийся парадокс, заключающийся в том, что перемещение (численного) элемента из одного множества в другое может увеличить среднее значение обоих множеств.
Сре́днее значе́ние — числовая характеристика множества чисел или функций (в математике); — некоторое число, заключённое между наименьшим и наибольшим из их значений.
Стати́стика — отрасль знаний, наука, в которой излагаются общие вопросы сбора, измерения, мониторинга и анализа массовых статистических (количественных или качественных) данных; изучение количественной стороны массовых общественных явлений в числовой форме.
Неопределённость — отсутствие или недостаток определения или информации о чём-либо.
Анализ полных наблюдений (англ. listwise/casewise deletion, реже англ. complete-case analysis) — статистический метод обработки пропущенных данных, основанный на удалении всех наблюдений с неполными признаковыми описаниями. Считается самым простым способом разрешения проблемы пропущенных данных.
Фа́кторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки.
Фанега (исп. fanega) — старинная испанская мера объема сыпучих тел. В разное время и в разных областях Испании её точное значение было неодинаковым и могло колебаться в пределах 54-56 л. К примеру, в XVI веке кастильская фанега равнялась 55,5 л и включала в себя 4 квартильи по 3 селемина каждая, разделяющиеся на 4 квартильо по 4 акавиллы (здесь не следует путать квартильи (13,875 л) и квартильо (1,156 л)). Именно кастильская система мер объема получила в Испании наибольшее распространение и существовала...
Индикатор подлинного прогресса (англ. genuine progress indicator, GPI) – обобщённый показатель, заменяющий ВВП в качестве интегральной меры экономического прогресса. GPI, как и ВВП, имеет денежное выражение, но в отличие от ВВП, суммирующего свои составляющие, в основе GPI лежит идея разделения на категории выгод и издержек, а итоговый показатель определяется как разность между ними. GPI стал одной из немногих альтернатив ВВП, широко обсуждаемых в научном сообществе и применяемых правительствами...
Со времени появления в начале XX века тестов на умственное развитие (IQ) связь между расой и интеллектом была предметом дебатов, как в научно-популярной, так и в научно-исследовательской литературе. Несмотря на показанные, в общем, такими тестами различия в средних показателях IQ между самоопределившимися представителями разных рас или народов, не стихают оживленные дискуссии по поводу того, действительно ли (и если да, то в какой степени) эти различия вызываются воздействием окружающей среды или...
Подробнее: Связь интеллекта и расы
Фармакоэкономика — новая самостоятельная наука, которая изучает в сравнительном плане соотношение между затратами и эффективностью, безопасностью, качеством жизни при альтернативных схемах лечения (профилактики) заболевания.
Число ́ — основное понятие математики, используемое для количественной характеристики, сравнения, нумерации объектов и их частей. Письменными знаками для обозначения чисел служат цифры, а также символы математических операций. Возникнув ещё в первобытном обществе из потребностей счёта, понятие числа с развитием науки значительно расширилось.
Ключ для определения в биологии — это описанный или реализованный в CAE-системе алгоритм, служащий для помощи в идентификации биологических сущностей, таких как растения, животные, фоссилии, микроорганизмы, зёрна пыльцы. Такие ключи, кроме того, нашли широкое применение в различных областях науки и техники для идентификации разного вида сущностей, например заболеваний, почв, минералов, археологических и антропологических артефактов.
Перекрёстные данные — это тип данных, собранный путем наблюдения за многими объектами (такими как физические лица, фирмы, страны или регионы) в один и тот же период времени.
Эффективное число партий (англ. Effective number of parties, ENP, ENPP), иногда индекс Лааксо — Таагепера, — концепт, использующийся в политической науке в сравнительных исследованиях электоральных и партийных систем для измерения уровня фрагментации партийной системы. Эффективное число политических партий отражает одновременно число партий в партийной системе, а также их относительный вес, причём оно может быть рассчитано как для результатов партий на выборах (иногда обозначается как ENEP или NV...
Фиктивная переменная (англ. dummy variable) — качественная переменная, принимающая значения 0 и 1, включаемая в эконометрическую модель для учёта влияния качественных признаков и событий на объясняемую переменную. При этом фиктивные переменные позволяют учесть влияние не только качественных признаков, принимающих два значения, но и несколько возможных. В этом случае добавляются несколько фиктивных переменных. Фиктивная переменная может быть также индикатором принадлежности наблюдения к некоторой...
История теории вероятностей отмечена многими уникальными особенностями. Прежде всего, в отличие от появившихся примерно в то же время других разделов математики (например, математического анализа или аналитической геометрии), у теории вероятностей по существу не было античных или средневековых предшественников, она целиком — создание Нового времени. Долгое время теория вероятностей считалась чисто опытной наукой и «не совсем математикой», её строгое обоснование было разработано только в 1929 году...
Популяционная динамика старения — направление исследования старения с помощью методов популяционной динамики, то есть исследования возрастного состава популяций стареющих организмов и изменений этой зависимости в зависимости от типа организма и условий окружающей среды.
Статистика широко применяется в оценивании программ. Способ, при помощи которого проводится оценка программы и соответствующих относящихся к программе факторов, в большой степени определяет те аналитические методы и статистические показатели, которые будут использоваться в процессе оценивания.
Подробнее: Применение статистики в оценивании
Диаграмма Исикавы — т. н. диаграмма «рыбьей кости» (англ. Fishbone Diagram), или «причинно-следственная» диаграмма (англ. Cause and Effect Diagram), известная также как диаграмма «анализа корневых причин».
Шкала (измерительная шкала) — это знаковая система, для которой задано отображение (операция измерения), ставящее в соответствие реальным объектам (событиям) тот или иной элемент (значение) шкалы. Формально шкалой называют кортеж,
, где X — множество реальных объектов (событий), φ — отображение, Y — множество элементов (значений) знаковой системы.
Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности — надёжность как устойчивость и надёжность как внутреннюю согласованность.
Подробнее: Надёжность психологического теста
Тео́рия приня́тия реше́ний — область исследования, вовлекающая понятия и методы математики, статистики, экономики, менеджмента и психологии с целью изучения закономерностей выбора людьми путей решения проблем и задач, а также способов достижения желаемого результата.
Интегрированный временной ряд — нестационарный временной ряд, разности некоторого порядка от которого являются стационарным временным рядом. Такие ряды также называют разностно-стационарными (DS-рядами, Difference Stationary). Примером интегрированного временного ряда является случайное блуждание, часто используемое при моделировании финансовых временных рядов.
Обучение ассоциативным правилам или поиск ассоциативных правил — это метод обучения машин на базе правил обнаружения интересующих нас связей между переменными в большой базе данных. Метод предлагается для установления сильных правил, обнаруженных в базе данных с помощью некоторых мер интересности. Этот основанный на правилах подход генерирует также новые правила по мере анализа дополнительных данных. Конечной целью, исходя из достаточно большого набора данных, помочь машине имитировать выделение...
Показа́тель ослабле́ния (показатель экстинкции) — величина, обратная расстоянию, на котором поток излучения, образующего параллельный пучок, уменьшается за счет поглощения и рассеяния в среде в некоторое заранее оговоренное число раз.
Проце́нт (лат. per cent «на сотню; сотая») — сотая часть; обозначается знаком «%»; используется для обозначения доли чего-либо по отношению к целому. Например, 17 % от 500 кг означает 17 частей по 5 кг каждая, то есть 85 кг. Справедливо также утверждение, что 200 % от 500 кг является 1000 кг, поскольку 1 % от 500 кг равен 5 кг, и 5 × 200 = 1000.
Классификация документов — одна из задач информационного поиска, заключающаяся в отнесении документа к одной из нескольких категорий на основании содержания документа.
Порядок Шарковского — упорядочение натуральных чисел, связанное с исследованием периодических точек динамических систем на отрезке или на вещественной прямой.
Ана́лиз свя́зей или анализ ссылок (от англ. «link analysis») — это метод анализа данных, используемый в рамках сетевого анализа для оценки отношений (связей) между узлами (объектами/акторами). Отношения могут быть определены для различных типов узлов: людей, организаций, операций и т. д.
Задачи прогнозирования — в прогностике существуют различные частные виды классических задач на прогнозирование. Формулирование таких задач единообразным образом позволяет сравнивать различные методы, предлагаемые различными дисциплинами.
Вара́ктор (от англ. variable — переменный и act — действие, actor — тот, кто действует) — электронный прибор, полупроводниковый диод, реактивное сопротивление которого зависит от приложенного обратного напряжения. Точное определение неоднозначно.
Планирование эксперимента — один из важнейших этапов организации психологического исследования, на котором исследователь пытается сконструировать наиболее оптимальную для воплощения на практике модель (то есть план) эксперимента.