Связанные понятия
Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Если вероятность задана в процентах, то квантиль называется процентилем или перцентилем (см. ниже).
Сре́днее арифмети́ческое (в математике и статистике) множества чисел — число, равное сумме всех чисел множества, делённой на их количество. Является одной из наиболее распространённых мер центральной тенденции.
То́чечная оце́нка в математической статистике — это число, оцениваемое на основе наблюдений, предположительно близкое к оцениваемому параметру.
Ковариа́ция (корреляционный момент, ковариационный момент) — в теории вероятностей и математической статистике мера линейной зависимости двух случайных величин.
Доверительный интервал — термин, используемый в математической статистике при интервальной оценке статистических параметров, более предпочтительной при небольшом объёме выборки, чем точечная. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.
Упоминания в литературе
Вероятность определяется на основе объективных и субъективных оценок. При объективном вычислении вероятности наступления события за основу берется частота реализации схожих событий, при субъективном – экспертные мнения. Основой статистической оценки рисков принят показатель, называемый средним квадратичным отклонением (σ). Данный показатель характеризует среднюю величину отклонений отдельно взятых величин от
среднего значения . При расчете среднего квадратичного отклонения используются следующие показатели: частные величины (xi), количество частных величин (n) и простая средняя арифметическая частной величины x. Стандартное среднее квадратичное отклонение (возведение в квадрат используется для избежания отрицательных знаков в результате) рассчитывается следующим образом:
Корреляционная зависимость. Функциональные зависимости можно выразить аналитически. Так, например, площадь круга зависит от радиуса (S = pr2), ускорение F тела – от силы и массы (a = F/m0). Однако имеются зависимости, которые не слишком очевидны и не выражаются простыми и однозначными формулами. Так, например, прослеживается связь между ростом людей и массой их тела, изменение погодных условий влияет на число простудных заболеваний населения и т. д. Такая более сложная, чем функциональная, вероятностная зависимость является корреляционной (или просто – корреляцией). В этом случае изменение одной их величин влияет на
среднее значение другой. Предположим, что изучается связь между случайной величиной Х и случайной величиной Y Каждому конкретному значению Х будет соответствовать несколько значений Y: у1, у2 и т. д.
Для определения профиля инновационной активности технологических эпох воспользуемся данными о крупных изобретениях, приведенными на рис. 4.3, а также датами технологических революций согласно табл. 4.2. При этом будем рассматривать соответствующие революции попарно – революция-предвестник и основная. Для того чтобы сравнить профили активности патентования, нормируем значения Н к среднему по профилю за каждую пару волн и
среднее значение Н приравняем к уровню 50 %. По оси абсцисс отложим точку от начала революции, причем точке 1 соответствует начало революции-предвестника, точке 11 – начало основной технологической революции, а точке 21 – конец цикла и начало следующей революции-предвестника (шкала равномерная). Соответствующие профили представлены на рис. 4.4.
Сравнение параметров столбиков по
средним значениям , при использование t-критерия Стьюдента, показало значимое отличие средних для следующих параметров матриц исследования:
• «В сущности, никакое эмпирическое социальное исследование не обходится без сравнения того или иного рода. Ученые сравнивают между собой случаи; они используют статистические методы для проведения (и корректировки) количественных сравнений; они сопоставляют случаи с теоретически сконструированными чистыми типами; они также сравнивают значения случаев по интересующим их переменным со
средними значениями , чтобы оценить ковариацию. Сравнение предоставляет основания для суждений об эмпирических регулярностях и для оценки и интерпретации случаев, исходя из действительных или теоретических критериев. В этом широком смысле сравнение играет центральную роль в эмпирических социальных науках, как они существуют сегодня» [Ragin, 1987, p. 1].
Связанные понятия (продолжение)
Несмещённая оце́нка в математической статистике — это точечная оценка, математическое ожидание которой равно оцениваемому параметру.
Генеральная совокупность (от лат. generis — общий, родовой) — совокупность всех объектов (единиц), относительно которых предполагается делать выводы при изучении конкретной задачи.
Апостерио́рная вероя́тность — условная вероятность случайного события при условии того, что известны апостериорные данные, т.е. полученные после опыта.
Фу́нкция распределе́ния в теории вероятностей — функция, характеризующая распределение случайной величины или случайного вектора; вероятность того, что случайная величина X примет значение, меньшее или равное х, где х — произвольное действительное число. При соблюдении известных условий (см. ниже) полностью определяет случайную величину.
Многоме́рное норма́льное распределе́ние (или многоме́рное га́уссовское распределе́ние) в теории вероятностей — это обобщение одномерного нормального распределения. Случайный вектор, имеющий многомерное нормальное распределение, называется гауссовским вектором.
Усло́вное распределе́ние в теории вероятностей — это распределение случайной величины при условии, что другая случайная величина принимает определённое значение.
Состоя́тельная оце́нка в математической статистике — это точечная оценка, сходящаяся по вероятности к оцениваемому параметру.
Непреры́вное равноме́рное распределе́ние — в теории вероятностей — распределение случайной вещественной величины, принимающей значения, принадлежащие интервалу , характеризующееся тем, что плотность вероятности на этом интервале постоянна.
Ме́тод максима́льного правдоподо́бия или метод наибольшего правдоподобия (ММП, ML, MLE — англ. maximum likelihood estimation) в математической статистике — это метод оценивания неизвестного параметра путём максимизации функции правдоподобия. Основан на предположении о том, что вся информация о статистической выборке содержится в функции правдоподобия.
Ковариацио́нная ма́трица (или ма́трица ковариа́ций) в теории вероятностей — это матрица, составленная из попарных ковариаций элементов одного или двух случайных векторов.
Независимая переменная — в эксперименте переменная, которая намеренно манипулируется или выбирается экспериментатором с целью выяснить её влияние на зависимую переменную.
Метод наименьших квадратов (МНК) — математический метод, применяемый для решения различных задач, основанный на минимизации суммы квадратов отклонений некоторых функций от искомых переменных. Он может использоваться для «решения» переопределенных систем уравнений (когда количество уравнений превышает количество неизвестных), для поиска решения в случае обычных (не переопределенных) нелинейных систем уравнений, для аппроксимации точечных значений некоторой функции. МНК является одним из базовых методов...
Статистика — измеримая числовая функция от выборки, не зависящая от неизвестных параметров распределения элементов выборки.
Тест отноше́ния правдоподо́бия (англ. likelihood ratio test, LR) — статистический тест, используемый для проверки ограничений на параметры статистических моделей, оценённых на основе выборочных данных. Является одним из трёх базовых тестов проверки ограничений наряду с тестом множителей Лагранжа и тестом Вальда.
В статистике
степенной закон (англ. power law) - это такая функциональная зависимость между двумя величинами, при которой относительное изменение одной величины приводит к пропорциональному относительному изменению другой величины, независимо от исходных значений этих величин: зависимость одной величины от другой представляет собой степенную функцию. Например, рассмотрим зависимость площади квадрата от длины его стороны. Если длина будет увеличена вдвое, то площадь увеличится вчетверо.
Выброс (англ. outlier), промах — в статистике результат измерения, выделяющийся из общей выборки.
Центра́льные преде́льные теоре́мы (Ц. П. Т.) — класс теорем в теории вероятностей, утверждающих, что сумма достаточно большого количества слабо зависимых случайных величин, имеющих примерно одинаковые масштабы (ни одно из слагаемых не доминирует, не вносит в сумму определяющего вклада), имеет распределение, близкое к нормальному.
Подробнее: Центральная предельная теорема
Выборка или выборочная совокупность — часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением, опросом).
В теории вероятностей два случайных события называются независимыми, если наступление одного из них не изменяет вероятность наступления другого. Аналогично, две случайные величины называют независимыми, если известное значение одной из них не дает информации о другой.
Подробнее: Независимость (теория вероятностей)
Погрешность измерения — отклонение измеренного значения величины от её истинного (действительного) значения. Погрешность измерения является характеристикой точности измерения.
Весовая функция — математическая конструкция, используемая при проведении суммирования, интегрирования или усреднения с целью придания некоторым элементам большего веса в результирующем значении по сравнению с другими элементами. Задача часто возникает в статистике и математическом анализе, тесно связана с теорией меры. Весовые функции могут быть использованы как для дискретных, так и для непрерывных величин.
Функция потерь — функция, которая в теории статистических решений характеризует потери при неправильном принятии решений на основе наблюдаемых данных. Если решается задача оценки параметра сигнала на фоне помех, то функция потерь является мерой расхождения между истинным значением оцениваемого параметра и оценкой параметра.
Для определения средних или наиболее типичных значений совокупности используются показатели центра распределения. Основные из них — математическое ожидание, среднее арифметическое, среднее геометрическое, среднее гармоническое, среднее степенное, взвешенные средние, центр сгиба, медиана, мода.
Подробнее: Показатели центра распределения
Характеристи́ческая фу́нкция случа́йной величины ́ — один из способов задания распределения. Характеристические функции могут быть удобнее в тех случаях, когда, например, плотность или функция распределения имеют очень сложный вид. Также характеристические функции являются удобным инструментом для изучения вопросов слабой сходимости (сходимости по распределению). В теорию характеристических функций внесли большой вклад Ю.В. Линник, И.В. Островский, С.Р. Рао, Б. Рамачандран.
Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.
Временно́й ряд (или ряд динамики) — собранный в разные моменты времени статистический материал о значении каких-либо параметров (в простейшем случае одного) исследуемого процесса. Каждая единица статистического материала называется измерением или отсчётом, также допустимо называть его уровнем на указанный с ним момент времени. Во временном ряде для каждого отсчёта должно быть указано время измерения или номер измерения по порядку. Временной ряд существенно отличается от простой выборки данных, так...
Нера́венство Ма́ркова в теории вероятностей даёт оценку вероятности, что случайная величина превзойдёт по модулю фиксированную положительную константу, в терминах её математического ожидания. Хотя получаемая оценка обычно груба, она позволяет получить определённое представление о распределении, когда последнее не известно явным образом.
Дисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий в средних значениях. В отличие от t-критерия, позволяет сравнивать средние значения трёх и более групп. Разработан Р. Фишером для анализа результатов экспериментальных исследований. В литературе также встречается обозначение ANOVA (от англ. ANalysis Of VAriance).
Коэффицие́нт (от лат. co(cum) «совместно» + efficients «производящий») — числовой множитель при буквенном выражении, множитель при той или иной степени неизвестного, или постоянный множитель при переменной величине.
Логистическая регрессия или логит-регрессия (англ. logit model) — это статистическая модель, используемая для прогнозирования вероятности возникновения некоторого события путём подгонки данных к логистической кривой.
Частотное распределение — метод статистического описания данных (измеренных значений, характерных значений). Математически распределение частот является функцией, которая в первую очередь определяет для каждого показателя идеальное значение, так как эта величина обычно уже измерена. Такое распределение можно представить в виде таблицы или графика, моделируя функциональные уравнения. В описательной статистике частота распределения имеет ряд математических функций, которые используются для выравнивания...
Коэффициент Байеса — это байесовская альтернатива проверке статистических гипотез. Байесовское сравнение моделей — это метод выбора моделей на основе коэффициентов Байеса. Обсуждаемые модели являются статистическими моделями. Целью коэффициента Байеса является количественное выражение поддержки модели по сравнению с другой моделью, независимо от того, верны модели или нет. Техническое определение понятия «поддержка» в контексте байесовского вывода дано ниже.
Нулевая гипотеза — принимаемое по умолчанию предположение о том, что не существует связи между двумя наблюдаемыми событиями, феноменами. Так, нулевая гипотеза считается верной до того момента, пока нельзя доказать обратное. Опровержение нулевой гипотезы, то есть приход к заключению о том, что связь между двумя событиями, феноменами существует, — главная задача современной науки. Статистика как наука даёт чёткие условия, при наступлении которых нулевая гипотеза может быть отвергнута.
Винеровский процесс в теории случайных процессов — это математическая модель броуновского движения или случайного блуждания с непрерывным временем.
Автокорреляция — статистическая взаимосвязь между последовательностями величин одного ряда, взятыми со сдвигом, например, для случайного процесса — со сдвигом по времени.
Пара́метр (от др.-греч. παραμετρέω — «отмеривающий»; где παρά: «рядом», «второстепенный», «вспомогательный», «подчинённый»; и μέτρον: «измерение») — величина, значения которой служат для различения элементов некоторого множества между собой.. Параметр - величина, постоянная в пределах данного явления или задачи, но при переходе к другому явлению или задаче могущая изменить своё значение. Иногда параметрами называют также величины, очень медленно изменяющиеся по сравнению с другими величинами (переменными...
Гауссовский процесс назван так в честь Карла Фридриха Гаусса, поскольку в его основе лежит понятие гауссовского распределения (нормального распределения). Гауссовский процесс может рассматриваться как бесконечномерное обобщение многомерных нормальных распределений. Эти процессы применяются в статистическом моделировании; в частности используются свойства нормальности. Например, если случайный процесс моделируется как гауссовский, то распределения различных производных величин, такие как среднее значение...
Ме́тод моме́нтов — метод оценки неизвестных параметров распределений в математической статистике и эконометрике, основанный на предполагаемых свойствах моментов (Пирсон, 1894 г.). Идея метода заключается в замене истинных соотношений выборочными аналогами.
Робастность (англ. robustness, от robust — «крепкий», «сильный», «твёрдый», «устойчивый») — свойство статистического метода, характеризующее независимость влияния на результат исследования различного рода выбросов, устойчивости к помехам. Выбросоустойчивый (робастный) метод — метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки.
Упоминания в литературе (продолжение)
Значение средних величин в экономическом анализе состоит в обобщении соответствующей совокупности типичных, однородных показателей и процессов. Они позволяют переходить от единичного к общему, от случайного к закономерному, абстрагируясь от случайных, нетипичных явлений.
Классическим примером, показывающим, что стохастика (изменчивость) соседствует с детерминистическими законами, является турбулентность. В этом на первый взгляд абсолютно хаотическом движении жидкости всегда можно обнаружить своеобразную строгую упорядоченность. Оно подчиняется строгим физическим законам, в нем наблюдается стабильность средних характеристик, существуют определенные формы организации (коэффициенты сопротивления,
среднее значение завихренности и т. д.). Но объяснить возникновение турбулентности без обращения к случайности (случайным возмущениям) невозможно. И по существу, все развитие нашего мира можно представить моделью некоего турбулентнообразного движения материи – как непрерывное образование новых форм организации, их неизбежное разрушение, последовательность переходов от одних состояний к другим. Различие будет заключаться лишь во временных масштабах, в степени детализации анализа и характере интерпретации результата. Таким образом, все наблюдаемое нами – это единство случайного и необходимого, стохастического и детерминированного.
В рассматриваемом нами случае (условия риска) точно указать нельзя, какие значения они примут в случае принятия решения, поэтому величины дохода и затрат следует рассматривать как случайные величины,
средние значения и дисперсии которых могут быть вычислены с использованием формул (3.6)-(3.9).
Одна из первых попыток научного обоснования количественной оценки качества была сделана известным русским математиком, механиком и кораблестроителем академиком А.Н. Крыловым. Он предложил для ряда проектов боевого корабля определенного класса вычислять
средние значения параметров, характеризующих его качество, и с помощью полученных таким образом показателей характеризовать некоторый «средний корабль» данного класса и определять комплексную оценку качества любого подобного корабля.
Классическим примером, показывающим, что стохастичность, как проявление изменчивости, соседствует с детерминистскими законами, является развитое турбулентное движение. В этом на первый взгляд абсолютно хаотическом движении жидкости всегда можно обнаружить своеобразную строгую упорядоченность. Оно подчиняется строгим физическим законам – законам сохранения в первую очередь, – в нем наблюдается стабильность средних характеристик, существуют определенные формы организации (коэффициенты сопротивления,
средние значения завихренности и т. д.).
10. На основе теории, можно утверждать, что полученное значение знаменателя масштаба m? должно при выполнении определенных условий быть равным
среднему значению знаменателя масштаба зоны V. Если равенства нет – обосновать возможное отклонение, а при недопустимом отклонении найти ошибки.
Высокая наследуемость ЭЭГ-характеристик послужила для нас серьезным основанием, чтобы включить их в исследования по выяснению конкретных психофизиологических механизмов, лежащих в основе темперамента. Из характеристик темперамента исследовалась только одна – пластичность. Из ЭЭГ-параметров был использован новый обобщенный показатель (возможный показатель подвижности нервной системы) – количество типов сегментов индивидуального алфавита ЭЭГ. Этот показатель отражает, по мнению М. В. Бодунова, разнообразие нейрофункциональных программ работы мозга. Сопоставление
средних значений пластичности показало, что чем выше у испытуемых разнообразие нейрофункциональных программ, тем более выраженной является у них характеристика пластичности темперамента (Бирюков, 1988; Бодунов, 1985). Таким образом, интегральные ЭЭГ-характеристики, в частности количество сегментов в индивидуальном алфавите ЭЭГ, являются, очевидно, теми необходимыми психофизиологическими компонентами, которые участвуют в механизмах обобщения природных характеристик человека в процессе формирования темперамента.
Правильность – степень близости
среднего значения , полученного на основании большой серии результатов измерений (или результатов испытаний), к принятому опорному значению.
Для интервального вариационного ряда находится
среднее значение интервала для каждой группы как полусуммы его верхней и нижней границ.
Определение же
средних значений – задача теории вероятностей. При максимальном температурном равновесии максимален и хаос движения молекул, в котором исчезает всякий порядок. Встает вопрос: может ли и если да, то как, из хаоса снова возникнуть порядок? На это физика сможет ответить лишь через сто лет, введя принцип симметрии и принцип синергии.
Для характеристики степени расслоения часто пользуются показателем превышения доходов 10 % населения, имеющего самые высокие доходы, и 10 % населения с самыми низкими доходами. Этот показатель, называемый коэффициентом фондов (Kf), представляет собой отношение
средних значений признака в границах верхнего и нижнего децилей:
Для характеристики степени расслоения часто пользуются показателем превышения доходов 10 % населения, имеющего самые высокие доходы, и 10 % населения с самыми низкими доходами. Этот показатель называется коэффициентом фондов (Kf) и представляет собой отношение
средних значений признака в границах верхнего и нижнего децилей:
что означает вероятность отклонения случайной величины x от своего
среднего значения на величину большую, чем 3δ. Причем полученный результат справедлив при любом теоретическом распределении.
В. Кашин утверждает, что управлять здоровьем можно через инвестиции в него. Инвестиции в широком смысле: времени и средств – в физическую активность, свой настрой, экологию жилища и рациональное питание. Автором разработана оценочная шкала эффективности различных направлений оздоровления. Так, рубль, вложенный в традиционную медицину, сохраняет ресурсов здоровья в среднем на 6 руб., санаторно-курортное лечение –18 руб., медицинскую реабилитацию – 30 руб., физическую культуру – 42 руб. и рациональное питание – на 64 руб. А совместное использование двух последних – на 102 руб. Получается, что относительно традиционной медицины эффективность этих направлений выше в 3–5 – 7 – 11–17 раз соответственно. Но это
средние значения эффективности частных инвестиций в здоровье.
Доход. Выявлены значимые тенденции по шкалам семейной тревожности для члена семьи (Рис. 1.5) и лидерства (Рис. 1.6). Основываясь на результатах расчета, мы можем достоверно сказать о наличии меньшей степени тревожности в семьях с высоким (более 2-х прожиточных минимумов) доходом. Как достоверно видно из графика, наблюдается тенденция увеличения семейной тревожности у члена семьи в следующей последовательности: ниже всех семейная тревожность у семей с высоким доходом, далее идут семьи со средним доходом (от 1 до 2-х прожиточных минимумов) и семьи с низким доходом (менее 1-го минимума). Причем достоверно видно, что
среднее значение семейной тревожности у семей со средним и низким доходом практически одинаковое, но разброс значений у семей со средним доходом явно меньше.
Сравнение можно проводить по одному критерию или нескольким: сравнением фактических показателей с плановыми, сравнение показателей со значениями нормативов или с показателями других предприятий, расчет
среднего значения показателя за одну единицу времени и т. д.
• Во время волатильного рынка при формировании портфелей из далеких опционов границы дельта-нейтральности располагаются преимущественно в районе
средних значений диапазона страйков. Этот вывод основан на расположении большинства контурных кружков приблизительно посередине вертикальной оси рис. 1.4.7.
Что представляют собой индексы. Индексы рынка ценных бумаг – это сумма определенным образом взвешенных цен акций, обращающихся на рынке. В качестве базы отсчета берут день, когда значение индекса было равно 100 или 1000. По мере роста или падения цен на акции
среднее значение цен акций также растет или падает, соответственно меняется значение индекса. На каждом фондовом рынке применяется как минимум один индекс, характеризующий акции крупнейших компаний. Однако на многих рынках используют несколько индексов для крупных и небольших компаний определенной отрасли.
Средние значения АД и отношения САД/ДАД и ДАД/ПАД в зависимости от формы гипертензии
Интересно, что с арабами материкового Йемена эта группа связана максимально тесно: обобщенное расстояние составляет 11,2, что соответствует нижней границе
средних значений , т. е. сравнительно малой разнице. Сокотрийцы западных и восточных гор также теснее связаны с европеоидами, чем с австралоидами, но абсолютная величина всех различий у них значительно выше, а различие с арабами Йемена оценивается как очень большое. Сокотрийцы побережья отличаются от индийских австралоидов лишь ненамного больше, чем от европеоидов; можно сказать, что они одинаково далеки от обеих групп, но несхожесть с жителями Черной Африки еще больше. От арабов же прибрежные сокотрийцы очень отличаются.