Statistics#

Различные типы распределений применяются в качестве теоретических моделей в задачах, связанных со случайностью и неопределённостью. Однако на практике далеко не всегда ясно, какое именно распределение моделирует имеющиеся в наличии данные. А если из каких-либо соображений тип распределения всё же установлен, то следующая задача — оценить параметры этого распределения, например, среднее и/или дисперсию в случае гауссовского распределения N(μ,σ2).

Подобными обратными по отношению к теории вероятностей задачами занимается математическая статистика. Типичный пример статистической задачи: по числовой выборке X1,,Xn оценить параметры распределения, из которого они были получены. Обычно предполагается, что выборка i.i.d. (independent and identically distributed), то есть представляет собой независимые реализации случайной величины с одним и тем же распределением. Параметр этого определения θ может быть числом или вектором; оценку этого параметра по выборке X1,,Xn обычно обозначают θ^(X1,,Xn) или просто θ^.

Common statistics#

Statistic is a function of sample X1,,Xn. Here are some widely used statistics:

  1. Sample average:

    Xn=1ni=1nXi.
  2. Sample variance:

    Sn=1ni=1n(XiXn)2.
  3. Sample median is the middle element of the rearranged sample

    X(1)X(2)X(n).

    If n is odd, n=2m+1, then the middle element is unique and

    med(X1,,Xn)=X(m)

    Otherwise, if n=2m, then median is taken as average of two middle elements:

    med(X1,,Xn)=12(X(m)+X(m+1)).