Jan. 26th, 2012

akuklev: (Default)
Пусть у вас есть случайная величина X с распределением P(x), про которое известно, что оно относится к некому семейству: в типовом случае известно, что это нормальное распределение P[µ, ε](x), где параметры µ и ε (среднее и дисперсия) заранее неизвестны.

Чтобы найти неизвестные параметры, вы делаете несколько измерений X, получаете в результате выборку чисел x1, …, x_n. Вы можете найти наиболее вероятные значения параметров исходя из имеющихся измерений: наиболее вероятное µ* = среднее выборки, наиболее вероятное ε* = дисперсия выборки (как корень среднеквадратичного отклонения от среднего выборки.
Теперь следующий вопрос: какова оценка распределения X исходя из имеющейся у нас информации (N семплов)?

Люди часто считают, что оценка — P[µ*, ε*](x), но это не так! Чтобы найти правильную оценку*, следует взять P[µ', ε'](x) для всех возможных µ' и ε' и усреднить с весами соответствующими тому, насколько вероятна соответствующая пара (µ', ε') исходя из имеющейся у нас информации. Распределения µ' и ε' (выборочного среднего и выборочной дисперсии соответственно) зависят только от (µ*, ε*) и числа N измерений, которые мы используем. Таким образом, оценкой (исходя из N проделанных измерений) распределения X является некое распределение SP[µ*, ε*, N](x), называемое распределением Стьюдента для распределения P и быстро стремящееся к P[µ*, ε*](x) при увеличивающемся N.

(* ниже в комментариях подробное обсуждение того, в каком смысле это _правильная_ оценка. Благодарю [livejournal.com profile] certus и [livejournal.com profile] ext_4199.)

Сам Уилльям Госсет, писавший под псевдонимом Стьюдент, вычислил только классическое распределение Стьюдента — т.е. распределение Стьюдента, стремящееся к нормальному. Много позже были подсчитаны распределения Стьюдента для других распространённых распределений.

На практике весьма полезно т.н. косонормальное (skew-normal) распределение, оно отвечает следующему физическому положению дел: пусть величина X распределена нормально, как будет распределена величина Y = f(X)? Если f линейная функция или близка к линейной локально, то Y тоже будет распределена нормально. Однако если нелинейностью f нельзя пренебречь, можно учесть ещё и вторую производную: тогда Y будет распределена косонормально. У косонормального распределения к параметрам матожидание и дисперсия добовляется коэффициент асимметрии. Альтернативно можно рассматривать матожидание, положительную дисперсию и отрицательную дисперсию (у последние всегда совпадают у нормального распределения). Для косонормального распределения рассчитано соответствующее косое распределение Стьюдента SP[µ*, ε*, γ*, N](x).

_____
Отдельно благодарю молодого учителя физики лет 20-22 (чьё имя я, увы, уже не помню), который работал в нашей 64 физматшколе в Омске, и как-то раз несколько недель ведшего наш класс, за то что он не пожалел сил и нескольких часов своего времени после уроков, чтобы рассказать мне, тогдашнему восьмикласснику-почемучке с тысячей вопросов, про распределение Стьюдента, центральные предельные теоремы, хи-квадрат и массу других полезных вещей.
Page generated Sep. 4th, 2025 10:55 am
Powered by Dreamwidth Studios