В файле записаны результаты некоторых наблюдений в формате <номер варианта>,<наблюдение1>,<наблюдение2>. Для каждого варианта представлено некоторое количество наблюдений. Требуется:
1) Выбрать данные своего варианта.
2) Разбить наблюдения на 10 групп примерно одного размера.
3) Для каждой из групп найти выборочные средние и медиану для каждого из наблюдений.
4) Получится 10 оценок медианы и 10 оценок среднего. Считая их элементами выборки объема 10, проанализировать, какая из них имеет меньший разброс.
5) Проделать то же самое для выборочных квантилей на уровнях 0.2, 0.4, 0.6, 0.8.
6) Продумать, какие из этого можно сделать выводы.
В файле записаны результаты некоторых наблюдений в формате <код измеряемой величины>,<наблюдение1>,<наблюдение2>. Известно, что наблюдение 1 имеет экспоненциальное распределение, параметр которого θ неизвестен, но (возможно) различается для разных измеряемых величин. Наблюдение 2 представляет собой то же значение, к которому добавлен некоторый случайный шум. Требуется:
1) Понять, для какой функции от параметра θ у экспоненциального распределения найдется эффективная оценка.
2) Построить эту эффективную оценку по данным наблюдения 1.
3) Для каждой пары различных кодов эксперимента оценить сверху вероятности того, что параметры θ для них совпадают. Например, можно использовать дисперсию полученной оценки (из теоремы Крамера-Рао) и неравенство Чебышёва - придумайте, как. Или более сильные результаты, которые, по идее, дадут лучшие оценки.
4) Проделать то же самое для данных наблюдения 2 и посмотреть, как зашумленность влияет на результаты.
5) Продумать, какие из этого можно сделать выводы.
В файле записаны результаты некоторых наблюдений в формате <язык>,<наблюдение>. Требуется:
1) Для каждого языка найти левосторонний (вида (-∞,a] ) и центральный доверительные интервалы для среднего наблюдений на уровнях доверия 90%, 95% и 99%.
2) Для двух типов интервалов и каждого уровня доверия (всего 6 вариантов) найти количество языков (из 50, для которых указаны данные), для которых настоящее математическое ожидание (равное 100) в них не попадает.
3) Разобраться, какие вероятности того, что не попадет в доверительный интервал именно столько языков, сколько не попало для каждого из 6 вариантов, и какое теоретическое мат.ожидание количества не попавших языков.
4) Продумать, какие из этого можно сделать выводы.
В файле записаны результаты измерений радиусов планет в формате <номер варианта>, <планета>,<наблюдение>. Требуется:
1) Выделить данные вашего варианта.
2) Для каждой планеты найдите точечную оценку среднего и дисперсии наблюдений.
3) Для каждой планеты найти правосторонний (вида [a.∞) ) и центральный доверительные интервалы для среднего наблюдений на уровнях доверия 95% и 99%.
4) Для каждой планеты найдите левосторонний и центральный доверительный интервалы для дисперсий наблюдений на уровнях доверия 95% и 99%.
5*) Для каждой планеты найдите кратчайший интервал, в который с вероятностью 0.95 попадет следующее измерение радиуса. Для этого нужно применить теорему Фишера и подобрать константу c, чтобы случайная величина c(X_(n+1) - m)/S, где m -- выборочное среднее, а S2 -- выборочная дисперсия, построенные по имеющимся n наблюдениям, имела известное распределение, и воспользоваться квантилями этого распределения. Для имеющихся данных найдите количество измерений, которые попали в этот интервал.
6) Какие из полученных результатов нужно использовать, чтобы с вероятностью ошибки не более 1% найти нижнюю границу радиуса каждой из планет?
7) Проведенное исследование оформите с выбранной вами степенью подробности (указав вариант, который вы делали) и пришлите для проверки на адрес yakubovich.yv@talantiuspeh.ru.