Таким образом, вероятность ошибиться при отвержении гипотезы c помощью критерия может быть вычислена по формуле:
Таким образом, мы получили серию критериев с критическими статистиками где k пробегает все значения, для которых Логично из этих критериев выбрать критерий с наименьшей ошибкой первого рода:
Аналогичным образом вводим альтернативную гипотезу и обозначения:
- набор критических статистик.
- количество значений в таблице меньше либо равных .
Это вероятности ошибиться, отвергнув нулевую гипотезу из-за слишком маленьких значений в выборке. Аналогично выбираем тот критерий, который имеет наименьшую вероятность ошибки первого рода.
И, окончательно
Причем, если то, отвергнув нулевую гипотезу, целесообразно объявить исследуемый объект повысившим свою регуляцию. Если же , то ген объявляется понизившим регуляцию.
Введем обозначения:
Тогда алгоритм можно описать следующим образом:
Упорядочиваем значения
Идем по массиву значений и находим величины
Итоговый ответ для каждого объекта - это скор, знак которого указывает на то, вероятность чего больше: того, что ген повысил или понизил экспрессию, а абсолютное значение, на то какова вероятность ошибиться при отвержении нулевой гипотезы. Скор близкий к нулю означает, что нулевая гипотеза, скорее всего, верна. Десятичный логарифм здесь взят для удобства. Т.е. например скор, равный указывает нам, что если мы отвергнем гипотезу о том, что объект не изменил свою экспрессию и примем альтернативу то мы ошибемся с вероятностью 0,01. Вероятность ошибки при принятии альтернативы
Перейти на страницу: 1 2 3 4
|