Редкие события и вероятность
Редкие события имеют особую природу и требуют другого обращения. Поясню на примере из книги Bad Science (о ней скоро тоже напишу).
Возьмем какую нибудь болезнь, например, ВИЧ. Представьте что существует анализ на ВИЧ, который, если у человека есть ВИЧ покажет это с 99.99% вероятности. И если у человека нету ВИЧ то он будет отрицательный с вероятностью 99.99%. Важно принимать вероятность и правильного ответа и ложной положительной реальности.
Далее. Допустим что заболеваемость ВИЧ составляет 1.5%, возьмем и протестируем этим тестом 10 000 человек. В среднем мы получим 151 положительный результат. Среди которых будут 150 человек у которых есть ВИЧ, и 1 ложно положительный результат. Выглядит неплохо, да?
А теперь представим что в той же группе заболеваемость ВИЧ равна 0.01%. Если мы протестируем 10 000 этим тестом, то мы получим, в среднем, 2 положительных результата. 1 будет реальный больной и 1 будет ложно положительный. Это получается что 50% срабатываний, в этом случае, будет ложными.
Получается тот же самый тест уже не выглядит таким хорошим.