Предположим, я сказал: «Вероятность завтрашнего дождя — 50 %», а кто-то другой сказал: «Нет, на самом деле 60 %». Как мы можем узнать, кто из них прав? На самом деле я спрашиваю, как правильно назначать вероятности утверждениям. Кроме того, я хотел бы некоторые ссылки, которые обсуждают эту проблему.
[Длинный ответ, который был принят, но оказался в основном неправильным. Подробности смотрите в истории редактирования]
Трудно проверить отдельное вероятностное утверждение о реальном событии, особенно если оценка настолько расплывчата, как 50%, но мы можем проверить большие наборы вероятностных утверждений в сравнении с наблюдениями. Мы можем спросить, когда этот человек говорит, что шансы равны 50%, сколько раз предсказанное им событие происходит на самом деле? Если событие происходит в 75% случаев, когда он говорит, что это 50%, то его (частично) сфальсифицировали; не так сильно сфальсифицировано, как если бы событие произошло в 5% случаев или в 95% случаев. Фальсификация вероятностных утверждений зависит от степени и повторения.
Будучи немного более изощренным, мы можем посмотреть на неожиданность событий, согласно предсказаниям человека. Если он предсказывает вероятность дождя 75%, а дождь идет, то неожиданность равна -log_2(0,75) = 0,41. Если он предсказывает вероятность дождя в 75%, а дождя нет, то неожиданность равна -log_2(0,25) = 2,0. Чем выше было удивление, тем менее точным он был. Мы можем посмотреть на его среднюю неожиданность во многих прогнозах.
Например, давайте посмотрим на предсказания человека о дожде за 10 последовательных дней, а также на то, шел дождь (R) или нет (N):
10% 20% 5% 75% 90% 10% 5% 5% 5% 5%
R N N R R N N N N N
Среднее удивление здесь равно (-log(.1) - log(.8) - log(.95) - log(.75) - log(.9) - log(.9) - log(.95) - log (0,95) - журнал (0,95) - журнал (0,95)) / 10 = 0,47. Это мера того, сколько бит в среднем нам потребуется, чтобы скорректировать его предсказания относительно того, что произошло на самом деле. Чем выше, тем хуже, 0 — это лучшее, что вы можете сделать.
Еще один способ фальсифицировать вероятностные прогнозы — это определенные формы азартных игр. Если вы действительно знаете шансы и принимаете решения, основываясь на этом, у вас будет долгосрочное преимущество, когда вы играете в азартные игры, по сравнению с кем-то, кто не знает шансов. Теория вероятности изначально была разработана для помощи в азартных играх. Это принцип, лежащий в основе рынков предсказаний . Если кто-то, играя на рынке предсказаний, в долгосрочной перспективе проигрывает, то его оценки вероятностей различных событий должны быть неточными — по крайней мере, по сравнению с его конкурентами.
Говоря в более общем плане, когда вы играете в игру, в которой вы делаете вероятностные прогнозы, а ваша награда основана на правильном правиле подсчета очков , ваш успех в этой игре максимизируется, когда ваши прогнозы максимально точны, а плохой успех в этой игре искажает ваши прогнозы. .
Я описывал способы проверки вероятностных прогнозов наблюдениями. Но есть и другие способы подтвердить или опровергнуть предсказания, которые не требуют от нас ожидания наблюдения.
Во-первых, мы можем посмотреть на внутреннюю согласованность. Если кто-то говорит, что P(A) = 0,5, P(B) = 0,7 и P(A ∩ B) = 0,8, то он совершил ошибку конъюнкции , искажая свое распределение вероятностей.
Наконец, мы можем взглянуть на метод, с помощью которого были получены вероятности, а также на послужной список или теоретические гарантии этого метода. Создание и оценка таких методов — это практически вся статистика. Если метод хорош, то следует больше доверять вероятностям. Если метод не проверен или известен как плохой, то мы должны меньше доверять вероятностям.
Как указывалось в других ответах, существует множество интерпретаций вероятности (хотя эти ответы полны ошибок и неточностей, так что будьте осторожны).
Я думаю, что самая основная проблема, на которую следует обратить внимание, заключается в том, что ваш вопрос предполагает, что высказывания вроде «С вероятностью 50%, что завтра пойдет дождь» имеют значение истины . То есть вы предполагаете, что есть смысл говорить о том, что такие высказывания правильные (истинные) или неправильные (ложные).
Байесовцы (субъективисты, персоналисты) отрицают это. Если Боб говорит: «Вероятность того, что завтра пойдет дождь, составляет 50 %», это следует интерпретировать как «Я (Боб) так же уверен, что будет дождь, как и в том, что его не будет». Если Чарли возразит: «Нет, вероятность дождя составляет 60 %», нет смысла спрашивать, кто прав. У Боба и Чарли просто разные мнения, разный уровень уверенности.
Чтобы узнать больше об этой точке зрения, вам следует прочитать «Теорию вероятностей» де Финетти и «Предприятие знаний» Исаака Леви . Или начать с этого .
Прогноз погоды – это вывод из фактов. Для полного описания проблемы вам необходимо включить доказательства, которые в основном представляют собой все данные, которые бюро погоды использует для составления прогноза.
С частотной точки зрения это свидетельство можно рассматривать как эксперимент; дождь или отсутствие дождя на следующий день является исходом. Итак, предположим, что ваше свидетельство — это таблица показаний барометра и скорости ветра в течение дня, и вы делаете свой прогноз 60-процентной вероятности дождя, основываясь только на этом свидетельстве. Для частотника прогноз верен тогда и только тогда, когда в 60% случаев, когда у вас есть эти точные показания, на следующий день идет дождь, а в 40% случаев — нет.
Конечно, вы никогда больше не увидите эти точные показания, так что вы не сможете таким образом измерить свою точность; вместо этого мы можем написать функцию, которая сопоставляет диаграмму показаний барометра и показаний скорости ветра с предсказанием дождя на следующий день, затем мы измеряем, идет ли дождь в 10% случаев, когда модель предсказывает вероятность дождя 10%, 20% времени, когда модель предсказывает вероятность дождя 20% и т. д.
Заявления о том, что вероятность дождя завтра на севере страны составляет 60%, не могут быть проверены. Будет дождь или не будет. Это может быть совпадением, что синоптик только что заявил о 99-процентной вероятности дождя на севере. Если бы уже целую неделю было солнечно и если бы на севере действительно шел дождь на следующий день, его бы считали чудо-метеорологом. Но сохранить этот статус будет очень сложно.
Как вы можете когда-либо проверить, что шанс действительно был 50% или 60%. От этого зависит, какому метеорологу можно доверять. Единственное, что нужно сделать, это позволить нескольким Землям развиваться с несколько разными начальными условиями и посмотреть, сколько из них показывают, какие погодные условия. Как вы будете делать это в реальности? Делая аппроксимации текущей погоды и позволяя вариациям абстрактной картины погоды развиваться на компьютере. Для каждого другого исходного паттерна будет возникать другой паттерн. Вероятность дождя — это количество различных моделей дождя на севере, деленное на общее количество моделей.
Существуют различные уровни аппроксимации и различные схемы расчетов. Кто из них прав, трудно сказать. Будет дождь или нет. Разные приближения и разные теоретические расчеты дают разную вероятность. Какой из них правильный, можно узнать только так, как я уже упоминал. Но этот путь реализовать невозможно *в отличие от броска игральной кости).
Вы можете подумать, что шансы правдоподобны, взглянув на более ранние прогнозы синоптиков. Если он предсказал правильно в прошлом, тогда вы можете быть уверены, что он не просто так вам что-то скажет. С вероятностью 59% он имеет в виду, что просто не знает (принимая во внимание только компьютеры). С вероятностью 90% вы сможете взять с собой зонт. Если ты ей доверяешь.
Если вы больше доверяете другому способу предсказания, вам следует прислушиваться к другим видам предсказания. Я могу предсказать, что следующей зимой температура будет ниже, чем сейчас (измерение в течение недели и среднее значение). Это на 99% правда. Я даже могу предсказать, что средняя температура на Земле повысится в ближайшие 25 лет. Для этого не нужен компьютер. И я слушаю хопи, когда они говорят, что огромное облако прольет дождь из горячего пепла, когда температура поднимется и лицо планеты слишком сильно изменится из-за людей.
Дешеле Шильдер
Дешеле Шильдер
Конифолд
Бамбл
Дешеле Шильдер
Джордан С