Значение значения 5.1σ5.1σ5.1\sigma относительно GW150914

Я не смог найти ни одной публикации LIGO, объясняющей, как мы должны интерпретировать это значение. Самое близкое, что я нашел, это следующая цитата:

Это означает, что шумовое событие, имитирующее GW150914, будет чрезвычайно редким явлением — действительно, мы ожидаем, что такое сильное событие, как GW150914, произойдет случайно только один раз за примерно 200 000 лет таких данных! Этот уровень ложных срабатываний можно перевести в число «сигм» (обозначаемое как s), которое обычно используется в статистическом анализе для измерения значимости заявления об обнаружении. Этот поиск идентифицирует GW150914 как реальное событие со значимостью более 5 сигм.

http://www.ligo.org/science/Publication-GW150914/index.php

Из моего чтения кажется, что 5.1 о значимость относится к:

Вероятность наблюдения такого сигнала при условии, что модель фонового шума правильно описывает все входные сигналы детекторов в момент поступления сигнала .

Я хотел бы убедиться, что приведенная выше интерпретация верна и отличается от вероятности GW150914:

  1. возникло случайно
  2. была вызвана гравитационной волной
  3. был вызван слиянием BH-BH

Я спрашиваю, потому что я видел сообщения на этом сайте и в других местах (как в новостях, так и в блогах), которые, кажется, подразумевают другое. Я беспокоюсь, что могу неправильно понять некоторые термины, характерные для астрофизики.

Кроме того, кто-нибудь знает, какие расчеты использовались для преобразования частоты ложных срабатываний в число сигм? Эта деталь, похоже, не упоминалась в документах, поэтому я предполагаю, что это что-то тривиальное, что я упустил из-за отсутствия опыта в этой области.

Редактировать:

Позвольте мне пояснить (то, что я узнал, неверно) интерпретацию № 1 выше. Это правило Байеса:

(1) п ( ЧАС | О ) "=" п ( ЧАС ) п ( О | ЧАС ) п ( О )
где,

ЧАС "=" Гипотеза (модель фонового шума описывает весь ввод в извещатели во время сигнала)
О "=" Наблюдение (сигнал GW150914)

Просто чтобы быть на 100% ясным:

п ( ЧАС | О ) "=" Вероятность H истинна при условии, что O наблюдалось п ( О | ЧАС ) "=" Вероятность наблюдения O при заданном H верна п ( ЧАС ) "=" Вероятность H верна  независимый  наблюдения О п ( О ) "=" Вероятность наблюдения O  независимый  истинно ли H

Последний член можно переписать как:

(2) п ( О ) "=" п ( ЧАС ) п ( О | ЧАС ) + п ( ¬ ЧАС ) п ( О | ¬ ЧАС )
где вероятность H ложна, обозначается
(3) п ( ¬ ЧАС ) "=" 1 п ( ЧАС )

В ответах мы установили о -level представляет собой простое преобразование p-значения, равное п ( О | ЧАС ) . Ясно, что п ( ЧАС | О ) должно иметь числовое значение, отличное от p-значения, за исключением некоторых очень специфических обстоятельств, т. е. когда п ( ЧАС ) "=" п ( О ) . Значение p рассчитывается в предположении, что ЧАС верно, и из уравнений 1/2/3 мы видим, что п ( ЧАС | О ) явно зависит от обоих п ( ЧАС ) и вероятность наблюдения такого сигнала, если ЧАС неверно: п ( О | ¬ ЧАС ) .

Если наша гипотеза верна, я думаю, мы все согласны с тем, что единственный способ получить сигнал, подобный GW150914, — это случайное совпадение шумовых паттернов между двумя детекторами LIGO. Поэтому при написании мы часто используем сокращения, такие как:

ЧАС "=" любой сигнал обусловлен, т. е. вызван случайным совпадением
или
ЧАС "=" любой сигнал не настоящий

Есть много сокращенных способов сказать одно и то же, что сбивает с толку. Дело в том, что p-значение не является вероятностью того, что GW150914 была вызвана (возникла из-за) случайностью (фоновым шумом; случайным совпадением). Это также не вероятность того, что GW150914 «ненастоящая» или «насколько маловероятно», что GW150914 возникла случайно.

В этом случае p-значение, по-видимому, п ( О | ЧАС ) 2 × 10 7 . Кроме того, по-видимому, единственным другим правдоподобным объяснением является слияние BH-BH. В более раннем вопросе мы оценили априорную вероятность этого как 10 4  к  10 1 . Если мы предположим, что это единственное другое возможное объяснение, то это должна быть вероятность того, что H ложно независимо от наблюдения GW150914: п ( ¬ ЧАС ) .

Во-первых, давайте использовать нижнюю границу: п ( ¬ ЧАС ) 10 4 . Из уравнения 3 тогда п ( ЧАС ) 0,9999 . Кроме того, GW150914, по-видимому, точно совпал с предсказанием. Следовательно, вероятность увидеть такой сигнал при условии, что H ложно, равна п ( О | ¬ ЧАС ) 1 . Подставляя эти значения, мы получаем:

п ( ЧАС | О ) "=" 0,9999 × 2 × 10 7 0,9999 × 2 × 10 7 + 10 4 × 1 0,002

Делая то же самое для верхней границы, я получаю п ( ЧАС | О ) 1,8 × 10 6 . Теперь мы можем сказать, что «вероятность GW150914 произошла из-за случайных диапазонов от 2 × 10 3  к  1,8 × 10 6 », что сильно отличается от p-значения. Есть ли ошибки в этом рассуждении?

Почему ты исключаешь 1. arose due to chance?
@Тимей P(Наблюдение|Гипотеза) != P(Гипотеза|Наблюдение). Это логическая ошибка, называемая «перестановкой условного предложения» или, альтернативно , «смешением обратного» . Я полагаю, что мы имеем дело с P (Наблюдение | Гипотеза), где гипотеза состоит в том, что «сигнал возник из-за случайности / фона», но может быть ошибочным.
@ Тимеус Я не вижу, где я обвинял тебя в чем-либо. Я просто ответил на ваш вопрос. Я исключил «вероятность того, что сигнал возник из-за случайности», потому что это будет P (гипотеза | наблюдение). Прошу прощения за любое предполагаемое оскорбление.
@livid Теперь я понимаю твою точку зрения. Я обратился к этому в своем ответе
@innisfree Ваше редактирование делает вопрос менее ясным, потому что это выглядит так, как будто я прошу the probability GW150914: p(GW150914 arose due to chance|data), то есть вероятность вероятности. Кроме того, спасибо, что оба ответа касаются моей первой проблемы. Может кто-нибудь дать точный расчет вероятности получения ложной тревоги "=" 1 / 200 , 000 лет до 5.1 о ?
Отменить изменения
Я понимаю, что вы делаете, но ваш настоятель слишком неуверен, чтобы воспринимать его всерьез. Опубликованные прогнозы скорости слияния составляли от 0,1 до 1000 на кубический Гпк/год. Объем выборки для 10 слияний ЧД солнечной массы составляет 0,1 куб. Гпк. Это дает ожидаемое количество обнаруживаемых событий за 16 дней. 4.4 × 10 4 к 4.4 . dcc.ligo.org/LIGO-P1500262/public
Вероятности, которые вы должны использовать tgen, исходят из распределения Пуассона. Вероятность наблюдения хотя бы одного события равна 1 п ( 0 ) "=" 1 опыт ( мю ) , который, учитывая вышеприведенные ожидаемые значения, колеблется от 4.4 × 10 4 до 0,988. Как ясно сказано в упомянутом выше документе, одно обнаружение LIGO несовместимо только с самыми низкими из этих оценок скорости.
@RobJeffries У меня нет опыта, чтобы выбрать лучший вариант здесь, но да, это то, что я рассчитывал, как указано в моем комментарии к вашему ответу. p(H|O) тогда будет между 4,5 × 10 4 и 2,5 × 10 9 , оба по-прежнему на несколько порядков отличаются от p-значения. Если бы они оказались очень близкими к p-значению, совпадение значений все равно было бы случайностью. Кроме того, обратите внимание, что я считаю, что возможность быстро читать литературу и получить предварительный диапазон, охватывающий 10 ^ 5, очень впечатляет. Обычно это невозможно с теориями, с которыми я привык иметь дело.
@RobJeffries Я пытался быть кратким, но, возможно, вышеизложенное кажется загадочным. я рассчитал п ( ¬ ЧАС ) "=" 1 е Икс п ( р * т ) , который р * т , используя диапазон R="ожидаемая ставка" из другого вопроса. Затем я просто округлил до ближайшей степени 10, так как точный ответ не был моей целью. Кроме того, ваш источник сообщает о предыдущих диапазонах 0 1000   г п с 1 у р 1 ... Другое дело, пожалуй, я ошибаюсь, что п ( ЧАС | О ) п ( О | ЧАС ) должно быть совпадение. Есть ли какой-то способ (преднамеренный или интуитивный), чтобы все устроено так, как это имеет место в астрофизике?

Ответы (3)

Я вижу, куда вы клоните со своим вопросом. Позвольте мне кормить пламя.

Приведенное значение сигмы эквивалентно вероятности ложной тревоги. Это говорит вам о том, насколько маловероятно, что ваш эксперимент, учитывая ваше понимание (теоретическое и эмпирическое) шумовых характеристик, произвел сигнал, похожий на GW от сливающейся ЧД.

Лично я предпочитаю утверждение в тексте, который вы цитируете. Такое событие можно было наблюдать (в обоих детекторах) примерно раз в 200 000 лет. Учитывая, что наблюдения были в течение 16 дней, это означает, что ожидание будет 2.2 × 10 7 такие события в данных. то есть один шанс на 4,6 миллиона.

Команда LIGO только что преобразовала это число в числа сигма-значения, используя интеграл под одним хвостом нормального распределения. Используя один из доступных калькуляторов, например http://www.danielsoper.com/statcalc3/calc.aspx?id=20 , мы видим, что 5.0-5.1 о (известный как z-показатели) соответствует p-значениям 2,7 × 10 7 к 1,7 × 10 7 , заключая в скобки значение, найденное выше.

Однако это не уровень уверенности в том, что это гравитационная волна или сливающаяся черная дыра. Всегда существует вероятность того, что вкрался какой-то непредвиденный источник ошибки, который имитирует сигнал GW (но учтите, что он должен воздействовать на оба детектора) или что какой-то другой астрофизический источник может генерировать сигнал. Насколько мне известно, кроме обычных теорий заговора (зевает), никто не придумал правдоподобной альтернативы ГВ от сливающейся ЧД.

Думаю, я понял. В R это будет Nsigma=qnorm(exp(-r*t)), где r = «частота ложных срабатываний» и t = «прошедшее время». В этом случае я получаю Nsigma=5,05.
Что касается «никто не придумал правдоподобной альтернативы GW из сливающейся ЧД» , я так понимаю, вам не понравилась моя идея взрыва в обратном направлении ? Кроме этого, я был бы удивлен, если бы никто не смог придумать другие причины для такого сигнала, даже если слияние BH-BH остается лучшим кандидатом. Например, вы можете получить возрастающую частоту, наблюдая за любым периодическим сигналом под углом .
Это последнее утверждение может не иметь смысла в данном случае... Я просто пытаюсь придумать общие механизмы, которые производят экспоненциальный чирп , но без знаний астрофизики я сомневаюсь, что смогу придумать конкретное объяснение.
Я перечитал это и понял, что не могу понять на 100%. Вы пишете: " Сигма-значение говорит вам... насколько маловероятно, чтобы ваш эксперимент, учитывая ваше понимание... характеристик шума, произвел сигнал, похожий на ГВ от сливающейся ЧД ". Вы согласны с этим? отличается от «насколько маловероятно (т. е. вероятность) того, что сигнал был вызван случайным совпадением»?
@Livid Я не знаю, что вы подразумеваете под «случайным совпадением».
Я отредактировал вопрос, пытаясь прояснить его.
@Livid Нет, то, что вы называете случайным совпадением, является частью оценки на 200 000 лет.
Я согласен с этим. Я не понимаю, почему вы говорите «нет», так что что-то все равно должно быть неясным. Частота ложных срабатываний (1/200 000) — это просто способ говорить о p(O|H) = «вероятность того, что шум производит сигнал, похожий на GW». Я утверждаю, что это отличается от p(H|O)="вероятность того, что сигнал был вызван случайным совпадением". Перефразировано: p (H | O) = «вероятность того, что сигнал, похожий на GW, был вызван шумом».

Во всех проверках частотных гипотез обнаруживается так называемая п -значение: вероятность получения таких "экстремальных" наблюдений (т.е. такой экстремальной тестовой статистики) при истинности нулевой гипотезы.

Нулевая гипотеза отвергается тогда и только тогда, когда п -значение меньше предварительно заданного критического значения или уровня достоверности. В противном случае null не принимается и не подтверждается — он просто не отклоняется.

В этом случае нулевая гипотеза состоит в том, что

модель фонового шума правильно описывает все входные данные детекторов

и он был отклонен с высокой степенью достоверности.

The п -значения обычно преобразуются в односторонние гауссовские значения, т. е. в такое количество стандартных отклонений, при котором одинаковая вероятность находится в хвосте гауссовского распределения,

Z "=" Φ 1 ( п -ценить )
где Φ 1 является обратным гауссовой CDF. Это соглашение раздражает, поскольку отношение между п -ценность и значимость не являются алгебраическими или легко аппроксимируемыми. Было бы разумнее просто сообщить о п -ценить.

В своем комментарии вы ссылаетесь на теорему Байеса и расчет вероятности или правдоподобия нулевой гипотезы. Однако проверка гипотезы LIGO является строго частотной. Учитывается только вероятность данных и псевдоданных. Поскольку в этом случае данные кажутся такими надежными, не должно быть никаких качественных различий в выводах байесовского или частотного методов.

Вы правы, конечно, что

п ( Любые сигнальные признаки, обусловленные случайностью | данные )
не равно
п ( данные | Любые сигнальные признаки, обусловленные случайностью )
Они связаны теоремой Байеса. Частотные методы, включая методологию LIGO, учитывают только последний.

Вы можете найти arXiv:1609.01668 интересным, так как в нем обсуждаются различия между байесовским и частотным анализом сигналов LIGO. Примечательно, что даже малые значения могут соответствовать колоссальным байесовским факторам. 5.1 о событие имело байесовский фактор 10 125 , что является самым большим числом, которое я видел в этом контексте.

«Было бы разумнее просто указать значение p». А в астрофизике мы думаем, что для медицины было бы более целесообразно использовать сигмы, а не p-значения. Это просто мнение. «Однако проверка гипотезы LIGO строго частотная». Никогда не бывает разницы между частотным и байесовским ответом на вопрос. Единственная разница в том, что люди, называющие себя частотными, склонны задавать вопросы одного типа, а те, кто называют себя байесовцами, чаще задают другой.
@ChrisWhite извините, почему вы советуете сообщать о сигме? Насколько невероятнее 5 сигм против 4 сигм? Сможете ли вы угадать, не глядя?
@innisfree Since the data is so strong in this case, there shouldn't be any qualitative differences in the conclusions of Bayesian or frequentist methods.Смотрите мой предыдущий вопрос . Похоже, что предпочтительное объяснение также было несколько маловероятным, поэтому p-значение завышает доказательства по сравнению с фоновым объяснением.
Что же касается байесовского и частотного анализа, то они никогда не приводят к противоречивым ответам на один и тот же вопрос, это на удивление грубая точка зрения. Рассмотрим безобидный вопрос, должен ли я отказаться от нуля в пользу альтернативы? Есть случаи, когда Байес и частота. методы дают противоречивые ответы.
Конечно, никакого парадокса логики нет, так как методы вычисляют разные вещи.
Правда, p-значения легче использовать для непосредственного сравнения вероятностей (хотя я бы сказал, что человеческий разум довольно ужасно оценивает вероятности меньше, чем 1 / 1000 во всяком случае, так что интуиция не очень важна для некоторых вещей). С другой стороны, сигмы дают ответ с точки зрения естественного масштаба шума. Если я удвою время экспозиции моего изображения, в котором преобладает статистика счета, мой шум должен снизиться в 2 раза. 2 и я могу ожидать 3 -сигма-обнаружение, если оно реально, стать 4.2 -сигма-обнаружение.
Хорошо, а насколько маловероятнее 4.2 против 3? Что на самом деле означает 4,2 сигма? Вам придется вычислить p-значения...

Это p-значение, записанное в виде z-показателя.

Любое вычисление шанса основано на модели, иногда это даже закреплено в названии нулевой гипотезы. Нулевая гипотеза для первого прямого наблюдения гравитационной волны может заключаться в том, что гравитационные волны не существуют, но ваши детекторы могут реагировать на шум.

Теперь вычисление не так просто, как шанс получить какой-либо конкретный набор данных. Фактически вы упорядочиваете данные, разделяя их на те, которые выглядят как предсказанные волновые данные, и на те, которые таковыми не являются. А затем внутри тех, которые выглядят как предсказанные волновые данные, вы упорядочиваете их по силе.

И тогда вы обнаружите вероятность того, что он отреагирует на такой сильный сигнал... или более сильный (и именно об этом или более сильной части и идет речь в последних двух абзацах). И это ваше p-значение. На самом деле речь идет об ошибке, когда вы говорите, что видели сигнал, когда на самом деле эти данные иногда появляются случайно ... учитывая нулевую гипотезу.

Наконец, вы берете вероятность, вычисленную сверху, и находите отсечение по z-показателю, хвостом которого является эта вероятность. И затем вы сообщаете, что z-оценка в «единицах» о .

Дело в том, что такой стандарт может снизить частоту того, как мы сообщаем друг другу об открытиях, которые на самом деле были просто шумом. А у физиков довольно высокий стандарт (по сравнению с p-значениями 0,05 или 0,01).

Может кто-нибудь дать точный расчет вероятности получения ложной тревоги "=" 1 / 200 , 000 лет до 5.1 о ?

Интуитивно вы смотрите на теорию, чтобы идентифицировать вещи, называемые сигналами. А затем посмотреть на детекторы, чтобы узнать, как часто детекторы дают результаты, которые выглядят как эти сигналы только из-за шума. Таким образом, необходимо знать, как выглядят сигналы и как детекторы реагируют на шум. И то, и другое вам следует знать, если вы разрабатываете детектор. Ни один из них не будет простым расчетом. Теория требовала множества очень долгих и нудных вычислений, часов машинного времени. Шум также трудно вычислить, поскольку они используют так много вещей, чтобы уменьшить шум. Они буквально скорректировали работу рычагов, чтобы отрегулировать шум, чтобы в некоторых областях было меньше шума, чем энергия нулевой точки, производимая естественным образом.

Но у вас есть набор сигналов и модель реакции детектора на шум. Скорость (во времени), с которой детектор генерирует (из шума) результаты, похожие на сигналы, будет зависеть от длины различных сигналов. Короткий сигнал может появляться много раз за период в 200 000 лет. Более длинный сигнал имеет меньшее количество раз.

Это не простой расчет, когда у вас много разных сигналов, разной длины и разной формы. Вы не можете просто посмотреть на это на столе. Вы можете найти p-значение для z-показателя в таблице. Но преобразование в скорость во времени будет зависеть от того, как часто машина переводится в режим сбора данных и сколько времени требуется для сбора возможных сигналов, когда машина включена.



Чтобы разобраться с подтекстом. Если вы сидите сложа руки и не сообщаете 5 о результат, то вам не следовало строить свой детектор. Это не означает, что какая-либо конкретная альтернатива нулевой гипотезе верна. Это означает, что это согласованный стандарт о том, когда сообщать о своих результатах.

Он разработан, чтобы не было слишком много отчетов о вещах, которые являются просто шумом.

Спасибо, я хотел убедиться, что правильно интерпретировал это, потому что, как я уже упоминал, я видел некоторые комментарии, которые, казалось, предполагали обратное. Основная проблема с p-значением заключается в том, что очень маловероятно, что сигнал возникает из-за фона, но обнаружение слияния BH-BH (которое, как мне сказали, является единственной альтернативой, кроме заговора, выдвинутой до сих пор) также может быть маловероятно, учитывая то, что было известно об этих событиях заранее. Для протокола, учитывая мой нынешний уровень знаний, я считаю весьма вероятным, что это была гравитационная волна из-за слияния ЧД и ЧД.