У меня есть два распределения Гаусса со средним значением и дисперсией ) и . Затем я получаю ряд значений со средним и дисперсией .
Предполагая, что есть равные шансы, что были сгенерированы из первого или второго гауссиана (и всех были сгенерированы из одного и того же дистрибутива), как я могу определить — или даже количественно — какой из двух дистрибутивов, скорее всего, был источником?
(В случае, если я разделываю терминологию: у меня есть распределение для событий типа A и распределение для событий типа B, и я получаю неразмеченный набор данных - я хочу определить, более ли вероятно, что это данные событий события типа А или события типа Б).
Если вы считаете, что ВСЕ новые данные исходят именно от одного из двух, вы можете попробовать проверить гипотезу. Для отдельных точек данных вы можете проверить «Дискриминантный анализ».
Вы можете попробовать применить окно Парцена-Розенблата на своем дистрибутив и сравните его с исходным дистрибутивом.