Справочный запрос на экспериментальные данные реального мира [закрыто]

Я всегда удивляюсь, как физики-экспериментаторы время от времени открывают новые частицы, размеры/свойства/масса/заряд которых на несколько порядков ниже, чем у всего видимого/осязаемого. Так что, как это делают инженеры, я думаю, они также настраивают чрезвычайно сложное оборудование и проводят довольно сложные эксперименты и измеряют некоторую физическую величину, скажем (извините меня, если мой пример неудачен) напряжение или напряженность магнитного поля или что-то еще, зависящее от экспериментальная установка. Теперь они сравнивают это измеренное изменение напряжения с ожидаемым теоретически, а затем переходят к доказательству гипотезы. (Это самое сложное, что я мог себе представить).

Теперь мой запрос заключается в том, где я могу найти набор данных (предпочтительно непрерывное изменение одного физического параметра по отношению к другому... можно отбирать с достаточной частотой дискретизации) вместе с контекстом эксперимента (как можно меньше, но достаточно) так что я могу выполнить некоторую обработку данных по-своему, чтобы я мог проверить гипотезу или что-то в этом роде. Проще говоря, мне нужны действительно крутые данные реального мира (в виде сигнала).

Есть ли такая вещь в Интернете или где я могу найти ее? Пожалуйста, предложите мне что-нибудь, что связано с обработкой сигналов.

Викификация, так как на этот вопрос нет единственно правильного ответа.

Ответы (4)

Обновление: апрель 2016 г. Совместная работа CMS сделала около 300 терабайт данных LHC (а также инструменты и учебные пособия, необходимые для понимания всего этого) в открытом доступе . Данные реконструируются на уровне треков частиц, поэтому на самом деле они не являются необработанными, но еще многое нужно знать, чтобы эффективно использовать эти данные.


Необработанные данные современных экспериментов по физике элементарных частиц имеют размер в несколько терабайт (даже петабайт) и довольно сложны.

Для экспериментов на коллайдере детекторы представляют собой составные многоуровневые устройства с тремя или более различными технологиями, используемыми пятью или более отдельными подсистемами, плюс вспомогательный мониторинг производительности детектора, температурных и влажностных условий в экспериментальном зале, данные о состоянии предоставляются эксплуатационной бригадой ускорителя. луча, и так далее и тому подобное. Существуют десятки тысяч отдельных детекторных каналов и сотни «медленных» устройств (таких как термометры, магнитные токи, мониторы тока пучка и т. д.). Все это было предварительно отфильтровано триггерным оборудованием (и то, какая именно фильтрация применялась, меняется со временем).

Для нейтринных экспериментов данные представляют собой подробную информацию о заряде, обнаруженном фотоэлементами (некоторая комбинация общего заряда в окне, пикового напряжения, времени пика, времени начала и/или оцифрованных форм волны) для сотен или тысяч ФЭУ. Плюс мониторинг окружающей среды, подобный тому, что делают люди с коллайдера.

В обоих случаях есть множество калибровочных данных, изменения рабочих условий в течение всего периода сбора данных, а иногда и замена или повторная настройка подсистем на полпути.

Обычно существует много десятков тысяч строк пользовательского компьютерного кода для открытия и обработки файлов данных. Код, написанный физиками. Теперь физики элементарных частиц немного более профессиональны в кодировании, чем некоторые из их коллег, но это не означает современный процесс и красивый код.

Обычно требуется много тысяч часов аспирантов и докторантов, чтобы свести это к чему-то, из чего можно извлечь физику.

Есть причина, по которой мы называем это «Большой наукой».


Тем не менее, вы обычно можете получить данные . В конце концов. (Каждая совместная работа будет удерживать их некоторое время, чтобы гарантировать, что они опубликуют их первыми.)

Как вы его получите? Просто спроси.

Но вам придется предоставить собственное хранилище (и, возможно, оборудование для копирования); прийти туда, где хранятся данные; понимать, что документация будет разбросана по сотням или тысячам внутренних (сотруднических) документов, написанных по мере их появления разными авторами, некоторые из которых владеют английским как вторым или третьим языком (и могут свидетельствовать о некоторых особенностях); и что помощь в интерпретации всего этого будет краткой, поскольку эти люди ушли дальше и заняты другими проектами. И вам, возможно, придется убедить людей, располагающих данными, в том, что у вас есть возможность ими управлять.

Я не уверен в доступности частично обработанных наборов данных, но вы можете попробовать спросить и об этом. Худшее, что может случиться, это когда вам скажут «Нет». Но даже если вы можете получить это, не воображайте, что с ним легко работать.


Если я вас не разубедил, позвольте предложить практический метод для начала. Пойдите в ближайший университет, в котором есть группа ядерной физики или физики элементарных частиц, и попросите помочь. Действительно. Всегда есть потребность в лабораторных обезьянах, и вы будете учиться по ходу дела, потому что вы не сможете выполнять работу, если они ничему вас не научат.

В процессе вы будете

  1. Узнайте, как работают некоторые подсистемы. Почувствуйте, какие необработанные данные они возвращают и как они преобразуются в менее необработанные данные. Если вы спросите, люди расскажут вам, как менее необработанные данные могут быть преобразованы в информацию, более похожую на физику, и в конечном итоге реконструированы в частицы.
  2. Заведите несколько деловых контактов. Начните говорить : «Я работаю с профессором Смитом и Подунк У». намного лучше, чем "мне интересно". когда дело доходит до доступа к данным.

Уважаемый Раджеш, вам нужны данные, озвученные экспериментаторами, которые использовались для открытия новых частиц. Это просто. Напишите URL-адрес

http://arxiv.org/abs/hep-ex/xxxxxxx

где семь крестов — это случайные цифры — первый должен быть 9 или 0, потому что первые два — это год. Третья и четвертая цифры — это месяц, а последние три цифры не должны быть слишком большими. Вы можете поиграть с ним и найти десятки тысяч статей, подобных описанным вами.

Например, один из них будет

http://arxiv.org/abs/hep-ex/9503003

так получилось, что это статья о наблюдении топ-кварка, самой последней элементарной частицы, открытой в 1995 году.

Я также мог бы дать вам десятки тысяч подобных работ и решений вашей проблемы в области физики конденсированного состояния, химии, биологии, геологии или десятков других научных дисциплин. Вы видите множество решений, поэтому, возможно, ваш вопрос был слишком расплывчатым? ;-)

Пожалуйста, предложите мне что-нибудь, что связано с обработкой сигналов.

По крайней мере, в физике элементарных частиц у вас не будет доступа к этой низкоуровневой информации, которая вам нужна, если вы не являетесь частью экспериментальной группы, которая фактически проводит измерения. Для этого есть много причин, одни политические, другие более физические. Давайте быстро прокомментируем оба.

Прежде всего, для измерения этих частиц требуется много работы, и участники сотрудничества хотят сами использовать данные, прежде чем позволить кому-либо еще взглянуть на них. Таким образом, они не покажут вам необработанные данные, пока не извлекут все, что смогут. «Хорошо, покажите мне данные старых экспериментов», — можете сказать вы. Теперь другая проблема, объем данных просто огромен. Это не то, что вы можете записать на DVD и принести домой или скачать с megaupload.

Что касается более физической проблемы. Вы специально запрашиваете необработанные данные очень низкого уровня. Чтобы преобразовать напряжения в частицы, необходимо использовать множество других предположений. Например, как происходит взаимодействие между частицами и детекторами, как обрабатывается сигнал на детекторах и так далее. Каждый эксперимент буквально тратит годы на понимание этих взаимодействий для разработки программного обеспечения, позволяющего реконструироватьсигнала и проверить их, чтобы узнать, достаточно ли точности этой реконструкции для правильного измерения того, что вы хотите измерить. Ну, даже если вам дадут доступ к необработанным данным, кто может гарантировать, что вы восстановите их должным образом? Люди, измерившие данные, не хотят, чтобы кто-то другой делал неправильные выводы из их работы. Это своего рода научная ответственность. Единственная информация, которая у вас действительно будет сегодня, — это высокоуровневые, уже проанализированные данные, которые можно найти в любой статье (см. ответ Любоша выше).

Есть интересные предложения сделать больше информации общедоступной. Возможно, вы захотите взглянуть на систему Recast . Но что-то подобное для всех экспериментов далеко не факт.

Было проведено несколько повторных анализов данных низкого уровня. Как только приоритет гарантирован, люди более спокойно относятся к доступу, хотя, как вы говорите, они могут потребовать, чтобы вы убедили их, что вы знаете, что делаете.
@dmckee: Большое спасибо за ответы. Знать такие подробности довольно сложно. Но моя потребность не так уж и велика. Я, очевидно, не собираюсь проводить весь процессинг, который очень тщательно делается большими группами, а также это невозможно сделать и убедить их, что я могу, и уверить, что я знаю, что я делаю, и, что не менее важно, даже подумайте о таком. Все, что мне нужно, это сигнал реального мира, желательно из физического мира... чтобы я мог изучить математическую природу сигнала реального мира... Я не собираюсь делать из этого какие-либо физические выводы.
@Rajesh: дайте определение «сигналу». Вы можете прочитать некоторые статьи, которые предлагает Любош, чтобы получить представление о том, насколько разнообразны и абстрактны эти данные. Как физик элементарных частиц, когда я читаю статью о новом открытии, мне приходится размышлять над цифрами и текстом, чтобы понять, что они сделали и почему они считают это важным. Каждый раз.
@dmckee: Сигнал, например, представляет собой изменение напряжения во времени на конце микрофона, которое улавливает колебания акустического давления перед ним. Этот сигнал дискретизируется и оцифровывается с помощью аналого-цифрового преобразователя для хранения, воспроизведения и анализа. Я работаю над обработкой речевых (акустических) сигналов, генерируемых человеком. Мне любопытно посмотреть и поработать с некоторыми сигналами из физического мира, где я изучаю истинную природу сигналов реального мира. Даже такой простой сигнал, как речевой сигнал, очень сложен, и в нем так много необъяснимых вещей.
@Rajesh: Каждая категория детекторов имеет свои характеристики сигнала. Для ФЭУ его одномодальные отрицательные импульсы заряда, для проволочных камер - одномодальные импульсы тока на проводах сбора, но бимодальные на индукционных проводах (где они используются). Германиевые и кремниевые детекторы имеют другой набор характеристик и т. д. Пойдите в местный университет и спросите у профессора ядерной физики или физики элементарных частиц. Скорее всего, у них в лаборатории есть несколько детекторов.

Вы можете загрузить необработанные (или обработанные) данные из различных проектов наблюдательной космологии (например, COBE и WMAP) здесь:

http://lambda.gsfc.nasa.gov/product/map/current/

В качестве проекта вы могли бы использовать это для повторного вычисления знаменитого углового спектра мощности космического микроволнового фонового излучения.