Набор данных для машинного обучения звездной классификации MK

Я хотел бы создать программу для автоматической звездной классификации Моргана-Кинана с использованием машинного обучения. Для этого мне нужен набор звезд с известной абсолютной величиной, температурой и типом светимости (0, Ia, Ib, ..., VII). Я нашел несколько наборов данных (например, kaggle.com ), однако они содержат всего несколько сотен звезд, и представлены не все типы звезд.

Существует ли какой-либо достаточно большой набор данных (не менее 1000 звезд), в котором представлены все типы звезд, от гипергигантов до карликов, и со всей упомянутой информацией?

Ответы (1)

Я знаю, что есть каталог XHIP через VizieR , и вы можете ввести диапазон в UMag (или B- и V-диапазоне), например -20 .. 20, . Установите флажки SpType и Tc, чтобы получить также спектральный тип и температуру (дважды проверьте литературу на наличие необходимых величин)

В столбце слева под названием Preferences установите максимальное количество на неограниченное (это количество данных), а в поле чуть ниже указан формат для загрузки данных, если вы хотите *.csv, выберите CDS Portal и нажмите Submit .

Вы будете перенаправлены на портал CDS и просто нажмите « Сохранить » , а затем «Мои данные» , он покажет вам список сохраненных вами наборов данных, и вы сможете выбрать формат своего файла (csv, fits и т. д.), а затем загрузить.

С простым диапазоном абсолютной величины V от -20 до 20 вы получите более 100 тысяч звезд.

Отредактировано: я заметил, что загрузка данных через портал CDS дает вам не количество, которое вы проверяете, а какое-то фиксированное. Может быть, я могу предложить выбрать ascii text/plain , а затем загрузить страницу.

Спасибо, это именно то, что я искал.