Почему бы нам не защитить существующие процессоры от радиации, а разрабатывать новые?

Я только что прочитал эту статью о процессорах космического класса [1] .

Я вообще не специалист по космосу , но у меня возник естественный вопрос:
почему мы не предпочитаем экранировать ЦП, разработанные для Земли (гораздо менее дорогие), чем разрабатывать совершенно новые радиационно-стойкие ЦП?

PS: Я прочитал некоторые вопросы здесь, но никто не говорит об этой стороне вопроса.


[1] https://arstechnica.com/science/2019/11/space-grade-cpus-how-do-you-send-more-computing-power-into-space/

Кстати, это крутая статья, там много истории.
Подавляющее большинство космических лучей, падающих на компьютер, просто проходят сквозь него. Крошечная фракция наносит урон. Аналогичная проблема с экранированием. Большинство космических лучей, падающих на слой свинца толщиной в пару метров, просто проходят насквозь. (Это обман с моей стороны, свинец плохо защищает от космических лучей.) Алюминий, вода и жидкий водород гораздо лучше. Все, что нужно, — это мегатонна этих материалов, чтобы обеспечить адекватную защиту крошечного компьютера. Такое количество защиты означает, что запуск невозможен.
Никаких доказательств исследований. Различные qns под тегом космического излучения проливают свет на эту область, например, space.stackexchange.com/questions/388/…
@ andy256: andy256: проливает ли это свет на то, насколько чувствительны к излучению современные процессоры, изготовленные по 10-нанометровому техпроцессу? С такими небольшими функциями не требуется много паразитного заряда, чтобы перевернуть бит где-то (например, в кеше, где все данные «драгоценны». Или даже в таблице распределения регистров для процессора с неупорядоченным исполнением, что приводит к инструкциям). получение неправильных входных данных, пересылаемых им.Или, возможно, другие битовые ошибки могут полностью остановить ЦП (ROB думает, что он не выполняется и не может уйти в отставку, но он уже покинул планировщик, поэтому никогда не будет выполняться. Отставка останавливается навсегда)
(Поэтому, очевидно, вам нужна какая-то надежная система сторожевого таймера, которая перезагружает компьютер, если он периодически не подключает какое-либо оборудование. Ошибки блокировки могут быть менее серьезными, чем необнаруженные ошибки поврежденных данных.)
@PeterCordes Именно из-за такого пассивно-агрессивного ответа я больше не провожу время в стеке.
@andy256: я не собирался делать это пассивно-агрессивным. После быстрого просмотра этой ссылки (и поиска по слову «ЦП») я не увидел ничего, что проливало бы свет на то, сколько экранирования потребуется компьютеру. Я спрашивал на случай, если я пропустил что-то, имеющее отношение к защите процессоров; даже после прочтения (очень хорошей) статьи Ars Technica совсем не очевидно, какой уровень защиты потребуется для стандартного ARM Cortex A53 (основа для HPSC). Затем я увлёкся разговором об архитектуре ЦП, что является основной причиной, по которой я трачу время на SO. Этот Q выглядит хорошо для меня.
@RonJohn: Конечно, они подумали об этом. Поскольку они этого не делают, должна быть причина. Объяснение этой причины (например, что космические лучи высокой энергии могут проникать через значительную защиту и создавать в процессе поток частиц с более низкими энергиями) является предметом этого вопроса, я полагаю, более подробно, чем «это было бы не работаю».
@PeterCordes, если бы ОП хотел знать, зачем нам нужно отправлять защищенные от радиации чипы в космос, он спросил об этом. Но говоря: «Почему бы нам не экранировать существующие процессоры?», он довольно откровенно подразумевает, что экранирование — это очевидный ответ.
@RonJohn: Я все еще думаю: «Почему именно экранирование не работает?» — справедливый вопрос. Ответ «потому что он должен быть слишком толстым/тяжелым, чтобы его хватило» — это ответ, независимо от уровня детализации, в который вы хотите углубиться. И/или что экономия этой защитной массы с защищенным от радиации процессором стоит затрат, потому что масса = $.
@PeterCordes Q должен, по крайней мере, признать, что эксперты в этой области подумали о проблеме и выбрали, казалось бы, нелогичное решение.
Смутно похоже на физику : физика .
@DavidHammen «Большинство космических лучей, падающих на слой свинца толщиной в пару метров, просто проходят насквозь». из этого ответа : «Для снижения излучения в 1000 раз до 10-сантиметрового куба потребуется около половины мм свинца, что в сумме составит около 250 г». РЕДАКТИРОВАТЬ: комментарии, кажется, противоречат этому. Есть у кого реальные цифры?
@ andy256 andy256 Комментарии, на которые вы ответили, похоже, не содержат даже намека на пассивную агрессию по отношению ко мне. Напротив, они кажутся хорошо продуманным противоречием вашему предыдущему комментарию. Простое сомнение в чьем-то утверждении о чем-либо не означает, что оно является пассивно-агрессивным.
@JollyJoker Эти комментарии, похоже, основаны на серьезном непонимании того, от чего вы пытаетесь защититься. Бывают ситуации, когда довольно скромная защита весьма эффективна (ваш эпидермус, например, достаточен для защиты от внешних источников распада альфа), но здесь угрозы гораздо более проникающие.
@RonJohn написал: «Q должен хотя бы признать, что эксперты в этой области ...» - но OP написал: «Я вообще не эксперт». ОП подразумевает, что решение, вероятно, приняли более знающие люди. Тем не менее, это признание в основном не имеет отношения к заданному вопросу.
@ andy256 andy256 Я считаю, что ваш стиль комментариев гораздо более воинственный и агрессивный, чем тот, на который вы ответили. Действительно, два ваших комментария содержат разглагольствования о том, как вы тратите свое время впустую, что этот сайт не стоит посещать и т. д. Я нашел другой комментарий гораздо более обдуманным и основанным на фактах. Вы можете полностью не согласиться с поднятыми там вопросами, но если мы заставим замолчать всех, с кем не согласны, этот сайт будет бесполезен. Я вообще не считаю вашу аналогию с "битьем жены" полезным сравнением.
Этот вопрос специально задавался о защите в миссиях «Аполлон», однако ответы содержат много полезной информации, которая полезна в этом вопросе, включая некоторые контринтуитивные аргументы о том, что иногда лучше не защищать, чем защищать слишком мало. (по крайней мере для людей)

Ответы (3)

Потому что защита от радиации тяжелая, а вес — враг для доставки вещей в космос.

Процессоры довольно чувствительны к излучению, а некоторые виды излучения (космические лучи) не только достаточно хорошо проникают в большинство вещей, но и вызывают каскад вторичного излучения. Защитить устройство от любого проникающего излучения — непростая (легкая) задача. В какой-то момент перепроектирование ЦП, чтобы сделать его устойчивым к нескольким ударам, является более экономичным, поскольку вам не нужно исключать какое-либо событие переключения битов, если вы терпимы к 1 за цикл.

Несколько дополнительных мыслей:

  • Часть расходов связана с одноразовым характером космического оборудования и необходимостью тестирования и т. д. Даже если бы ЦП можно было производить бесплатно, к тому времени, когда он прошел летные испытания и был доставлен из BAE, он был бы большим. баксов.

  • Новая архитектура ЦП — не единственный способ сделать чипы менее чувствительными. Например: «Один из способов использования более быстрых потребительских процессоров в космосе — просто иметь в три раза больше процессоров, чем вам нужно: три процессора выполняют одни и те же вычисления и голосуют за результат. Если один из процессоров делает радиационно-индуцированное ошибка, два других все равно согласятся, таким образом выиграв голосование и дав правильный результат.». Это подход, используемый программой НАСА «Экологически адаптивные отказоустойчивые вычисления» или «EAFTC». Компьютеры EAFTC служат той же цели. Однако они по-прежнему не считаются такими же надежными, как специализированные радиационно-стойкие процессоры. Ожидается, что эти или подобные системы будут использоваться для снятия части нагрузки с радиационно-стойких процессоров. Хотя я не знаю, каков этот статус.

Можете ли вы дать мне несколько цифр? например, «вес» для защиты устройства; во-вторых, по той же причине (вес) космонавты менее/более защищены, чем приборы?
@mattia.b89 астронавты в какой-то степени устойчивы к радиации. В нашей ДНК есть некоторые механизмы коррекции копирования, и если клетка повреждена без возможности восстановления, в большинстве случаев она просто покончит с собой. Этого достаточно для низкого уровня радиации, с риском случайного рака, конечно. Земной ЦП не имеет ни одного из этих механизмов, поэтому любой космический луч может непредсказуемым образом испортить вычисления. Таким образом, дозировка, подходящая для человека, не подойдет для типичной электроники. Экранирование, как правило, одно и то же: слои полиэтилена.
@Davidmh: Большинство основных процессоров используют ECC (коды исправления ошибок) в своих кешах, обычно с 32- или 64-битной детализацией. (Забавный факт: кэш данных L1 Intel (по крайней мере, в некоторых uarches) использует только контроль четности, а не ECC, как L1i/L2/L3, поэтому они могут поддерживать эффективные однобайтовые и невыровненные хранилища без цикла RMW). ECC для основной памяти также возможен (и обычно используется на серверах). Это, конечно, не полное решение, а только SECDED (исправление одиночной ошибки, двойное обнаружение). Ячейки SRAM также используют больше транзисторов, чем минимум, поэтому они могут работать более стабильно при очень минимальном напряжении.
@mattia.b89 (относительно веса): трудно сказать с уверенностью, потому что нет конечной точки для того, чтобы быть «безопасным», даже на Земле случаются события с переворотом бита, просто они очень редки, и снижение уровня радиации до уровня поверхности земли было бы непомерно высоким. : тонны, а может и десятки тонн. Однако память ECC, не говоря уже о системе голосования, может означать гораздо меньше, чем необходимо, для достижения радиационно-стойкой надежности.
@mattia.b89 (О людях): Есть те, кто может рассказать вам намного больше, чем я в этих краях, но: на данный момент они очень похожи, например, защищены (порядком 2,5 мм алюминия для МКС ). Разница в том, насколько восприимчивы и к каким типам излучения. Для людей долгосрочное воздействие является реальным риском, для процессоров это вероятность того, что неверный расчет будет использован для чего-то критического.
Я недавно был на семинаре, где инженеру, специалисту в этой области, задали именно этот вопрос, и он ответил именно так. Мы просто не знаем способа защитить процессор, который даже отдаленно правдоподобен по весу.
@ mattia.b89: в случае готового компьютера, если один единственный транзистор разрушен или если один единственный бит перевернут, программное обеспечение обычно дает сбой или выдает неправильные результаты. В случае человека смерть одной клетки не имеет существенного значения, клетки умирают и размножаются все время. Люди обладают гораздо большей избыточностью, чем компьютеры.
@mattia.b89 Ответ на то, как астронавты переносят радиацию, которую они получают во время миссии в дальний космос, звучит так: «Мы никогда не пробовали» nasa.gov/feature/goddard/…
@mattia.b89, я не могу назвать вес защиты, но могу назвать цену: 3000 долларов за кг на борту Falcon 9, и вам потребуется несколько килограммов защиты на чип.
@Mark На самом деле это кажется очень дешевым. Вы уверены, что где-то не пропало несколько нулей?
@Voo Похоже, он может быть прав. В этой статье говорится, что Falcon 9 может поднять полезную нагрузку за 2700 долларов за кг, в отличие от шаттла за 54 500 долларов за кг.
@Cort Это впечатляет, как дешево мы можем отправлять вещи в космос в наши дни. Цена в 50к больше соответствовала моим ожиданиям. Удивительный.

Вы действительно задаете очень хороший вопрос. И ответ таков: мы делаем и то, и другое, в зависимости от потребностей.

НАСА стремится к сверхнадежности, а радиационно-устойчивые компоненты более надежны, поэтому они предпочитают именно этот путь. Однако многие коммерческие спутники используют компоненты некосмического класса, которые слегка экранированы, а программное и аппаратное обеспечение построено таким образом, чтобы два процессора могли выполнять один и тот же расчет, и если они получают разные результаты, они пересчитывают его. Для памяти распространенным способом является использование тройной избыточности, когда память хранится 3 раза в разных микросхемах, а ответы сравниваются. Наиболее чувствительные и важные компоненты по-прежнему обычно устойчивы к радиации, но это относительно небольшое подмножество компонентов спутника, поэтому для подъема тяжелых грузов можно использовать более чувствительный к радиации и гораздо менее дорогой компонент.

Бросив грубую и готовую математику на вопрос, буду рад, если кто-нибудь с реальными цифрами поправит его.

Закалка увеличивает уровень радиации для срабатывания ошибок на несколько порядков, назовем для этого 1000.

Уменьшение радиации в 1000 раз до 10-сантиметрового куба потребует примерно полмм свинца, что в сумме составит около 250 г. Большинство компьютерных модулей крупнее и имеют более неуклюжую форму, чем пара килограмм экранирования.

Таким образом, экранирование было бы достижимо, но потребовало бы инструмента или резервного элемента в окончательной конструкции.

Что, возможно, упущено из этого, так это то, кто на самом деле заплатил за защищенный от радиации ЦП и сколько стоило бы тестирование экранированного, но обычного ЦП. Закаленные процессоры в основном рождаются из военных расходов, а не из-за освоения космоса (чтобы НАСА не получило сэкономленных денег), и поставляются с большим количеством документов, в которых указано не только радиационное упрочнение, но и «бесплатное» упрочнение от экстремальных температур и вибрации.

Стандартный ЦП необходимо будет поместить в радиационно-стойкий корпус, а затем подвергнуть соответствующим испытаниям перед запуском. Это, вероятно, потерпит неудачу, и его нужно будет несколько раз перепроектировать и повторно протестировать, чтобы все было правильно. Таким образом, окончательная стоимость, вероятно, будет дешевле, но может оказаться намного выше или даже задержать вещи настолько, чтобы пропустить окно запуска, и это будет неизвестно во время планирования. Где радиационно-упрочненный блок будет известным количеством с точки зрения цены, веса и мощности с самого начала процесса проектирования.

Так что вполне возможно, что если вы создаете семейство спутников LEO, где вы можете позволить себе отказ первой пары, и распределяете стоимость тестирования на остальную часть семейства, это может сработать, и на самом деле многие спутники текущего поколения (особенно кубические / малые спутники) иди по этому пути.

Если вы проектируете космический зонд с бюджетом в полмиллиарда долларов и летите в течение десятилетий, то обмен пары миллионов на достаточный вес, чтобы добавить еще один датчик, начинает выглядеть лучше. Особенно, если вы можете получить компьютеры по цене ниже билета и назвать это исследовательским/пропагандистским проектом для агентства, которое их разработало.

Так что это математика, которая может идти в любом направлении, в значительной степени в зависимости от деталей.

Я не думаю, что математика (ы) для этого совершенно правильна. 0,5 мм свинца недостаточно для предотвращения битовых ошибок в типичном процессоре в глубоком космосе. Из любопытства, откуда вы взяли коэффициент 1000. Я видел это только в контексте общей дозы облучения, вызывающей долговременный ущерб, а не эффектов единичного события.
Согласитесь, что математика неверна в нескольких разных направлениях, и я буду рад либо удалить, либо обновить сообщение, если у кого-то будут лучшие цифры, чем на первой странице результатов поиска. Существует десять отличий в зависимости от того, из чего состоит ваше излучение (частицы или чистое электромагнитное излучение), расстояния (закон обратных квадратов) и точной природы вашей электроники, но наблюдаемые результаты (кубспутники и марсианские зонды) предполагают, что оба варианта могут быть реализованы. работать до тех пор, пока вы принимаете затраты/ограничения.
Безусловно, в космосе используются не столь сильно защищенные от радиации устройства. Как вы правильно заметили, не все пространство одинаково (основное различие находится внутри или вне земной магнитосферы). Однако это не главный фактор в необходимости радиационного упрочнения. Простой ASIC без сохранения состояния, производящий данные, должен выдержать только дозу радиации. Аномалии могут быть отфильтрованы на Земле при получении данных. Однако центральный процессор, который управляет чем-то важным, не должен ошибаться. Это не значит, что вы никогда не сможете использовать устройства, не защищенные от радиации, просто вы не всегда можете это делать.
Re Снижение радиации в 1000 раз на 10-сантиметровый куб потребовало бы примерно полмиллиметра свинца . включая протоны, дейтроны и альфа-частицы, разрушают также следовые количества очень разрушительных более тяжелых ионов). Эффект полмиллиметра свинца на самом деле хуже, чем полное отсутствие экранирования из-за вторичного излучения. Но, по крайней мере, полмиллиметра свинца — это не так плохо, как пять миллиметров свинца, что примерно в два раза хуже, чем полное отсутствие экранирования.
Свинец хорошо блокирует рентгеновское и гамма-излучение, но карликовая желтая звезда не представляет серьезной угрозы. Ключевыми угрозами являются солнечный ветер, пик которого приходится на солнечный максимум, и галактические космические лучи, пик которых приходится на солнечный минимум. Свинец — настолько плохой выбор против протонов и более тяжелых ядер, что он включен в исследования только в целях сравнения.