Можно ли восстановить данные на обнуленном жестком диске?

Предположим, что у меня есть современный магнитный (не SSD) жесткий диск, изготовленный в течение последних десяти лет, и на жестком диске находятся единственные экземпляры неопубликованной статьи о дешевом холодном синтезе, написанной ученым, погибшим в пожаре, который сгорела единственная в мире лаборатория холодного синтеза.

дд, если=/dev/ноль из=/dev/sdx

Упс.

Я слышал, что люди говорят, что если вы хотите быть уверены, что данные полностью стерты, вам необходимо:

  1. Используйте случайные данные, а не нули.

  2. Обнулите жесткий диск несколькими проходами, либо 7 («стандартная» практика), либо 35 (для настоящих параноиков).

  3. Сотрите, используя проходы, которые имеют специальные чередующиеся узоры. Предположительно, это либо размагничивает исходный сигнал, либо добавляет достаточно дополнительных шумов, которые вы не можете выделить.

  4. Выполните какое-либо стирание «низкого уровня», которое заставляет головки двигаться по разным шаблонам или приводит к тому, что битовые шаблоны различаются. Для этого требуется аппаратная поддержка.

  5. Поднимите пластины выше их температуры Кюри

Мой вопрос: реально ли восстановить данные с обнуленного диска? Другими словами, оправдано ли использование случайных данных / множественных проходов / и т. д., чтобы похоронить ваши цифровые секреты?

Я понимаю, что " The Great Zero Challenge " (приз 40 долларов США) не был выигран, но гипотетически, если стоимость такого восстановления достаточно велика или секретна, то это спорный вопрос.

Я не понимаю. Утверждение, которое вы хотите, чтобы мы рассмотрели, заключается в том, что «Чтобы безопасно стереть данные, необходимо использовать запись случайных данных ИЛИ многократную запись нуля ИЛИ использовать специальные аппаратные методы». Вы думаете, что может быть достаточно сделать один проход обнуления данных. Это верно?

Ответы (1)

Вкратце: кажется, что плотность данных на жестких дисках увеличилась до такой степени, что восстановить данные с обнуленных дисков невозможно.

Процесс восстановления данных с «обнуленного» жесткого диска основан на концепции остаточного магнетизма. По сути, идея состоит в том, что если вы исследуете накопитель с помощью магнитно-силового микроскопа, то увидите небольшую разницу между битами, которые были равны «1» до того, как они были перезаписаны, и битами, которые были «0». На вики ArchLinux есть интересная справочная информация для интересующихся. Сказав это, этот процесс требует разборки привода в чистом помещении и даже попытки дорогостоящего оборудования.

Ситуация на самом деле еще хуже, рассмотрим Руководство NIST по санитарной обработке носителей [PDF], в котором говорится (выделено мной):

Развитие технологий создало ситуацию, которая изменила ранее существовавшую передовую практику в отношении носителей данных типа магнитных дисков. По сути, изменение плотности дорожек и связанные с этим изменения в носителе данных создали ситуацию, когда действия по очистке и очистке носителей совпали. То есть для дисков ATA, выпущенных после 2001 года (более 15 ГБ), однократная очистка путем перезаписи носителя достаточна для защиты носителя как от атак с клавиатуры, так и от лабораторных атак.

РЕДАКТИРОВАТЬ: Еще одно исследование, подтверждающее вышеизложенное, — « Перезапись данных жесткого диска: великий спор о стирании» (к сожалению, за платным доступом), в котором делается вывод (выделено мной):

Это исследование показало, что правильно стертые данные невозможно восстановить, даже если они имеют небольшой размер или находятся только на небольших участках жесткого диска. Даже с использованием МСМ или других известных методов. Мнение, что можно разработать инструмент для извлечения гигабайт или терабайт информации с стертого диска, ошибочно. Хотя есть хорошие шансы на восстановление любого отдельного бита с диска, шансы на восстановление любого объема данных с диска с помощью электронного микроскопа ничтожны .

РЕДАКТИРОВАТЬ 2: На самом деле неясно, относилось ли приведенное выше резюме к «чистому диску и 1 очистке» или к «чистому диску и 3 очисткам». Я бы склонялся к варианту «это не имеет значения», поскольку они дают шанс восстановить одно 32-битное число с вероятностью около 1,16% даже за один проход. Авторы также утверждают, что никакое значимое количество данных не может быть восстановлено с уровнями достоверности «вне разумных сомнений», что обычно является требованием законодательства в США.

Подводя итог, кажется, что одного прохода достаточно, чтобы очистить диск до такой степени, что его нельзя будет восстановить с помощью современных технологий.

И «незначительные шансы» — это мягко сказано. Вероятность правильного восстановления одного 32-битного слова составляет 1,6%. Следовательно, шансы восстановить 8-значный пароль составили бы 0,0265% (если бы вы знали, где именно он находится!). Восстановление файла размером 1кб ( скажем, любовного письма ) имеет шанс ровно 0 (согласно гугл-калькулятору ). Или, если быть точным, 0,0…256%, где «…» соответствует почти 2000 нулям.
@KonradRudolph Действительно, и пароль также должен быть в виде обычного текста, чтобы это работало. Однако, чтобы быть на 100% правильным, я думаю, что эти вероятности представляют собой получение полностью безошибочной версии; так что вполне возможно, что эта информация может быть использована для вероятностного сужения атаки. Это по-прежнему смехотворно маловероятный сценарий, особенно если учесть, что цифры, которые я привел, относятся к «нетронутому» диску, и, по словам авторов, у «подержанного» диска шансы на восстановление лишь незначительно выше, чем у подбрасывания монеты. .
Мне нравится этот ответ, но вики Arch Linux кажется неуместной цитатой, поскольку она не предлагает никаких аргументов в поддержку своего утверждения и не дает ссылок на дополнительное чтение по этой теме.
@DietrichEpp хороший момент, он был задуман как справочная ссылка, но на самом деле мало что добавил. Я удалил цитату, но оставил ссылку для справочной информации.
@KonradRudolph Я считаю 1,16% для 32-битного слова огромным, а не незначительным. Вероятность восстановления одного бита составляет 87 % (при условии независимости), поэтому даже небольшая избыточность в сообщении может привести к полному восстановлению.
@CodesInChaos Нет, это совсем не следует. Чтобы использовать любую такую ​​избыточность при поиске, вам необходимо иметь некоторую информацию о ее структуре. Кроме того, если вы предполагаете независимость, вы не можете в то же время принять структуру (даже через слова, а не внутри них). Таким образом, единственное, что вы могли бы восстановить, — это избыточность, которой вы обладали до восстановления, другими словами, избыточность без информации.
Документ NIST был заменен документом nvlpubs.nist.gov/nistpubs/SpecialPublications/… , в котором больше нет цитируемого абзаца. Между прочим, вы говорите, что « нельзя восстановить с помощью сегодняшних технологий », но более высокая плотность просто требует более точных инструментов, гонки вооружений, которую правительственное агентство определенно может выиграть.
@nic спасибо за обновление. Новый документ немного более расплывчатый в этом вопросе, но не исключает, что однократный проход достаточно хорош, например: «Для … магнитных носителей один проход перезаписи с … двоичными нулями обычно затрудняет восстановление данных даже если современные лабораторные методы ... попытаться получить данные» и «Шаблон очистки должен быть как минимум одним проходом записи с фиксированным значением данных». Я бы также не стал использовать слово «определенно»; предыдущие документы, казалось, подразумевали прямо противоположное (например, «гонка вооружений» имела тенденцию к необратимости).
Интересно, как они пришли к такому выводу. Неужели действительно очень сложно построить устройство для чтения магнетизма, более точное, чем обычно используемое сейчас? Потому что теоретически, если бы вы знали точный маг. level вы, вероятно, имели бы довольно хорошее представление о том, что это за значение. Насколько я понимаю, затраты и трудозатраты означают, что, насколько нам известно, это никогда даже не пробовали, но трудно представить, почему это было бы так сложно выполнить, если бы вы действительно сосредоточились на этой задаче.
На самом деле цифра «1,6% на слово», по-видимому, получена из предположения, что скорость случайного искажения битов составляет 12% на бит, что просто требует, чтобы исходные данные имели 1/8 битов четности (идентично ECC RAM) для восстановления данных. .