Можно ли восстановить исходный контент из отредактированного файла изображения?

Хорошо, возможно, здесь случайный вопрос, но тот, который имеет отношение к сайту и касается горячей темы в настоящее время: конфиденциальность.

Если я загружаю файл изображения (в моем случае фотокопию документа в формате PNG, который содержит некоторые личные данные) в Gimp и «заполняю» черным цветом (т. е. как бы редактируя) области изображения, содержащие конфиденциальную информацию, и Затем я перезаписываю исходный файл. Можно ли каким-либо образом восстановить исходное нетронутое изображение? Например, низкоуровневый битовый анализ или...?

Если да, то какие инструменты и методы стоят за этим, и как я могу смягчить это? Это простой случай не перезаписывать оригинал, а просто создать новый файл с изменениями?

Хотя это интересно, я изо всех сил пытаюсь понять, как это относится к фотографии.
Учитывая ответ mattdm, я думаю, мы должны оставить это в силе.
Тогда вопрос, вероятно, необходимо отредактировать, чтобы отразить применимость к фотографии, как она применяется здесь.
Этот вопрос кажется не по теме, потому что он касается обработки и восстановления данных, а не фотографии. Далее речь идет об обработке данных и восстановлении отсканированных документов, содержащих информацию в виде слов и цифр, а не в виде фотографий.
@Michael: Действительно, все правильно. Тем не менее, ответы действительно важны, и ответ mattdm превосходен. На самом деле не в наших правилах радикально менять содержание вопроса, поэтому я лично предпочел бы, чтобы мы оставили его в покое, несмотря на то, что он не по теме.
Вот краткая статья об отмене эффекта вращения для поимки подозреваемого преступника — boingboing.net/2007/10/08/untwirling-photo-of.html — но, поскольку ваш вопрос касается покраски в черный цвет, это не является ответом.
Если вы долго думали над этим вопросом и специально задали его на сайте вопросов и ответов, то это вовсе не «случайно». Вот если бы у вас была куча вопросов в шапке и вы просто залезли и вытащили один, это было бы случайным.

Ответы (3)

Как написано, это граничит с оффтопом. Но ответ может быть применим и к фотографии, например, если фотографировать в зоне боевых действий, где узнаваемые лица могут быть опасны для объекта.

Чтобы ответить на него, мы должны рассмотреть две вещи.

Во-первых, способ хранения информации в файле изображения. Как правило, каждый пиксель просто представлен тройкой значений для красного, зеленого и синего. Смешанные вместе, это дает цвет. Если вы измените значение пикселей в определенной области на 0, вы затемните их, и исходная информация исчезнет. Итак, это довольно безопасно — если это все, что содержит ваше изображение. Многие форматы изображений также включают невидимые метаданные — информацию о камере, с помощью которой была сделана фотография, и, возможно, такие вещи, как теги местоположения. С ними нужно разбираться отдельно. Кроме того, некоторые форматы изображений сохраняют несколько слоев и могут даже включать историю отмен — сюда входят PSD-файлы Photoshop и файлы XCF Gimp. (И, возможно, некоторые файлы TIF.) Если вы экспортируете в PNG или JPEG, у вас, вероятно, все в порядке.

Во-вторых, подумайте о том, как вы редактируете свою фотографию. Если вы используете инструмент рисования и заменяете пиксели, как указано выше, это довольно безопасно, потому что вы добавляете новую информацию и уничтожаете старую. Если вы используете какой-то фильтр мозаики или размытия, который берет существующие пиксели и преобразовывает их, на самом деле возможно, что умный реверс алгоритма может вернуть больше информации, чем кажется возможным. Итак, не делайте этого.

Если вы уверены, что замаскировали пиксели, используя безопасный подход, но немного не уверены, что сам файл безопасно «очищен», взгляните на Какие инструменты существуют для удаления метаданных с фотографий? , что дает несколько хороших подходов. (Лично я использую jhead -purejpg.)

Хороший ответ. Не говоря уже об удалении оригинальной миниатюры в рамках очистки метаданных. Не могу вспомнить где, но я знаю, что это была проблема с конфиденциальностью по крайней мере для одного человека, который попал в новости из-за того, что не сделал этого.
Но будьте осторожны с изображениями с прозрачностью — они добавляют дополнительный альфа-канал (непрозрачность). В зависимости от того, как было сделано изображение, могут быть данные в RGB прозрачных областей, которые вы не можете видеть из-за прозрачности, но они могут отображаться, если отображаются чем-то, что не поддерживает прозрачность (или вы редактируете изображение, чтобы увеличьте непрозрачность в этих областях).
Некоторая информация также может быть восстановлена ​​из других частей изображения. Например, объекты в отредактированной части изображения также могут отражаться в других объектах. Точно так же свет, отраженный объектами в отредактированных частях, может окрашивать неотредактированные части, давая хотя бы некоторое представление о том, что находится в затемненных областях.

Вы не сможете восстановить закрытые части изображения, но, возможно, вы сможете найти предыдущую версию.

Если вы используете Windows, вы можете щелкнуть правой кнопкой мыши содержащую папку и выбрать предыдущие версии. Вы можете найти версию там в зависимости от того, когда запускается ваша теневая копия и как долго вы оставили ее перед редактированием изображения.

Спасибо за ваш ответ. В этом случае меня беспокоит только то, что после того, как я отредактировал определенные части фотокопии изображения и перезаписал исходную нетронутую версию файла, после отправки по электронной почте этого отредактированного PNG кому-либо они не смогут использовать какие-либо инструменты. чтобы «угадать» то, что было вычеркнуто. Вы говорите, что это так, верно (поскольку никто, кроме меня, не имеет доступа к папке/теневой копии)?

В дополнение к ответу @mattdm я хотел бы добавить еще одну точку зрения. Если вопрос касается только восстановления данных с изображения, которое вы кому-то отправили или где-то загрузили, то приведенные ответы являются правильными и достаточными.

Но также рассмотрите возможность восстановления исходных данных с физического запоминающего устройства, например жесткого диска, USB-накопителя, SD-карты и т. д.

1) Перезапись файла не означает, что он физически перезаписывается на устройстве.

2) Даже если он перезаписывается физически, одного раза может быть недостаточно.

Согласовано. Есть ответ на этот вопрос, связанный с обработкой изображений, и ответ на этот вопрос, связанный с судебной экспертизой. Судебно-медицинский ответ на этот вопрос становится очень сложным.
Если файлы записываются на твердотельный накопитель, вполне вероятно, что данные из исходного образа останутся в покое и не будут перезаписываться в течение нескольких недель. (Твердотельные накопители каждый раз записывают свои данные в разные части твердотельной памяти, поскольку память изнашивается по мере использования. Вероятно, эксперт сможет найти исходное изображение.)
Магнитные носители также могут записывать новые версии файла в другое физическое место на диске и оставлять оригинал нетронутым, хотя они также могут записывать данные обратно в то же самое место или в смесь новых и старых частей диска. Однако специалисты могут анализировать магнитные данные на накопителе и могут извлекать исходные данные даже после того, как они были перезаписаны новыми данными.