Настоящее шифрование ДНК (или, по крайней мере, затрудняющее декодирование/изменение)

Итак, я владелец стартапа, который облегчит нам жизнь с помощью существ с нестандартной ДНК! Наши несколько первых продуктов продаются очень хорошо, и до событий на прошлой неделе все было в порядке.

Другая компания купила один из наших продуктов и просто расшифровала всю последовательность ДНК, затем изменила несколько вещей и перепродала их как свои собственные, поглотив наш доход. Это довольно плохо для нас, но все же хорошо, потому что мы можем подать на них в суд.

А теперь представьте, что какие-то террористы украли наши вирусы (ничего противозаконного, мы используем их для терапии) и изменили (хорошо разработанный, читабельный) код, чтобы делать какие-то действительно плохие вещи (например, просто убивать для начала — или даже хуже).

Итак, наш план состоит в том, чтобы установить какое-то шифрование! Но это кажется трудно сделать.

Есть ли простой способ настроить шифрование или, по крайней мере, сделать ДНК менее читаемой?

Бонусные баллы за

  • Шифрование РНК тоже
  • Клетки делятся без процесса расшифровки
  • Некоторые вариации ДНК
  • Усложнение поиска белковых последовательностей
Почему процесс не запатентован? Обычно, если у вас есть что-то настолько уникальное, вы регистрируете несколько патентов на свои уникальные процессы, чтобы добраться до этой точки и иметь 20-летнее окно, в течение которого вы можете быть эксклюзивным продавцом своей технологии.
@Anoplexian Хорошо, но вы уверены, что террористы будут беспокоиться о таких вещах, как патенты?
Чем больше вы контролируете, в какой среде разрешено находиться вашему вирусу, и контролируете доступ к этим вирусам, тем сложнее будет террористам. Думайте об этом как о банковской информации. Несколько крутых хакеров-террористов теоретически могут взломать банк и устроить погром, но вместо этого они прибегают к физическим атакам. Тот же принцип, только у них нет причин для этого, и я подозреваю, что корпоративный шпионаж - более серьезная проблема. Имейте в виду, что если бы террористы действительно этого хотели, распространение прионов или болезней было бы лучшим способом уничтожить «неверных».
Вам нужна биоинженерная «молния». Таким образом, репликация ДНК включает в себя расщепление спирали чем-то вроде молнии. Если бы у вас была специальная застежка-молния, вы могли бы разделить ДНК на нити РНК по-другому... но что бы вы ни делали, это будет реверс-инжиниринг.
Как показывают другие ответы, ценна не ДНК, а ВАША документация о том, что делает какой геном, и так далее. И ЭТО, надеюсь, останется секретом компании (и/или патентом). [Это как с софтом: теоретически можно все это декомпилировать, но без исходного кода это бесполезный мусор с малой ценностью]
Мне немного грустно, что первая реакция на успех новой технологии всегда звучит так: «Как мы можем обеспечить монополию на это?», а не «Как мы можем отплатить обществу, которое в первую очередь сделал возможным этот прорыв?» Но если оставить в стороне личные чувства — что именно может сделать, например, ваши вирусы лучшей «базой» для биологического оружия, чем «природные»? Изменили ли вы их таким образом, чтобы облегчить дальнейшую модификацию? Обладают ли они необычными способностями, которые легко использовать?
@Hobbamok Даже реверс-инженер-любитель не согласится с вами ...

Ответы (13)

Не произойдет в обозримом будущем

Позвольте мне сначала показать вам этот XKCD :

Расшифровка ниже

[Белая Шляпа, держа ноутбук, разговаривает с Меган, которая смотрит в свой смартфон.]

Белая шляпа: биология в значительной степени решена. ДНК — это исходный код нашего тела. Теперь, когда секвенировать гены легко, нам просто нужно прочитать это.

Меган: Это не просто «исходный код». Есть масса отзывов и внешней обработки.

[Белая Шляпа, открывая свой ноутбук, идет к столу и стулу мимо Меган, которая протягивает руки.]

Меган: Но даже если бы это было так, ДНК — это результат самого агрессивного процесса оптимизации во Вселенной, протекающего параллельно на каждом уровне, в каждом живом существе, в течение четырех миллиардов лет.

White Hat: Это все еще просто код.

[Белая Шляпа садится за стол с открытым ноутбуком, а Меган заглядывает ему через плечо.]

Меган: Хорошо, попробуйте открыть google.com и нажать «Просмотр исходного кода».

Белая Шляпа: Хорошо, я... О боже.

Меган: Это всего лишь несколько лет оптимизации разработчиками Google. ДНК в тысячи раз длиннее и намного хуже.

Белая шляпа: Ничего себе, биология невозможна .

Что это значит, конкретно к вашему вопросу?

  1. ДНК, кодирующая белок, должна располагаться в определенном порядке. На самом деле нет двух способов закодировать один белок.

  2. ДНК уже настолько сложна, взаимосвязана, нелогична, ее результаты зависят от эффектов совершенно других частей ДНК и так далее (см. статью о некодирующей ДНК , если вам интересно), что все усложнения, которые вы можете намеренно добавить, будут очень, очень незначительно по сравнению с тем, что уже сделала природа. Таким образом, если кто-то сможет взломать то, что сделала природа, ваш дополнительный уровень обфускации на самом деле ничего не изменит.

    2а. Даже для вирусов — если кто-то хочет модифицировать и эффективно использовать их на людях, он должен быть в состоянии расшифровать и понять человеческий геном — вирус будет легко понятен тому, кто обладает такими способностями, с очень, очень ограниченным пространством, которое у вас есть внутри вируса.

ДНК не является «кодом» в каком-либо осмысленном смысле. ДНК — это просто массивная библиотека химических формул белков; ни больше ни меньше. В нем нет решений, в нем нет циклов, нет подпрограмм: все , что у него есть, — это огромный список химических формул белков. ДНК не говорит, что делают эти белки, сколько нужно производить из каждого белка, если таковые имеются, при каких обстоятельствах следует производить каждый белок и при каких обстоятельствах его следует избегать.
@AlexP «огромная библиотека химических формул для белков; ни больше, ни меньше». - ЛОЖЬ. Пожалуйста, прочитайте en.wikipedia.org/wiki/Non-coding_DNA — в основном там есть IFинструкция , например.
Циклические конструкции находятся на один слой выше. Репродукция клеток продолжает повторяться, а белки создают триггеры окружающей среды, которые заставляют операторы ЕСЛИ выполняться по-разному. Какой-то идиот думал, что аспектно-ориентированное программирование — это круто, и наложил на него механическую систему метапрограммирования. Все приложение было встроено в планетарную ОС, которая даже не является стабильной. Никакой сетевой безопасности... любой внешний вирус может перезаписать внутренние приложения. Как будто никто даже не заморачивался над разумным дизайном и просто позволил системе развиваться или что-то в этом роде.
ДНК @AlexP вызывает синтез белков, и эти белки взаимодействуют друг с другом. Эти взаимодействия можно разумно назвать «решениями», «циклами» и «подпрограммами». Сказать, что ДНК не является кодом, потому что на самом деле ничего не делает, это все равно, что сказать, что исходный код, который не был скомпилирован, не является кодом.
@Acccumulation: Разница в том, что ДНК не говорит, как эти белки взаимодействуют ... Более того, взаимодействия между белками на самом деле определяются не самими белками, а клеточным механизмом.
@AlexP Взаимодействие между строками кода на самом деле определяется не самими строками кода, а механизмом, на котором они работают. Вы не идентифицируете какой-либо смысл, в котором ДНК не является кодом, которым являются компьютерные программы.
@Acccumulation: Но исходный код сам по себе указывает, как взаимодействуют строки кода. Он не может заставить их взаимодействовать, но указывает, как они должны взаимодействовать при выполнении. ДНК этого не делает; в нем просто перечислено большое количество рецептов для производства белков, и именно клеточный механизм знает, какие белки нужно производить, а какие нет, сколько их нужно производить, как сбалансировать производство белков, когда их производить и т. д. Можно понять исходную программу, не зная, на какой машине она выполняется; невозможно понять ДНК, не понимая, как работают клетки.
@AlexP Исходный код сам по себе не указывает, как взаимодействуют строки кода. Исходный код — это просто текст. Компилятор и код вместе определяют результат машинного кода, а машинный код вместе с набором инструкций определяет, что делает компьютер. Если вы думаете, что можете понять, что будет делать исходный код, не зная, на какой машине он работает, то вы просто совсем не разбираетесь в компьютерах и вам следует перестать делать заявления о вещах, которых вы не понимаете.
Да, компьютеры в какой-то степени стандартизированы, чтобы делать одно и то же с одним и тем же машинным кодом, но это связано с тем, что компьютерная индустрия решила, что компьютеры должны делать то же самое, а не с тем, что исходный код по своей сути имеет фиксированный результат. «ДНК этого не делает, она просто перечисляет большое количество рецептов для создания белков». Либо вы очень плохо выражаете свои мысли, либо вы очень запутались в том, как работает биология. ДНК не просто говорит клетке , как производить белки, она говорит клетке, какие белки производить.
«ДНК, которая кодирует белок, должна быть в определенном порядке. На самом деле нет двух способов закодировать один белок». Что? Если вы имеете в виду последовательность пар оснований, сгруппированных в кодоны, определяющие аминокислоты, то существует множество вариантов, производных одного и того же белка. Только две аминокислоты имеют один кодон, который их определяет. en.wikipedia.org/wiki/Genetic_code#Standard_codon_tables
ОП спросил, что, если люди украдут свои пользовательские вирусы и «изменят (хорошо разработанный, такой легко читаемый) код», что я интерпретировал как означающее, что пользовательские вирусы имеют генетический код, написанный с использованием лучших практик, существующих в этой вселенной. . Так что это модульная и легко изменить. Это означает, что их существа также написаны очень логично и прямолинейно, и они ищут способ запутать это. Я думаю, что ваш второй пункт игнорирует эту тонкость вопроса.
@Thymine, о котором позже идет речь, вы можете увидеть «Клетки делятся без процесса расшифровки» - так что речь идет не только о вирусах. Кроме того, поиск «полностью синтетической ячейки» в Google показывает, насколько это сложная задача. Даже при минимальном геноме его экспрессия зависит от генов, которые раньше находились в опустевшей клетке...
@Thymine добавил более подробную информацию о вирусах
@AlexP На самом деле это не совсем так. ДНК, даже в биологических условиях, выполняет «обработку» и содержит гораздо больше, чем просто кодирующие экзоны. Хотя это более характерно для РНК (например, странность, которая позволяет кодировать селеоцистеин без кодона для него), это все же происходит с ДНК. На самом деле, большинство генетиков утверждают, что только небольшая часть функционального генетического материала действительно кодирует белок (в отличие от того, что связано с обратной связью и контролем).
Не согласен с вашим пунктом №2. Говоря строго с криптографической точки зрения (я не могу сказать, что знаю достаточно о биографии, чтобы говорить о ее специфике), ваше утверждение в основном путает КОДИРОВАНИЕ с ШИФРОВАНИЕМ. Кодировка запутанная, но понятная. Шифрование, когда оно сделано правильно (а есть способы сделать это правильно), буквально математически невозможно вычислить без ключа. Так что нет, природа дала нам не шифрование, а кодирование. Добавление шифрования по запросу OP (если это будет сделано биологически возможным способом) сделает информацию недоступной без ключа.
@ColonelPanic ваше беспокойство уже было рассмотрено в этом ответе - ключ уже есть. Должно быть, если гены работают. Таким образом, речь идет о поиске связей, а не о математическом воссоздании ключа. Криптографическая сложность ключа не имеет значения.
@AlexP "основной клеточный механизм". Вы имеете в виду те, которые сделаны из белка, который был создан в соответствии с инструкциями ДНК?

Химера.

кошка-химера

https://www.boredpanda.com/chimera-cat-split-face-разные-глаза-gataquimera/

Quimera может быть тем, что известно как генетическая химера, редкое природное явление, при котором особь состоит из клеток, по крайней мере, из двух разных исходных яйцеклеток. Они сливаются вместе, чтобы стать единым организмом, чья ДНК принадлежит двум совершенно разным людям.

Нормальный организм возникает из одной клетки. За исключением соматических мутаций, каждая клетка существа несет один и тот же генетический код. Ваш конкурент может смахнуть волос и расшифровать из него геном.

Химеры, подобные этой кошке, могут возникать в природе. Два яйца сливаются на ранней стадии, и в результате существо представляет собой сбалансированную смесь двух геномов. Геном, расшифрованный из одного волоса, может не совпадать с расшифрованным из другого.

Вы делаете еще один шаг. Все ваши нестандартные существа — это химеры, не из двух, а из многих, многих различных искусственных «яиц». Большинство этих клеточных линий имеют геномы, которые преднамеренно дефектны, и существо, происходящее только из одного из этих дефектных геномов, было бы уродом или нежизнеспособным. Но вместе в вашей химере мутантные гены некоторых клеток компенсируются силой (или просто нормальностью) соседних клеток. Набор клеток, использованных для создания вашей химеры, не случаен — например, у человека может быть высокая популяция определенного мутантного типа в печени, где их избыток белкового продукта может спасти оставшуюся часть организма, испытывающего дефицит этого продукта. Вы бы этого не знали, если бы секвенировали геном украденного волоса.

Вашему конкуренту нужно будет секвенировать множество клеток всего организма, определить, какие части плохие (или они плохие?), а какие хорошие, и надеяться воссоздать множество используемых родословных и скомбинировать их в правильной пропорции для репликации. существо.

Генно-инженерные животные — это старая шляпа — вы можете купить светящуюся модифицированную рыбу в Petsmart. Но создание химеры из сконструированных линий выводит создание существ на совершенно новый уровень научной фантастики.

Будучи творческим ответом, это кажется чем-то очень сложным, но эффективным.
@val - это не супер СФ. Прямо сейчас вы можете вылечить людей от серповидноклеточной анемии с помощью трансплантации костного мозга человека без серповидноклеточной анемии. Человек, у которого раньше была серповидноклеточная анемия, станет химерой с клетками крови одного человека и остальными частями исходного тела другого.
Я чувствую, что этот ответ получает больше голосов, потому что на нем изображен кот...
@afaulconbridge - мне сказали, что Интернет предназначен для двух вещей, и одну из них трудно включить в идею на бирже стека.
@Willk PronExchange? Я иду в Зону 51 прямо сейчас!
О, она такая красивая кошка

Вам не нужно шифровать последовательность ДНК, чтобы другие люди не могли ее использовать.

Молекула ДНК не имеет внутреннего значения, а это означает, что, хотя вы можете различать закономерности, вы никогда не получите всю информацию об организме, просто взглянув на его ДНК.

Позвольте мне объяснить это аналогией с языком. Если бы я дал вам книгу на языке, которого вы не читаете, вы бы не смогли ее понять. Вы знаете, что это книга, и вы знаете, что в ней есть смысл, но вы не можете реконструировать ее, не протестировав. Например, взять предложение и повторить его тому, кто говорит на этом языке, или изменить порядок слов и проверить, оказывают ли они желаемый эффект, когда вы говорите их тому, кто их понимает.

Код, в данном случае генетический код, требует системы декодирования, чтобы содержать значимую информацию. В биологии декодер состоит из многих других частей клетки, включая, помимо прочего, аппарат транскрипции, который транскрибирует ДНК в РНК, аппарат трансляции, который переводит РНК в белки, эпигенетический аппарат, который контролирует, какие области должны быть транскрибированы. , клеточные сигнальные пути, которые модулируют предыдущие системы на основе внешних и внутренних факторов, и так далее.

Итак, все возвращается к яйцеклетке. Это не просто молекула ДНК сама по себе. Это молекула ДНК в очень специфическом клеточном контексте, а в случае многоклеточных животных это также клетка в очень специфическом органном контексте. Человеческая яйцеклетка не может развиваться в вашем мочевом пузыре. У него есть определенные требования, которым (обычно) отвечает матка.

Если у ваших существ есть половое размножение, вы можете сконструировать племенную породу существа, которое рождает стерильное потомство. Чтобы избежать возможности экстракорпорального оплодотворения, вы можете создать у них потомство, не имеющее эквивалента матки, или вы можете систематически выполнять гистерэктомию перед их продажей.

Если вы действительно хотите, чтобы он был невероятно непрозрачным, вам нужно изменить способ работы различных механизмов, о которых я упоминал ранее:

  • Измените стартовые и стоп-кодоны, изменив механизм транскрипции для распознавания различных паттернов. Вам также потребуется изменить последовательность сайта начала транскрипции.

  • Расшифруйте генетический код, заставив различные тРНК соответствовать разным аминокислотам, что заставит потенциальных воров проводить эксперименты, чтобы выяснить, чему соответствует ваша запатентованная версия генетического кода.

  • Если вы используете уже существующие факторы транскрипции, проведите эксперименты по направленному мутагенезу, чтобы заставить их распознавать различные мотивы последовательности.

Что касается сложности чтения и интерпретации ДНК, вот несколько идей:

  • Вы должны включить в его ДНК много очень длинных участков повторяющихся участков, а также транспозонов. Это значительно усложняет сборку полного генома организма. Мы начинаем решать эту проблему с помощью методов секвенирования третьего поколения, которые генерируют длинные чтения, которые могут разрешить эти повторяющиеся последовательности.

  • Добавьте много псевдогенов, чтобы запутать интерпретацию, это последовательности ДНК, которые выглядят как гены и распознаются автоматическими инструментами, но не функционируют как таковые.

  • Систематически перемешивайте геномы. В некоторых одноклеточных организмах было показано, что вы можете вырезать и случайным образом лигировать большие участки генома без каких-либо серьезных последствий для приспособленности. Если вы не возражаете против уникальной стерильности каждого существа, можно было бы начать со свежеперестроенной яйцеклетки без особых негативных последствий для здоровья существа. Вы, вероятно, хотите сохранить определенные синтетические блоки вместе, но если вы определите приемлемые области для вырезания, тогда все будет в порядке.

В конечном счете, вы хотите сделать клетку достаточно другой, чтобы гарантировать, что для того, чтобы украсть ваше существо, вам придется изучать его так долго, что будет проще просто спроектировать свое собственное оригинальное существо. Не забудьте убедиться, что существа, выпущенные для публики, неспособны к размножению.

У вас есть организм, у вас есть его ДНК, и у вас, по-видимому, есть возможность клонировать организм. Почему бы вам не составить карту генома так же, как мы уже сделали с существующими организмами? Геном был бы словарем для вашей книги по мистическому языку.
Если вы будете следовать идее избавиться от матки и сохранить специальный племенной штамм только для производства, тогда клонирование станет невозможным. Всегда будет возможно нанести на карту геном так же, как мы это делаем сейчас с существующими организмами, вопрос лишь в том, чтобы сделать это непомерно дорогим.

Это уже решенная проблема, но решение не в шифровании.

Текущее решение состоит в том, чтобы иметь неполную ДНК. В частности, в ДНК отсутствует код основного белка, находящегося в процессе развития. Для вас это не проблема: вы знаете, какого белка не хватает, поэтому добавляете его в рацион молодых существ. Как только они покинут вашу лабораторию, не останется и следа этого таинственного белка или кодирующей его ДНК.

Сегодня мы используем эту технику для выпуска генетически модифицированных организмов в дикую природу. Поскольку они не могут воспроизводиться, также предотвращается непреднамеренное распространение модифицированных генов.

Разве это не сюжет «Парка Юрского периода»?
Очаровательный. Можете дать ссылку на дополнительную информацию?

Чтобы добавить к тому, что сказал Молот: это действительно не просто код.

РНК считывается и расшифровывается рибосомами:

Рибосома (/ˈraɪbəˌsoʊm, -boʊ-/]) представляет собой сложную молекулярную машину, обнаруженную во всех живых клетках и служащую местом биологического синтеза белка (трансляции). Рибосомы связывают аминокислоты вместе в порядке, указанном молекулами матричной РНК (мРНК).

Они умеют читать РНК только очень специфическим образом. Каждые три основания транслируются в определенную аминокислоту, связанную с выходным белком. Если просто «зашифровать» последовательность РНК, рибосомы прочтут ее без расшифровки. Выходной белок будет полностью отличаться от исходного.

Кроме того, не все трио оснований кодируют аминокислоту. Также есть код для «конца белка». В зашифрованной ДНК они будут как минимум в совершенно разных местах.

Ваша зашифрованная ДНК ничем не отличается от «мусорной» ДНК, которая не кодирует ничего значимого. Человеческая ДНК уже наполнена этим.

Короче говоря, мы полностью ожидаем, что биоисследования позволят легко и быстро убить каждого человека на планете задолго до того, как станет возможным получить все преимущества исцеления и аугментации. Вероятность предполагает, что будущее биоинженерии будет адом: либо нарастающая волна вирусных угроз, либо массовое полицейское государство.
@SRM В принципе, все инструменты уже доступны, просто нам не хватает знаний, чтобы собрать все это вместе. Или, может быть, мы уже делаем — совершенно секретно — в каких-то лабораториях по биологическому оружию. Представьте переносимый по воздуху вирус типа Эбола с начальной контагиозной стадией с гриппоподобными симптомами.
Немного странно, что вы процитировали отрывок с правильным написанием слова «рибосома», а затем продолжали повторять его с ошибками.
@Accumulation Я пишу с мобильного телефона. Это не так идеально, как использование физической клавиатуры.

Объедините любое из следующего:

  1. Используйте собственные запатентованные аминокислоты. Бонус: каждый должен питаться вашей едой для своих существ, а вирусы могут расти только в ваших чанах, просто смотрите, кто это покупает. Будет труднее вникнуть в ваш генетический код, по крайней мере, ваш противник не может просто использовать обычные инструменты анализа кода ДНК, не думая самостоятельно.

  2. Чтобы сделать это еще сложнее: изобретите свою собственную биологическую систему. Возможно, вы по-прежнему захотите использовать такие вещи, как «белки» и отдельные молекулы для переноса генетического кода (что-то вроде РНК, ДНК и т. д.), но меняйте аминокислоты, азотистые основания и многое другое по своему усмотрению. Проблемы здесь: это непросто и может быть несъедобным, и пока само существо может воспроизводиться и «жить», каждый, у кого есть достаточно денег и времени, может его проанализировать.

  3. Убийственное решение: не отдавайте репродуктивную систему. Поместите соответствующую репродуктивную информацию (с некоторыми фирменными особенностями) на специальную хромосому и т. д. только для одного пола и никогда не продавайте существ с ней (и не позволяйте шпионам украсть их).

Также рассмотрите галплодиплоидию (см. en.wikipedia.org/wiki/Гаплодиплоидия — что делают пчелы/муравьи) с геном, который смертелен в двух копиях, но у вас есть «лекарство» для лечения. Таким образом, вы можете поддерживать жизнь маток в своей лаборатории, а ваши конкуренты – нет.

У меня есть очень... ответ ученого-компьютерщика на это. Десять лет назад было соревнование по программированию, которое в основном имитировало цепочку ДНК — РНК — белок. Вы должны создавать не исходное изображение, а целевое изображение, операции рисования были в основном инструкциями РНК, конструирующими белок. Ожидалось, что участники вмешаются в «ДНК».

Чтобы сделать это сложнее и менее простым, реальная программа кодирования «ДНК», используемая в задаче, выполнила около 20000 операций копирования и подмножества более или менее полного фрагмента «текста» ДНК, прежде чем выполнить свою фактическую работу. Людям, которые не очень усердно разбирались в деталях реализации, гораздо меньше удавалось быстро выполнить этот код.

Вот кровавые подробности .

исходное изображение целевое изображение

Проводилось ли это соревнование по программированию на рибосомах в реальных клетках?
Нет, ДНК и вся обстановка были фальшивыми.
Это не совсем то, что я хочу, но спасибо за ссылку на отличную головоломку, которую я попытаюсь решить!

Большая проблема здесь в том, что организм должен уметь расшифровывать свою собственную ДНК. Поэтому «механизм расшифровки» должен быть встроен в организм.

Вы можете сделать его более неясным, спрятав важные фрагменты в большом количестве мусорной ДНК. Вы можете усложнить декодирование и кодирование, используя такие вещи, как нестандартные пары оснований и нестандартные аминокислоты. Тогда конкурент не может просто использовать готовые продукты для клонирования, он должен разработать с нуля ту же инфраструктуру, которую ваша компания использует для их разработки.

Но, в конечном счете, вы не можете скрыть генетический код от хорошо финансируемого противника, потому что конкурент может просто реконструировать то, что делает организм, чтобы прочитать свою собственную ДНК.

Скрытие вещей в juni DNA не помогает, коды начала и конца найти проще всего. И использование нестандартных оснований/аминокислот тоже не помогает, в первой репликации вы уже это потеряли.
@Renan Нестандартные основания, по-видимому, имеют регулирующие функции у людей, но другие фрагменты генома действительно кодируют ферменты для создания нестандартных оснований и их репликации при копировании ДНК во время клеточного деления ( ncbi.nlm.nih .gov/pubmed/28941008 )
@Renan Я больше думал об использовании совершенно неестественных пар оснований . Мы уже экспериментировали с парой SY с 2-амино-8-(2-тиенил)пурином (s) и пиридин-2-оном (y) и парой Ds-Px с 7-(2-тиенил)имидазо[4]. ,5-b]пиридин (Ds) и 4-[3-(6-аминогексамидо)-1-пропинил]-2-нитропиррол (Px), а также несколько других с еще менее броскими названиями. Очевидно, вам потребуется перестроить механизм репликации организма, чтобы иметь возможность кодировать и декодировать такие пары. Но, как я уже сказал, это в основном лишь незначительное препятствие.

Каждая клетка вашего тела уже делает это, просто вы могли этого не замечать. Вы не заметили, потому что у вас не выросла лишняя конечность или глазное яблоко, что могло бы случиться, если бы не это.

Вы просите шифрование. Теперь единственное, что вы можете сделать с ДНК, — это зашифровать ее, к чему и привел ответ Молота . Это не столько шифрование, сколько просто сокрытие данных. Все необходимое для декодирования данных присутствует, просто это может быть сложно.

Если вам нужно шифрование, то вам нужен «ключ», чтобы любой, кто знает этот «ключ», мог правильно декодировать данные. Тот, у кого нет этого «ключа», не может.

Так что я говорю, что каждая клетка в нашем теле делает это, потому что они дифференцированы. Каждая клетка кожи «забыла», как стать клеткой печени. Каждая нервная клетка «забыла», как быть поджелудочной железе. Если бы кто-нибудь из них знал волшебный ключ, который вернул бы их к «стволовой клетке», тогда они могли бы изменить свою роль в организме. Но без этого ключа они остаются дифференцированными.

Теперь это может быть просто шифрование. Мы добились больших успехов в создании ключей, которые учат клетки становиться стволовыми клетками. Таким образом, похоже , что ключи могли быть там все время, но также возможно, что это просто не работает таким образом и что ключи навсегда потеряны.

Есть несколько убедительных примеров безвозвратно утраченных возможностей. Эритроциты теряют свое ядро, прежде чем попасть в кровоток, поэтому им действительно не хватает знаний, чтобы иметь возможность размножаться.

Таким образом, чтобы по-настоящему зашифровать данные, вам нужно что-то, что функционирует как «ключ», который вы можете ввести во время создания и удалить впоследствии. Что вам, вероятно, нужно, так это белковая структура, которая может выполнять расшифровку нитей РНК до того, как они будут использованы для сборки белков. В вашей «чистой» нити, которая знает ключ, эта белковая структура закодирована в ДНК и выстраивается по мере роста существа.

В какой-то момент вы вводите вирус с сигналом «убить». Этот сигнал запускает механизм в этой структуре, который имеет эффект, подобный CRISPR, который вырезает «ключ» ДНК, который может создать эту структуру.

Белки не живут вечно. Таким образом, через некоторое время все копии этого белка-декодера исчезают, а поскольку код для их генерации был удален, новые белки создаваться не будут. Теперь ваше существо больше не имеет доступа к этим зашифрованным нитям ДНК.

Вы, вероятно, будете держать племенное поголовье, которое никогда не подвергалось воздействию вируса, чтобы они продолжали производить новых детей с этой способностью. Тем не менее, я рекомендую хранить последовательность где-нибудь в безопасном месте, чтобы, если вирус поразит ваше племенное поголовье, вы не потеряли свои ключи.

«Во время строительства». Для живых существ это эквивалентно «всегда». С тем же успехом я мог бы написать это здесь: фундаментальная проблема заключается в том, что организму необходимо знать, что находится в ДНК, это не просто инертные данные, ожидающие чтения, они считываются все время.
@NathanCooper Я использую здесь термин «строительство» скорее в деловом смысле, как этап перед продажей существа. Не все функциональные возможности тела необходимы постоянно. Некоторые возникают только во время беременности или в младенчестве. Например, на раннем этапе развития мозга мозг посылает аксоны на значительное расстояние через белое вещество мозга. Он никогда больше не сделает этого после твоего рождения. В глазу также есть генераторы тестовых шаблонов, которые помогают мозгу правильно связать аксоны зрительного нерва со зрительной корой.
Эти паттерны возникают только в течение небольшого отрезка нескольких дней внутриутробного развития, после чего сетчатка больше никогда не будет генерировать этот паттерн.
Есть также несколько трюков, которые вы можете проделать с эпигенетикой, чтобы сгенерировать криптографический эквивалент одноразового номера, но это становится немного сложнее, и он просто строится на этой фундаментальной идее о том, что у существа нет ключей, чтобы разблокировать его собственную ДНК.

Я чувствую, что некоторые из этих ответов не совсем охватывают весь спектр правдоподобия. Я согласен с тем, что в настоящее время невозможно зашифровать ДНК только потому, что методы чтения и записи ДНК также требуют от нас работы в рамках существующей жизни. Из-за этого ответ @Thymine не имеет смысла, поскольку вам нужно будет полностью переписать то, как на самом деле работает ДНК (или, проще говоря, как функционируют белки), чтобы сделать его «нечитаемым языком».

Однако ДНК можно расширить. Есть несколько лабораторий, которые создали новые «буквы» ДНК. Команда Флойда Ромесберга добавила две новые «буквы» и создала совершенно новые белки. Но они по-прежнему читаются и пишутся с использованием расширенной версии существующего известного фреймворка. Расширение доступных кодонов, создание новых мРНК и тРНК, безусловно, на короткое время сделает вещи «нечитаемыми», но я полагаю, что вам понадобится новый подход к мРНК и тРНК и к тому, как они работают с новыми кодонами, а новые кодоны будут необходимо выполнять важные функции, если вы хотите, чтобы он оставался нечитаемым без значительных исследований.

Этот выпуск подкаста After On может помочь вам понять некоторые основы этого подхода: https://after-on.com/episodes-31-60/031

Редактировать: для краткой статьи о работе команды Ромесберга: https://www.smithsonianmag.com/smart-news/researchers-add-two-new-synthetic-letters-dnas-alphabet-180967402/

ДНК уже зашифрована. Просто нужно сменить ключ.

Центральная догма молекулярной биологии состоит в том, что молекула ДНК кодирует молекулу РНК, которая, в свою очередь, кодирует последовательность аминокислот, которая сворачивается в белок. ДНК к РНК к белку. Теперь кодирование ДНК в РНК прямолинейно и прямолинейно, каждое основание ДНК соответствует своему аналогу РНК (за исключением урацила, но если мы начнем говорить о каждом исключении в биологии, мы никогда ничего не добьемся). Однако код РНК для белка совершенно произволен. Существует 4 основания РНК ACGU, но 21 аминокислота, образующая белок. Итак, жизнь использует последовательность из трех оснований РНК для кодирования каждой аминокислоты. Они называются кодонами и кодируются небольшими молекулами РНК, называемыми транспортными РНК или тРНК.введите описание изображения здесь

Этот код является полностью произвольным. Нет причин, по которым CGA долженкод аргинина. Это просто так. Чтобы изменить этот код, все, что вам нужно сделать, это заменить тРНК, отвечающую за сопоставление аргинина с CGA, на вашу собственную, которая сопоставляет CGA с другой аминокислотой. Если вы замените каждую тРНК своей собственной версией, вы эффективно «зашифруете» геном. Вы полностью изменили значение каждого основания ДНК в геноме. Тот, кто просто секвенирует ДНК вашего организма, не сможет понять ее. Не зная, что такое стартовый кодон или стоп-кодон, вы даже не сможете эффективно отличить настоящие гены от остального генома. Они не смогут добавить в ваш организм функционирующие гены, пока не расшифруют новый код. Важно отметить, что в настоящее время работать с РНК и белками намного сложнее, чем с ДНК, поэтому «расшифровка» нового кода тРНК не является тривиальной. Вы даже можете предпринять дополнительные шаги, чтобы сделать это более сложным. Сокрытие ваших тРНК в повторяющихся последовательностях, что затрудняет их секвенирование, и включение множества «отвлекающих» последовательностей, которые выглядят как тРНК, но не совсем работают по разным причинам, или даже внесение более фундаментальных изменений в процесс метаболизма тРНК, чтобы вы могли не предсказать аминокислоту, которую будет нести данная тРНК, на основе ее последовательности ДНК.

РЕДАКТИРОВАТЬ: Чтобы решить проблему, связанную с тем, что это «шифрование» будет слишком легко взломать. Шифрование Transfer-RNA не будет уязвимо для частотного анализа по нескольким причинам:

  1. Геном большой, а «зашифрованная» часть довольно мала. Только около 1% генома когда-либо будет транслироваться в белок. Не зная кода тРНК, злоумышленник не может точно определить, где находится эта часть. Участки ДНК — это не просто помеченные гены. Это означает, что частотный анализ будет перегружен остальной частью генома, которая не соответствует тому же частотному распределению.
  2. Описывать шифрование как моноалфавитное не совсем правильно. Потому что существует 64 различных возможных кодона из 3 оснований, но только 21 аминокислота должна быть закодирована. Следовательно, обязательно существует множество альтернативных способов кодирования каждой аминокислоты . Это чем-то похоже на омофоническую замену и сделает частотный анализ еще более сложным.
  3. Еще одна трудность, с которой столкнется злоумышленник, заключается в том, что каждую базу можно интерпретировать в 3 разных «фреймах». Не зная стартового кодона, вы не знаете каркас последовательности, поэтому для любой заданной последовательности есть 3 возможных интерпретации последовательности, которые одинаково действительны без знания кода тРНК.
  4. Последним осложнением является наличие сплайсинга РНК . Эукариотические гены содержат последовательности, известные как интроны, которые представляют собой междометия переменной длины в последовательности ДНК гена, которые будут удалены из РНК после ее образования. Это означает, что ген не является единым непрерывным блоком сообщения, он может быть перемежен десятками некодирующих последовательностей переменной длины. Кроме того, эти интроны не обязательно должны быть кратны трем по длине, поэтому рамка, вероятно, будет смещаться после каждого интрона.
  5. Размер генома позволяет создателю потенциально включать в геном несколько полнофункциональных наборов генов, которые по любому криптографическому виду неотличимы от подлинного изделия, но для организма, конечно, являются тарабарщиной. Таким образом, даже если мы допустим, учитывая все вышеизложенное, что злоумышленник может идентифицировать потенциальные коды тРНК, у него все равно нет возможности узнать, какая из 20 копий каждого гена на самом деле является функционирующим набором без дальнейших экспериментов.

Что касается атак с известным открытым текстом, то это просто вопрос изменения и запутывания генома до такой степени, что он больше не распознается.

Теперь я не пытаюсь утверждать, что это шифрование невосприимчиво к расшифровке, но это, конечно, не тривиально. На мой взгляд, самым простым способом расшифровки, скорее всего, будут биологические эксперименты. Потенциальное секвенирование РНК и анализ того, что, поскольку она будет в основном содержать экзонические последовательности, сделает расшифровку несколько более удобной, хотя вы можете бороться с этим, создавая множество бессмысленных РНК, которые даже не транслируются. Другая методология может состоять в том, чтобы ввести в организм различные известные последовательности, а затем искать белковые продукты, которые могут соответствовать введенной последовательности, но это было бы утомительно, и снова можно было бы использовать различные контрмеры.

За исключением того, что тРНК регулируют экспрессию , поэтому изменение структуры тРНК будет иметь далеко идущие последствия. Например, Ile — единственная AA, которая имеет три, если вы не переключите ее стоп-кодоном, и в этом случае вам также придется перепроектировать свои ДНК-полимеразы и т. д.
@Punintended К вашему первому замечанию, конечно, биологические системы сложны, но такое регулирование не невозможно учесть в будущем, когда мы проектируем организмы. Во-вторых, количество кодонов, соответствующих каждой аминокислоте, не обязательно должно оставаться постоянным. За каждую пару кодон-аминокислота отвечают разные тРНК. Нет причин, чтобы остаться. 3. В-третьих, ДНК-полимеразы не считывают стоп-кодоны, рибосомы используют стоп-кодоны тРНК. Вы можете заменить стоп-кодон на другой кодон, заменив тРНК без каких-либо дополнительных трудностей.
-1 Это будет эквивалентно моноалфавитному шифру подстановки, который будет тривиально побежден с помощью атак частотного анализа. Даже другая реализация может быть в лучшем случае эквивалентна шифрованию XOR, которое можно легко обойти атакой с известным открытым текстом.
@forest Я попытался решить ваши проблемы в редактировании моего ответа. Я считаю, что геном предлагает некоторые дополнительные сложности для расшифровки, которые вы не учли. Я ни в коем случае не эксперт по криптографии, поэтому, если вы увидите какие-либо дополнительные уязвимости, мне было бы интересно о них узнать.
@MikeNichols Это все равно будет уязвимо для тривиального криптоанализа. Например, идентифицировать бета-лист или альфа-спираль будет легко, даже если вы не знаете пары кодонов/аминокислот и используете что-то иное, чем пары Уотсона-Крика. Как только вы это узнаете, вы сможете расшифровать эти кодоны. Корень проблемы в том, что одни и те же несколько кодонов определяют изолейцин, поэтому, если вы знаете, что, скажем, AGG зашифрован для изолейцина, вы знаете, что все экземпляры AGG — это одна и та же аминокислота.

Гомоморфное шифрование

Гомоморфное шифрование позволяет выполнять произвольные операции с зашифрованными данными. Вам не нужно его расшифровывать, вам просто нужна схема шифрования, которая позволяет это сделать.

Существуют гомоморфные компиляторы, которые могут компилировать исходный код, который уже зашифрован, чтобы предотвратить обратный инжиниринг.

Вы можете использовать тот же подход, зашифровать свою ДНК, разработать рибосому, которая может создавать белки из зашифрованной ДНК, и все готово. Никто не может прочитать вашу ДНК и изменить ее.

Единственное, гомоморфное шифрование в настоящее время все еще исследуется, и в реальном мире нет приложений, которые его регулярно используют. Это также значительно замедляет работу. Это все еще развивающийся процесс.

Может быть способ.

Во-первых, вы захотите добавить в ДНК гораздо больше белков, чтобы сделать ее загрязненной, но не смешивайте их с той последовательностью, которая нужна вашему организму. Неактивные гены называются рецессивными генами. У вас может быть гораздо больший список рецессивных генов, в котором невозможно будет обнаружить доминантный. Перенос генов человеческих конечностей в улитку в качестве рецессивных генов будет хорошим шагом в этом направлении.

Эти рецессивные гены предотвратят дальнейшее развитие или копирование организма. Представьте себе это как добавление «соли» к ДНК, которая, если ее модифицировать, вызовет немедленную смертельную болезнь. Расщепление ДНК по-прежнему необходимо для роста организма, но рецессивные гены не будут смешиваться с доминантными. Возможно, у вас также должен быть огромный список смертельных болезней, которые вы будете случайным образом вводить в свой организм.

Клонирование было бы возможно.

«У вас может быть гораздо больший список рецессивных генов, в котором невозможно будет обнаружить доминантный». - две проблемы. 1) не все рецессивные гены действительно неактивны. 2) Как только вы узнаете цепь аминокислот, вы сможете довольно легко найти кодирующий ее ген, где бы он ни находился.
1) «Добавить больше белков в ДНК, чтобы сделать ее загрязненной»? ДНК полна гистонов в своем естественном состоянии, но от них довольно легко избавиться — это ключевой шаг в любой очистке ДНК , а гистоны эволюционировали специально для связывания ДНК. 2) рецессивные аллели ? Обычно они имеют последовательности, невероятно похожие на доминантные аллели. 3) Клонирование — это именно то, чего он пытается избежать. Выделите яйцеклетку хозяина, вставьте ДНК, и они станут золотыми.