Итак, я владелец стартапа, который облегчит нам жизнь с помощью существ с нестандартной ДНК! Наши несколько первых продуктов продаются очень хорошо, и до событий на прошлой неделе все было в порядке.
Другая компания купила один из наших продуктов и просто расшифровала всю последовательность ДНК, затем изменила несколько вещей и перепродала их как свои собственные, поглотив наш доход. Это довольно плохо для нас, но все же хорошо, потому что мы можем подать на них в суд.
А теперь представьте, что какие-то террористы украли наши вирусы (ничего противозаконного, мы используем их для терапии) и изменили (хорошо разработанный, читабельный) код, чтобы делать какие-то действительно плохие вещи (например, просто убивать для начала — или даже хуже).
Итак, наш план состоит в том, чтобы установить какое-то шифрование! Но это кажется трудно сделать.
Есть ли простой способ настроить шифрование или, по крайней мере, сделать ДНК менее читаемой?
Бонусные баллы за
Позвольте мне сначала показать вам этот XKCD :
[Белая Шляпа, держа ноутбук, разговаривает с Меган, которая смотрит в свой смартфон.]
Белая шляпа: биология в значительной степени решена. ДНК — это исходный код нашего тела. Теперь, когда секвенировать гены легко, нам просто нужно прочитать это.
Меган: Это не просто «исходный код». Есть масса отзывов и внешней обработки.
[Белая Шляпа, открывая свой ноутбук, идет к столу и стулу мимо Меган, которая протягивает руки.]
Меган: Но даже если бы это было так, ДНК — это результат самого агрессивного процесса оптимизации во Вселенной, протекающего параллельно на каждом уровне, в каждом живом существе, в течение четырех миллиардов лет.
White Hat: Это все еще просто код.
[Белая Шляпа садится за стол с открытым ноутбуком, а Меган заглядывает ему через плечо.]
Меган: Хорошо, попробуйте открыть google.com и нажать «Просмотр исходного кода».
Белая Шляпа: Хорошо, я... О боже.
Меган: Это всего лишь несколько лет оптимизации разработчиками Google. ДНК в тысячи раз длиннее и намного хуже.
Белая шляпа: Ничего себе, биология невозможна .
ДНК, кодирующая белок, должна располагаться в определенном порядке. На самом деле нет двух способов закодировать один белок.
ДНК уже настолько сложна, взаимосвязана, нелогична, ее результаты зависят от эффектов совершенно других частей ДНК и так далее (см. статью о некодирующей ДНК , если вам интересно), что все усложнения, которые вы можете намеренно добавить, будут очень, очень незначительно по сравнению с тем, что уже сделала природа. Таким образом, если кто-то сможет взломать то, что сделала природа, ваш дополнительный уровень обфускации на самом деле ничего не изменит.
2а. Даже для вирусов — если кто-то хочет модифицировать и эффективно использовать их на людях, он должен быть в состоянии расшифровать и понять человеческий геном — вирус будет легко понятен тому, кто обладает такими способностями, с очень, очень ограниченным пространством, которое у вас есть внутри вируса.
IF
инструкция , например.Химера.
https://www.boredpanda.com/chimera-cat-split-face-разные-глаза-gataquimera/
Quimera может быть тем, что известно как генетическая химера, редкое природное явление, при котором особь состоит из клеток, по крайней мере, из двух разных исходных яйцеклеток. Они сливаются вместе, чтобы стать единым организмом, чья ДНК принадлежит двум совершенно разным людям.
Нормальный организм возникает из одной клетки. За исключением соматических мутаций, каждая клетка существа несет один и тот же генетический код. Ваш конкурент может смахнуть волос и расшифровать из него геном.
Химеры, подобные этой кошке, могут возникать в природе. Два яйца сливаются на ранней стадии, и в результате существо представляет собой сбалансированную смесь двух геномов. Геном, расшифрованный из одного волоса, может не совпадать с расшифрованным из другого.
Вы делаете еще один шаг. Все ваши нестандартные существа — это химеры, не из двух, а из многих, многих различных искусственных «яиц». Большинство этих клеточных линий имеют геномы, которые преднамеренно дефектны, и существо, происходящее только из одного из этих дефектных геномов, было бы уродом или нежизнеспособным. Но вместе в вашей химере мутантные гены некоторых клеток компенсируются силой (или просто нормальностью) соседних клеток. Набор клеток, использованных для создания вашей химеры, не случаен — например, у человека может быть высокая популяция определенного мутантного типа в печени, где их избыток белкового продукта может спасти оставшуюся часть организма, испытывающего дефицит этого продукта. Вы бы этого не знали, если бы секвенировали геном украденного волоса.
Вашему конкуренту нужно будет секвенировать множество клеток всего организма, определить, какие части плохие (или они плохие?), а какие хорошие, и надеяться воссоздать множество используемых родословных и скомбинировать их в правильной пропорции для репликации. существо.
Генно-инженерные животные — это старая шляпа — вы можете купить светящуюся модифицированную рыбу в Petsmart. Но создание химеры из сконструированных линий выводит создание существ на совершенно новый уровень научной фантастики.
Вам не нужно шифровать последовательность ДНК, чтобы другие люди не могли ее использовать.
Молекула ДНК не имеет внутреннего значения, а это означает, что, хотя вы можете различать закономерности, вы никогда не получите всю информацию об организме, просто взглянув на его ДНК.
Позвольте мне объяснить это аналогией с языком. Если бы я дал вам книгу на языке, которого вы не читаете, вы бы не смогли ее понять. Вы знаете, что это книга, и вы знаете, что в ней есть смысл, но вы не можете реконструировать ее, не протестировав. Например, взять предложение и повторить его тому, кто говорит на этом языке, или изменить порядок слов и проверить, оказывают ли они желаемый эффект, когда вы говорите их тому, кто их понимает.
Код, в данном случае генетический код, требует системы декодирования, чтобы содержать значимую информацию. В биологии декодер состоит из многих других частей клетки, включая, помимо прочего, аппарат транскрипции, который транскрибирует ДНК в РНК, аппарат трансляции, который переводит РНК в белки, эпигенетический аппарат, который контролирует, какие области должны быть транскрибированы. , клеточные сигнальные пути, которые модулируют предыдущие системы на основе внешних и внутренних факторов, и так далее.
Итак, все возвращается к яйцеклетке. Это не просто молекула ДНК сама по себе. Это молекула ДНК в очень специфическом клеточном контексте, а в случае многоклеточных животных это также клетка в очень специфическом органном контексте. Человеческая яйцеклетка не может развиваться в вашем мочевом пузыре. У него есть определенные требования, которым (обычно) отвечает матка.
Если у ваших существ есть половое размножение, вы можете сконструировать племенную породу существа, которое рождает стерильное потомство. Чтобы избежать возможности экстракорпорального оплодотворения, вы можете создать у них потомство, не имеющее эквивалента матки, или вы можете систематически выполнять гистерэктомию перед их продажей.
Если вы действительно хотите, чтобы он был невероятно непрозрачным, вам нужно изменить способ работы различных механизмов, о которых я упоминал ранее:
Измените стартовые и стоп-кодоны, изменив механизм транскрипции для распознавания различных паттернов. Вам также потребуется изменить последовательность сайта начала транскрипции.
Расшифруйте генетический код, заставив различные тРНК соответствовать разным аминокислотам, что заставит потенциальных воров проводить эксперименты, чтобы выяснить, чему соответствует ваша запатентованная версия генетического кода.
Если вы используете уже существующие факторы транскрипции, проведите эксперименты по направленному мутагенезу, чтобы заставить их распознавать различные мотивы последовательности.
Что касается сложности чтения и интерпретации ДНК, вот несколько идей:
Вы должны включить в его ДНК много очень длинных участков повторяющихся участков, а также транспозонов. Это значительно усложняет сборку полного генома организма. Мы начинаем решать эту проблему с помощью методов секвенирования третьего поколения, которые генерируют длинные чтения, которые могут разрешить эти повторяющиеся последовательности.
Добавьте много псевдогенов, чтобы запутать интерпретацию, это последовательности ДНК, которые выглядят как гены и распознаются автоматическими инструментами, но не функционируют как таковые.
Систематически перемешивайте геномы. В некоторых одноклеточных организмах было показано, что вы можете вырезать и случайным образом лигировать большие участки генома без каких-либо серьезных последствий для приспособленности. Если вы не возражаете против уникальной стерильности каждого существа, можно было бы начать со свежеперестроенной яйцеклетки без особых негативных последствий для здоровья существа. Вы, вероятно, хотите сохранить определенные синтетические блоки вместе, но если вы определите приемлемые области для вырезания, тогда все будет в порядке.
В конечном счете, вы хотите сделать клетку достаточно другой, чтобы гарантировать, что для того, чтобы украсть ваше существо, вам придется изучать его так долго, что будет проще просто спроектировать свое собственное оригинальное существо. Не забудьте убедиться, что существа, выпущенные для публики, неспособны к размножению.
Это уже решенная проблема, но решение не в шифровании.
Текущее решение состоит в том, чтобы иметь неполную ДНК. В частности, в ДНК отсутствует код основного белка, находящегося в процессе развития. Для вас это не проблема: вы знаете, какого белка не хватает, поэтому добавляете его в рацион молодых существ. Как только они покинут вашу лабораторию, не останется и следа этого таинственного белка или кодирующей его ДНК.
Сегодня мы используем эту технику для выпуска генетически модифицированных организмов в дикую природу. Поскольку они не могут воспроизводиться, также предотвращается непреднамеренное распространение модифицированных генов.
Чтобы добавить к тому, что сказал Молот: это действительно не просто код.
РНК считывается и расшифровывается рибосомами:
Рибосома (/ˈraɪbəˌsoʊm, -boʊ-/]) представляет собой сложную молекулярную машину, обнаруженную во всех живых клетках и служащую местом биологического синтеза белка (трансляции). Рибосомы связывают аминокислоты вместе в порядке, указанном молекулами матричной РНК (мРНК).
Они умеют читать РНК только очень специфическим образом. Каждые три основания транслируются в определенную аминокислоту, связанную с выходным белком. Если просто «зашифровать» последовательность РНК, рибосомы прочтут ее без расшифровки. Выходной белок будет полностью отличаться от исходного.
Кроме того, не все трио оснований кодируют аминокислоту. Также есть код для «конца белка». В зашифрованной ДНК они будут как минимум в совершенно разных местах.
Ваша зашифрованная ДНК ничем не отличается от «мусорной» ДНК, которая не кодирует ничего значимого. Человеческая ДНК уже наполнена этим.
Объедините любое из следующего:
Используйте собственные запатентованные аминокислоты. Бонус: каждый должен питаться вашей едой для своих существ, а вирусы могут расти только в ваших чанах, просто смотрите, кто это покупает. Будет труднее вникнуть в ваш генетический код, по крайней мере, ваш противник не может просто использовать обычные инструменты анализа кода ДНК, не думая самостоятельно.
Чтобы сделать это еще сложнее: изобретите свою собственную биологическую систему. Возможно, вы по-прежнему захотите использовать такие вещи, как «белки» и отдельные молекулы для переноса генетического кода (что-то вроде РНК, ДНК и т. д.), но меняйте аминокислоты, азотистые основания и многое другое по своему усмотрению. Проблемы здесь: это непросто и может быть несъедобным, и пока само существо может воспроизводиться и «жить», каждый, у кого есть достаточно денег и времени, может его проанализировать.
Убийственное решение: не отдавайте репродуктивную систему. Поместите соответствующую репродуктивную информацию (с некоторыми фирменными особенностями) на специальную хромосому и т. д. только для одного пола и никогда не продавайте существ с ней (и не позволяйте шпионам украсть их).
У меня есть очень... ответ ученого-компьютерщика на это. Десять лет назад было соревнование по программированию, которое в основном имитировало цепочку ДНК — РНК — белок. Вы должны создавать не исходное изображение, а целевое изображение, операции рисования были в основном инструкциями РНК, конструирующими белок. Ожидалось, что участники вмешаются в «ДНК».
Чтобы сделать это сложнее и менее простым, реальная программа кодирования «ДНК», используемая в задаче, выполнила около 20000 операций копирования и подмножества более или менее полного фрагмента «текста» ДНК, прежде чем выполнить свою фактическую работу. Людям, которые не очень усердно разбирались в деталях реализации, гораздо меньше удавалось быстро выполнить этот код.
Вот кровавые подробности .
Большая проблема здесь в том, что организм должен уметь расшифровывать свою собственную ДНК. Поэтому «механизм расшифровки» должен быть встроен в организм.
Вы можете сделать его более неясным, спрятав важные фрагменты в большом количестве мусорной ДНК. Вы можете усложнить декодирование и кодирование, используя такие вещи, как нестандартные пары оснований и нестандартные аминокислоты. Тогда конкурент не может просто использовать готовые продукты для клонирования, он должен разработать с нуля ту же инфраструктуру, которую ваша компания использует для их разработки.
Но, в конечном счете, вы не можете скрыть генетический код от хорошо финансируемого противника, потому что конкурент может просто реконструировать то, что делает организм, чтобы прочитать свою собственную ДНК.
Каждая клетка вашего тела уже делает это, просто вы могли этого не замечать. Вы не заметили, потому что у вас не выросла лишняя конечность или глазное яблоко, что могло бы случиться, если бы не это.
Вы просите шифрование. Теперь единственное, что вы можете сделать с ДНК, — это зашифровать ее, к чему и привел ответ Молота . Это не столько шифрование, сколько просто сокрытие данных. Все необходимое для декодирования данных присутствует, просто это может быть сложно.
Если вам нужно шифрование, то вам нужен «ключ», чтобы любой, кто знает этот «ключ», мог правильно декодировать данные. Тот, у кого нет этого «ключа», не может.
Так что я говорю, что каждая клетка в нашем теле делает это, потому что они дифференцированы. Каждая клетка кожи «забыла», как стать клеткой печени. Каждая нервная клетка «забыла», как быть поджелудочной железе. Если бы кто-нибудь из них знал волшебный ключ, который вернул бы их к «стволовой клетке», тогда они могли бы изменить свою роль в организме. Но без этого ключа они остаются дифференцированными.
Теперь это может быть просто шифрование. Мы добились больших успехов в создании ключей, которые учат клетки становиться стволовыми клетками. Таким образом, похоже , что ключи могли быть там все время, но также возможно, что это просто не работает таким образом и что ключи навсегда потеряны.
Есть несколько убедительных примеров безвозвратно утраченных возможностей. Эритроциты теряют свое ядро, прежде чем попасть в кровоток, поэтому им действительно не хватает знаний, чтобы иметь возможность размножаться.
Таким образом, чтобы по-настоящему зашифровать данные, вам нужно что-то, что функционирует как «ключ», который вы можете ввести во время создания и удалить впоследствии. Что вам, вероятно, нужно, так это белковая структура, которая может выполнять расшифровку нитей РНК до того, как они будут использованы для сборки белков. В вашей «чистой» нити, которая знает ключ, эта белковая структура закодирована в ДНК и выстраивается по мере роста существа.
В какой-то момент вы вводите вирус с сигналом «убить». Этот сигнал запускает механизм в этой структуре, который имеет эффект, подобный CRISPR, который вырезает «ключ» ДНК, который может создать эту структуру.
Белки не живут вечно. Таким образом, через некоторое время все копии этого белка-декодера исчезают, а поскольку код для их генерации был удален, новые белки создаваться не будут. Теперь ваше существо больше не имеет доступа к этим зашифрованным нитям ДНК.
Вы, вероятно, будете держать племенное поголовье, которое никогда не подвергалось воздействию вируса, чтобы они продолжали производить новых детей с этой способностью. Тем не менее, я рекомендую хранить последовательность где-нибудь в безопасном месте, чтобы, если вирус поразит ваше племенное поголовье, вы не потеряли свои ключи.
Я чувствую, что некоторые из этих ответов не совсем охватывают весь спектр правдоподобия. Я согласен с тем, что в настоящее время невозможно зашифровать ДНК только потому, что методы чтения и записи ДНК также требуют от нас работы в рамках существующей жизни. Из-за этого ответ @Thymine не имеет смысла, поскольку вам нужно будет полностью переписать то, как на самом деле работает ДНК (или, проще говоря, как функционируют белки), чтобы сделать его «нечитаемым языком».
Однако ДНК можно расширить. Есть несколько лабораторий, которые создали новые «буквы» ДНК. Команда Флойда Ромесберга добавила две новые «буквы» и создала совершенно новые белки. Но они по-прежнему читаются и пишутся с использованием расширенной версии существующего известного фреймворка. Расширение доступных кодонов, создание новых мРНК и тРНК, безусловно, на короткое время сделает вещи «нечитаемыми», но я полагаю, что вам понадобится новый подход к мРНК и тРНК и к тому, как они работают с новыми кодонами, а новые кодоны будут необходимо выполнять важные функции, если вы хотите, чтобы он оставался нечитаемым без значительных исследований.
Этот выпуск подкаста After On может помочь вам понять некоторые основы этого подхода: https://after-on.com/episodes-31-60/031
Редактировать: для краткой статьи о работе команды Ромесберга: https://www.smithsonianmag.com/smart-news/researchers-add-two-new-synthetic-letters-dnas-alphabet-180967402/
ДНК уже зашифрована. Просто нужно сменить ключ.
Центральная догма молекулярной биологии состоит в том, что молекула ДНК кодирует молекулу РНК, которая, в свою очередь, кодирует последовательность аминокислот, которая сворачивается в белок. ДНК к РНК к белку. Теперь кодирование ДНК в РНК прямолинейно и прямолинейно, каждое основание ДНК соответствует своему аналогу РНК (за исключением урацила, но если мы начнем говорить о каждом исключении в биологии, мы никогда ничего не добьемся). Однако код РНК для белка совершенно произволен. Существует 4 основания РНК ACGU, но 21 аминокислота, образующая белок. Итак, жизнь использует последовательность из трех оснований РНК для кодирования каждой аминокислоты. Они называются кодонами и кодируются небольшими молекулами РНК, называемыми транспортными РНК или тРНК.
Этот код является полностью произвольным. Нет причин, по которым CGA долженкод аргинина. Это просто так. Чтобы изменить этот код, все, что вам нужно сделать, это заменить тРНК, отвечающую за сопоставление аргинина с CGA, на вашу собственную, которая сопоставляет CGA с другой аминокислотой. Если вы замените каждую тРНК своей собственной версией, вы эффективно «зашифруете» геном. Вы полностью изменили значение каждого основания ДНК в геноме. Тот, кто просто секвенирует ДНК вашего организма, не сможет понять ее. Не зная, что такое стартовый кодон или стоп-кодон, вы даже не сможете эффективно отличить настоящие гены от остального генома. Они не смогут добавить в ваш организм функционирующие гены, пока не расшифруют новый код. Важно отметить, что в настоящее время работать с РНК и белками намного сложнее, чем с ДНК, поэтому «расшифровка» нового кода тРНК не является тривиальной. Вы даже можете предпринять дополнительные шаги, чтобы сделать это более сложным. Сокрытие ваших тРНК в повторяющихся последовательностях, что затрудняет их секвенирование, и включение множества «отвлекающих» последовательностей, которые выглядят как тРНК, но не совсем работают по разным причинам, или даже внесение более фундаментальных изменений в процесс метаболизма тРНК, чтобы вы могли не предсказать аминокислоту, которую будет нести данная тРНК, на основе ее последовательности ДНК.
РЕДАКТИРОВАТЬ: Чтобы решить проблему, связанную с тем, что это «шифрование» будет слишком легко взломать. Шифрование Transfer-RNA не будет уязвимо для частотного анализа по нескольким причинам:
Что касается атак с известным открытым текстом, то это просто вопрос изменения и запутывания генома до такой степени, что он больше не распознается.
Теперь я не пытаюсь утверждать, что это шифрование невосприимчиво к расшифровке, но это, конечно, не тривиально. На мой взгляд, самым простым способом расшифровки, скорее всего, будут биологические эксперименты. Потенциальное секвенирование РНК и анализ того, что, поскольку она будет в основном содержать экзонические последовательности, сделает расшифровку несколько более удобной, хотя вы можете бороться с этим, создавая множество бессмысленных РНК, которые даже не транслируются. Другая методология может состоять в том, чтобы ввести в организм различные известные последовательности, а затем искать белковые продукты, которые могут соответствовать введенной последовательности, но это было бы утомительно, и снова можно было бы использовать различные контрмеры.
Гомоморфное шифрование позволяет выполнять произвольные операции с зашифрованными данными. Вам не нужно его расшифровывать, вам просто нужна схема шифрования, которая позволяет это сделать.
Существуют гомоморфные компиляторы, которые могут компилировать исходный код, который уже зашифрован, чтобы предотвратить обратный инжиниринг.
Вы можете использовать тот же подход, зашифровать свою ДНК, разработать рибосому, которая может создавать белки из зашифрованной ДНК, и все готово. Никто не может прочитать вашу ДНК и изменить ее.
Единственное, гомоморфное шифрование в настоящее время все еще исследуется, и в реальном мире нет приложений, которые его регулярно используют. Это также значительно замедляет работу. Это все еще развивающийся процесс.
Может быть способ.
Во-первых, вы захотите добавить в ДНК гораздо больше белков, чтобы сделать ее загрязненной, но не смешивайте их с той последовательностью, которая нужна вашему организму. Неактивные гены называются рецессивными генами. У вас может быть гораздо больший список рецессивных генов, в котором невозможно будет обнаружить доминантный. Перенос генов человеческих конечностей в улитку в качестве рецессивных генов будет хорошим шагом в этом направлении.
Эти рецессивные гены предотвратят дальнейшее развитие или копирование организма. Представьте себе это как добавление «соли» к ДНК, которая, если ее модифицировать, вызовет немедленную смертельную болезнь. Расщепление ДНК по-прежнему необходимо для роста организма, но рецессивные гены не будут смешиваться с доминантными. Возможно, у вас также должен быть огромный список смертельных болезней, которые вы будете случайным образом вводить в свой организм.
Клонирование было бы возможно.
Аноплексиан
Вэл все еще с Моникой
Аноплексиан
Ричард
Хоббамок
Рутер Рэндоммелей
лес