Список np-сложных задач биологии/биоинформатики

Question

Список np-сложных задач биологии/биоинформатики

Колтон

Я не уверен, что это подходящее место для этого, но...

Я ищу список вычислительно «сложных» задач, так что, если бы проблема из этого списка могла быть решена эффективно, это было бы (значительно или иначе) полезно в той или иной форме для биологического сообщества.

Некоторые примеры, которые я нашел (или, по крайней мере, были помечены как проблемы «np-hard»):

Multiple sequence alignment problem
Protein threading / design problem
Map / sequence assembly problem

Список не обязательно должен быть обширным, но, надеюсь, больше, чем несколько.

Благодарю вас!

(Кроме того, я не мог придумать больше тегов для добавления, поэтому не стесняйтесь помогать и там.)

Примечание. Тот же вопрос в biostars: https://www.biostars.org/p/98112/

скаймнинген

Попробуйте задать этот вопрос на biostars.org , люди там наверняка чаще задумывались над вопросом, является ли проблема np-сложной.

Реми.б

Почему этот вопрос был отклонен? Кстати, этот пост может вас заинтересовать @Colton

Маттиа Роветта

Просто любопытство: NP-полная задача (гамильтонов путь), решенная с помощью молекулярных вычислений ncbi.nlm.nih.gov/m/pubmed/7973651

Бехзад Роушанраван

Надеюсь, что приведенный ниже ответ будет несколько полезен.

пользователь137

@MattiaRovetta Вот соответствующая статья

пользователь22020

Хорошо известно, что задача геометрии молекулярных расстояний является NP-трудной в трех измерениях.

пользователь3658307

Я думаю, что это отличный вопрос, но, возможно, он был неправильно истолкован как означающий буквально NP-сложные задачи в биоинформатике, тогда как на самом деле он задает сложные вычислительные задачи, которые были бы очень полезны в биологии или биоинформатике. Возможно, это следует переспросить здесь.

Ответы (3)

Список np-сложных задач биологии/биоинформатики

Попробуйте задать этот вопрос на biostars.org , люди там наверняка чаще задумывались над вопросом, является ли проблема np-сложной.
Почему этот вопрос был отклонен? Кстати, этот пост может вас заинтересовать @Colton
Просто любопытство: NP-полная задача (гамильтонов путь), решенная с помощью молекулярных вычислений ncbi.nlm.nih.gov/m/pubmed/7973651
Надеюсь, что приведенный ниже ответ будет несколько полезен.
@MattiaRovetta Вот соответствующая статья
Хорошо известно, что задача геометрии молекулярных расстояний является NP-трудной в трех измерениях.
Я думаю, что это отличный вопрос, но, возможно, он был неправильно истолкован как означающий буквально NP-сложные задачи в биоинформатике, тогда как на самом деле он задает сложные вычислительные задачи, которые были бы очень полезны в биологии или биоинформатике. Возможно, это следует переспросить здесь.

Бехзад Роушанраван · Answer 1

Я не эксперт в области вычислительной биологии, но мне очень интересно, и я провожу анализ больших данных с использованием R для своих собственных проектов, поэтому я постараюсь предоставить некоторую информацию.

Это ( http://www.ncbi.nlm.nih.gov/books/NBK25461/ ) отличная книга, рассказывающая обо всех грандиозных проблемах вычислительной биологии и новых областях, поэтому я определенно рекомендую просмотреть хотя бы список на страницу, если вы не хотите читать всю книгу. Для меня все это указывает на тот факт, что мы живем в эру больших данных, когда у нас есть масса данных, но понять их все, представить их в перспективе и проанализировать их таким образом, чтобы показать нам новое понимание проблем.

Вас также может заинтересовать BOINC, который реализует несколько сложных вычислительных проектов посредством краудсорсинга/сетевых вычислений ( http://boinc.berkeley.edu/projects.php ). В более теоретических аспектах, вот список нерешенных проблем ( http://en.wikipedia.org/wiki/List_of_unsolved_problems_in_mathematics ), решение которых превзойдет наше понимание многих проблем моделирования, которые также просачиваются в биологические проблемы, хотя я Я совсем не специалист по моделированию биологических систем.

Надеюсь это поможет!

МаленькиеШахматы · Answer 2

Сборка de novo

Чтобы построить геном из коротких прочтений, необходимо построить граф этих прочтений. Мы делаем это, разбивая чтения на k-меры и собирая их в граф.

В этом примере у нас есть k-мер, равный 3. Мы можем реконструировать геном, посетив каждый узел один раз, как показано на диаграмме. Это известно как гамильтонов путь.

К сожалению, построение такого пути NP-сложно. Невозможно вывести эффективный алгоритм ее решения. Вместо этого в биоинформатике мы строим эйлеров цикл, где ребро представляет собой перекрытие двух k-меров.

Артем Казначчеев · Answer 3

Это скорее длинный комментарий, чем ответ, но я подумал, что это может вас заинтересовать. Обычно нас волнует NP-трудность, потому что это означает, что мы не можем что-то сделать или решить какую-то проблему. Но это не единственный трудноразрешимый класс сложности, который должен быть важен для биологов.

Если мы переформулируем проблемы NP как проблемы оптимизации (вместо строгого определения как проблемы принятия решений), то NP-сложность обычно говорит о том, что мы не можем (в общем случае и в разумные сроки) найти глобальный оптимум. Однако во многих эволюционных условиях нас даже не волновал бы глобальный оптимум, мы были бы довольны локальным оптимумом.

Сложность поиска локальных оптимумов определяется классом сложности, известным как полиномиальный локальный поиск (PLS) . И здесь у нас также есть барьеры удивительной сложности. Например, NK-модель статических фитнес-ландшафтов Кауфмана (см. также этот пост в блоге и вопрос SE для обзора) является не только NP-трудной [Weinberger, E. (1996), "NP-completeness of Kauffman's Nk model, Tuneably Прочный фитнес-ландшафт», Рабочий документ Института Санта-Фе, 96-02-003], но также и PLS-жесткий ( Казначчеев, 2017 ; см. здесь для обзора или здесьдля итоговой работы). Это означает, что произвольная эволюционная динамика не только не может найти глобальные оптимумы, но в целом они даже не всегда могут найти локальные оптимумы на этих конечных (но экспоненциально больших) ландшафтах. Предположение, что локальная оптимальность может быть неразумным предположением даже для статических ландшафтов.

Список np-сложных задач биологии/биоинформатики

Колтон

скаймнинген

Реми.б

Маттиа Роветта

Бехзад Роушанраван

пользователь137

пользователь22020

пользователь3658307

Ответы (3)

Бехзад Роушанраван

МаленькиеШахматы

Артем Казначчеев

Какую информацию можно извлечь из данных РНК-секвенирования во времени?

Биологическая проверка компьютерно-определяемого межгенного взаимодействия

Попытка понять общую картину, стоящую за секвенированием, выравниванием и поиском ДНК.

Поиск целевой базы данных противораковых препаратов для определения последовательности ДНК опухоли пациента

Простой проект по вычислительной биологии для класса AP Biology. Идеи? [закрыто]

Проверка маркеров с использованием транскриптома и геномных последовательностей, полученных из одной клетки

химерные последовательности [закрыто]

Что такое «контиги» в ReorderSAM Пикарда?

Рекомендуемый алгоритм кластеризации последовательностей для данных транскриптома

Должен ли я отказаться от несвязанной работы, назначенной научным руководителем?