Эй, я надеюсь, что этот вопрос должен быть в этом форуме.
Я не из биологического сообщества, я из сообщества по безопасности данных, поэтому я не знаком со словами, которые вы могли бы использовать для ответов.
Мне нужно использовать алгоритм, который очень похож на алгоритм сборки de novo . Я попытаюсь объясниться лучше. У меня есть несколько последовательностей «1» и «0», все они являются частями одной большой последовательности.
Я видел некоторые приложения, которые работают с этим алгоритмом, такие как головастик SPAdes и Geneious, но я не смог заставить работать ни одно из них, кроме Geneious, потому что оно было самым простым.
Гениальный не подходит для меня, потому что мне нужно что-то, что я могу использовать с помощью командной строки в терминале, какое приложение вы рекомендуете мне использовать, чтобы я вводил последовательности, и на выходе будет большая последовательность.
Кстати, в Geneious я использовал файл FASTA для своей последовательности, где мои «0» и «1» переведены в «C» и «D».
Спасибо большое жду ответов))
Вы можете попробовать Velvet , но вы, скорее всего, получите тысячи контигов, если только ваш ожидаемый эталонный геном не будет достаточно простым. Этот вопрос затрагивает многие трудности сборки de novo . Я также не уверен, что вы имеете в виду под этим:
Кстати, в Geneious я использовал файл FASTA для своей последовательности, где мои «0» и «1» переведены в «C» и «D».
Вы пытаетесь использовать это для другой цели, кроме фактической сборки генома? Вы говорите, что занимаетесь безопасностью данных, поэтому неясно, какова ваша конечная цель. Если у вас есть только двоичная последовательность, вам лучше иметь действительно большую длину чтения и надеяться, что повторов не слишком много, иначе у вас действительно возникнут проблемы с поиском согласованной последовательности.
пользователь31589