Изучите биокондуктор трудным путем!

Я пришел к анализу данных популяционной генетики с опытом теоретика и компьютерного биолога, но не с помощью стандартных инструментов, которые известны биоинформатику (или эмпирику в популяционной генетике). У меня довольно хорошие знания в R и в программировании в целом.

Я ищу курс/руководство по изучению биокондуктора (и других инструментов R для анализа генетических данных). Короткий, насыщенный курс/учебник, предполагающий наличие у пользователя хороших знаний в области программирования. Я доволен как видео, так и письменным руководством, хотя я бы предпочел письменное руководство. Обычно я стремлюсь анализировать данные о структурированных популяциях, таких как среднее количество попарных различий между популяциями, или графически отображать частотный спектр сайта для каждой популяции и т. д.

Таких уроков довольно много. Не могли бы вы дать мне рекомендации?

bioconductor является источником пакетов. Вы можете запросить учебные пособия по пакетам биоинформатики в bioconductor, это будут виньетки. Но я не понимаю, что вы имеете в виду под учебниками по биокондуктору. На мой взгляд, если у вас есть данные популяционной генетики, то, скорее всего, вы имеете дело с нормальным распределением. Существуют статистические пакеты, которые гораздо более надежны, чем большинство пакетов для биокондуктора. Этот вопрос немного неясен относительно того, что вы хотите сделать и какие данные у вас есть.

Ответы (1)

Я рекомендую учебник DESeq2 по адресу:

http://www.bioconductor.org/help/workflows/rnaseqGene/

Я думаю, что это хорошее начало для вас, потому что:

  • DESeq2 — очень популярный пакет. Вы узнаете, как именно работает биоинформатик.
  • Рабочий процесс начинается с выравнивания и показывает, как подключить инструменты командной строки к R-пакету.
  • В нем показано, как генерировать график MA, график PCA и т. д. Вы оцените, как легко делать такие вещи в R.
  • Тестирование дифференциальной экспрессии генов очень важно
  • Вы узнаете, как R программирует. Например, в R рекомендуется создать объект набора данных и сделать что-то вроде этого:

obj <- .... # This is my R-object
obj <- fun1(obj) <- # Function 1 adds information to the object
obj <- fun2(obj) <- # Function 2 adds more information to the object

Не могу исправить формат. Кто-нибудь может мне помочь?
Я пытался исправить форматирование, но форматирование выглядит глючным.
@bli Извините, я пытался ответить на вопрос как мог, но как-то напортачил с форматированием.
Я к тому, что вроде бы не твоя вина, что форматирование накосячило: Нормально работает отступ в 4 пробела, и мне кажется, ты все сделал правильно. Или, может быть, форматирование кода не должно работать после листинга?
@бли Да. Я пытался сделать форматирование кода, но у меня не получилось...
Кажется, это происходит из-за <. Не знаю почему. Возможно, потому что это указывает на начало тегов xml/html.