Как начать заниматься биоинформатикой [закрыто]

Я студент второго курса бакалавриата по электротехнике и программист-самоучка. У меня всегда был интерес к биологии, но я никогда не увлекался ею (кроме двухгодичной биологии в средней школе и некоторой базовой биохимии на уроках химии).

Я особенно очарован взаимодействием между информатикой и биологией, как информатикой, используемой для биологии, так и концепциями информатики, вдохновленными биологией. Подумайте о таких вещах, как проект генома человека, генетические алгоритмы, глубокое обучение, предсказание структуры белка и т. д. Я думаю, что многие из этих вещей (информатика, используемая в биологии) являются, насколько мне известно, частью биоинформатики.

Я выполнял задания на Розалинде , и хотя они хороши, это больше похоже на тренировку/изобретение велосипеда. Хотя это может быть слишком многого, я хочу сделать что-то «настоящее», что действительно можно было бы использовать. Не то чтобы я хотел начать сразу, не изучая, но у меня нет в голове картины того, что я могу сделать после изучения некоторой теории.

Я ищу обзор области биоинформатики и руководство о том, как начать работу. Несколько примеров того, над чем я могу работать. Может быть, есть какой-то энергоемкий алгоритм, для которого я могу начать разрабатывать микросхемы (ASIC), чтобы ускорить процесс. Это только один пример.

Я надеюсь, что вы можете мне помочь, спасибо заранее.

Добро пожаловать в Bilogy.SE! Я не уверен, что вас больше интересует: биоинформатика , вычислительная биология или биологические вычисления . Различие между этими полями иногда неясно и может различаться в зависимости от того, кого вы спросите, но я думаю, что стоит потратить некоторое время на чтение их определений.
Первым шагом к биоинформатике или вычислительной биологии, вероятно, является понимание основ молекулярной биологии ( вот ссылка на академию хана, которая может помочь)
Спасибо. :) Насколько мне известно, биоинформатика и вычислительная биология очень близки друг к другу. Биоинформатика немного больше фокусируется на (теоретической) информатике, тогда как вычислительная биология немного больше фокусируется на математике. (Опять же, это мое представление об этом.) Для биологических вычислений я вижу большую разницу, потому что все наоборот (компьютеры используют биологию, а биология использует компьютеры). У меня есть некоторые базовые знания в области молекулярной биологии (или биохимии, я думаю, что это более или менее одно и то же). (продолжать...)
Я знаю, например, как вы можете перевести цепочку ДНК в РНК в аминокислоты или идентифицировать (некоторые простые) мутации. Но (конечно) я действительно не знаю, как предсказать трехмерную структуру белка. Так что мне немного трудно понять, с чего мне начать. Если посмотреть на то, как я начал программировать, я хотел создать веб-сайт, поэтому я нашел учебник. Когда мне хотелось чего-то нового, я искал, как это сделать, и учился этому на ходу. С биоинформатикой мне сложнее. У меня нет такой цели, как создание этого веб-сайта, если вы понимаете, что я имею в виду. (продолжать...)
И это потому, что я действительно не знаю, что я буду с этим делать (знания биоинформатики). В любом случае, очень ценю вашу помощь.
Хорошо, что у вас есть эти базы. Тогда я бы порекомендовал сузить пост. На данный момент я не думаю, что можно полностью ответить на ваш вопрос, поскольку он слишком широк. Например, я вычислительный биолог (точнее, вычислительный популяционный генетик; я изучаю различные эволюционные процессы, используя индивидуальное моделирование, и пытаюсь разработать статистические методы), но я понятия не имею, как предсказать свертывание белка.
Если я могу задать вопрос: почему вы занимаетесь электротехникой, если вас интересует биоинформатика? Я не вижу большой связи. Конечно, нет ничего постыдного (на самом деле, как раз наоборот) работать над предметом, отличным от того, который вы получаете во время учебы в университете, но мне просто любопытно.
Я интересуюсь компьютерами и электроникой, поэтому я выбрал его. Я чувствую, что электротехника действительно учит вас, как они работают. Кроме того, меня всегда интересовала биология (и биоинформатика), поэтому что-то, объединяющее эти два направления, должно быть отличным.
@Remi.b Также на сайте newscientist.com/article/… показан хороший (и мне очень интересный) пример.
Я голосую за закрытие как слишком широкое. Я согласен, хотя, как сказал @David, если вы не можете сузить свой интерес, лучше всего для вас, вероятно, связаться с кем-то в вашем собственном университете, исследование которого вас интересует.
Я голосую за закрытие, потому что это основано на мнении. Я знаю биоинформатиков, которые начинали как физики, биохимики, биологи, ученые-вычислители, математики, доктора медицинских наук и т. д., и они работают над совершенно разными проектами. Не существует единственного «лучшего» пути или правильной ниши, в которую можно было бы попасть. Подайте заявку на некоторые проекты / должности / стажировки в области биоинформатики и посмотрите, получите ли вы их. Удачи.
@ Remi.b Кроме того, в EEE будет много модулей системной инженерии и соответствующие модули программирования (большинство курсов биологии имеют в лучшем случае один модуль на R или Perl, который едва знакомит вас с идеей переменной) и тонну математики. Эта степень пригодилась бы вам для проекта по созданию инструментов: биология, которую вы сможете изучить позже!

Ответы (4)

Мой совет: наладьте контакт с биологами из вашего университета.

Вы говорите, что вам нужны настоящие проблемы, и я приветствую это, поскольку решение реальных проблем — лучший способ избежать пустой траты времени (что является слишком распространенной участью подобных набегов). Как установить контакт? Предположительно, социальные сети — это выход. В вашем возрасте надо уметь им пользоваться. Однако вам нужно ориентироваться на аспирантов и сотрудников, а не на студентов.

Чтение книг — это очень хорошо, но пока вы не узнаете, какую проблему решаете, вы не будете знать, на чем сосредоточиться. А биология слишком широка и неструктурирована, чтобы ее можно было освоить, читая.

Я бы предпочел связаться с PI напрямую, а не через социальные сети. Многие PI рады нанять студента, который проявляет интерес.
@ Remi.b — Конечно, все работает. Знал бы студент, к какому PI обратиться? В любом случае, я считаю, что молодой студент, разбирающийся в Интернете, должен использовать эту смекалку в своей собственной среде, чтобы объявить о своей готовности участвовать в проекте. Он должен знать лучше меня.
Спасибо за Ваш ответ. Как вы думаете, лучше связаться с кем-то из отдела биоинформатики моего университета или напрямую связаться с биологами?
@ Кевин, я бы определенно пошел в отдел биоинформатики. По-видимому, у них уже есть проекты с биологами, но если вы расскажете им, каковы ваши навыки, у них вполне может быть что-то, что вы можете сделать. По крайней мере, они могут в стороне от вас.

Вы найдете различные учебные пособия по биоинформатике на: https://www.biostars.org/t/Tutorials/

Тем не менее, как вычислительный биолог, я настоятельно рекомендую посещать лекции по биологии и читать много учебников, которые охватывают темы, выходящие за рамки любимых тем современной биоинформатики (хорошим началом будет «Молекулярная биология клетки» Брюса Альберта):

Технические аспекты легко решить и изучить (а также передать на аутсорсинг). Трудная часть состоит в том, чтобы найти умные проблемы и понять, как вы можете решить некоторые проблемы быстрее, чем ваши конкуренты, сочетая биоинформатику с другими подходами.

Кстати: мне очень нравится ваша идея подойти к биоинформатике с аппаратной стороны (см. также развивающееся аппаратное обеспечение ).

Да, я читал об эволюционирующем оборудовании, это звучит так здорово. К сожалению, у меня такое ощущение, что по какой-то причине это больше не исследуется. (Возможно, тем больше причин вникать в это.) И спасибо за совет, поищу эту книгу.

Помимо того, что было предложено в других ответах, вы также должны попытаться узнать о современном состоянии биоинформатики , т.е. прочитать о том, что было сделано за последние несколько лет, внимательно следить за новыми публикациями в поле и пусть вас вдохновляет то, над чем работают другие люди.

Этот пост Стивена Тернера хорошо обобщает ряд связанных с биоинформатикой журналов / RSS-каналов, блогов, списков рассылки, уведомлений по электронной почте / подписок и учетных записей Twitter, которые вы должны назначить или регулярно проверять, чтобы оставаться в курсе последних событий.

Я сам компьютерный инженер и никогда не изучал биологию даже в старшей школе. ( Возможно, люди здесь начали бы меня бить, но, признаюсь, раньше я ненавидел биологию до битов - может быть, байты или мегабайты )

Осенью 2013/14 те же Павел Павензер и Филип Компо из Rosalind познакомили меня с биоинформатикой ( я поступил на этот курс совершенно случайно ), и биоинформатика звучала довольно круто. Во-первых, так как программирование было довольно крутым, так как все, что мне нужно было делать, это применять строковые алгоритмы, а позже я был очарован красивым дизайном Генома Всевышним Аллахом.

Ну, вот краткое изложение моего опыта, чтобы поделиться с вами:

  • Купите хорошую книгу по геномике ( PS Верма и В.К. Агарвал довольно хорошая книга - я нашел ее достаточно хорошей )
  • Освойте базовые алгоритмы биоинформатики (те, которые вы найдете на Rosalind)
  • Проверьте сайты, такие как TCGA, ICGC, на наличие данных об экспрессии генов. Он в числовой форме, и вам понравится применять к ним статистические алгоритмы, такие как PCA, регрессия и т. д.
  • Если вас интересует классификация данных последовательности, я бы посоветовал вам прочитать String Kernels CS Leslie et al. ( Я могу предоставить вам его реализацию с использованием SVM на C++, если хотите )
  • Большинство курсов по биоинформатике учат вас алгоритмам выравнивания последовательностей или HMM. Они будут тратить ваше время. Не относитесь к ним слишком серьезно. Вы найдете причину отказа от HMM в документе String Kernel (HMM используют эвристический подход и очень медленны и неэффективны по сравнению с SVM).
  • Над эпигенетическими данными предстоит еще много работы. С небольшими усилиями вы можете внести свой вклад в сообщество, опубликовав свое исследование. Я бы порекомендовал вам проверить и этот аспект. Но опять же, беритесь за одно дело за раз, и вы начнете с Nature Scitable ( используйте только этот веб-сайт в течение первых двух недель - сохраняйте ясность ума и выполняйте одну задачу за раз. Я потратил свое время впустую, будучи жадным до слишком многому научился, пока не пришел к Nature Scitable and man!Это было именно то, что я искал. )
В то время как биоинформатика в настоящее время немного перегружена довольно стандартизированными проблемами, связанными с последовательностями, вы также можете рассмотреть такие темы, как компьютерное зрение (и в некоторой степени теория управления), которые в настоящее время встречаются во многих ведущих публикациях по вычислительной биологии.