База данных подтвержденных с медицинской точки зрения SNP

Я ищу все возможные источники клинически протестированных человеческих SNP. Существует несколько баз данных, в которых хранятся SNP (например, dbSNP), но мне нужны только те, которые подтвердили наличие/отсутствие фенотипических эффектов с некоторыми дополнительными метаданными. Заранее спасибо.

Любой тип заболевания или только его подмножество?
@mdperry подойдет любая менделевская болезнь.
@EliKorvigo Разве вы не нашли нужную информацию в базах данных GWAS, о которых я упоминал ниже?
@WYSIWYG Я изо всех сил пытаюсь найти настоящие минусы. Я уже нашел много истинных положительных моментов, хотя. Спасибо за ваш ответ. Я подожду пару дней, прежде чем принять его, на случай, если кто-то еще придумает действенный способ найти истинные негативы.
@EliKorvigo Я думаю, для этого вам, возможно, придется проверить оригинальное исследование и получить статистику.
@EliKorvigo - Будьте осторожны со статистикой исследований GWAS. Клинически мы не слишком в восторге от них, потому что экономическая эффективность проведения исследования превзошла возможности соответствующего статистического анализа - размеры выборки почти всегда слишком малы - слишком много шума, чтобы сигнализировать - есть несколько обзоров для обсуждения это, например [ ncbi.nlm.nih.gov/pubmed/18464043] (обзор)
@VanceAlbaugh Спасибо, что указали на это. Да, на данный момент у нас много данных, но мы должны быть осторожны, прежде чем делать выводы. Было много дискуссий о правильном статистическом анализе.
@VanceAlbaugh точно. В этом весь смысл этого вопроса - я не могу полагаться на доступные биоинформатические исследования GWAS, чтобы получить набор истинно отрицательных SNP из-за статистических проблем. Поэтому я отчаянно пытаюсь найти что-то, что было клинически подтверждено.
@EliKorvigo - да, удачи с этим - я не знаю ни одного исследования GWAS, которое было бы воспроизведено статистически достоверным образом извне и было опубликовано. Если бы кто-то сделал это, это было бы большой проблемой, потому что анализ данных еще не совершенен. У нас есть аналогичные вопросы в метаболомике, протеомике и РНКсек. Слишком много шума, недостаточно сигнала.
Я добавил несколько ссылок на данные, которые мне удалось собрать.

Ответы (2)

Вы можете искать по признакам (в основном заболеваниям) полногеномную ассоциацию в этих базах данных:

Просто чтобы сделать этот пост немного более полезным, я должен добавить, что есть несколько дополнительных источников, которые я нашел:

  • UniProt имеет открытый набор данных под названиемhumsavar
  • База данных ClinVar
  • База данных HGMD
  • ОМИМ
  • Статья с собранной вручную базой данных на основе последних публикаций в Nature Genetics.

Различные наборы данных в некоторой степени пересекаются, но в целом вы получаете более 200 тысяч проверенных SNP.