Статистика: как виды белков распределяются по типам клеток?

В протеоме человека содержится примерно от 10 000 до 20 000 белковых видов (хотя я видел также цифры от 500 000 до 1 000 000 ). Кроме того, в человеческом теле насчитывается около 200 различных типов клеток . Мой вопрос:

Как виды белков распределяются по типам клеток?

Это означает конкретно:

Сколько белков экспрессируется n типами клеток?

Сколько типов клеток экспрессируют n белков?

Вероятно, эти числа точно неизвестны, потому что могут быть известны не все белки, которые экспрессирует данный тип клеток.

Но могут быть доказательства того, какую общую форму имеют две кривые распределения. Являются ли они распределениями Пуассона и больше похожи на это?

введите описание изображения здесь

Или это?

введите описание изображения здесь

Или это?

введите описание изображения здесь

Или какое-то другое распределение, например, Гаусса или даже мультимодальное?

Вы можете обратиться к этому веб-сайту - ncbi.nlm.nih.gov/pmc/articles/PMC4889822 . Этот веб-сайт дает широкое представление о распределении белковых видов. Таким образом, вы можете соотнести это со статистикой.
Вы можете найти некоторые важные данные на этом сайте: bionumbers.hms.harvard.edu
@Dirigible дает отличный ответ с хорошей литературой — вы также можете найти интерес к этой недавней статье «Аналитические распределения для подробных моделей стохастической экспрессии генов в эукариотических клетках» — включает белки (рис. 5): pnas.org/content/ 117/9/4682

Ответы (1)

Судя по моим поискам, не существует единого ресурса, включающего атлас всех белков человека, продуцируемых во всех типах клеток человека. Тем не менее, есть несколько недавних масс-спектрометрических исследований, в которых рассматриваются протеомы с разрешением по типу клеток для конкретных тканей человека и мыши, которые дают некоторое представление о распределении белков в разных клетках.

Протеом печени с разрешением по типу клеток

Это исследование выявило от 6200 до 8500 продуктов генов мыши в каждом из четырех типов клеток — гепатоцитах, звездчатых клетках печени, клетках Купфера и синусоидальных эндотелиальных клетках печени — и в общей сложности 10 075 продуктов генов во всех четырех типах клеток . Рисунок 1D показывает, что между протеомами существует значительное перекрытие; 5246 белков (52,1%) являются общими для всех четырех типов клеток, и только 1451 белок (14,4%) в этом наборе является эксклюзивным для клеточного типа. Помимо клеточно-резидентных белков, авторы также сообщают о секретируемых белках, уникальных для гепатоцитов и клеток Купфера. Эти результаты в целом подтверждают более раннюю публикацию « Количественная протеомика мышиной печени с разрешением по типу клеток»., где авторы сообщили, что 8 338 из 11 520 (72,4%) белков были общими для пяти протестированных типов клеток печени.

Протеом мозга мыши с разрешением по типу клеток и области мозга

В этом исследовании рассматривались четыре типа изолированных нейронов из определенных областей мозга мыши , а также пять типов первично культивируемых нейронов. Из 13 061 общего белка 10 529 (80,6%) являются общими для пяти протестированных типов культивируемых клеток, и только 194 (1,4%) являются уникальными для одного типа клеток. Рисунок 2D ясно показывает, что изобилие белка в разных типах клеток, а не только бинарное присутствие/отсутствие, важно для идентичности клеток. (Подробнее об этом ниже...)

Количественная протеомная карта сердца человека с разрешением по регионам и типам клеток

Что касается белков человека, упомянутых в вашем вопросе, в этой публикации проанализированы три типа сердечных клеток и жировые фибробласты в 16 анатомических областях, что дает как пространственную, так и функциональную перспективу распределения типов белков в сердце человека . Рисунок 5A , как и рисунок 1D для статьи о протеоме печени мыши, показывает большое количество перекрывающихся белков между типами клеток: из 11 163 общих белков 7 965 (71,4%) являются общими для всех типов клеток (включая жировые фибробласты) и 617 ( 5,5%) уникальны для одного типа клеток. Интересно и, возможно, неудивительно, что подмножества белков, уникальных для конкретных клеток, обогащены маркерами клеточной поверхности. (См. также: Поверхность человека in silico )

Архитектура социальной сети иммунных клеток человека раскрыта с помощью количественной протеомики

Эти авторы идентифицировали более 10 000 различных белков в 28 первичных популяциях гемопоэтических клеток человека с тремя или четырьмя биологическими репликами на тип клеток, включая 17 различных типов иммунных клеток. Они идентифицировали в среднем 9500 белков на тип клеток, а для иммунных клеток создали как «стационарные», так и «активированные» протеомы, что дало представление о том, как протеом изменяется как между типами клеток, так и внутри каждого типа между состояниями .

Чтобы прямо ответить на ваш вопрос,

Как виды белков распределяются по типам клеток?

Я взял данные из дополнительной таблицы 6 , усреднил повторы, преобразовал значения количества копий белка в бинарную матрицу присутствия/отсутствия и вычислил количество типов иммунных клеток (1–17), представленных каждым уникальным идентификатором белка. График вставки объединяет метки типа клеток и состояния активации, чтобы выяснить, преобладает ли эффект активации над различиями типов клеток в расхождении протеома.

сравнение протеома иммунных клеток, бинарное

Наличие/отсутствие, без порога — Уникальное распределение белка по 17 типам первичных иммунных клеток. Белок считается «присутствующим» в типе клеток, если среднее значение числа копий больше нуля. Данные Rieckmann et al . Нат Иммунол. 2017.

Поскольку предполагаемые числа копий белков из данных масс-спектрометрии охватывают широкий динамический диапазон, я также рассмотрел распределение белков, которые имели средние значения числа копий, по крайней мере, вдвое превышающие среднее значение числа копий для нулевого истощения клеток, специфичное для типа клеток. .

медианный порог, протеомы иммунных клеток

Белки в большом количестве — уникальное распределение белков среди 17 первичных типов иммунных клеток. Пары белок-клетка подсчитывают только в том случае, если среднее число копий белка по меньшей мере вдвое превышает среднее число копий белка для каждого типа клеток. Данные Rieckmann et al . Нат Иммунол. 2017.

В совокупности эти дистрибутивы предполагают несколько вещей:

  • для этого разнообразного набора иммунных клеток большинство белков присутствуют во всех типах клеток, если смотреть на строгие данные о наличии / отсутствии
  • после подгруппы для очень распространенных белков появляется бимодальное распределение, предполагающее, что количество белков является лучшим показателем для функционального сравнения протеомов, чем простая бинарная метрика.
  • протеомы одного типа клеток между разными состояниями активации более похожи, чем протеомы разных типов клеток в одном и том же состоянии

Для всех, кто заинтересован, я сделал очищенные данные доступными в Dropbox .

Более полный ответ мог бы объединить данные из публикаций по иммунным клеткам и клеткам сердца, чтобы получить представление о согласованности протеомов в тканях, но даже при беглом анализе различия в метках белков между наборами данных сделают сравнение утомительным, поэтому я приведу оставь это кому-то другому!