Системная биология – сети М.Гельфанд «Сравнительная геномика» БиБи 4 курс
разные сети белок-белковые взаимодействия регуляторные сети (фактор-ген) метаболические
свойства сетей N = количество вершин распределение степеней вершин P(k) = вероятность того, что у случайно взятой вершины будет k ребер средняя длина пути между вершинами L
случайная сеть пуассоновское распределение P(k) = exp(-λ) λk / k! Теорема Эрдеша-Реньи: фазовый переход – возникновение гигантской компоненты средняя длина пути ~ log N
scale-free network P(k) ~ k–γ γ>3 – ничего особенного 2<γ<3 – hubs, иерархия γ=2 большой hub, соединенный с большой долей вершин При γ<3 удаление случайной вершины не разрушает сеть, удаление hub’а – разрушает средняя длина пути (при 2<γ<3) ~ log log N
Random and scale-free P(k) (linear and log scales)
Коэффи-циент класте-ризации Мера связи между соседями данной вершины
примеры белок-белковые взаимодействия синтетические летали регуляция транскрипции метаболические сети
Yeast protein interaction network Data from the high-throughput two-hybrid experiment (T. Ito, et al. PNAS (2001) ) The full set containing 4549 interactions among 3278 yeast proteins 87% nodes in the largest component The highest connected protein interacts with 285 others! Figure shows only nuclear proteins
Гигантская компонента в графе белок-белковых взаимодействий в дрожжах Красный – летальная мутация Оранжевый – медленный рост Желтый – неизвестно Зеленый – нелетальная мутация
Белок-белковые взаимодействия в дрожжах: P(k) и размеры связных компонент
Synthetic lethals in yeast
Rank vs. degree for metabolites and reactions in Helicobacter pylori
Transcription regulatory network in baker’s yeast Downloaded from the YPD database: 1276 regulations among 682 proteins by 125 transcription factors (10 regulated genes per TF) Part of a bigger genetic regulatory network of 1772 regulations among 908 proteins Positive to negative ratio 3:1 Broader distribution of out-degrees (up to 72) and more narrow of in-degrees (up to 21)
регуляция транскрипции (дрожжи, ChIP-chip) A: in-degree (относительно регулируемых генов): гистограмма (в полулогарифмических координатах) количества промоторов с заданным числом регуляторов– экспоненциальное распределение (у большинства генов мало регуляторов). Пустые кружки – случайный граф В: out-degree (относительно факторов): гистограмма количества факторов, связывающих заданное количество промоторов – scale-free
Transcription regulatory network in Homo Sapiens Data courtesy of Ariadne Genomics obtained from the literature search: 1449 regulations among 689 proteins Positive to negative ratio is 3:1 (again!) Broader distribution of out-degrees (up to 95) and more narrow of in-degrees (up to 40)
Transcription regulatory network in E. coli Data (courtesy of Uri Alon) was curated from the Regulon database: 606 interactions between 424 operons (by 116 TFs) Positive to negative ratio is 3:2 (different from eukaryots!) Broader distribution of out-degrees (up to 85) and more narrow of in-degrees (only up to 6 !)
зависимость физиологических и геномных свойств от топологии дрожжи: ~10% genes with <5 links are essential >60% genes with >15 links are essential гены с большим числом связей с большей вероятностью имеют ортологов в многоклеточных эукариотах ближе к ортологам из C. elegans
party hubs и date hubs Бимодальное распределение корреляций уровня экспрессии Красный: hubs Голубой: non-hubs Черный: случайный граф Party hubs: сам и соседи ко-экспрессируются (комплексы) Date hub: нет корреляции в уровнях экспрессии (сигнальные пути)
Устойчивость к атаке (распадение гигантской компоненты) основа сети – party hubs Красный: атака на party hubs Коричневый: атака на все хабы Голубой: атака на date hubs Зеленый: атака на случайные белки
мотивы клики много в графах белок-белковых взаимодействий (масс-спек. анализ комплексов – по определению) подграфы фиксированной структуры, встречающиеся существенно чаще, чем в случайном графе (с теми же свойствами)
Регуляторный каскад R – транскрипционная регуляция Х – ко-экспрессия
R – транскрипционная регуляция Р – белок-белковое взаимодействие Н – гомология
Субъединицы факторов транскрипции R – транскрипционная регуляция Р – белок-белковое взаимодействие Н – гомология
R – транскрипционная регуляция Р – белок-белковое взаимодействие Х – ко-экспрессия Н – гомология
Регулоны R – транскрипционная регуляция Р – белок-белковое взаимодействие Х – ко-экспрессия Н – гомология
Р – белок-белковое взаимодействие Х – ко-экспрессия
Ко-экспрессия в комплексах Р – белок-белковое взаимодействие Х – ко-экспрессия
S – синтетические летали (слабость) Н – гомология
Взаимозаменяемость паралогов (?) S – синтетические летали (слабость) Н – гомология
Компенсаторные комплексы (?) S – синтетические летали (слабость) Н – гомология Р – белок-белковое взаимодействие Х – ко-экспрессия
Четверные мотивы: взаимозаменяемость
Регуляция транскрипции в E.coli Почти все “bi-fan” мотивы связаны друг с другом
эволюция rich get richer дупликации случайные рождения/исчезновение ребер