Машинное обучение выявляет генетические связи между клетками крови и болезнями
Ученые из Кембриджской инициативы по системной геномике Бейкера использовали машинное обучение для создания генетических предикторов признаков клеток крови, таких как количество лейкоцитов, которые связаны с хроническими заболеваниями.
Исследование, опубликованное сегодня в журнале Cell Genomics, выявило общую генетическую архитектуру между характеристиками клеток крови и различными распространенными заболеваниями, включая ишемическую болезнь сердца.
Старший автор исследования профессор Майкл Иноуе, заведующий кафедрой прогнозирования и профилактики сердечно-сосудистых заболеваний Института Бейкера, сказал, что полученные результаты могут проложить путь к новым, персонализированным методам для лучшего прогнозирования, профилактики и лечения различных заболеваний, включая болезни сердца - главного убийцы в мире. Клетки крови играют важную роль в различных биологических процессах, обеспечивающих нормальную работу нашего организма.
Характеристики клеток крови - такие как количество клеток и соотношение различных типов - являются одними из наиболее распространенных тестов в здравоохранении. Эти признаки частично наследуются, а их генетическая архитектура является полигенной, что означает, что на них влияет сочетание многих генетических вариантов.
Команда профессора Иноуе хотела найти лучший способ предсказать характеристики клеток крови индивидуума, собрав воедино прогностическую информацию из всего генома человека, известную как полигенная оценка. Однако разработка полигенных показателей - это все еще относительно новый процесс. Он остается сложным, поскольку в геноме человека известно более 324 миллионов вариантов, а оптимальные методы неясны.
Чтобы решить эту проблему, группа профессора Иноуэ изучила шесть различных методов машинного и глубокого обучения, используя данные из крупных исследовательских биобанков, таких как UK Biobank и INTERVAL. Затем они использовали лучший метод для достижения оптимальной предсказательной силы для 25 различных признаков клеток крови.
"Измерения клеток крови используются во всем мире для принятия клинических решений. Однако клетки крови у всех разные, и эти различия частично наследуются. В настоящее время мы не учитываем эти генетические различия в здравоохранении, но эти оптимизированные с помощью машинного обучения полигенные показатели должны помочь в этом", - сказал профессор Иноуе.
Соединив новые мощные полигенные показатели с уже разработанными для расчета наследственного риска хронических заболеваний, авторы исследования подтвердили хорошо известные связи между определенными признаками клеток крови и такими заболеваниями, как астма, ревматоидный артрит, шизофрения и болезнь Крона. Но команда также выявила новые ассоциации между признаками клеток крови и болезнью коронарных артерий.
"Сравнивая их общую генетику, мы смогли определить, какие черты клеток крови могут быть индикаторами или посредниками риска развития ишемической болезни сердца", - сказал профессор Иноуе.
Далее мы показали, что влияние полигенных показателей меняется в зависимости от того, мужчина вы или женщина, что также может привести к совершенно разным траекториям развития признаков клеток крови с возрастом".
"В совокупности это исследование является важным шагом к персонализации того, как мы можем использовать информацию, содержащуюся в одном из самых распространенных медицинских тестов в мире. Она может быть использована как для прогнозирования индивидуальной траектории изменения характеристик клеток крови по мере старения человека, так и для определения того, что это может означать для риска развития многих различных заболеваний, включая сердечные болезни"
Оптимизированные показатели теперь находятся в открытом доступе в PGS Catalog, что позволит проводить дальнейшие трансляционные исследования и разработки.