+

Анализ NGS-данных


Девятидневный практический курс прошел
в Москве 15-19, 22-25 марта. Следующий курс
планируется в июле 2021 года.

В курсе будут рассмотрены основные типы NGS-данных, а также продвинутые технологии — секвенирование единичных клеток и нанопоровое секвенирование.

Учиться можно самому, на факультативах или перенимать опыт коллег. Но на это часто не хватает времени и мотивации, поэтому мы предлагаем формат интенсива: за девять дней вы научитесь обрабатывать и анализировать данные современного секвенирования.
Интенсив будут вести профессионалы-практики с опытом преподавания.

Приглашаем биологов, биоинформатиков, и программистов — всех, кому интересно получить опыт работы с NGS-данными.
Мы заранее расспросим о вашем бэкграунде и посоветуем, знания в каких областях следует подтянуть до курса. Однако предварительные знания по молекулярной биологии, статистике, работе в командной строке, опыт программирования на R и Python весьма желательны.
Важно: мы немного изменили программу курса и теперь ожидаем, что у вас есть базовые навыки работы с командной строкой и языками R и Python. Если вы новичок, мы опубликовали методические материалы для знакомства со средой Linux, командной строкой и обучения основам языков R и Python. Рекомендуем перед курсом изучить эту техническую часть, она содержит только необходимые для прохождения курса навыки.
Программа
Первый день:
Обзор методов секвенирования

Контроль качества данных
Методы секвенирования. Процесс анализа сиквенсных данных с ответвлениями или этапами для частных случаев.

Контроль качества результатов секвенирования. Понятие качества чтения. Источники ошибок и особенности чтений, полученных на разных платформах. Подготовка чтений (тримминг). Технические последовательности. Разбор отчетов FastQC.
Второй день:
Сборка геномов и транскриптомов
Сборка геномов de novo. Алгоритмические подходы к сборке (overlap-consensus-layout, графы Де Брёйна). Контиги и скаффолды. Скаффолдинг. Классификация сборок, улучшение качества сборки. Нестандартные методы сборки.

Влияние платформы и параметров секвенирования (длина чтения, длина вставки, покрытие) на строку. Выбор стратегии секвенирования. Оценка качества сборки. N50. Сравнение сборок.

Транскриптомные сборки de novo.
Третий и четвертый день:
Анализ данных полногеномного и полноэкзомного секвенирования

РНК-секвенирование
Ресеквенирование. Парные выравнивания. Алгоритмы картирования чтений на геном. Программы-картировщики и основные форматы данных, используемые для хранения выравниваний. Терминология картирования. Особенности парных чтений. Влияние референса. 

Поиск структурных вариантов (SNV-calling). Обзор принципа метода. Набор программ GATK. Формат VCF. Описание типичного протокола поиска однонуклеотидных полиморфизмов. 

Введение в РНК-секвенирование. Fatsqc, multiqc, trimmomatics. Картирование. Hisat2. Сборка транскриптов. Stringtie. Квантификация (htseq-count, stringtie, etc).
Пятый день:
РНК-секвенирование (продолжение)
Проверка самосогласованности: корреляционная тепловая карта, PCA/MDS, t-test, поправка на множественное тестирование. lm/ANOVA, glm/ANODEV, нормализация. 

Дифференциальная экспрессия (edgeR), дифференциальный сплайсинг (DEXseq, SAJR), функциональный анализ (topGO). Визуализация данных РНК-сек в IGV и при помощи R. Кластеризация генов по паттернам.
Шестой день:
Анализ WGS: аннотация и анализ метилирования ДНК
Аннотация для WGS человека. 

Эпигенетика. Эпигенетическая регуляция экспрессии генов. Метилирование ДНК, функции. Методы анализа метилирования ДНК. Бисульфитная конверсия. WGBS, RRBS и другие. 

Пайплайн обработки данных бисульфитного секвенирования, стандарты и особенности. Анализ данных бисульфитного секвенирования. Дифференциальное метилирование.
Седьмой день:
Метагеномика
Методы профилирования состава микробиома на основании NGS. Ампликонное и shotgun (WGS) секвенирование. Референсные базы данных (SILVA, GreenGenes, RDP).

Предобработка ридов и таксономическая классификация 16S рРНК/ITS данных (QIIME2, DADA2, Deblur). Интерактивный анализ данных по микробиому (Knomics-Biota).

Определение состава сообщества по shotgun-метагеномам: от кладоспецифичных маркеров (MetaPhlAn2) до анализа MAG (MetaBat2). Hi-C метагеномика.

Предсказание метаболического потенциала по 16S рРНК данным (PICRUSt, Tax4fun, FAPROTAX).

Особенности статистической обработки данных по составу микробиоты: разреженность (виды нулей в таблице представленностей, замена на псевдо-отсчеты, GBM и пакет zCompositions в R), композиционность (alr-, clr- и ilr-преобразования, методы philr, selbal, gneiss, DBA, amalgam).

Альфа- и бета-разнообразие: метрики (chao1, Shannon, UniFrac, Bray-Curtis, Aitchison distance), визуализация (MDS, PCoA).
Восьмой день:
Анализ данных секвенирования единичных клеток: scRNA-Seq и snRNA-Seq
Общая схема эксперимента scRNA-Seq и snRNA-Seq. Amplification bias и UMI. Основные методы подготовки библиотек scRNA-Seq: SMART-Seq и 10x Chromium. Плюсы и минусы каждого из методов. CITE-seq.

Основной пайплайн обработки scRNA-Seq. QC данных. Способы кластеризации данных. Дополнительные стадии обработки scRNA-Seq: CellPhoneDB, RNA velocity, определений траекторий и прочее.

Основные результаты в исследованиях опухолей при помощи scRNA-Seq.
Девятый день:
Перспективные технологии секвенирования - Nanopore
Особенности приборов и протоколов. Примеры биологических задач использования технологии. Сборка и картирование чтений.

Пайплайн по анализу метагеномных данных, анализ секвенирования РНК и модификаций в ДНК.
Почему вам стоит взять наш курс:
Вы будете знать конкретные пайплайны для анализа каждого типа данных.

⁍ Мы расскажем вам о бесплатных пакетах и ключевых базах данных, которые используются в современном научном и индустриальном мире.

⁍ На каждом этапе вы будете понимать с чем работаете и как оценивать качество текущей работы.
⁍ Мы разберем конкретные примеры задач, характерные для каждого типа NGS-данных. В каждой теме вы научитесь с нуля анализировать данные до достижения результата хотя бы для одного частного случая.

⁍ Мы продемонстрируем вам экспертные решения, куда двигаться при различных промежуточных результатах с реальными числовыми значениями.

⁍ Вы получите знания о возможностях обработки данных несколькими способами с рекомендациями, что считать наиболее близким к истинному результату.

⁍ Вы научитесь формулировать задачи биоинформатикам (или самому себе :)), будете представлять, сколько времени и сил требуется для выполнения конкретных задач.


⁍ По окончании курса мы дадим вам материалы с расшифровкой основных терминов, указанием программ обработки данных и полезными советами по каждой теме.


⁍ После прохождения курса биологи смогут запускать базовые анализы по современным пайплайнам и поймут пользу и ограничения разных разделов NGS, биоинформатики – повысят свою универсальность, а программисты смогут продолжить самостоятельное изучение данных секвенирования.

Преподаватели
  • Павел Мазин
    Выпускник ФББ МГУ, научный сотрудник Сколковского института науки и технологий, доцент НИУ ВШЭ.
  • Евгений Герасимов
    Выпускник биофака МГУ, к.б.н., с.н.с. лаборатории геномики простейших кафедры молекулярной биологии Биофака МГУ.
    Разработчик ПО T-Aligner.
  • Степан Тощаков
    Выпускник биофака МГУ, генетик, с.н.с. в ФИЦ Биотехнологии РАН, к.б.н.
  • Вера Одинцова
    Выпускница мехмата МГУ,
    информатик в Atlas Biomed Group,
    одна из разработчиков платформы Knomics-Biota.
  • Валерия Микова
    Окончила бакалавриат на кафедре биоинформатики в МФТИ, магистратуру по программе Life Sciences в Сколтехе. Биоинформатик в ФГБУ «ЦСП» ФМБА, преподаватель МФТИ.
  • Наталья Клименко
    Выпускница МГТУ им Баумана, биоинформатик в Институте биологии гена и в компании Кномикс.
  • Влад Бабенко
    Выпускник биофака МГУ, научный сотрудник лаборатории геномных исследований и вычислительной биологии ФГБУ ФНКЦ физико-химической медицины ФМБА.
  • Александр Тяхт
    Выпускник ВМиК МГУ, к.б.н., директор по технологиям в компании Кномикс, зав. группой биоинформатики ИБГ РАН.
  • Сергей Исаев
    И.о. младшего научного сотрудника ИППИ РАН, биоинформатик в BostonGene.
Из отзывов участников

Мурад Омаров
выпускник РГАУ-МСХА, студент ФКН НИУ ВШЭ
Мне понравилось. Преподаватели все молодцы. Больше бы практики чуть: именно кейсов по реальным данным. И, наверно, в начале следует объяснять неподготовленным участникам, что универсальных пайплайнов, подходящих под все данные нет и не надо ныть, что таких не выкладывают. Мы учимся, когда нам сложно и приходится думать)

Айжан Турмагамбетова
Ведущий научный сотрудник в Институте микробиологии и вирусологии
Посоветовала бы [курс] тем биологам, кто знаком с командной строкой и обладает навыками программирования. Мне кажется, что для них это просто замечательный курс, во всяком случае они вынесут из него очень много полезного для дальнейшей работы именно по анализу данных секвенирования.

Анна Торгашева
Научный сотрудник в Институте Цитологии и Генетики СО РАН
Понравились преподаватели, насыщенность, количество охваченных тем, соотношение теории и практики место проведения. Уровень оказался идеальным для моего биологического бэкграунда и (небольшого) опыта работы с данными NGS.
Ребята, вы классные :)

Татьяна Наседкина
Ведущий научный сотрудник ИМБ РАН
Для меня это был очень сильный мозговой штурм, вся информация еще до конца не уложилась. Но курс был суперполезный. То, что было знакомо, лучше структурировалось, кроме того, очень много нового и интересного, о чем было очень слабое и общее представление.

Алина Балыкова
мнс в лаборатории молекулярной микробиологии ФКУЗ РосНИПЧИ «Микроб»
Что понравилось на курсе?
Понравилась организация, работа тех. ассистентов и преподаватели, особенно Артем Касьянов, его день уложился лучше всего. Также организация кофе-брейка — блеск.
Что не понравилось на курсе? 
Не понравилось, что было заложено много тем (специфических), которые просто пробежали, но материалы остались, поэтому есть возможность разобраться самой, все охватить, конечно, нельзя. 

Валерий Черанев
Инженер в геномном центре РНИМУ
Огромная благодарность организаторам и всем лекторам! Получилось очень интересно и полезно!
Понравилось оперативное реагирование, подход большинства преподавателей и интересные лекции, полезные ссылки и общий обзор плюсов и минусов того или иного метода (этого бы хотелось побольше т.к. это было основным стимулом для среднеподготовленных студентов).
Полноценный онлайн-вариант
⁍ Онлайн участники задают вопросы в реальном времени, обсуждают с преподавателями задачи практикума

⁍ Общий чат для всех участников и преподавателей

⁍ Мы предусмотрели онлайн-ассистентов с возможностью персональных консультаций
Оставить заявку на следующий поток (планируется в июле 2021 года)
При записи вы соглашаетесь на обработку персональных данных и c политикой конфиденциальности
Договор оферты для физлиц
Договор оферты для юрлиц

На наших курсах соблюдают правила безопасности: участники из разных лабораторий сидят по одному, ТА и организаторы носят маски, регулярно обрабатывают руки и предметы антисептиком.


Оргкомитет
Директор Бластима, сооснователь Кситеста
Вита Степанова
Управляющий партнер Бластима
Наталья Мнафки
Организатор курса
Ольга Стукалова
Руководитель проектов Science Media Projects