+

Анализ NGS-данных


Девятидневный практический курс,
25-30 января и 1-3 февраля.

На выбор — в Москве или онлайн!
Открыта предварительная запись на следующий поток.
В курсе будут рассмотрены основные типы NGS-данных, а также продвинутые технологии — секвенирование единичных клеток и нанопоровое секвенирование.

Учиться можно самому, на факультативах или перенимать опыт коллег. Но на это часто не хватает времени и мотивации, поэтому мы предлагаем формат интенсива: за девять дней вы научитесь обрабатывать и анализировать данные современного секвенирования.

Интенсив будут вести профессионалы-практики с опытом преподавания.

Приглашаем биологов, биоинформатиков, и программистов — всех, кому интересно получить опыт работы с NGS-данными.

Мы заранее расспросим о вашем бэкграунде и посоветуем, знания в каких областях следует подтянуть до курса. Однако предварительные знания по молекулярной биологии и статистике весьма желательны. Для того, чтобы вам было легче практиковаться, мы предусмотрели отдельный день для обучения основам языков R и Python и ознакомления с командной строкой и Linux — только то, что вам точно понадобится на курсе ;-)
Программа
Первый день:
Обзор методов секвенирования,
введение в Linux, R, Python, обращение с командной строкой
Методы секвенирования. Процесс анализа сиквенсных данных с ответвлениями или этапами для частных случаев.

Вводный день, посвященный ознакомлению с основными терминами, командами и операциями для работы с данными NGS.
Второй день:
Сборка геномов и транскриптомов
Чтение, длина вставки, контиг, скаффолд, покрытие, k-mer, N50. Выбор платформы и библиотек. Чем хорошая сборка отличается от плохой. Разбор типовых ошибок.
Третий и четвертый день:
Анализ данных полногеномного и полноэкзомного секвенирования
Выравнивание, поиск коротких мутаций и структурных вариантов, оценки качества, аннотация вариантов. Прогнозирование эффекта.

Применение для клинической генетики и анализ небольших когорт. Поиск ассоциаций.
Пятый день:
Полногеномный анализ метилирования ДНК
Эпигенетика. Эпигенетическая регуляция экспрессии генов. Метилирование ДНК, функции. Методы анализа метилирования ДНК. Бисульфитная конверсия. WGBS, RRBS и другие.

Пайплайн обработки данных бисульфитного секвенирования, стандарты и особенности. Анализ данных бисульфитного секвенирования. Дифференциальное метилирование.

Шестой день:
Метагеномика
Методы профилирования состава микробиома на основании NGS. Ампликонное и shotgun (WGS) секвенирование. Референсные базы данных (SILVA, GreenGenes, RDP).

Предобработка ридов и таксономическая классификация 16S рРНК/ITS данных (QIIME2, DADA2, Deblur). Интерактивный анализ данных по микробиому (Knomics-Biota).

Определение состава сообщества по shotgun-метагеномам: от кладоспецифичных маркеров (MetaPhlAn2) до анализа MAG (MetaBat2). Hi-C метагеномика.

Предсказание метаболического потенциала по 16S рРНК данным (PICRUSt, Tax4fun, FAPROTAX).

Особенности статистической обработки данных по составу микробиоты: разреженность (виды нулей в таблице представленностей, замена на псевдо-отсчеты, GBM и пакет zCompositions в R), композиционность (alr-, clr- и ilr- преобразования, методы philr, selbal, gneiss, DBA, amalgam).

Альфа- и бета-разнообразие: метрики (chao1, Shannon, UniFrac, Bray-Curtis, Aitchison distance), визуализация (MDS, PCoA).
Седьмой день:
РНК-секвенирование
Введение. Контроль качества. Fatsqc, multiqc, trimmomatics. Картирование. Hisat2. Сборка транскриптов. Stringtie. Квантификация (htseq-count, stringtie, etc).

Проверка самосогласованности: корреляционная тепловая карта, PCA/MDS, t-test, поправка на множественное тестирование. lm/ANOVA, glm/ANODEV, нормализация.

Дифференциальная экспрессия (edgeR), дифференциальный сплайсинг (DEXseq, SAJR), функциональный анализ (topGO). Визуализация данных РНК-сек в IGV и при помощи R. Кластеризация генов по паттернам.
Восьмой день:
Анализ данных секвенирования единичных клеток: scRNA-Seq и snRNA-Seq
Общая схема эксперимента scRNA-Seq и snRNA-Seq. Amplification bias и UMI. Основные методы подготовки библиотек scRNA-Seq: SMART-Seq и 10x Chromium. Плюсы и минусы каждого из методов. CITE-seq.

Основной пайплайн обработки scRNA-Seq. QC данных. Способы кластеризации данных. Дополнительные стадии обработки scRNA-Seq: CellPhoneDB, RNA velocity, определений траекторий и прочее.

Основные результаты в исследованиях опухолей при помощи scRNA-Seq.
Девятый день:
Перспективные технологии секвенирования - Nanopore
Особенности приборов и протоколов. Примеры биологических задач использования технологии. Сборка и картирование чтений.

Пайплайн по анализу метагеномных данных, анализ секвенирования РНК и модификаций в ДНК.
Почему вам стоит взять наш курс:
Вы будете знать конкретные пайплайны для анализа каждого типа данных.

⁍ Мы расскажем вам о бесплатных пакетах и ключевых базах данных, которые используются в современном научном и индустриальном мире.

⁍ На каждом этапе вы будете понимать с чем работаете и как оценивать качество текущей работы.
⁍ Мы разберем конкретные примеры задач, характерные для каждого типа NGS-данных. В каждой теме вы научитесь с нуля анализировать данные до достижения результата хотя бы для одного частного случая.

⁍ Мы продемонстрируем вам экспертные решения, куда двигаться при различных промежуточных результатах с реальными числовыми значениями.

⁍ Вы получите знания о возможностях обработки данных несколькими способами с рекомендациями, что считать наиболее близким к истинному результату.

⁍ Вы научитесь формулировать задачи биоинформатикам (или самому себе :)), будете представлять, сколько времени и сил требуется для выполнения конкретных задач.


⁍ По окончании курса мы дадим вам материалы с расшифровкой основных терминов, указанием программ обработки данных и полезными советами по каждой теме.


⁍ После прохождения курса биологи смогут запускать базовые анализы по современным пайплайнам и поймут пользу и ограничения разных разделов NGS, биоинформатики – повысят свою универсальность, а программисты смогут продолжить самостоятельное изучение данных секвенирования.

Преподаватели
  • Павел Мазин
    Выпускник ФББ МГУ, научный сотрудник Сколковского института науки и технологий, доцент НИУ ВШЭ.
  • Екатерина Нуждина
    Выпускница ФББ МГУ, аспирант в Центре теоретических проблем физико-химической фармакологии РАН, Sr. Bioinformatics Scientist в Bostongene.
  • Евгения Зотова
    Выпускница ФББ МГУ, Аналитик в ФГБУ «ЦСП» ФМБА, составитель и ведущая учебных курсов в МГУ и Сколтехе.
  • Степан Тощаков
    Выпускник биофака МГУ, генетик, с.н.с. в ФИЦ Биотехнологии РАН, к.б.н.
  • Вера Одинцова
    Выпускница мехмата МГУ,
    информатик в Atlas Biomed Group,
    одна из разработчиков платформы Knomics-Biota.
  • Валерия Микова
    Окончила бакалавриат на кафедре биоинформатики в МФТИ, магистратуру по программе Life Sciences в Сколтехе. Биоинформатик в ФГБУ «ЦСП» ФМБА, преподаватель МФТИ.
  • Анна Петухова
    Окончила ПМГМУ имени Сеченова по специальности биоинженерия и биоинформатика, Аналитик в ФГБУ «ЦСП» ФМБА, преподаватель в совместной магистратуре ФБМФ МФТИ и Napoleon IT.
  • Артем Касьянов
    Выпускник ВМиК МГУ, с.н.с. Института проблем передачи информации.
  • Наталья Клименко
    Выпускница МГТУ им Баумана, биоинформатик в Институте биологии гена и в компании Кномикс.
  • Влад Бабенко
    Выпускник биологического факультета МГУ, научный сотрудник лаборатории геномных исследований и вычислительной биологии ФГБУ ФНКЦ физико-химической медицины ФМБА.
  • Александр Тяхт
    Выпускник ВМиК МГУ, к.б.н., директор по технологиям в компании Кномикс, зав. группой биоинформатики ИБГ РАН.
  • Сергей Исаев
    И.о. младшего научного сотрудника ИППИ РАН, биоинформатик в BostonGene.
Из отзывов участников

Наталья Гоголева
С.н.с. лаборатории молекулярной биологии Казанского института биохимии и биофизики КазНЦРАН
На самом деле всё очень понравилось.
Прекрасная организация, место проведения, обеды и кофе-брейки.
Эмоций много. Эти курсы, как это сейчас говорят, «сделали» мои дальнейшие планы и действия в моих исследованиях. :) Очень полезно и необходимо общаться с профессионалами в рамках таких курсов. Спасибо вам!

Айжан Турмагамбетова
Ведущий научный сотрудник в Институте микробиологии и вирусологии
Посоветовала бы [курс] тем биологам, кто знаком с командной строкой и обладает навыками программирования. Мне кажется, что для них это просто замечательный курс, во всяком случае они вынесут из него очень много полезного для дальнейшей работы именно по анализу данных секвенирования.

Анна Торгашева
Научный сотрудник в Институте Цитологии и Генетики СО РАН
Понравились преподаватели, насыщенность, количество охваченных тем, соотношение теории и практики место проведения. Уровень оказался идеальным для моего биологического бэкграунда и (небольшого) опыта работы с данными NGS.
Ребята, вы классные :)

Георгий Арапиди
ИБХ РАН, инженер лаборатории Протеомики МФТИ(ГУ), научный сотрудник лаборатории Системной биологии
Здорово, что вы не дали нам отдыхать! (как бы это странно не звучало) Получился действительно интенсивный курс: много интересных лекций, домашка (которой приходилось жертвовать) и "ночной" проект.

Интернет подкачал - хотя могло было быть и хуже) Просто все остальное было замечательно, а поругать нужно же за что-то))

Вы бы посоветовали курс коллегам?
Обязательно! И даже уже знаю кому.

Полина Павлович
Студентка, Moscow Institute of Physics and Technology (MIPT), Shemyakin-Ovchinnikov Institute of Bioorganic Chemistry, RAS
Очень понравился ваш доброжелательный и позитивный подход к школе=) Было видно, что вы стараетесь сделать курс наиболее комфортным для всех и создать приятную атмосферу всего курса: занятий и отдыха)
Не было прям такого, что ну вообще не понравилось) Аа интернет мог быть побыстрее!!=)

Вообще все признались, что не хватало последнего "веселого вечера" после защиты=)) Хотя без всего этого осталось ощущение интенсивного обучения, "все по-серьезному"))

Александр Гришин
Биоинформатик в лаборатории протеомики ИБХ РАН
Вы бы посоветовали курс коллегам?
Уже посоветовал. Коротко говоря, все действительно было прекрасно и с любовью подготовлено для очень комфортной и очень эффективной учебы.

Хотелось бы высказать благодарность организаторам - чувствовался труд, вложенный для проведения высококлассного интенсива. Продолжайте в том же духе.
Полноценный онлайн-вариант
⁍ Онлайн участники задают вопросы в реальном времени, обсуждают с преподавателями задачи практикума

⁍ Общий чат для всех участников и преподавателей

⁍ Мы предусмотрели онлайн-ассистентов с возможностью персональных консультаций
Участники на январский поток набраны, открыта предварительная запись на следующий поток!
Студенты дневных и вечерних отделений получают скидку 30%, скидка для аспирантов — 10%. Попросим сообщить название вуза, телефон деканата и контактное лицо.

Для обучения понадобится ноутбук с любой операционной системой. Позже мы напишем, что и как необходимо будет предустановить дополнительно.
Занятия начинаются в 10 утра мск, кончаются около шести вечера. В перерывах кофе-брейк и время на обед.
Адрес проведения: Москва, улица Колмогорова, 1 строение 73 (119192).
При записи вы соглашаетесь на обработку персональных данных и c политикой конфиденциальности
Договор оферты для физлиц
Договор оферты для юрлиц
На наших курсах соблюдают правила безопасности!

Оргкомитет
Директор Бластима, сооснователь Кситеста
Вита Степанова
Управляющий партнер Бластима
Наталья Мнафки
Организатор курса
Ольга Стукалова
Руководитель проектов Science Media Projects