Синхронный курс

Прикладные аспекты анализа данных высокопроизводительного секвенирования

Физтех-школа биологической и медицинской физики

Купить курс
Старт курса
15 июля
72 ак. ч.
3 мес. длительность длит.

О чем этот курс

О чем этот курс

Курс познакомит с передовыми способами обработки данных высокопроизводительного секвенирования и постепенно введет слушателя в геномную биоинформатику.

Программа курса разработана для формирования у слушателей основных навыков разработки методов для анализа данных и приобретения ими практического опыта, необходимого для проведения самостоятельных научных исследований области вычислительной обработки биологических данных, полученных с помощью технологий высокопроизводительного секвенирования.

Для кого этот курс

Молодым исследователям и студентам с математическим бэкграундом мы предлагаем прослушать вводные лекции по молекулярной биологии, а начинающим программистам — основы языка R и командной строки LINUX.

Более опытные слушатели получат возможность самостоятельно поработать с разными видами данных, освоить инструменты, применяемые при сборке геномов и транскриптомов, проверке качества сборки и многое другое.

Как проходит курс

Часы занятий

72 академических часа

Занятия в онлайн-формате в вечернее время

Занятия

Лекции и практические занятия

Лекционные занятия от опытных преподавателей из ведущих научных центров дают необходимую базу для выполнения практических работ 

Тесты

Итоговая аттестация в виде тестирования

Для получения свидетельства о повышении квалификации необходимо пройти итоговое тестирование.

После курса вы получите

Всем успешно завершившим обучение будет выдан документ установленного образца, который повысит конкурентоспособность на рынке труда:

  • • Удостоверение о повышении квалификации
  • • Сертификат о прохождении курса

Вас будут обучать настоящие профессионалы

Логачева Мария Дмитриевна
Логачева Мария Дмитриевна

к.б.н., специалист по геномике растений, старший преподаватель Центра наук о жизни Сколтеха

Ковтун Алексей Сергеевич
Ковтун Алексей Сергеевич

к.б.н., старший научный сотрудник лаборатории генетики микроорганизмов ИОГен РАН

Ткаченко Александр Анатольевич
Ткаченко Александр Анатольевич

Младший научный сотрудник в НИИ АГиР им. Д.О.О. Институт прикладных компьютерных наук ИТМО

Золотовская Марианна Арсеновна
Золотовская Марианна Арсеновна

Научный сотрудник лаборатории трансляционной геномной биоинформатики МФТИ . Врач-онколог. Лауреат премии Губернатора Московской области.

Программа курса

Курс познакомит слушателей с передовыми способами обработки данных высокопроизводительного секвенирования и постепенно введет слушателя в геномную биоинформатику.

Опытные преподаватели из ведущих научных центров прочитают свои лекции в соответствии с современными представлениями о методах анализа данных NGS.

К третьей неделе обучения у слушателей появится возможность на примере решения реальных научных задач воспользоваться биоинформатическими инструментами и методами анализа, которые позволят получить максимальное количество информации из геномных и транскриптомных экспериментов, и сделать это согласно принципам best practice

Предварительная подготовка

Преимуществом для слушателей курса будут знания в области молекулярной биологии, статистики и работе с командной строкой.

Для тех, кто сомневается в своих силах, мы предоставляем предзаписанные лекции по молекулярной биологии от наших преподавателей на старте программы, а также даем рекомендации по повышению уровню знаний статистики и навыков работы с командной строкой!

  • существующие поколения технологий секвенирования; 
  • принцип секвенирования Illumina;
  • линейка приборов Illumina;
  • полупроводниковое секвенирование; 
  • секвенирование на платформе BGI/MGI; 
  • мономолекулярное секвенирование;
  • о линейке приборов Oxford nanopore technologics;
  • “Что секвенирование может сделать для нас?” и тд 
  •  «Как подключаться к серверу?»
  •  «Способы «общения» с удаленным сервером»;
  •  «Подключение к серверу через SSH (у кого не Windows)»;
  •  отличие системы Linux от других систем;
  •  основные объекты и разрешения в Linux;
  •  как устроена система Linux.
Практическое занятие. Основы удаленной работы с сервером под управлением OC Linux. * «Bash» язык для общения с системой Linux; *  разбор примеров скриптов: логика построения команды, последовательность; * основные команды; * работа с файлами; * пайплайны (конвейеры); * система распределения задач SLURM.
  • построение задачи;
  • мера качества;
  • алгоритмы работы при получении “сырых” данных;
  • формат данных FASTQ;
  • какие виды данных часто встречаются;
  • контроль качества данных секвенирования 2-го поколения;
  • типичные ошибки секвенирования;
  • исключения в FastQC;
  • проверка на контаминацию;
  • исправление ошибок секвенирования;
  • инструменты для тримминга: о «Trimmomatic»
Практическое занятие. Контроль качества данных секвенирования. * команды в slurm; * анализ в FastQC; * trimmomatic; * удаление «universal illumina adapters» с помощью cutadapt; * стратегия борьбы с контаминацией чужеродной ДНК.
  • алгоритмические объекты;
  • гамильтонов цикл, теорема Эйлера, граф де Брёйна (de Bruijn);
  • основные сложности при сборке;
  • решение типичных проблем;
  • об оценке качества полученной сборки;
  • что такое покрытие и как его оценить;
  • «Busco» – классификатор «завершенности» сборки;
  • сборка транскриптома и полного метагенома;
  • о сложностях задачи сборки транскриптомов и метагеномов;
  • контроль качества транскриптомной сборки;
  • биннинг.

 

Практическое занятие. Сборка чтений. * сборка коротких чтений при помощи SPAdes: переключение между режимами; * ключевые настройки; * оценка качества полученной сборки; * Busco - оценка полноты сборки, оценка технических метрик; * сборка с помощью Trinity: запуск, постобработка; * аннотация генома с помощью Braker.
  • микробные сообщества;
  • основные направления в метагеномике;
  • “Что делать после секвенирования?”: демультиплексирование, устранение ошибок, OTU;
  • особенности Shotgun метагеномики;
  • сложности сборки;
  • поиск повторов в графе сборки;
  • алгоритм для поиска суперпузырей, сборка плазмид;
  • “Что еще искать в метагеномных данных?”: определение контекста гена в метагеномике, Hi-C и метагеномика, функциональный анализ, пангеном, математическое моделирование метагенома.
  • ограничения метагеномики: высокий порог восхождения, предвзятость геномных каталогов, предвзятость функциональных аннотаций, микробная темная материя;
  • подходы для решения проблемы неизвестных генов: распределение неизвестных генов, специфика неизвестных генов, поиск новых генов среди неизвестных;
  • проблема мертвых организмов: мета-транскриптомика, сортировка клеток из почвы, полнометагеномная амплификация генома;
  • проблема композитных данных: композиционные данные, секвенирование вирусов, анализ штаммов и поиск специфических генов.

 

  • ре-секвенирование: сравнение полученных геномов, способы представления геномов популяций, источники ошибок;
  • инструменты анализа: Genome Analysis Toolkit;
  • схема детекции вариантов при секвенировании ДНК;
  • инструменты по поиску дубликатов;
  • выравнивание;
  • работа с инделами;
  • BWA MEM – Рекомендация GATK, его запуск;
  • дубликаты прочтения;
  • работа HaplotypeCaller;
  • Genomic Variant Call (g.vcf) – результат работы HaplotypeCaller;
  • альтернативы GATK;
  • аннотация vcf файлов.
  • РНК секвенирование (РНКсек). Принцип работы;
  • типы возможных экспериментов;
  • планирование эксперимента;
  • основные этапы анализа РНК-сек;
  • сплайсинг: сплайсома, альтернативный сплайсинг;
  • проблема картрирования прочтений РНКсек: TopHat;
  • два варианта алгоритмов: TopHat;
  • аннотация транскриптомов: стандарты аннотирования генов, псевдовыравнивания, нормализация, нормализация RPKM, нормализация DESeq2 и edgeR, метод главных компонентов, кластеризация, дифференциальная экспрессия, анализ генной онтологии.
  • общие механизмы регуляции;
  • транскрипционные факторы;
  • регуляция транскрипции;
  • иммунопреципитация хроматина;
  • передовой опыт планирования экспериментов.
  • GhiP-seq анализ данных: контроль качества, выравнивание, низкая сложность, воспроизведение соответствий, поиск пиков;
  • различия между поиском пиков для транскрипционных факторов и гистонов;
  • поиск мотивов связывания транскрипционных факторов в пиках: сайты связывания.
  • SNP: сценарий, в которых проводится поиск SNP;
  • BASE QUALITY SCORE (Q): качество чтения нуклеотида (Q), Phred-масштабирование.
  • формула quality score;
  • FASTQC: разбор особенностей;
  • TRIMMOMATIC: триммеры: группы функций;
  • TRIMMOMATIC: триммеры, общий план строения команды trimmomatic:, примеры команд;
  • инструмент для картирования bowtie2: флаги выравнивания, общая схема работы с Bowtie2;
  • Samtools;
  • IGV (Integrative Genomics Viewer);
  • GATK (Genome Analysis Toolkit): основной код для работы с GATK:;
  • основные инструменты для правильного подбора праймера.
  • основные направления использования;
  • области применения;
  • базы данных;
  • типы данных;
  • типы операторов
  • основные команды;
  • арифметические опции;
  • графические команды.

Чему вы научитесь на курсе

  • Сборка геномных последовательностей
  • Анализ качества сборки
  • Обработка и анализ данных RNA-seq
  • Обработка и анализ данных ChIP-seq
  • Работа с командной строкой

Инструменты и навыки

Стоимость обучения

Базовый

45 000₽/чел.

  • Лекции + практические занятия
  • Тесты для самопроверки
  • Дополнительный материал(лонгриды, инструкции по установке программ, предзаписанные лекции)
  • Доступ к материалам курса после обучения - 2 месяца
Выбрать

Эксперт

60 000₽/чел.

  • Лекции + практические занятия
  • Тесты для самопроверки
  • Дополнительный материал
  • Домашние занятия с обратной связью от преподавателя
  • Дополнительная консультация с разбором домашнего задания от эксперта
  • Доступ к материалам курса после обучения - 12 месяцев 
Выбрать

Оплатить курс или получить
бесплатную консультацию

Оставьте ваш запрос и мы свяжемся с вами

Прикладные аспекты анализа данных высокопроизводительного секвенирования

  • - Оплата по оферте или после заключения договора
  • - Гарантии качества вашего обучения

Часто задаваемые вопросы

Курсы подходят как для сотрудников компаний, так и для частных лиц. Важно знать, что программы предназначены для тех, кто имеет среднее или высшее образование и желает повысить свою квалификацию или сменить профессию.

Онлайн обучение – синхронные и предзаписанные курсы - проходит на нашей удобной платформе. Офлайн (очное) обучение может проходить на Физтехе или на территории заказчика.

Вам нужно пройти простую регистрацию. Регистрация позволит отслеживать статус заявки и осуществит быстрый переход к процессу оплаты и обучению на курсе.

Период обучения указан в карточке каждого курса. При прохождении асинхронных курсов с выдачей сертификата вы сможете учиться в удобном для вас темпе.

Вы можете оплатить курс непосредственно на нашем сайте, используя карты любых платежных систем. Также вы можете заключить с нами договор и произвести оплату по выставленному счету с помощью банковского перевода.

С этим курсом покупают

Управление винодельческим предприятием

Управление винодельческим предприятием

120 000₽/чел.

Институт нано-, био-, информационных, когнитивных и социогуманитарных наук и технологий

466 часов
Смешанный