Синхронный курс

Прикладные аспекты анализа данных высокопроизводительного секвенирования

Физтех-школа биологической и медицинской физики

Купить курс
Старт курса
25 мая
72 ак. ч.
12 мес. длительность длит.

О чем этот курс

О чем этот курс

Курс познакомит с передовыми способами обработки данных высокопроизводительного секвенирования и постепенно введет слушателя в геномную биоинформатику.

Программа курса разработана для формирования у слушателей основных навыков разработки методов для анализа данных и приобретения ими практического опыта, необходимого для проведения самостоятельных научных исследований области вычислительной обработки биологических данных, полученных с помощью технологий высокопроизводительного секвенирования.

Для кого этот курс

Молодым исследователям и студентам с математическим бэкграундом мы предлагаем прослушать вводные лекции по молекулярной биологии, а начинающим программистам — основы языка R и командной строки LINUX.

Более опытные слушатели получат возможность самостоятельно поработать с разными видами данных, освоить инструменты, применяемые при сборке геномов и транскриптомов, проверке качества сборки и многое другое.

Как проходит курс

Часы занятий

72 академических часа

Занятия в онлайн-формате в вечернее время

Занятия

Лекции и практические занятия

Лекционные занятия от опытных преподавателей из ведущих научных центров дают необходимую базу для выполнения практических работ 

Тесты

Итоговая аттестация в виде тестирования

Для получения свидетельства о повышении квалификации необходимо пройти итоговое тестирование.

После курса вы получите

Всем успешно завершившим обучение будет выдан документ установленного образца, который повысит конкурентоспособность на рынке труда:

  • • Удостоверение о повышении квалификации

Вас будут обучать настоящие профессионалы

Ковтун Алексей Сергеевич
Ковтун Алексей Сергеевич

к.б.н., старший научный сотрудник лаборатории генетики микроорганизмов ИОГен РАН

Ткаченко Александр Анатольевич
Ткаченко Александр Анатольевич

Младший научный сотрудник в НИИ АГиР им. Д.О.О. Институт прикладных компьютерных наук ИТМО

Золотовская Марианна Арсеновна
Золотовская Марианна Арсеновна

Научный сотрудник лаборатории трансляционной геномной биоинформатики МФТИ . Врач-онколог. Лауреат премии Губернатора Московской области.

Программа курса

Курс познакомит слушателей с передовыми способами обработки данных высокопроизводительного секвенирования и постепенно введет слушателя в геномную биоинформатику.

Опытные преподаватели из ведущих научных центров прочитают свои лекции в соответствии с современными представлениями о методах анализа данных NGS.

К третьей неделе обучения у слушателей появится возможность на примере решения реальных научных задач воспользоваться биоинформатическими инструментами и методами анализа, которые позволят получить максимальное количество информации из геномных и транскриптомных экспериментов, и сделать это согласно принципам best practice

Предварительная подготовка

Преимуществом для слушателей курса будут знания в области молекулярной биологии, статистики и работе с командной строкой.

Для тех, кто сомневается в своих силах, мы предоставляем предзаписанные лекции по молекулярной биологии от наших преподавателей на старте программы, а также даем рекомендации по повышению уровню знаний статистики и навыков работы с командной строкой!

  • существующие поколения технологий секвенирования; 
  • принцип секвенирования Illumina;
  • линейка приборов Illumina;
  • полупроводниковое секвенирование; 
  • секвенирование на платформе BGI/MGI; 
  • мономолекулярное секвенирование;
  • о линейке приборов Oxford nanopore technologics;
  • “Что секвенирование может сделать для нас?” и тд 
  •  «Как подключаться к серверу?»
  •  «Способы «общения» с удаленным сервером»;
  •  «Подключение к серверу через SSH (у кого не Windows)»;
  •  отличие системы Linux от других систем;
  •  основные объекты и разрешения в Linux;
  •  как устроена система Linux.
Практическое занятие. Основы удаленной работы с сервером под управлением OC Linux. * «Bash» язык для общения с системой Linux; *  разбор примеров скриптов: логика построения команды, последовательность; * основные команды; * работа с файлами; * пайплайны (конвейеры); * система распределения задач SLURM.
  • построение задачи;
  • мера качества;
  • алгоритмы работы при получении “сырых” данных;
  • формат данных FASTQ;
  • какие виды данных часто встречаются;
  • контроль качества данных секвенирования 2-го поколения;
  • типичные ошибки секвенирования;
  • исключения в FastQC;
  • проверка на контаминацию;
  • исправление ошибок секвенирования;
  • инструменты для тримминга: о «Trimmomatic»
Практическое занятие. Контроль качества данных секвенирования. * команды в slurm; * анализ в FastQC; * trimmomatic; * удаление «universal illumina adapters» с помощью cutadapt; * стратегия борьбы с контаминацией чужеродной ДНК.
  • алгоритмические объекты;
  • гамильтонов цикл, теорема Эйлера, граф де Брёйна (de Bruijn);
  • основные сложности при сборке;
  • решение типичных проблем;
  • об оценке качества полученной сборки;
  • что такое покрытие и как его оценить;
  • «Busco» – классификатор «завершенности» сборки;
  • сборка транскриптома и полного метагенома;
  • о сложностях задачи сборки транскриптомов и метагеномов;
  • контроль качества транскриптомной сборки;
  • биннинг.

 

Практическое занятие. Сборка чтений. * сборка коротких чтений при помощи SPAdes: переключение между режимами; * ключевые настройки; * оценка качества полученной сборки; * Busco - оценка полноты сборки, оценка технических метрик; * сборка с помощью Trinity: запуск, постобработка; * аннотация генома с помощью Braker.
  • микробные сообщества;
  • основные направления в метагеномике;
  • “Что делать после секвенирования?”: демультиплексирование, устранение ошибок, OTU;
  • особенности Shotgun метагеномики;
  • сложности сборки;
  • поиск повторов в графе сборки;
  • алгоритм для поиска суперпузырей, сборка плазмид;
  • “Что еще искать в метагеномных данных?”: определение контекста гена в метагеномике, Hi-C и метагеномика, функциональный анализ, пангеном, математическое моделирование метагенома.
  • ограничения метагеномики: высокий порог восхождения, предвзятость геномных каталогов, предвзятость функциональных аннотаций, микробная темная материя;
  • подходы для решения проблемы неизвестных генов: распределение неизвестных генов, специфика неизвестных генов, поиск новых генов среди неизвестных;
  • проблема мертвых организмов: мета-транскриптомика, сортировка клеток из почвы, полнометагеномная амплификация генома;
  • проблема композитных данных: композиционные данные, секвенирование вирусов, анализ штаммов и поиск специфических генов.

 

  • ре-секвенирование: сравнение полученных геномов, способы представления геномов популяций, источники ошибок;
  • инструменты анализа: Genome Analysis Toolkit;
  • схема детекции вариантов при секвенировании ДНК;
  • инструменты по поиску дубликатов;
  • выравнивание;
  • работа с инделами;
  • BWA MEM – Рекомендация GATK, его запуск;
  • дубликаты прочтения;
  • работа HaplotypeCaller;
  • Genomic Variant Call (g.vcf) – результат работы HaplotypeCaller;
  • альтернативы GATK;
  • аннотация vcf файлов.
  • РНК секвенирование (РНКсек). Принцип работы;
  • типы возможных экспериментов;
  • планирование эксперимента;
  • основные этапы анализа РНК-сек;
  • сплайсинг: сплайсома, альтернативный сплайсинг;
  • проблема картрирования прочтений РНКсек: TopHat;
  • два варианта алгоритмов: TopHat;
  • аннотация транскриптомов: стандарты аннотирования генов, псевдовыравнивания, нормализация, нормализация RPKM, нормализация DESeq2 и edgeR, метод главных компонентов, кластеризация, дифференциальная экспрессия, анализ генной онтологии.
  • общие механизмы регуляции;
  • транскрипционные факторы;
  • регуляция транскрипции;
  • иммунопреципитация хроматина;
  • передовой опыт планирования экспериментов.
  • GhiP-seq анализ данных: контроль качества, выравнивание, низкая сложность, воспроизведение соответствий, поиск пиков;
  • различия между поиском пиков для транскрипционных факторов и гистонов;
  • поиск мотивов связывания транскрипционных факторов в пиках: сайты связывания.
  • SNP: сценарий, в которых проводится поиск SNP;
  • BASE QUALITY SCORE (Q): качество чтения нуклеотида (Q), Phred-масштабирование.
  • формула quality score;
  • FASTQC: разбор особенностей;
  • TRIMMOMATIC: триммеры: группы функций;
  • TRIMMOMATIC: триммеры, общий план строения команды trimmomatic:, примеры команд;
  • инструмент для картирования bowtie2: флаги выравнивания, общая схема работы с Bowtie2;
  • Samtools;
  • IGV (Integrative Genomics Viewer);
  • GATK (Genome Analysis Toolkit): основной код для работы с GATK:;
  • основные инструменты для правильного подбора праймера.
  • основные направления использования;
  • области применения;
  • базы данных;
  • типы данных;
  • типы операторов
  • основные команды;
  • арифметические опции;
  • графические команды.

Чему вы научитесь на курсе

  • Сборка геномных последовательностей
  • Анализ качества сборки
  • Обработка и анализ данных RNA-seq
  • Обработка и анализ данных ChIP-seq
  • Работа с командной строкой

Инструменты и навыки

Стоимость обучения

Базовый

49 500₽/чел.

  • Лекции + практические занятия
  • Тесты для самопроверки
  • Дополнительный материал(лонгриды, инструкции по установке программ, предзаписанные лекции)
  • Доступ к материалам курса после обучения - 2 месяца
Выбрать

Эксперт

66 000₽/чел.

  • Лекции + практические занятия
  • Тесты для самопроверки
  • Дополнительный материал
  • Домашние занятия с обратной связью от преподавателя
  • Дополнительная консультация с разбором домашнего задания от эксперта
  • Доступ к материалам курса после обучения - 12 месяцев 
Выбрать

Оплатить курс или получить
бесплатную консультацию

Оставьте ваш запрос и мы свяжемся с вами

Прикладные аспекты анализа данных высокопроизводительного секвенирования

  • - Оплата по оферте или после заключения договора
  • - Гарантии качества вашего обучения

Часто задаваемые вопросы

Курсы подходят как для сотрудников компаний, так и для частных лиц. Важно знать, что программы предназначены для тех, кто имеет среднее или высшее образование и желает повысить свою квалификацию или сменить профессию.

Онлайн обучение – синхронные и предзаписанные курсы - проходит на нашей удобной платформе. Офлайн (очное) обучение может проходить на Физтехе или на территории заказчика.

Вам нужно пройти простую регистрацию. Регистрация позволит отслеживать статус заявки и осуществит быстрый переход к процессу оплаты и обучению на курсе.

Период обучения указан в карточке каждого курса. При прохождении асинхронных курсов с выдачей сертификата вы сможете учиться в удобном для вас темпе.

Вы можете оплатить курс непосредственно на нашем сайте, используя карты любых платежных систем. Также вы можете заключить с нами договор и произвести оплату по выставленному счету с помощью банковского перевода.

С этим курсом покупают

Управление винодельческим предприятием

Управление винодельческим предприятием

150 000₽/чел.

Институт нано-, био-, информационных, когнитивных и социогуманитарных наук и технологий

466 часов
Онлайн