Прикладные аспекты анализа данных высокопроизводительного секвенирования
О чем этот курс
Курс познакомит с передовыми способами обработки данных высокопроизводительного секвенирования и постепенно введет слушателя в геномную биоинформатику.
Программа курса разработана для формирования у слушателей основных навыков разработки методов для анализа данных и приобретения ими практического опыта, необходимого для проведения самостоятельных научных исследований области вычислительной обработки биологических данных, полученных с помощью технологий высокопроизводительного секвенирования.
Для кого этот курс
Молодым исследователям и студентам с математическим бэкграундом мы предлагаем прослушать вводные лекции по молекулярной биологии, а начинающим программистам — основы языка R и командной строки LINUX.
Более опытные слушатели получат возможность самостоятельно поработать с разными видами данных, освоить инструменты, применяемые при сборке геномов и транскриптомов, проверке качества сборки и многое другое.
Как проходит курс
72 академических часа
Занятия в онлайн-формате в вечернее время
Лекции и практические занятия
Лекционные занятия от опытных преподавателей из ведущих научных центров дают необходимую базу для выполнения практических работ
Итоговая аттестация в виде тестирования
Для получения свидетельства о повышении квалификации необходимо пройти итоговое тестирование.
Вас будут обучать настоящие профессионалы
к.б.н., специалист по геномике растений, старший преподаватель Центра наук о жизни Сколтеха
к.б.н., старший научный сотрудник лаборатории генетики микроорганизмов ИОГен РАН
Младший научный сотрудник в НИИ АГиР им. Д.О.О. Институт прикладных компьютерных наук ИТМО
Научный сотрудник лаборатории трансляционной геномной биоинформатики МФТИ . Врач-онколог. Лауреат премии Губернатора Московской области.
Программа курса
Курс познакомит слушателей с передовыми способами обработки данных высокопроизводительного секвенирования и постепенно введет слушателя в геномную биоинформатику.
Опытные преподаватели из ведущих научных центров прочитают свои лекции в соответствии с современными представлениями о методах анализа данных NGS.
К третьей неделе обучения у слушателей появится возможность на примере решения реальных научных задач воспользоваться биоинформатическими инструментами и методами анализа, которые позволят получить максимальное количество информации из геномных и транскриптомных экспериментов, и сделать это согласно принципам best practice
Предварительная подготовка
Преимуществом для слушателей курса будут знания в области молекулярной биологии, статистики и работе с командной строкой.
Для тех, кто сомневается в своих силах, мы предоставляем предзаписанные лекции по молекулярной биологии от наших преподавателей на старте программы, а также даем рекомендации по повышению уровню знаний статистики и навыков работы с командной строкой!
- существующие поколения технологий секвенирования;
- принцип секвенирования Illumina;
- линейка приборов Illumina;
- полупроводниковое секвенирование;
- секвенирование на платформе BGI/MGI;
- мономолекулярное секвенирование;
- о линейке приборов Oxford nanopore technologics;
- “Что секвенирование может сделать для нас?” и тд
- «Как подключаться к серверу?»
- «Способы «общения» с удаленным сервером»;
- «Подключение к серверу через SSH (у кого не Windows)»;
- отличие системы Linux от других систем;
- основные объекты и разрешения в Linux;
- как устроена система Linux.
- построение задачи;
- мера качества;
- алгоритмы работы при получении “сырых” данных;
- формат данных FASTQ;
- какие виды данных часто встречаются;
- контроль качества данных секвенирования 2-го поколения;
- типичные ошибки секвенирования;
- исключения в FastQC;
- проверка на контаминацию;
- исправление ошибок секвенирования;
- инструменты для тримминга: о «Trimmomatic»
- алгоритмические объекты;
- гамильтонов цикл, теорема Эйлера, граф де Брёйна (de Bruijn);
- основные сложности при сборке;
- решение типичных проблем;
- об оценке качества полученной сборки;
- что такое покрытие и как его оценить;
- «Busco» – классификатор «завершенности» сборки;
- сборка транскриптома и полного метагенома;
- о сложностях задачи сборки транскриптомов и метагеномов;
- контроль качества транскриптомной сборки;
- биннинг.
- микробные сообщества;
- основные направления в метагеномике;
- “Что делать после секвенирования?”: демультиплексирование, устранение ошибок, OTU;
- особенности Shotgun метагеномики;
- сложности сборки;
- поиск повторов в графе сборки;
- алгоритм для поиска суперпузырей, сборка плазмид;
- “Что еще искать в метагеномных данных?”: определение контекста гена в метагеномике, Hi-C и метагеномика, функциональный анализ, пангеном, математическое моделирование метагенома.
- ограничения метагеномики: высокий порог восхождения, предвзятость геномных каталогов, предвзятость функциональных аннотаций, микробная темная материя;
- подходы для решения проблемы неизвестных генов: распределение неизвестных генов, специфика неизвестных генов, поиск новых генов среди неизвестных;
- проблема мертвых организмов: мета-транскриптомика, сортировка клеток из почвы, полнометагеномная амплификация генома;
- проблема композитных данных: композиционные данные, секвенирование вирусов, анализ штаммов и поиск специфических генов.
- ре-секвенирование: сравнение полученных геномов, способы представления геномов популяций, источники ошибок;
- инструменты анализа: Genome Analysis Toolkit;
- схема детекции вариантов при секвенировании ДНК;
- инструменты по поиску дубликатов;
- выравнивание;
- работа с инделами;
- BWA MEM – Рекомендация GATK, его запуск;
- дубликаты прочтения;
- работа HaplotypeCaller;
- Genomic Variant Call (g.vcf) – результат работы HaplotypeCaller;
- альтернативы GATK;
- аннотация vcf файлов.
- РНК секвенирование (РНКсек). Принцип работы;
- типы возможных экспериментов;
- планирование эксперимента;
- основные этапы анализа РНК-сек;
- сплайсинг: сплайсома, альтернативный сплайсинг;
- проблема картрирования прочтений РНКсек: TopHat;
- два варианта алгоритмов: TopHat;
- аннотация транскриптомов: стандарты аннотирования генов, псевдовыравнивания, нормализация, нормализация RPKM, нормализация DESeq2 и edgeR, метод главных компонентов, кластеризация, дифференциальная экспрессия, анализ генной онтологии.
- общие механизмы регуляции;
- транскрипционные факторы;
- регуляция транскрипции;
- иммунопреципитация хроматина;
- передовой опыт планирования экспериментов.
- GhiP-seq анализ данных: контроль качества, выравнивание, низкая сложность, воспроизведение соответствий, поиск пиков;
- различия между поиском пиков для транскрипционных факторов и гистонов;
- поиск мотивов связывания транскрипционных факторов в пиках: сайты связывания.
- SNP: сценарий, в которых проводится поиск SNP;
- BASE QUALITY SCORE (Q): качество чтения нуклеотида (Q), Phred-масштабирование.
- формула quality score;
- FASTQC: разбор особенностей;
- TRIMMOMATIC: триммеры: группы функций;
- TRIMMOMATIC: триммеры, общий план строения команды trimmomatic:, примеры команд;
- инструмент для картирования bowtie2: флаги выравнивания, общая схема работы с Bowtie2;
- Samtools;
- IGV (Integrative Genomics Viewer);
- GATK (Genome Analysis Toolkit): основной код для работы с GATK:;
- основные инструменты для правильного подбора праймера.
- основные направления использования;
- области применения;
- базы данных;
- типы данных;
- типы операторов
- основные команды;
- арифметические опции;
- графические команды.
Чему вы научитесь на курсе
- Сборка геномных последовательностей
- Анализ качества сборки
- Обработка и анализ данных RNA-seq
- Обработка и анализ данных ChIP-seq
- Работа с командной строкой
Инструменты и навыки
Стоимость обучения
Базовый
45 000₽/чел.
- Лекции + практические занятия
- Тесты для самопроверки
- Дополнительный материал(лонгриды, инструкции по установке программ, предзаписанные лекции)
- Доступ к материалам курса после обучения - 2 месяца
Эксперт
60 000₽/чел.
- Лекции + практические занятия
- Тесты для самопроверки
- Дополнительный материал
- Домашние занятия с обратной связью от преподавателя
- Дополнительная консультация с разбором домашнего задания от эксперта
- Доступ к материалам курса после обучения - 12 месяцев
Оплатить курс или получить
бесплатную консультацию
Оставьте ваш запрос и мы свяжемся с вами
Часто задаваемые вопросы
Курсы подходят как для сотрудников компаний, так и для частных лиц. Важно знать, что программы предназначены для тех, кто имеет среднее или высшее образование и желает повысить свою квалификацию или сменить профессию.
Онлайн обучение – синхронные и предзаписанные курсы - проходит на нашей удобной платформе. Офлайн (очное) обучение может проходить на Физтехе или на территории заказчика.
Вам нужно пройти простую регистрацию. Регистрация позволит отслеживать статус заявки и осуществит быстрый переход к процессу оплаты и обучению на курсе.
Период обучения указан в карточке каждого курса. При прохождении асинхронных курсов с выдачей сертификата вы сможете учиться в удобном для вас темпе.
Вы можете оплатить курс непосредственно на нашем сайте, используя карты любых платежных систем. Также вы можете заключить с нами договор и произвести оплату по выставленному счету с помощью банковского перевода.
С этим курсом покупают
Управление винодельческим предприятием
Институт нано-, био-, информационных, когнитивных и социогуманитарных наук и технологий