Геномный анализ в реальном времени: как C.B.D. Query ускоряет исследования рака

15 апреля 2024 Авиталь Коэн, ведущий биоинформатик

В современной онкологии скорость анализа геномных данных напрямую влияет на выбор терапевтической стратегии. Платформа C.B.D. Query внедрила новый модуль потоковой обработки, который позволяет исследовательским центрам в Израиле анализировать данные секвенирования нового поколения (NGS) в режиме, близком к реальному времени.

Традиционные пайплайны обработки сырых чтений (FASTQ) в аннотированные варианты (VCF) занимают часы, а иногда и дни. Наш облачный движок, использующий распределённые вычисления и оптимизированные алгоритмы выравнивания, сокращает это время на 65–80%.

Ученый работает с данными ДНК на экране

Анализ геномных данных в лабораторных условиях.

Ключевые технологические прорывы

Модуль построен на трёх основных инновациях:

  • Адаптивная сегментация данных: Система автоматически определяет оптимальный размер чанков для параллельной обработки, учитывая загрузку кластера и сложность геномного региона.
  • Кэширование референсных индексов: Часто используемые геномные сборки (например, GRCh38) хранятся в оперативной памяти GPU-кластеров, что устраняет задержки на ввод-вывод.
  • Предсказательная фильтрация артефактов: Машинное обучение используется для предварительной фильтрации технических артефактов секвенирования до этапа вызова вариантов, что резко снижает нагрузку на последующие этапы.

В пилотном проекте с онкоцентром «Ассута» применение платформы позволило сократить время от забора биоптата до получения отчёта по мутациям-мишеням с 14 до 4 дней. Это критически важно для пациентов с агрессивными формами заболеваний.

Безопасность и соответствие стандартам

Все вычисления выполняются в израильском облачном регионе с сертификацией ISO 27001. Данные пациентов полностью анонимизируются на этапе загрузки, а каждый доступ к информации фиксируется в зашифрованном логе, соответствующем требованиям Министерства здравоохранения.

Новый модуль — это не просто ускорение, это изменение парадигмы в исследовательской работе. Он позволяет учёным ставить более смелые вопросы и получать на них ответы в рамках одного экспериментального цикла.

Доктор Авив Леви

Доктор Авив Леви

Ведущий биоинформатик, C.B.D. Query

Доктор Леви возглавляет команду биоинформатиков в C.B.D. Query, специализируясь на разработке алгоритмов для анализа геномных данных и корреляции биомаркеров. Имеет более 12 лет опыта в области вычислительной биологии, работал с ведущими исследовательскими центрами Израиля. Его работы публиковались в международных рецензируемых журналах. Участвует в разработке протоколов защиты данных, соответствующих требованиям Министерства здравоохранения.