Informace o projektu
Automated Pipeline for Single-Cell RNA Sequencing in Galaxy and Invenio
- Kód projektu
- 779/2025
- Období řešení
- 7/2025 - 6/2026
- Investor / Programový rámec / typ projektu
-
CESNET
- Fond rozvoje CESNETu
- Fakulta / Pracoviště MU
- Lékařská fakulta
Sekvenování RNA na úrovni jednotlivých buněk (scRNA-seq) je moderní technika pro analýzu exprese genů v buňkách, která biologům poskytuje podrobné informace o jejich funkci. Potenciál této metody je však omezen nedostatkem centralizovaných a dobře integrovaných řešení pro ukládání a analýzu dat, což brání jejich přístupnosti a reprodukovatelnosti. V současnosti bývají scRNA-seq data uložené v různých repozitářích, přičemž workflows pro jejich analýzu jsou uloženy odděleně nebo vůbec, a původní nezpracovaná sekvenační data často nejsou sdílena, což komplikuje nalezení, reprodukci a další využívání již existujících dat. Pro zmírnění tohoto problému navrhujeme vytvořit centralizované řešení, které sjednotí scRNA-seq data a analytické workflows v rámci široce využívané platformy Galaxy, přičemž využije stávající infrastrukturu Invenio na CESNETu. Zajištěním správného uložení, anotace a propojení dat s reprodukovatelnými analytickými workflows tento projekt zlepší jak přístupnost, tak i dlouhodobou využitelnost scRNA-seq dat.
Návrh projektu zahrnuje spolupráci dvou týmů z Masarykovy univerzity: výzkumného týmu z Lékařské fakulty, který poskytne svá scRNA-seq data a analytické zkušenosti, a odborného týmu z Ústavu výpočetní techniky s potřebnou expertízou pro nasazení řešení v rámci infrastruktury CESNET prostřednictvím systémů Galaxy a Invenio. Tým z LF převede do infrastruktury CESNET svá scRNA-seq data, implementuje v Galaxy workflows pro jejich analýzu, a aktivně se zapojí do testování a zpětné vazby, aby výsledný systém vyhovoval potřebám širší vědecké komunity. Díky propojení špičkových výpočetních nástrojů s praktickými potřebami výzkumné komunity umožní tento projekt transparentnější, efektivnější a více kolaborativní ekosystém pro scRNA-seq analýzu. Výsledný systém bude také vstupním krokem pro snadnější zpracování a analýzu široké škály dalších biologických (omics) dat v budoucnu.