Menu
25 févr. 2023 – S. Schutz

API hour — Agrégez vos variants au format parquet

Dans cette présentation, je vous parlerai des nouveaux outils utilisés à l’ère du big data pour répondre à la problématique des 3 V (Volumétrie / Vélocité / Variété) dans le cadre de la génomique.

Nous verrons comment transformer des fichiers VCF au format parquet, et comment requêter ces derniers en Python, en Rust ou en SQL grâce à la librairie pola.rs et duckdb.

Et un billet si vous voulez continuer à lire sur le sujet.

Logo ANPGM
Logo NGS-Diag
Logo Bioinfo-fr