Par où débuter ? Cette question est centrale pour l’expérimentaliste ou spécialiste de la cytométrie qui a envie d’analyser ses données avec les nouvelles approches et les nouveaux outils que l’on voit dans toutes les publications maintenant.

Le premier point est déjà de bien comprendre l’information qui est présentée sur un graphique, comment elle se lit et s’interprète, de façon à déterminer si c’est bien ce graphique que l’on souhaite réaliser. Les graphiques présentent typiquement un nuage de points (les cellules, le plus souvent) sur un plan (2 dimensions). Pour représenter un point qui est mesuré dans un espace à 5, 10, 20 dimensions (les différents marqueurs), il est nécessaire de réduire ces dimensions à seulement 2. C’est l’étape de réduction de dimension. L’autre type de graphique présente une matrice de nombres en remplaçant les nombres par un code couleur. C’est une heatmap. Cette représentation s’adresse à une matrice de quelques centaines ou milliers de lignes, le nombre de colonnes étant de l’ordre d’au plus quelques dizaines. Pour obtenir une matrice de cette taille, il est nécessaire de former des groupes de cellules. C’est l’étape de clustering.

Réduction de dimensions et clustering sont au coeur de tous les pipelines d’analyse (un pipeline est un enchaînement d’étapes). Avant d’utiliser des outils pour réaliser ces 2 étapes, il important de comprendre un pipeline classique, ce qui permettra d’en comprendre plein d’autres. Voici une sélection d’articles pour débuter dans le domaine de l’analyse de données de cytométrie multi-paramétrique.

Bonne lecture.

A Cancer Biologist’s Primer on Machine Learning Applications in High-Dimensional Cytometry Keyes et al 2020 propose une très bonne présentation des étapes clés et des représentations.

Making the most of high-dimensional cytometry data Marsh et al 2021

The end of gating? An introduction to automated analysis … Mair et al 2016

A Beginner’s Guide to Analyzing and Visualizing Mass Cytometry Data. Kimball et al 2017

Getting the Most from Your High-Dimensional Cytometry Data Olsen et al 2019

The anatomy of single cell mass cytometry data Olsen et al 2019

Key steps and methods in the experimental design and data analysis of … Rybakowska et al 2020 effectue un tour d’horizon des outils pour chaque étape d’un pipeline d’analyse.

Computational flow cytometry: helping to make sense of high-dimensional immunology data. Saeys et al 2016

CyTOF workflow: Differential discovery in high-throughput high-dimensional cytometry datasets. Nowicka et al 2017

Comparison of clustering methods for high-dimensional single-cell flow and mass cytometry data. Weber, Robinson 2016

Deep Profiling Human T Cell Heterogeneity by Mass Cytometry. Cheng, Newell 2016