25 Novembre 2022

[Portraits] Les étoiles françaises de Gaia

Le centre de traitement des données Gaia au CNES (DPCC), constitue la composante française du consortium réuni autour de l'Agence spatiale européenne pour cartographier les objets célestes de notre galaxie. Sa mission ? Interpréter les signaux transmis par le satellite Gaia grâce à des capacités informatiques considérables utilisant les technologies du Big Data.
Clara Nicolas, le goût du travail d’équipe

Un rôle de chef d’orchestre. C’est ainsi que Clara Nicolas envisage sa mission au sein de l’équipe française de Gaia. Le DPCC, centre de traitement des données du CNES, est l’un des 6 centres de calcul européens du consortium DPAC (Data Processing and Analysis Consortium), qui déchiffrent les gigantesques volumes de données de la mission d’astrométrie Gaia, pilotée par l’ESA depuis 2013.

 L’objectif est de cartographier les étoiles de la galaxie pour produire des catalogues. Le dernier, publié cette année, référence près de 2 milliards d’étoiles. La prochaine version est programmée pour 2025. 

Arrivée il y a 3 ans sur le projet, elle y assume la double casquette de chef de projet et de chef de service. « Au sein du consortium, le CNES a pour rôle principal de traiter une partie des données de Gaia, mais aussi de piloter toutes les contributions françaises, c’est-à-dire les laboratoires qui travaillent avec Gaia pour le développement des algorithmes. Je suis là pour mettre en musique les différentes interventions et piloter l’équipe qui regroupe une quinzaine de personnes, parmi lesquelles par exemple des responsables de traitements scientifiques ou des opérateurs. » 

Parmi ses multiples attributions, Clara Nicolas anime et coordonne l’équipe, assure le suivi et le renouvellement des contrats et des conventions avec les laboratoires, veille au respect du budget et du planning, gère la communication du projet. Il y a aussi tout un volet ressources humaines et management des salariés du CNES.

 Motiver et faire travailler ensemble les membres de l'équipe, leur amener le meilleur pour les aider à développer leurs compétences et à s'épanouir dans leur travail, cet aspect humain m'intéresse particulièrement. 

Avant de diriger l’équipe de Gaia, Clara a passé 15 ans au CNES, dans un tout autre domaine, l’altimétrie. Ingénieure passée par l’Institut National des Télécommunications et Supaero, elle était responsable pour la mission Jason 3 du centre de traitement SSALTO (Segment Sol d’Altimétrie et d’Orbitographie précise). Au-delà du changement de thématique, elle a apprécié d’entrer avec Gaia dans une autre dimension : « Avec un cluster dédié et 250 serveurs qui tournent en permanence, c’est l’un des plus gros projets du CNES pour le traitement de données. A la publication du catalogue, on se rend compte du travail collectif accompli pendant des années. C’est très satisfaisant de savoir que des scientifiques arriveront à faire de la science à partir de ces données. » 

Wilhem Roux, un passeur entre la science et l’ingénierie

Au sein du DPCC, Wilhem Roux est le responsable de traitement scientifique de l’une des 3 cellules thématiques, celle qui s’intéresse aux objets complexes. « Cela regroupe tous les objets un peu exotiques que le télescope peut détecter et qui ne sont pas des étoiles : astéroïdes, quasars, étoiles binaires, galaxies… », précise-t-il. Le principe de Gaia est de fournir une fiche d’identité par objet, avec ses variations et ses mouvements à partir des données brutes, les signaux lumineux captés par le satellite. Il faut pour cela développer des chaînes de traitement qui permettent d’interpréter ces données. « Ce sont des technologies Big Data, explique Wilhem Roux. Mon métier consiste d’abord à coordonner le développement, le maintien en opération et l’évolution des chaînes de traitement. Cela se fait en interface avec les scientifiques, qui expriment leurs besoins et fournissent les codes informatiques correspondants. »

Ces codes sont ensuite intégrés comme des briques dans la chaîne de traitement, puis l’ensemble fait l’objet d’une qualification et, une fois que la chaîne est validée, part en opération pour produire le catalogue. « Je dois avoir une vision d’ensemble de ma thématique pour contrôler le cycle de production des données du début à la fin. Cela veut dire m’assurer que les besoins des scientifiques ont bien été exprimés, que les documents sont diffusés aux bonnes personnes, que les plannings sont respectés. Il faut aussi intervenir quand il y a un problème, vérifier qu’il n’y ait pas de résultat aberrant dans le contenu du catalogue… »

Wilhem a intégré Gaia au terme d’un parcours atypique qui l’a d’abord amené dans la recherche. « Initialement, je me voyais plus comme un scientifique, je suis passionné par les objets qui peuplent le ciel, cela m’intéressait de savoir comment ils fonctionnent, comment tout cela s’agence. » Il pousse ce goût jusqu’à obtenir un doctorat d’astrophysique, pour lequel il imagine un concept de télescope spatial géant futuriste. Quant à son intégration au projet Gaia, il l’attribue à une opportunité due au hasard. « Le profil recherché d’un ingénieur avec un solide bagage scientifique me correspondait à 100%. » Trois ans plus tard, l’expérience est concluante : à côté du volet scientifique et de la richesse du catalogue, Wilhem insiste particulièrement sur l’aspect humain.

 La confiance entre le monde de l’ingénierie, de purs informaticiens, et les scientifiques, cette confluence fait émerger quelque chose de beau, je m’y sens totalement à ma place. 

Angélique Barbier : la vision globale au service du projet

En intégrant l’équipe Gaia comme responsable mission et opérations, au printemps dernier, Angélique Barbier a renoué avec un sujet qu’elle connaît bien. « J’ai travaillé sur Gaia pendant 5 ans en participant notamment à l‘intégration et la mise en production du cluster de calcul. » Au début de sa carrière, diplômée de l’INSA Toulouse, Angélique était salariée du Groupe Thales, spécialisée dans l’informatique des systèmes sol. Pendant 15 ans, elle a mis ses compétences en systèmes informatiques au service de projets et missions spatiales aussi divers que le vaisseau européen de ravitaillement de l’ISS, l’ATV, le segment sol de la mission Galileo, et donc Gaia, avant de rejoindre le CNES il y a 3 ans. « C’était au poste de responsable d’exploitation des infrastructures informatiques mutualisées, où je faisais de l’informatique pure. Je suis très heureuse de revenir sur une partie mission. Je retrouve Gaia, mais c’est un nouveau métier pour moi, un virage vers une activité moins technique. »

Angélique met à profit toute cette expérience accumulée pour assumer une mission multitâches. En tant que responsable mission, elle joue un rôle essentiel de coordination et de facilitation, en interne auprès des 3 unités scientifiques qui composent le centre de traitement du CNES (DPCC), mais aussi en externe vis-à-vis des autres centres de traitement des données, du consortium composé de scientifiques et de développeurs informatiques, le DPAC, et de l’ESA. Cela recouvre des activités diverses : gestion du planning, interface avec les scientifiques, support à la planification et au développement, pilotages des contributions françaises, communication…« Mon travail quotidien se fait essentiellement dans la discussion et dans l’échange. Je dois savoir où en sont les développements, visualiser les retards et les anomalies bloquantes, trouver des solutions. J’apporte une vision globale pour aider les unités scientifiques à s’organiser et soutenir le travail des coordinateurs techniques. »

Egalement responsable opérations, Angélique anime l’équipe en charge d’assurer la production des données et la bonne exécution des algorithmes sur le cluster. « Sur cette partie, je veille notamment au respect des procédures sur les moyens opérationnels et à la bonne exploitation du DPCC. » En quelques mois, Angélique a retrouvé avec plaisir la richesse humaine de Gaia :

 Le travail collectif, la mécanique d’échange et de fonctionnement en consortium sont passionnants. Et il y a une part de rêve : quand les scientifiques nous expliquent ce qu’ils ont découvert grâce aux données que nous avons produites, j’ai l’impression de contribuer de manière microscopique à un projet qui nous dépasse. C’est très enrichissant. 

Antoine Guerrier, une expérience au long cours

Cela dure depuis 18 ans. Aussi loin qu’il remonte dans sa vie professionnelle, Antoine Guerrier a toujours travaillé sur Gaia. Il y a même consacré sa thèse de doctorat en astronomie et astrophysique, participant à la calibration en longueur d’onde du spectromètre du satellite, l’instrument RVS (Radial Velocity Spectrometer). « Cet instrument décompose la lumière dans le proche infrarouge afin d’obtenir des signatures spécifiques. En analysant ces signatures nettoyées et calibrées, on calcule la vitesse radiale des étoiles. J’ai développé des méthodes et des algorithmes pour calibrer les données du spectromètre au sol. » 

Après  ce passage fondateur par le versant scientifique du projet, alors à l’Observatoire de Paris, Antoine bascule du côté du support technique de la CU6, l’unité scientifique de Gaia en charge de la chaîne de traitement des données spectroscopiques. « Chez CapGemini pendant 4 ans, je travaillais avec les scientifiques pour les aider à développer les algorithmes de traitement, puis j’ai rejoint Thales, où je m’occupais de l’intégration des chaînes de traitement dans le système Big Data du CNES avant de coordonner l’équipe de support technique. » 

Aboutissement logique de cette expérience, Antoine finit par intégrer l’équipe Gaia du CNES en 2019. Il prend alors la responsabilité de la chaîne de traitement spectroscopique, son poste actuel. « La finalité de cette unité est de mesurer la vitesse radiale des étoiles. En tant que coordinateur technique, je suis garant du bon fonctionnement des chaînes scientifiques. » 

Après avoir touché à toutes les facettes de Gaia, c’est cet aspect du traitement de données qui le passionne aujourd’hui, davantage que le volet astronomique. « Nous avons des contraintes techniques, un volume de données et des plannings à respecter, et en face les scientifiques ont des besoins. Tout l’intérêt de notre métier est de chercher des idées pour allier les deux. » Cela lui demande bien sûr d’échanger beaucoup avec les équipes de chercheurs, ce qui n’est pas pour lui déplaire :

L’interface avec les scientifiques est toujours enrichissant, ce sont des personnes très attachantes. La dimension humaine compte énormément dans Gaia, c’est vrai aussi pour les relations au sein de l’équipe du CNES. Nous formons une vraie famille.

Frédéric Pailler, la passion de l’astronomie

Pour illustrer la puissance informatique déployée par le centre de traitement Gaia du CNES, Frédéric Pailler utilise une image très parlante : « Si tous les calculs avaient été faits sur un seul ordinateur, il aurait fallu 460 ans pour élaborer le catalogue 3. Nous avons pu le faire en quelques mois. » Arrivé en 2016 sur le projet, cet ingénieur en télécommunications est le coordinateur technique de l’unité scientifique qui calcule les paramètres astrophysiques des objets détectés. « Il s’agit de la partie de Gaia qui s’occupe de transformer une source, c’est-à-dire une lumière, en un vrai objet, en déterminant les éléments qui correspondent à sa nature : masse, âge, température… » Au quotidien, Frédéric pilote les aspects techniques et opérationnels de son domaine de responsabilité et assure le lien entre l’équipe du CNES et les scientifiques, en particulier pour évaluer ce qu’il est possible de faire et leur donner les moyens d’interpréter les données du satellite.

 Nous faisons du Big Data avec tous les problèmes techniques que cela peut poser, mais le gain est énorme une fois que nous l’avons bien intégré !  

Frédéric a réalisé un long parcours au CNES depuis 2000 avant de rejoindre l'équipe Gaia. D’abord spécialisé dans les réseaux et la sécurité informatique, il a plongé dans la mécanique spatiale où il faisait du calcul d’orbite de satellites au centre de contrôle ATV. A la fin des missions ATV, lorsque l’opportunité s’est présentée de bifurquer vers le traitement de données astronomiques, il a tout de suite saisi la chance d’allier dans son métier ses compétences en informatique et sa passion personnelle. « Comprendre comment est formé le monde qui nous entoure et comment il fonctionne m’intéresse depuis toujours, explique celui qui est également président d’un club d’astronomie. Forcément, contribuer à une mission astronomique de ce calibre et avoir des contacts quotidiens avec des astronomes professionnels apporte une motivation supplémentaire. »

Et six ans après, il se passionne toujours autant pour son sujet, d’autant plus que le propre de Gaia est d’être en perpétuelle évolution, conclut-il : « En plus des nouvelles données, chaque catalogue retraite l’ensemble des données depuis le départ, mais avec de nouveaux codes pour calculer plus de paramètres et avec  plus de précision. Cela veut dire toujours plus de contacts avec les scientifiques pour répondre à leurs besoins et organiser les développements et les calculs. »

Nicolas Mary, un support indispensable pour les scientifiques

Entré en 2010 chez Thales Services Numériques à la sortie de son master en intelligence artificielle et robotique, Nicolas Mary a depuis effectué toute sa carrière dans cette société au sein d’une cellule spécialisée dans le Big Data sur des projets spatiaux. Ainsi, cet ingénieur développement logiciel a d’abord aidé à développer le centre d’expertise technique pour le satellite franco-indien d’étude de l’atmosphère Megha-Tropiques, puis œuvré sur plusieurs missions d’observation de la Terre, avant de participer à la mission Gaia.

Pour le DPCC Nicolas est, en tant que salarié de la société Thales Services Numériques, Assistant à maîtrise d’ouvrage (AMOA) pour le développement et la maintenance des chaînes scientifiques dédiées aux objets complexes et aux astéroïdes du Système solaire. « Le principe de Gaia est de pouvoir observer des milliards d’objets spatiaux. L’infrastructure du CNES permet d’interpréter les signaux du satellite en traitant en parallèle plusieurs petits modules scientifiques dans un gros moteur Big Data. Je travaille sur le développement de ces modules et leur intégration dans le logiciel. » Cette mission comporte en amont une bonne part de communication avec les scientifiques, et un volet technique pour les accompagner dans la conception des codes. « Je suis aussi en support pendant la phase opérationnelle, quand les algorithmes tournent, pour m’assurer qu’ils fonctionnent en continu. En cas de problème, un plantage par exemple, il faut réagir très vite pour récupérer le code corrigé et l’intégrer sur la machine ! » 

Même après 7 ans, Nicolas se montre toujours autant captivé par les résultats de ces opérations complexes : « Aucun domaine scientifique ne fait autant rêver que l’espace et les étoiles. Quand les images iconiques des catalogues sortent, je trouve cela absolument magnifique. » Désormais, il se projette vers le prochain catalogue :

 Le satellite fait de plus en plus d’observations, on peut encore améliorer les résultats, développer des algorithmes plus performants, aider les scientifiques à optimiser leurs codes, c’est passionnant. 

Claire Fabre : un œil vigilant sur les opérations

Entre Claire Fabre et le spatial, c’est une longue histoire de famille. Fille d’un ingénieur du CNES, elle a été attirée par ce secteur depuis l’enfance, et s’est naturellement orientée vers un master en télédétection, imagerie numérique et spatial après l’obtention de sa maîtrise de physique. Depuis, elle a fait toute sa carrière chez des fournisseurs de services pour le spatial. Cela fait 10 ans que Claire participe à l’aventure Gaia en tant que salariée de la société ATOS. « J’ai commencé sur le projet un peu avant le lancement du satellite. Au départ, je m’occupais du développement des codes scientifiques et de leur intégration dans la structure, puis je suis passée du côté des opérations et de l’exploitation. » 

Claire intervient en support ingénierie exploitation pour le DPCC. Son rôle consiste à lancer les chaînes de traitement et à contrôler le bon déroulement de toutes les étapes. « Il y a d’abord les phases de qualification, où nous faisons tourner les algorithmes en changeant les paramètres d’entrée et en faisant de nombreux allers-retours avec les scientifiques. Ensuite, après ces tests, nous entrons dans la partie opérationnelle pour produire les données finales qui constitueront le prochain catalogue. » 

Claire peut être amenée à intervenir sur toutes les chaînes, mais s’occupe prioritairement des unités scientifiques dédiées au traitement spectroscopique et aux étoiles doubles. Elle valide techniquement les données produites, c’est-à-dire qu’elle s’assure qu’il y en a le bon nombre et qu’elles correspondent à ce qui était attendu, avant de les transmettre aux scientifiques. Et bien sûr, elle doit réagir immédiatement en cas de bug ou de problème de tout ordre durant les opérations. « Un aspect essentiel, et qui me plaît beaucoup, est le travail collectif : nous devons toujours être au courant de ce que ce que font les autres, échanger, savoir demander de l’aide, prendre le relais en cas de besoin. » Plus généralement, il y a une vraie synergie avec les autres centres de traitement du consortium, et Claire a aussi la mission d’assurer le lien avec eux chaque semaine lors d’une téléconférence où chacun fait le point sur ses activités. Autant de dimensions qui la passionnent :

 Depuis le temps que le satellite tourne, on pourrait croire qu’il y a une certaine routine. Ce n’est pas du tout le cas : l’environnement, la plateforme, les codes scientifiques évoluent sans cesse. Chaque publication de catalogue représente une révolution pour les astrophysiciens ! 

Céline Fouron, au cœur du traitement des données

En 20 ans de carrière, Céline Fouron a mis son savoir-faire d’ingénieure informatique spécialisée dans le développement au service de secteurs d’activité très divers : la sûreté nucléaire, la grande distribution, les prévisions météorologiques à moyen terme… Depuis 2019, en tant que salariée de Telespazio, c’est sur l’astronomie qu’elle se concentre désormais avec le projet Gaia. « L’un des avantages de l’informatique est de donner accès à des domaines qui n’ont rien à voir les uns avec les autres. Au départ, je faisais plutôt du développement, sur Gaia je fais partie de l’équipe Telespazio qui opère les chaînes de traitement. » 

Travaillant en binôme, Céline s’occupe plus précisément des objets complexes du Système solaire. En tant que Support contrôleur aux opérations Gaia, elle est à la fois en charge de l’exécution de la chaîne de traitement, qui permet de déterminer si Gaia a détecté des astéroïdes, et de la gestion des données. « Concrètement, il faut indiquer quelles données sont prises en entrée, faire tourner les algorithmes et contrôler que les données ne restent pas bloquées à un endroit, qu’on a assez d’espace sur les disques et les récupérer pour qu’elles partent correctement en sortie. »

La question de la saturation de l’espace sur les différents serveurs est cruciale puisque certains jours le centre reçoit plusieurs dizaines de téraoctets de données à traiter. Cela demande une capacité d’adaptation et beaucoup de réactivité pour nettoyer les espaces, investiguer quand il y a des problèmes, chercher des solutions pour automatiser et améliorer le système. Autant de tâches pour lesquelles le passé de développeuse de Céline est précieux, tout comme son esprit d’équipe. « Chacun a ses activités, mais Gaia est avant tout une mécanique collective dans laquelle tout est lié. On n’est jamais seul face à ses problèmes. »

 C’est un projet d’autant plus passionnant qu’il est porté par des scientifiques passionnés. Je trouve génial d’être engagée dans cette aventure qui mobilise 430 personnes en tout, qui arrivent à s’organiser sur des systèmes extrêmement complexes pour au bout du compte sortir le catalogue !  



Partenariats industriels

Dans le cadre de sa contribution à la mission Gaia, le CNES a développé un partenariat fort avec plusieurs industriels français. Depuis le lancement du satellite en 2013, les sociétés Thales Services Numériques, Atos et Telespazio apportent notamment leur expertise au projet à travers l’implication au quotidien des femmes et des hommes qui les représentent au sein du DPCC. L'équipe Gaia regroupe ainsi des ingénieurs et techniciens du CNES et de ces partenaires industriels.