Stage de recherche pour un étudiant M2 / Training for a M2 student

[version française]

Connaître les caractéristiques de l’activité électrique des orages sur la France à partir de longues séries de données

La foudre est un phénomène météorologique dangereux qui peut menacer directement la sécurité humaine et détruire des propriétés. Comprendre les caractéristiques de l’activité électrique des orages est une activité de recherche critique avec un impact plus large sur la société. Dans ce projet, l’étudiant collaborera avec un groupe de chercheurs pour analyser des données d’éclairs enregistrées en France par un réseau terrestre ainsi que des données météorologiques issues de réanalyses, afin d’identifier les propriétés statistiques de l’activité électrique selon les conditions météorologiques associées. Les résultats de ce projet devraient permettre de vérifier la pertinence de l’utilisation d’algorithmes d’apprentissage profond pour la prévision de l’occurrence d’activité électrique intense.

Profil et compétences recherchées

L’étudiant doit avoir une formation préalable de Master-1 en sciences de l’atmosphère, météorologie ou physique. L’étudiant doit également être familier avec le langage Python ou R et avoir une bonne capacité de communication. Une expérience antérieure dans l’analyse de données est favorable mais non requise.

Détail du projet, méthodes et résultats attendus

L’analyse sera effectuée sur deux types de données: (a) les enregistrements d’éclairs mesurés par le réseau terrestre Météorage, et (b) les conditions météorologiques (par exemple, la température, l’humidité, la circulation, etc.) à partir de jeux de réanalyse. Ces deux ensembles de données couvrent la France à haute résolution temporelle et sont construits selon un maillage spatial de haute résolution. Il est déjà envisagé que ces données seront analysées sur différents domaines plus petits couvrant les grandes métropoles françaises.

L’étudiant utilisera/adaptera/développera des méthodes numériques issues des sciences de la donnée. Cela inclut par exemple l’analyse de séries chronologiques, ou encore certains algorithmes d’apprentissage automatique. Ces méthodes seront utilisées pour dériver des propriétés statistiques clés (par exemple la moyenne, la variance, la distribution de probabilité) de divers paramètres de l’activité électrique. Elles permettront aussi de quantifier les corrélations entre ces différents paramètres pour les différents domaines géographiques étudiés. En parallèle, il/elle travaillera également sur les données météorologiques pour examiner si certains paramètres météorologiques spécifiques sont associés à l’activité électrique, que ce soit sur les différents sous-domaines de France considérés ou encore au cours de différents mois. Cela impliquera là aussi l’utilisation d’algorithmes d’apprentissage automatique pour traiter à nouveau une grande quantité de données. L’étudiant sera encouragé à se joindre à un projet sur la prévision immédiate de l’activité électrique exploitant entre autre l’apprentissage profond, projet en cours d’évaluation.

L’étudiant synthétisera ses résultats et en discutera les principales conclusions avec le groupe. L’étudiant sera également amené à présenter ses résultats devant d’autres étudiants et encadrants lors de différentes réunions du laboratoire.

Ce travail pourra être poursuivi par une thèse sur un sujet similaire ou convenu d’un commun accord avec le groupe.

Le financement de ce stage M2 est déjà disponible.

Durée su stage M2 : 5 à 6 mois.

Date de début : dès que possible.

Contact: chien.wang@aero.obs-mip.fr


[English version]

Understanding the characteristics of lightning activity over France using long-term network data

Lightning is a hazardous weather phenomenon that can directly threat human safety and destroy properties. To understand the long-term characteristics of lightning activity is a critical research task with a broader impact on the society. In this project, the student would work with a group of scientists to analyze lightning flash data recorded in a surface network as well as meteorological data from reanalysis, and to identify the statistical characters of such activities with associated weather conditions specifically over France. The outcome of this project would be expected to make contribution to an ongoing effort of applying deep learning algorithms to forecast the occurrence of intense lightning activity over France.

Desired Profile and skills

The student is expected to have a previous Master-1 training in atmospheric sciences, meteorology, or physics. The student should also be familiar with Python or R language and have a good communication skill. Previous experience in performing data analysis is favorable but not required.

Project detail, methods, and expected results

The analysis will be performed on two types of data: (a) lightning flash records measured by the Météorage surface network, and (b) meteorological conditions (e.g., temperature, humidity, circulation, etc.) from a reanalysis product. Both datasets contain high-frequent time series data distributed in a high-resolution grid system covering France. It is likely that the lightning data will be analyzed over different smaller domains covering major French metropolitans.

The student would use/adapt/develop adequate data science methods, e.g., time-series analysis, pattern analysis, and/or certain machine learning algorithms to derive key statistical parameters of various lightning parameters, such as mean, variance, probability distributions of lightning activity properties, and correlation among different lightning types over a given sub-domain. In parallel, she or he will also work on the meteorological data to examine whether certain specific weather patterns are associated with these activities, e.g., over different sub-domains of France or during different months. This would likely involve the use of machine learning algorithms to process a large quantity of data as well. The student will be encouraged to join a deep learning nowcasting/forecasting project under review.

The student will then summarize research findings in the data analysis and discuss various conclusions with the group. The student is also encouraged to present the results in front of fellow students and supervisors in a meeting of the Master Program of the Lab.

There is an excellent opportunity for the student to continue a Ph.D. study afterwards on a similar or a mutually agreed topic with the same group of scientists.

The funding of the M2 training is already available.

Duration of the M2 training: 5 to 6 months.

Start time: as soon as possible.

Contact: chien.wang@aero.obs-mip.fr

Rechercher