Stage #4: SKYISFA : Etude de la faisabilité d’un framework de Federated Learning pour l’actuariat basé sur les données autonomes
Contributeur
ALLAMINE ANNOUR SAAD
Supervisé par Eddy CARON et Denis CLOT
Dates
18/03/2024 – 02/04/2024;
22/04/2024 – 10/05/2024;
27/05/2024 – 17/07/2024;
02/09/2024 – 14/10/2024
Site
Laboratoire de l’Informatique du Parallélisme (LIP), ENS Lyon
Synopsis (En cours d’activité)
Un des premiers enjeux sera lié a la mise en place de méthodologie de collecte de données par une approche originale via des agents autonomes, ce qui représente en soit un premier défi. L’étude menée devra comprendre et identifier les données. L’ISFA dispose de sa propre base de connaissance mais l’exploitation de la base de données publique des mémoires d’actuariats de l’Institut des Actuaires sera également étudiée. Il s’en suit une phase de collecte et de préparation des données qui sont incontournables pour la construction du mod
ele de ML. Ces phases seront des enjeux centraux de notre approche. En effet, dans ce contexte nous nous intéresserons plus particulierement
à :
- l’apprentissage décentralisé : Au lieu d’envoyer des données brutes
a un serveur central, le mod
èle est envoyéa des appareils individuels o
u il apprend à partir des données locales; - l’agrégation des données pour la mise
a jour des mod
èles : Les données des utilisateurs pourront dans le cas de ce projet être assimiléa des données autonomes et seules les mises
à jour du modèle, qui sont généralement anonymisées et agrégées, sont partagées ou seront également associées
à un type d’agent autonome (appel´e SkyWorker dans le cadre de notre framework); - la mise en place du LLM (Large Language Models) associé. Le mod
ele d’apprentissage sera pré-entraîné
a partir des données spécifiques collectées. Nos données autonomes pourront avoir la capacité interne d’initier la phase de fine tuning permettant de réduire la quantité de données et de fait d’énergie consommée par les ressources lors de la phase d’entraînement.