Date Formation:
07/09/2023
Note Date Formation:
Dates et Lieu Les jeu-ven 7-8 sept ET le lun 18 sept 2023 (3 jours en 2j+1j) En distanciel POUR Y PARTICIPER : 1/ S’inscrire sur SIRENE : https://www.sirene.inserm.fr/ (onglet « Agent formation », menu « Demander une formation », sous-menus « offre de formation continue & collective », domaine « TS4-Statistiques ») 2/ Compléter le questionnaire de pré-formation en ligne : Questionnaire Big Data 1/ & 2/ A FAIRE pour le 21/06/2023 au plus tard
Date Limite d'inscription:
21/06/2023
Objectif:
Principaux aspects des Big Data abordés : le volume des données et leur variété.
Principaux thèmes travaillés : Données de grande dimension, Données de nature hétérogène, Classification, Régression, Clustering
Réaliser une analyse de régression lorsque les données sont en grande dimension
Réaliser un clustering en utilisant des modèles parcimonieux spécifiques à la grande dimension
Réaliser une étude de classification sur des données de grande dimension
Effectuer une sélection des variables pertinentes
Effectuer ces analyses sous le logiciel R
Extraire de l’information sur la problématique métier à partir des résultats de l’analyse
Public:
Personnes souhaitant se mettre à jour sur les dernières méthodes statistiques pour les données massives (Big Data)
Pré-requis
Avoir des notions avancées en statistique (inférence, clustering, régression, classification), ainsi que des notions de R.
Réfléchir à des problématiques, jeux de données ou documents susceptibles d’être utilisés en support lors de la formation.
Lieu:
Distanciel
Contacts/Informations:
CONTACT : Michèle HAYS
INSERM DR Grand Ouest
Tel: 02 40 35 86 80
Mail: michele.hays@inserm.fr