CF202440872
Recommandations intelligentes basées sur le Machine Learning pour faciliter la tâche des analystes de données
J-118
Doctorat Doctorat complet
Informatique
Occitanie
Disciplines
Autre (Informatique)
Laboratoire
INSTITUT DE RECHERCHE EN INFORMATIQUE DE TOULOUSE (IRIT) - UMR 5505
Institution d'accueil
UNIVERSITE DE TOULOUSE 1 CAPITOLE
Ecole doctorale
Mathématiques, informatique, télécommunications de Toulouse (MITT) - ED 475

Description

Les analystes de données sont confrontés à une multiplicité des types de données pour effectuer leurs taches. Les accès sont parfois longs et complexes, et les manipulations manquent d’uniformité : l’utilisation d’outils différents peut compliquer la poursuite d’une nouvelle analyse de données. L’objet de cette thèse est de développer un système de recommandation pour faciliter la tâche des analystes. L'objectif principal de cette thèse est de concevoir et d'évaluer un système de recommandation basé sur des algorithmes de machine learning pour : (i) Faciliter la sélection des données en proposant automatiquement des datasets ou des sous-ensembles pertinents à partir de métadonnées et d'historiques d'utilisation, (ii) Optimiser le choix des outils et techniques en recommandant des méthodes analytiques (algorithmes, modèles, frameworks) en fonction des besoins spécifiques de l'utilisateur et (iii) Accélérer la création de pipelines analytiques en suggérant des flux de travail partiellement ou entièrement automatisés, tout en tenant compte des préférences et des compétences des analystes. Le travail consiste à faire : (i) une analyse des besoins des analystes et collecte des données, (ii) une conception d’un système de recommandation hybride basé sur le contenu des métadonnées et des activités collaboratives, (iii) le développement d’un prototype et (iv) expérimentations.

Compétences requises

Connaissance des concepts de Big Data Analytics Compétences d'algorithmes de machine learning

Bibliographie

1. R. Hai, S. Geisler, et C. Quix, « Constance: An Intelligent Data Lake System », in Proceedings of the 2016 International Conference on Management of Data, New York, NY, USA, juin 2016, p. 2097‑2100. doi: 10.1145/2882903.2899389.
2. F. Ravat et Y. Zhao, « Data Lakes: Trends and Perspectives », in Database and Expert Systems Applications, Cham, 2019, p. 304‑313. doi: 10.1007/978-3-030-27615-7_23.
3. Z. Jin, M. R. Anderson, M. Cafarella, et H. V. Jagadish, « Foofah: Transforming Data By Example », in Proceedings of the 2017 ACM International Conference on Management of Data, New York, NY, USA, mai 2017, p. 683‑698. doi: 10.1145/3035918.3064034.
4. H. Fang, « Managing data lakes in big data era: What’s a data lake and why has it became popular in data management ecosystem », in 2015 IEEE International Conference on Cyber Technology in Automation, Control, and Intelligent Systems (CYBER), juin 2015, p. 820‑824. doi: 10.1109/CYBER.2015.7288049.

Mots clés

lac de données, machine learning, recommandation, analyse de données

Offre boursier / non financée

Ouvert à tous les pays

Dates

Date limite de candidature 28/11/25

Durée36 mois

Date de démarrage01/09/25

Date de création20/12/24

Langues

Niveau de français requisAucun

Niveau d'anglais requisB1 (pré-intermédiaire)

Divers

Frais de scolarité annuels400 € / an

Contacts

Vous devez vous connecter pour voir ces informations.

Cliquez ici pour vous connecter ou vous inscrire (c'est gratuit !)