Recommandations intelligentes basées sur le Machine Learning pour faciliter la tâche des analystes de données
J-118
Doctorat Doctorat complet
Informatique
Occitanie
- Disciplines
- Autre (Informatique)
- Laboratoire
- INSTITUT DE RECHERCHE EN INFORMATIQUE DE TOULOUSE (IRIT) - UMR 5505
- Institution d'accueil
- UNIVERSITE DE TOULOUSE 1 CAPITOLE
Description
Les analystes de données sont confrontés à une multiplicité des types de données pour effectuer leurs taches. Les accès sont parfois longs et complexes, et les manipulations manquent duniformité : lutilisation doutils différents peut compliquer la poursuite dune nouvelle analyse de données. Lobjet de cette thèse est de développer un système de recommandation pour faciliter la tâche des analystes. L'objectif principal de cette thèse est de concevoir et d'évaluer un système de recommandation basé sur des algorithmes de machine learning pour : (i) Faciliter la sélection des données en proposant automatiquement des datasets ou des sous-ensembles pertinents à partir de métadonnées et d'historiques d'utilisation, (ii) Optimiser le choix des outils et techniques en recommandant des méthodes analytiques (algorithmes, modèles, frameworks) en fonction des besoins spécifiques de l'utilisateur et (iii) Accélérer la création de pipelines analytiques en suggérant des flux de travail partiellement ou entièrement automatisés, tout en tenant compte des préférences et des compétences des analystes. Le travail consiste à faire : (i) une analyse des besoins des analystes et collecte des données, (ii) une conception dun système de recommandation hybride basé sur le contenu des métadonnées et des activités collaboratives, (iii) le développement dun prototype et (iv) expérimentations.Compétences requises
Connaissance des concepts de Big Data Analytics Compétences d'algorithmes de machine learningBibliographie
1. R. Hai, S. Geisler, et C. Quix, « Constance: An Intelligent Data Lake System », in Proceedings of the 2016 International Conference on Management of Data, New York, NY, USA, juin 2016, p. 2097‑2100. doi: 10.1145/2882903.2899389.2. F. Ravat et Y. Zhao, « Data Lakes: Trends and Perspectives », in Database and Expert Systems Applications, Cham, 2019, p. 304‑313. doi: 10.1007/978-3-030-27615-7_23.
3. Z. Jin, M. R. Anderson, M. Cafarella, et H. V. Jagadish, « Foofah: Transforming Data By Example », in Proceedings of the 2017 ACM International Conference on Management of Data, New York, NY, USA, mai 2017, p. 683‑698. doi: 10.1145/3035918.3064034.
4. H. Fang, « Managing data lakes in big data era: Whats a data lake and why has it became popular in data management ecosystem », in 2015 IEEE International Conference on Cyber Technology in Automation, Control, and Intelligent Systems (CYBER), juin 2015, p. 820‑824. doi: 10.1109/CYBER.2015.7288049.
Mots clés
lac de données, machine learning, recommandation, analyse de donnéesOffre boursier / non financée
Ouvert à tous les pays
Dates
Date limite de candidature 28/11/25
Durée36 mois
Date de démarrage01/09/25
Date de création20/12/24
Langues
Niveau de français requisAucun
Niveau d'anglais requisB1 (pré-intermédiaire)
Divers
Frais de scolarité annuels400 € / an
Contacts
Vous devez vous connecter pour voir ces informations.
Cliquez ici pour vous connecter ou vous inscrire (c'est gratuit !)