- Enseignant: KHODJA Fatima Zohra
- Enseignant: FATEH BOUGAMOUZA

Ce cours vise à initier les étudiants au Text Mining, une branche essentielle de la science des données et du traitement automatique du langage naturel (NLP). Le Text Mining consiste à extraire, structurer et interpréter des informations pertinentes à partir de textes non structurés, présents en grande quantité dans des sources telles que les réseaux sociaux, les avis clients, les articles scientifiques ou les rapports d’entreprise.
Dans un monde où les données textuelles sont omniprésentes, maîtriser ces techniques devient un levier stratégique pour l’analyse de tendances, la prise de décision automatisée et le développement de solutions intelligentes. Ce cours propose une progression pédagogique complète, alternant apports théoriques, démonstrations techniques et travaux pratiques.
Les étudiants apprendront à :
- Mettre en place un pipeline complet de traitement de texte (collecte, nettoyage, vectorisation) ;
- Appliquer des techniques classiques et avancées de représentation (TF-IDF, Word Embeddings) ;
- Utiliser des modèles de langue modernes (BERT, GPT, etc.) pour des applications telles que la classification de texte, l’extraction d’information ou l’analyse de sentiments.
En s’appuyant sur des outils reconnus comme Python, Scikit-learn, spaCy, Transformers ou HuggingFace, ce cours prépare les étudiants à aborder des projets de NLP à grande échelle, tant dans le domaine académique que professionnel.
Public cible :Ce cours de Text Mining s’inscrit dans le parcours de formation du Master 1 Systèmes d’Informations Avancées et Applications. Il constitue une étape essentielle pour initier les étudiants aux méthodes modernes d’exploitation de données textuelles, qui occupent aujourd'hui une place majeure dans les systèmes d’information.
Objectifs:
- Identifier les principales étapes d'un processus de Text Mining
- Utiliser des outils de Web Scraping et API pour extraire des données textuelles depuis le web
- Appliquer un pipeline de prétraitement de texte incluant transformation et nettoyage
- Comparer différentes méthodes de représentation de texte et mesures de similarité
- Évaluer les performances d'un modèle de langue.
- Concevoir une application utilisant un modèle NLP pour une tâche spécifique
- Dr.: Rabah MAZOUZI