Veuillez utiliser cette adresse pour citer ce document : http://dspace1.univ-tlemcen.dz/handle/112/19639
Affichage complet
Élément Dublin CoreValeurLangue
dc.contributor.authorHamza-Cherif épouse Rahmoun, Souaad-
dc.date.accessioned2022-11-17T08:41:28Z-
dc.date.available2022-11-17T08:41:28Z-
dc.date.issued2022-06-28-
dc.identifier.citationsalle des thèsesen_US
dc.identifier.otherDOC-003-38-01-
dc.identifier.urihttp://dspace.univ-tlemcen.dz/handle/112/19639-
dc.description.abstractSince the advent of the social and semantic web, in recent years new tools and sharing sites such as Meta, Twitter, WikiHow, etc. have emerged, making the web a universal collection of knowledge, where users geographically form communities of practice (CoP) online, these CoPs are originally a concept of sociology but find their full development in the current web where users share and exchange their know-how in different fields in the form of procedural knowledge ( PK) called good practices. These good practices are defined by a set of successive steps taken to achieve an objective. Conceptualizing this procedural knowledge has become a major challenge in several fields (information retrieval, intelligent applications, robotics...), knowledge extraction from data base (KDD) is the field that is evolving to offer solutions. KDD combines different methods of learning and knowledge representation in order to find solutions to explore unstructured data in order to facilitate their exploitation and in this context several works have focused on the exploration of procedural knowledge in different purposes, sometimes to create a knowledge base or to identify instructions from procedural knowledge. Most of this work is in the field of natural language processing, the goal we pursue is another, in this thesis we present a new approach to extract and conceptualize good practices from the web, and extract the best practice for a given query. The proposed approach takes place in two phases: in the first one extracts good practices from the web using a web scrapping method, after we represent them by oriented data graphs. In the second phase, we extract the best practice for a given query by applying the techniques of machine learning and text summarization on graphs. This phase takes place in three steps: (1) search for practices similar to the user’s query, here we use the word embedding model to identify sentences similar to the goal sought by the user; (2) Grouping and fusion of similar steps, where we use unsupervised learning (DBScan) and text summarization (PageRank) techniques to group semantically close nodes that we merge in the same step; (3) Extraction of the best practice that is identified by the path of the graph traversing the most important steps to reach the objective, this importance is calculated by measures of centrality of the graphs which quantify the importance of the nodes in a graph oriented by the number of their incoming and outgoing arc. The results obtained demonstrated the superiority of our approach for: (1) capturing practices similar to the goal sought by the user, and this by optimizing the execution time, (2) extracting the best practices for queries compared to a search engine from a real data set.en_US
dc.description.sponsorshipDepuis l’avènement du web social et sémantique, il ne cesse d’émerger ces dernières années de nouveaux outils et sites de partage tels que Meta, Twitter, WikiHow,... faisant du web un recueil universel de connaissances, où les utilisateurs répartis géographiquement forment des communautés de pratique (CdP) en ligne, ces CdP sont à l’origine un concept de sociologie mais trouvent tout leur essor dans le web actuel où des individus partagent et échangent leur savoir faire dans différents domaines sous forme de connaissances procédurales (CP) appelées bonnes pratiques. Ces bonnes pratiques sont définies par un ensemble d’étapes successives acheminées pour atteindre un objectif. Conceptualiser ces connaissances procédurales est devenu un enjeu majeur dans plusieurs domaines (recherche d’information, applications intelligentes, Robotique...), l’extraction des connaissances à partir de données (ECD) est le domaine qui évolue pour offrir des solutions. L’ECD combine différentes méthode d’apprentissage et de représentation des connaissances afin de trouver des solutions pour explorer les données non structurées dans le but de faciliter leur exploitation et dans ce contexte plusieurs travaux se sont penchés sur l’exploration des connaissance procédurales dans des buts différents, parfois pour créer une base de connaissance ou encore pour identifier les instructions à partir des connaissances procédurales. La plupart de ces travaux relèvent du domaine de traitement du langage naturel, le but que nous poursuivons est autre, dans cette thèse nous présentons une nouvelle approche pour extraire et conceptualiser les bonnes pratiques du web, et extraire la meilleure pratique pour une requête donnée. L’approche proposée se déroule en deux phases : durant la première on extrait les bonnes pratiques du web par une méthode de web scrapping, qu’on représente par des graphes orientés de données. Dans la seconde phase on procède à l’extraction de la meilleure pratique pour une requête donnée ceci en appliquant les techniques d’apprentissage artificiel et de résumé de texte sur les graphes. Cette phase de déroule en trois étapes : (1) recherche des pratiques similaires à la requête de l’utilisateur, on utilise ici le modèle de prolongement lexicale de mots pour identifier les phrases similaires au but recherché par l’utilisateur ; (2) regroupement et fusion des étapes similaires, où nous faisons appel aux techniques d’apprentissage non supervisé (DBScan) et de résumé de texte (PageRank) afin de regrouper les noeuds sémantiquement proches que nous fusionnons dans une même étape ; (3) extraction de la meilleure pratique qu’on identifie par le chemin du graphe parcourant les étapes les plus importantes pour atteindre l’objectif, cette importance est calculée grâce aux mesures de centralitè des graphes qui quantifient l’importance des noeuds dans un graphe orienté par ses le nombre de leur arc entrant et sortant. Les résultats obtenus ont démontré la supériorité de notre approche pour : (1) capturer les pratiques similaires au but recherché par l’utilisateur, et ceci en optimisant le temps d’exécution, (2) extraire les meilleure pratiques pour des requêtes par rapport à un moteur de recherche à partir d’un jeu de données réel.en_US
dc.language.isofren_US
dc.publisher17-11-2022en_US
dc.relation.ispartofseriesbfst2799;-
dc.subjectCommunity of practice, Good practice, Procedural knowledge extraction, Knowledge graph, Text synthesis, Machine learning.en_US
dc.subjectCommunauté de pratique, Bonne pratique, Extraction des connaissance procédurale, Graphe de connaissance, Synthèse de texte, Apprentissage artificiel.en_US
dc.titleConceptualisation des bonnes pratiques au sein d'une communauté de pratique.en_US
dc.typeThesisen_US
Collection(s) :Doctorat LMD RSD

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
Conceptualisation-des-bonnes-pratiques-au-sein..pdfCD7,53 MBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.