Comparaison entre les indices de validité  pour obtenir le cluster optimal dans le  clustering.

FEDDANE, Esma Nour El Houda; BRAHIMI, Fatima Zohra

Veuillez utiliser cette adresse pour citer ce document : http://dspace1.univ-tlemcen.dz/handle/112/20930

Affichage complet

Élément Dublin Core	Valeur	Langue
dc.contributor.author	FEDDANE, Esma Nour El Houda	-
dc.contributor.author	BRAHIMI, Fatima Zohra	-
dc.date.accessioned	2023-11-19T08:33:18Z	-
dc.date.available	2023-11-19T08:33:18Z	-
dc.date.issued	2023-07-04	-
dc.identifier.citation	salle des thèses	en_US
dc.identifier.other	CD	-
dc.identifier.uri	http://dspace1.univ-tlemcen.dz/handle/112/20930	-
dc.description.abstract	Clustering is a model that explores the similarities and intrinsic structures of data to group objects into clusters, without using pre-existing labels. There are many clustering methods, and one of the most commonly used is the k-means method. In this thesis, we propose a comparison between several validity indices by combining them with the k-means algorithm to determine the optimal number of clusters. The method involves varying the number of clusters within a predefined range [kmin, kmax] and extracting the best index values representing the final number of clusters. The compared indices are Calinski and Harabas index, Hartiga, Ball and Hall index, Dunn index, Silhouette index, Davies Bouldin index, Xie Beni index, WSJI, WB, and Bayesian Information Criterion. The experimentation and comparison of validity indices were performed on synthetic datasets. The results confirm the effectiveness of certain indices such as Calinski and Harabas indices, Silhouette index, Davies Bouldin index, and Sum of Squares (WB) among different datasets.	en_US
dc.description.sponsorship	Le clustering est un modèle qui explore les similitudes et les structures intrinsèques des données pour regrouper les objets en clusters, sans utiliser d'étiquettes préexistantes. Il existe de nombreuses méthodes de clustering, et l'une des plus couramment utilisées est la méthode des kmeans. Dans ce mémoire, nous proposons une comparaison entre plusieurs indices de validité en les combinant avec l'algorithme des k- means afin de déterminer le nombre optimal de clusters. La méthode consiste à faire varier le nombre de clusters dans une plage prédéfinie [kmin, kmax] et extrait les meilleures valeurs d'indices représentant le nombre final de clusters. Les indices comparés sont l'indice Calinski and Harabas, Hartiga, Ball and Hall, Dunn, Silhouette, Davies Bouldin, Xie Beni, WSJI, WB et Bayesian Information Criterion. L'expérimentation et la comparaison des indices de validité ont été réalisées sur des ensembles de données synthétiques. Les résultats confirment l'efficacité de certains indices tels que les indices Calinski and Harabas, Silhouette, Davies bouldin et Somme des carrés (WB) parmi différents ensemble de données.	en_US
dc.language.iso	fr	en_US
dc.publisher	19-11-2023	en_US
dc.relation.ispartofseries	son.for.p.;	-
dc.subject	clustering, validity indexes, K-means	en_US
dc.subject	clustering, indices de validité, K-means.	en_US
dc.title	Comparaison entre les indices de validité pour obtenir le cluster optimal dans le clustering.	en_US
dc.type	Thesis	en_US
Collection(s) :	Master MID

Fichier(s) constituant ce document :

Fichier	Description	Taille	Format
Comparaison-entre-les-indices-de-validite-pour-obtenir-le-cluster-optimal-dans-le-clustering..pdf	CD	2,77 MB	Adobe PDF	Voir/Ouvrir

Affichage abbrégé