Pour la plupart des gens, il est difficile dobtenir les informations dont ils ont besoin directement à partir de données brutes. Lapprentissage automatique peut transformer des données désordonnées en informations utiles. Le clustering est une technique dapprentissage automatique non supervisée qui regroupe des objets similaires dans le même cluster. Cluster2A combine les deux algorithmes de clustering les plus populaires, K-means et DBSCAN, pour vous aider à découvrir des modèles intéressants dans les données.
Par exemple, Cluster2A peut effectuer une analyse de cluster basé sur le comportement de consommation des clients et fournir des résultats pour la segmentation de la clientèle. La segmentation de la clientèle est lutilisation de caractéristiques spécifiques pour identifier et organiser les clients. Ces caractéristiques peuvent être des caractéristiques démographiques, comportementales/psychologiques et lemplacement géographique. La segmentation de la clientèle permet didentifier les clients et de proposer des produits et services adaptés à leurs besoins. Cette personnalisation vous procurera un avantage concurrentiel, augmentera les taux de conversion des clients et la fidélité à la marque.
Modèle K-means:
Lalgorithme K-means nécessite que le nombre de clusters soit spécifié. Lobjectif principal est de trouver un point de données représentatif (appelé centroïde) dans une grande quantité de données de grande dimension, puis daffecter chaque point de données au centroïde le plus proche.
Modèle DBSCAN:
Contrairement à K-means, DBSCAN na pas besoin de spécifier le nombre de clusters à générer. Lalgorithme DBSCAN traite les points de données en fonction de la densité, en divisant principalement les points suffisamment denses dans lespace des caractéristiques dans le même cluster, et peut identifier les valeurs aberrantes qui nappartiennent à aucun cluster, ce qui est très approprié pour détecter les valeurs aberrantes.
Type de données de croissance:
Vous pouvez sélectionner des données de séries chronologiques avec 12 périodes, 24 périodes et 36 périodes pour l’analyse.
Les données les plus couramment utilisées sont les prix dachat mensuels des matériaux, les ventes mensuelles de produits, les achats mensuels des clients et le résultat dexploitation annuel de lentreprise.
Par exemple, vous pouvez effectuer une analyse de cluster en fonction des données dachat mensuelles des clients VIP. Cluster2A calculera automatiquement le taux de croissance des achats de chaque client, la volatilité des achats et le taux de croissance par unité de volatilité, et fera des recommandations de clustering.
Type de données caractéristiques:
Vous pouvez sélectionner 2 à 10 caractéristiques pour l’analyse.
Les caractéristiques les plus couramment utilisées sont les suivantes: Données démographiques: par exemple, lâge, le sexe, le revenu, léducation, la nationalité et la taille de la famille. Comportement / Psychologie: Par exemple, le style de consommation (modèle RFM) et le type de personnalité (modèle DISC). Géographie: par exemple, pays, région et ville. Statistiques / Finances: par exemple, moyenne, écart-type, ratio de Sharpe, β, α et R-carré.
Par exemple, vous pouvez effectuer une analyse de cluster basée sur les trois caractéristiques dachat des clients, RFM (Recency, Frequency, Monetary).