Для большинства людей трудно получить необходимую информацию непосредственно из необработанных данных. Машинное обучение может преобразовывать неупорядоченные данные в полезную информацию. Кластеризация - это метод машинного обучения без учителя, при котором похожие объекты группируются в один кластер. Кластер2A сочетает в себе два самых популярных алгоритма кластеризации, K-means и DBSCAN, чтобы помочь вам обнаружить интересные закономерности в данных.
Например, Кластер2A может выполнять кластерный анализ на основе поведения потребителей и предоставлять результаты для сегментации клиентов. Сегментация клиентов - это использование определенных характеристик для выявления и организации клиентов. Эти характеристики могут быть демографическими, поведенческими / психологическими характеристиками и географическим положением. Сегментация клиентов позволяет идентифицировать клиентов и предоставлять продукты и услуги, соответствующие их потребностям. Такая персонализация обеспечит вам конкурентное преимущество, увеличит коэффициент конверсии клиентов и лояльность к бренду.
Модель K-means:
Алгоритм K-means требует указания количества кластеров. Основная цель - найти репрезентативную точку данных (называемую центроидом) в большом количестве многомерных данных, а затем назначить каждую точку данных ближайшему центроиду.
Модель DBSCAN:
В отличие от K-means, DBSCAN не требует указания количества создаваемых кластеров. Алгоритм DBSCAN обрабатывает точки данных на основе плотности, в основном разделяя достаточно плотные точки в характеристическом пространстве на один и тот же кластер, и может идентифицировать выбросы, которые не принадлежат какому-либо кластеру, что очень подходит для обнаружения выбросы.
Тип данные роста:
Вы можете выбрать данные временных рядов с 12 периодами, 24 периодами и 36 периодами для анализа.
Наиболее часто используемые данные - это ежемесячные закупочные цены на материалы, ежемесячные продажи продукции, ежемесячные покупки клиентов и годовой операционный доход компании.
Например, вы можете выполнить кластерный анализ на основе данных о ежемесячных покупках VIP-клиентов. Кластер2A автоматически рассчитывает скорость роста покупок каждого клиента, волатильность покупок и скорость роста на единицу волатильности, а также дает рекомендации по кластеризации.
Тип данные характеристик:
Вы можете выбрать от 2 до 10 характеристик для анализа.
Наиболее часто используемые характеристики следующие: Демография: К примеру, возраст, пол, доход, образование, национальность и размер семьи. Поведение / Психология: например, стиль потребления (модель RFM) и тип личности (модель DISC). География: например, страна, регион и город. Статистика / Финансы: например, среднее значение, стандартное отклонение, коэффициент Шарпа, β, α и R-квадрат.
Например, вы можете выполнить кластерный анализ на основе трех покупательских характеристик клиентов: RFM (Recency, Frequency, Monetary).