운동하는 공대생
K-Mean Clustering ( K- 평균 군집화) 본문
728x90
반응형
- 정의
k-평균 알고리즘(K-means clustering algorithm)은 먼저 데이터를 분류하는 군집화 방식중 하나로 간단하게 군집화가 가능한 방식이다. Clustring 하고 싶은 군집화의 수에 따라 중심점을 지정하고 그 중심점들(Centroids)에서 데이터들 사이의 평균 거리를 이용하는 방식이다. 이후 군집화 수에 따라 데이터를 분류하고 분류된 군집에서 다시 중심점을 정하는 방식으로 알고리즘을 수행한다.
위의 알고리즘 공식처럼 데이터(x) 와 중심점(u) 의 분산(v) 를 최소화 시키는 것이 이 알고리즘의 방식이다.
- 구현 순서
- 군집화 수 정하기
K-Mean 군집화 방식을 사용하려면 자신이 분류하고자 하는 군집의 수를 지정을 해주어야한다.
-Elbow method
이전에 설명했던 분산과 군집의 수를 기준으로 시각화를 했을경우 분산의 감소 비율이 적어지는 시점을 Elbow로 지정한다. 그래서 이 지점의 값을 k (군집의 수)값으로 지정한다.
728x90
반응형
'Machine Learning' 카테고리의 다른 글
MLOps 이란? (0) | 2022.10.26 |
---|---|
Synthetic Data(합성 데이터) (0) | 2022.10.14 |
LightGBM Theory (0) | 2022.09.22 |
XGBoost Theory (0) | 2022.08.20 |
Time Series Analysis(시계열 분석) (0) | 2022.08.18 |
Comments