일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- bigquery
- 빅쿼리
- Kaggle
- 클러스터링
- Machine Learning
- 최적화
- ADP
- LDA
- 파이썬
- 캐글
- docker
- 차원 축소
- React
- 쿠버네티스
- 머신러닝
- 타입스크립트
- TooBigToInnovate
- do it
- DBSCAN
- 대감집 체험기
- 구글
- frontend
- Kubernetes
- 리액트
- 프론트엔드
- 대감집
- 심층신경망
- python
- ADP 실기
- r
- Today
- Total
목록DBSCAN (2)
No Story, No Ecstasy
Clustering에는 크게 3개의 방법론들이 있다. 1. Distance-based (ex. K-means) 2. Density-based and grid-based (ex. DBSCAN, HDBSCAN) 3. Probabilistic and generative (ex. Mixture Distributed) 2번 방법론 중 가장 대표적인 예는 DBSCAN (Density based Spatial Clustering of Applications with Noise)인데, HDBSCAN (Hierarchical DBSCAN)은 기존의 계층적 클러스터링 개념을 DBSCAN에 입혀서 기존 DBSCAN이 가진 단점을 보완한 방법론이다. 구체적으로는 DBSCAN의 hyper parameter인 eps를 설정할 필..
1. Hierarchical Clustering (계층적 군집분석) - 유사한 데이터들을 거리 기반으로 점진적으로 병합(bottom-up)하거나 분할(top-down)하는 계층 기법 - 단계를 거칠 때마다 그룹의 개수가 단조적으로 증가/감소하기 때문에 그룹 형성 과정을 계층적으로 표현할 수 있다. - 데이터 연결 방법: 최단연결법, 최장연결법, 평균연결법, 와드연결법 - R 코드 예제 # 0. 별도의 package import 필요 없음 # 1. 데이터 간 거리 구하기 ## - 거리: euclidean, maximum, manhattan, canberra, binary, minkowski ha.dist = dist(data, method = "euclidean") # 2. 계층적 군집분석 수행 ## - ..