Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 구글
- DBSCAN
- bigquery
- do it
- frontend
- React
- 클러스터링
- Kubernetes
- 파이썬
- 타입스크립트
- Machine Learning
- 쿠버네티스
- TooBigToInnovate
- 차원 축소
- 최적화
- 빅쿼리
- docker
- 프론트엔드
- 리액트
- Kaggle
- 대감집
- ADP 실기
- r
- 머신러닝
- 대감집 체험기
- LDA
- 심층신경망
- ADP
- 캐글
- python
Archives
- Today
- Total
목록bin counting (1)
No Story, No Ecstasy
Encoding Categorical Data
1. One-hot Encoding Categorical data의 각 값을 하나의 bit로 나타내는 방법이다. 각 비트가 하나의 feature가 되며, k개의 범주를 가진 categorical data는 길이 k를 갖는 피처 벡터로 표현된다. 이 방법은 선형 종속성을 가진다(k개 feature의 합이 1). 2. Dummy Coding, Effect Coding Dummy Coding은 k-1개의 feature로 k개 범주의 categorical data를 표현한다(선형 종속성 제거). 하나의 피처가 책임을 지고 모든 요소가 0인 벡터로 표현된다. Effect Coding은 Dummy Coding과 매우 비슷하지만, (모든 feature 값이 0인) 기준 범주가 모두 -1의 벡터로 표현된다. 선형 회귀..
Versus (vs) Series
2021. 3. 12. 23:09