Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- docker
- 빅쿼리
- LDA
- 최적화
- 타입스크립트
- 프론트엔드
- 대감집 체험기
- 쿠버네티스
- ADP 실기
- r
- TooBigToInnovate
- 심층신경망
- 대감집
- bigquery
- 차원 축소
- 캐글
- 리액트
- Kaggle
- python
- 파이썬
- Machine Learning
- ADP
- 클러스터링
- 머신러닝
- frontend
- DBSCAN
- Kubernetes
- React
- 구글
- do it
Archives
- Today
- Total
목록feature hashing (1)
No Story, No Ecstasy
Encoding Categorical Data
1. One-hot Encoding Categorical data의 각 값을 하나의 bit로 나타내는 방법이다. 각 비트가 하나의 feature가 되며, k개의 범주를 가진 categorical data는 길이 k를 갖는 피처 벡터로 표현된다. 이 방법은 선형 종속성을 가진다(k개 feature의 합이 1). 2. Dummy Coding, Effect Coding Dummy Coding은 k-1개의 feature로 k개 범주의 categorical data를 표현한다(선형 종속성 제거). 하나의 피처가 책임을 지고 모든 요소가 0인 벡터로 표현된다. Effect Coding은 Dummy Coding과 매우 비슷하지만, (모든 feature 값이 0인) 기준 범주가 모두 -1의 벡터로 표현된다. 선형 회귀..
Versus (vs) Series
2021. 3. 12. 23:09