Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
Tags
- PARTITION BY
- SQLD
- Python
- partition
- sklearn
- 기본
- data preprocessing
- ML
- 사이킷런
- Machine Learning
- SQL
- Cartesina Product
- django
- CROSS JOIN
- 명령어
- 머신러닝
- 원핫인코딩
- 레이블 인코딩
Archives
- Today
- Total
목록data preprocessing (1)
프로그래밍 기록 Blog
기본적으로 사이킷런의 머신러닝 알고리즘은 문자열 값을 입력 값으로 허락하지 않으므로, 모든 문자열 값들을 숫자 형으로 인코딩하는 전처리 작업 후에 머신러닝 모델에 학습을 시켜야합니다. 인코딩 하는 방식에는 레이블 인코딩(Lable encoding)과 원-핫 인코딩(One Hot Encoding)이 있습니다. 레이블 인코딩(Label Encoding) from sklearn.preprocessing import LabelEncoder fruits=['사과', '바나나', '수박'] # LabelEncoder 객체 생성 후 fit()과 transform()으로 LabelEncoder 수행 encoder = LabelEncoder() encoder.fit(fruits) labels = encoder.trans..
머신러닝/데이터 전처리
2020. 11. 11. 14:17