일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- partition
- Cartesina Product
- 원핫인코딩
- SQL
- 사이킷런
- PARTITION BY
- 기본
- SQLD
- data preprocessing
- Python
- Machine Learning
- CROSS JOIN
- django
- ML
- 머신러닝
- 명령어
- 레이블 인코딩
- sklearn
- Today
- Total
목록빅데이터 분석/분석 기법 (2)
Programming Blog
앙상블(Ensemble) * 영문 뜻 : 조화 or 통일 보통 데이터를 예측할 때 하나의 모델을 사용한다. 하지만 앙상블 학습은 여러 모델을 사용하여 조화롭게 학습한 후, 예측 결과들을 결합하여 더 정확한 예측값을 구하는 학습 방법 또한, 여러 개의 의사 결정 트리를 결합하여 하나의 결정 트리보다 더 좋은 성능을 내는 머신러닝 기법이다. 강력한 하나의 모델을 사용하는 대신 약한 모델(분류기, Classfier) 여러 개를 사용하여 예측 정확성에 더 도움을 주는 방식이다. * 부트스트랩(bootstrap)은 random sampling을 적용하는 방법이다. ex) 예측을 하기 위해 임의(랜덤)로 n개를 추출하여 평균 측정 중복을 허용한 복원 추출로 n개를 추출하여, 뽑은 n개의 평균 구하는 것을 m번 반복..
회귀(한 변수에 다른 변수들이 주는 영향력)를 사용하여 선형적으로 분석하는 방법이 선형 회귀 분석입니다. 선형 회귀 분석을 위해서는 우선 선형 회귀 모델을 만들어야 합니다. * 모델 : 수학 식으로 표현되는 함수, 영향을 주는 변수(독립변수, 설명변수)와 영향을 받는 변수(종속변수, 반응변수)로 구성되어 있다. 종속 변수의 개수와 독립 변수의 개수에 따른 선형 회귀 모델 종류 종속 변수 1개 독립 변수 1개 단변량 단순 선형 회귀 모델 독립 변수 2개 이상 단변량 다중 선형 회귀 모델 종속 변수 2개 이상 독립 변수 1개 다변량 단순 선형 회귀 모델 독립 변수 2개 이상 다변량 다중 선형 회귀 모델 ex) 통화량과 환율, 실업률, 인구증가율이 물가에 미치는 영향 - 통화량, 환율, 실업률, 인구증가율 :..