일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 기본
- PARTITION BY
- ML
- 명령어
- data preprocessing
- Machine Learning
- sklearn
- Cartesina Product
- 사이킷런
- 원핫인코딩
- SQL
- partition
- 레이블 인코딩
- Python
- 머신러닝
- django
- CROSS JOIN
- SQLD
- Today
- Total
Programming Blog
선형 회귀 분석(Linear Regression) 본문
회귀(한 변수에 다른 변수들이 주는 영향력)를 사용하여 선형적으로 분석하는 방법이 선형 회귀 분석입니다.
선형 회귀 분석을 위해서는 우선 선형 회귀 모델을 만들어야 합니다.
* 모델 : 수학 식으로 표현되는 함수, 영향을 주는 변수(독립변수, 설명변수)와 영향을 받는 변수(종속변수, 반응변수)로 구성되어 있다.
종속 변수의 개수와 독립 변수의 개수에 따른 선형 회귀 모델 종류 | ||
종속 변수 1개 | 독립 변수 1개 | 단변량 단순 선형 회귀 모델 |
독립 변수 2개 이상 | 단변량 다중 선형 회귀 모델 | |
종속 변수 2개 이상 | 독립 변수 1개 | 다변량 단순 선형 회귀 모델 |
독립 변수 2개 이상 | 다변량 다중 선형 회귀 모델 |
ex) 통화량과 환율, 실업률, 인구증가율이 물가에 미치는 영향
- 통화량, 환율, 실업률, 인구증가율 : 독립(설명) 변수
- 물가 : 종속(반응) 변수
독립 변수가 각각 물가 지수에 미치는 영향은 회귀 분석을 통해 추정되는 회귀 계수의 크기 및 방향성으로 파악할 수 있습니다.
회귀 계수가 0에 가까운 독립 변수는 물가에 주는 영향력이 없다고 판단할 수 있고, 추정된 계수가 0보다 큰 양의 숫자(양의 계수)를 가질 경우에는 해당 독립 변수가 증가할 수록 물가지수도 올라갑니다(추정 계수 > 0 : 환율↑ 대비 물가↑). 일반적으로 통화량이 증가할수록 물가도 올라간다고 알려져 있기 때문에 회귀 분석 결과 추정된 통화량의 계수는 0보다 큰 숫자로 나올 가능성이 큽니다.
회귀 계수가 1에 가까운 독립 변수일수록 물가에 주는 영향력이 가장 크고, 독립 변수와 종속 변수의 증가가 비례하다는 것을 알 수 있습니다.
통화량과 환율이 오르면 물가 지수가 올라가고, 실업률이 높아지면 물가 지수가 떨어지며, 인구 증가율은 물가 지수에 영향을 주지 않는다는 결과가 나왔을 때, 이 결과로 08~12년도까지 5년 동안의 자료 분석을 통해 만들어진 회귀 모델을 2013년 혹은 그 미래에 대한 물가 지수 예측이 가능합니다.
인구 증가율을 제외한 물가 지수와 통화량, 환율, 실업률 사이에는 이미 만들어진 수학 함수(회귀 모델)이 있기 때문에, 2013년의 통화량과 환율, 실업률의 수치를 특정 값 또는 범위내로 계획한다면 이에 따른 2013년의 물가 지수 범위도 계산이 가능합니다.
'빅데이터 분석 > 분석 기법' 카테고리의 다른 글
앙상블(Ensemble) 학습 - 배깅(Bagging), 부스팅(Boosting), 스태킹(Stacking) (0) | 2020.11.12 |
---|