일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- shell
- python
- CV
- Computer Vision
- TensorFlow
- C언어
- 영상처리
- 프로세스
- c
- error
- 쉘
- OpenCV
- 학습
- 시스템프로그래밍
- C++
- Windows10
- 알고리즘
- 딥러닝
- 백준
- 리눅스
- 운영체제
- 텐서플로우
- Windows 10
- 프로그래밍
- linux
- 백준알고리즘
- 회귀
- 공부
- 코딩
- 턱걸이
- Today
- Total
목록회귀 (6)
줘이리의 인생적기
회귀는 여러 개의 독립변수와 한 개의 종속변수 간의 상관관계를 모델링하는 기법입니다. 이게 뭔 소린가 싶다. 아파트 가격을 예측하고 싶을 때를 예로 들면 아파트 가격을 종속변수, 아파트 가격을 결정짓는 여러 가지 변수(역세권, 스세권, 실면적 크기, 층, 방 개수 등)를 독립 변수라고 합니다 주어진 독립변수들로 아파트 가격을 정확히 예측하고 싶다면!! 각각의 독립변수들이 아파트 가격에 얼마만큼 영향을 끼치는지 알아야 하겠죠? 각각의 독립변수들이 영향을 끼치는 값을 회귀 계수라고 합니다. 회귀의 핵심은 주어진 독립변수와 종속변수 데이터를 학습을 통해 최적의 회귀 계수를 찾아내는 것입니다 하지만 완벽한 예측 모델을 만들 수 있을까요..? 위의 정의를 다시 말하자면 데이터의 오류가 최소가 되게 만든다는 의미입..
앞선 포스팅에서 사용했었던 Sequantial 모델을 사용하도록 하겠습니다. 4개의 Dense 레이어, relu, Adam, mse를 사용하겠습니다. from tensorflow.keras.datasets import boston_housing import tensorflow as tf import numpy as np import matplotlib.pyplot as plt #데이터셋 가져오기 (train_X, train_Y), (test_X, test_Y) = boston_housing.load_data() ###########정규화 (Standardization) ############# # X 값 Standardization X_mean = train_X.mean(axis=0) X_std = tr..
앞서 배웠던 것들로 학령인구와, 노령인구의 경향을 나타내주는 딥러닝 네트워크 회귀선을 만들어 보겠습니다. import tensorflow as tf import numpy as np import matplotlib.pyplot as plt #X = school_age_population, Y = elderly_population X = [16.4, 14.7, 17.2, 16.6, 17.1, 20.3, 17.2, 15.6, 17.4, 18.7, 16.9, 17.1, 15.8, 19.3, 16.6, 15.1, 17.9] Y = [11.4, 13.2, 11.1, 17.6, 16.3, 9.2, 15.2, 18.4, 18.5, 11.6, 13.7, 9.7, 21.5, 12.0, 14.5, 15.8, 14.0] m..
이번에는 직선이 아니라 곡선 회귀선을 구해보도록 하겠습니다. 직선인 1차 함수에서 곡선 2차 함수로 조금 복잡해지기 때문에 함수명을 조금 간단하게 바꾸어보도록 하겠습니다. import tensorflow as tf import numpy as np import matplotlib.pyplot as plt import random #X = school_age_population, Y = elderly_population X = [16.4, 14.7, 17.2, 16.6, 17.1, 20.3, 17.2, 15.6, 17.4, 18.7, 16.9, 17.1, 15.8, 19.3, 16.6, 15.1, 17.9] Y = [11.4, 13.2, 11.1, 17.6, 16.3, 9.2, 15.2, 18.4, 18...
tensorflow 10번째 게시물에서 수식과 최소제곱법을 이용하여 회귀선을 도출했었습니다. 하지만 텐서플로우에서는 이러한 어려운 수학 수식없이 회귀선을 구할 수 있습니다. [tensorflow 10] 선형회귀01 에서 사용했던 자료들을 이용해보겠습니다. 먼저, tf.Variable를 통해 랜덤 값을 뽑아내고 tf.reduce_mean을 통해 잔차의 제곱의 평균을 뽑아내고 tf.optimizers를 통해 잔차의 제곱의 평균을 최소화하려고 합니다. import tensorflow as tf import numpy as np import matplotlib.pyplot as plt import random school_age_population = [16.4, 14.7, 17.2, 16.6, 17.1, 20..
데이터의 경향성을 잘 설명하는 하나의 직선을 예측하는 선형 회귀(Linear Regression)에 대해 공부해보겠습니다. 예를 들어, 키와 몸무게 2개의 데이터 경향성을 보면 키가 클수록 몸무게가 많이 나갈 확률이 높습니다. 또, 날씨의 온도와 호빵의 판매량 2개의 데이터 경향성을 보면 날씨가 추울수록 호빵이 많이 판매될 확률이 높습니다. 저는 통계청에 재미있는 통계들이 많이 있어서 2개의 데이터를 뽑아 어떤 경향성이 있는지 확인해보려고 합니다. kosis.kr/easyViewStatis/visualizationIndex.do KOSIS 국가통계포털 kosis.kr 저는 이 곳에서 2017년 지역별로 학령인구와 고령인구비율 데이터를 가지고 이 두 데이터가 어떤 경향성을 가지고 있는지 선형 회귀로 예측해..