글 수 100

만화로 쉽게 배우는 회귀분석

조회 수 88 추천 수 0 2019.08.05 02:27:20


800.jpg

 

http://www.yes24.com/Product/Goods/57798538

 

< 목차 >

- 1. 기초지식
- 2. 회귀분석
- 3. 중회귀분석
- 4. 로지스틱회귀분석
 

 

 

만화로 쉽게 배우는 시리즈를 몇 권 읽었는데, 다 괜찮은 편이었습니다. 이번 책은 통계나 머신러닝의 가장 대표적인 방법인 회귀분석에 대해 다루고 있습니다.

 

머신러닝은 크게 분류(classification)와 회귀(regression)로 나뉩니다. 분류는 카테고리로 구분을 하고, 회귀는 수치로 예측을 합니다. 회귀라는 용어가 어려울 수 있는데, 데이터의 원래 패턴으로 돌아온다는 뜻입니다.

 

 

 

먼저 선형회귀는 y=ax+b와 같은 직선으로 된 모델입니다. 예를 들어, 키와 몸무게가 짝지어진 10개의 데이터가 있다고 가정해보겠습니다. 이를 기반으로 x에 키를 넣어 y에 몸무게가 나오도록 수식을 만들 수 있습니다. 파라미터인 a와 b만 구하면 되는데, 이 방법을 최소제곱법(Least Square Method)라고 부릅니다.

 

만약 첫 번째 데이터가 (키:180, 몸무게:70)이라고 해보겠습니다. 그러면 예측값과 측정값의 오차는 다음과 같습니다.

 

예측값 : a*180+b

측정값 : 70

오차 : (a*180+b-70)^2

 

10개 데이터의 오차를 모두 더한 값이 바로 오차함수(loss function)입니다. 이를 최소로 하는 a와 b를 구하면 됩니다. 이때 바로 미분이 사용됩니다. 2차 함수 그래프에서 미분값이 0이면 y축인 오차가 가장 낮습니다. a와 b를 각각 편미분 하면 두 개의 식이 만들어집니다. 최종적으로 이를 연립방정식으로 풀면 a와 b의 값을 구할 수 있습니다.

 

만약 (키, 나이) -> (몸무게)로 변수가 하나 증가하면 미지수가 3개인 연립방정식을 계산해야 합니다. 이렇게 변수가 늘어날수록 최소제곱법으로 처리하기 어려워집니다. 그래서 보통 경사하강법을 사용합니다. 한 번에 미분->0으로 계산하지 않고, 미분값의 기울기 방향으로 조금씩 파라미터를 변경하는 방식입니다.

 

 

 

책에서는 선형회귀 뿐만 아니라, 다중회귀와 로지스틱 회귀까지 설명하고 있습니다. 부담없이 읽을 수 있으니, 처음 머신러닝을 접하시는 분들에게 추천드립니다.






첨부
엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
영어학습을 위한 인공지능 챗봇 활용 및 제작 file 깊은바다 2019-08-12 49
파이썬을 이용한 머신러닝, 딥러닝 실전 앱 개발 file [2] 깊은바다 2019-08-12 69
만화로 쉽게 배우는 회귀분석 file 깊은바다 2019-08-05 88
인공지능을 위한 수학 file 깊은바다 2019-07-29 106
잡아라! 텍스트 마이닝 with 파이썬 file 깊은바다 2019-07-12 81
채용담당자가 공개하는 AI면접 합격 기술 file 깊은바다 2019-07-08 105
AI 마인드 file 깊은바다 2019-07-07 102
자연어 텍스트 처리를 통한 검색 시스템 구축 file 깊은바다 2019-06-30 127
만화로 쉽게 배우는 선형대수 file 깊은바다 2019-06-29 137
21세기를 위한 21가지 제언 file 깊은바다 2019-06-23 60
수학의 아름다움 - 자연어처리 알고리즘 file 깊은바다 2019-06-04 174
로봇 설계자 신시아 브리질 file 깊은바다 2019-05-26 98
머신러닝 비즈니스 - 애저 머신러닝 스튜디오 file 깊은바다 2019-04-30 122
자연어 처리 쿡북 with 파이썬 file 깊은바다 2019-04-15 230
PyTorch를 활용한 강화학습/심층강화학습 실전 입문 file 깊은바다 2019-03-17 219