레플리
글 수 126

처음 배우는 데이터 과학

조회 수 919 추천 수 0 2018.07.02 14:33:09


177729881.jpg

 

http://www.yes24.com/24/goods/58543297?scode=032&OzSrank=1

 

 

 

최근 들어 데이터과학이란 말이 많이 사용되고 있습니다. 데이터를 분석한다는 것이 전통적인 통계학과 비슷하긴 하지만 머신러닝 기법이 중요하게 사용되고 특히 빅데이터를 많이 다룬다는 점에서 차이점이 있습니다.

 

또한 통계학자들과 다르게 프로그램을 직접 작성하는 경우가 자주 있습니다. 데이터 전처리의 경우 자동으로 수행하기가 힘들기 때문에 각 데이터에 맞게 코드를 짜서 원하는 형식으로 변환해야 합니다. 또한 이렇게 정제한 데이터를 머신러닝 알고리즘으로 학습하고 결과를 그래프로 시각화하는 프로그램을 개발합니다.

 

빅데이터나 데이터과학에는 크게 두 가지 종류가 있습니다. 하나는 데이터를 분석하여 의사결정을 하는데 도움을 주는 것입니다. 예를 들어, 고객의 구입 패턴을 통해 맥주와 기저귀가 연관이 있는 것을 파악하고 같은 진열대에 놓아 매출을 높일 수 있습니다. 다른 하나는 자동화된 서비스를 제공하는데 사용하는 것입니다. 아마존이나 넷플릭스에서 유저 성향에 따라 제품을 추천하는 것이 대표적입니다.

 

 

 

이 책은 데이터과학에 대한 입문서입니다. 하지만 400 페이지 정도의 많지 않은 분량인데 다루고 있는 영역이 너무 넓습니다. 파이썬 언어, 소프트웨어 공학, 확률/통계, 심지어 분산처리 프레임워크인 하둡과 스파크까지 설명하고 있습니다.

 

거의 요약 수준이라서 초보자들은 이것만 가지고는 실제로 거의 이해를 하지 못할 것 같습니다. 데이터과학이 어떤 것인지 전체적으로 개념을 파악하는데는 유용합니다. 하지만 직접 분석을 하는 방법을 배우고자 하는 분들에게는 적합하지 않을 수도 있습니다.

 

 

List of Articles
제목 글쓴이 날짜 조회 수
한 권으로 정리하는 4차산업혁명 file 깊은바다 2018-07-06 300
처음 배우는 데이터 과학 file 깊은바다 2018-07-02 919
R을 이용한 텍스트 마이닝 file 깊은바다 2018-06-28 375
인공지능의 시대, 인간을 다시 묻다 file 깊은바다 2018-06-25 142
기본소득이 세상을 바꾼다 file [1] 깊은바다 2018-06-18 179
생활 속 문제를 통해 배워보는 머신 러닝 file 깊은바다 2018-06-09 230
알고리즘으로 세상을 지배하라 file 깊은바다 2018-05-29 242
추천 엔진을 구축하기 위한 기본서 file 깊은바다 2018-05-27 406
슬랙으로 협업하기 file 깊은바다 2018-05-22 240
모두의 딥러닝 file 깊은바다 2018-05-13 352
밑바닥부터 시작하는 딥러닝 file [3] 깊은바다 2018-05-01 1308
딥러닝의 정석 file 깊은바다 2018-05-01 223
파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문 file 깊은바다 2018-04-22 483
머신 러닝 워크북 file 깊은바다 2018-04-14 304
호모 데우스 file 깊은바다 2018-04-08 146