레플리
글 수 126

처음 배우는 데이터 과학

조회 수 919 추천 수 0 2018.07.02 14:33:09


177729881.jpg

 

http://www.yes24.com/24/goods/58543297?scode=032&OzSrank=1

 

 

 

최근 들어 데이터과학이란 말이 많이 사용되고 있습니다. 데이터를 분석한다는 것이 전통적인 통계학과 비슷하긴 하지만 머신러닝 기법이 중요하게 사용되고 특히 빅데이터를 많이 다룬다는 점에서 차이점이 있습니다.

 

또한 통계학자들과 다르게 프로그램을 직접 작성하는 경우가 자주 있습니다. 데이터 전처리의 경우 자동으로 수행하기가 힘들기 때문에 각 데이터에 맞게 코드를 짜서 원하는 형식으로 변환해야 합니다. 또한 이렇게 정제한 데이터를 머신러닝 알고리즘으로 학습하고 결과를 그래프로 시각화하는 프로그램을 개발합니다.

 

빅데이터나 데이터과학에는 크게 두 가지 종류가 있습니다. 하나는 데이터를 분석하여 의사결정을 하는데 도움을 주는 것입니다. 예를 들어, 고객의 구입 패턴을 통해 맥주와 기저귀가 연관이 있는 것을 파악하고 같은 진열대에 놓아 매출을 높일 수 있습니다. 다른 하나는 자동화된 서비스를 제공하는데 사용하는 것입니다. 아마존이나 넷플릭스에서 유저 성향에 따라 제품을 추천하는 것이 대표적입니다.

 

 

 

이 책은 데이터과학에 대한 입문서입니다. 하지만 400 페이지 정도의 많지 않은 분량인데 다루고 있는 영역이 너무 넓습니다. 파이썬 언어, 소프트웨어 공학, 확률/통계, 심지어 분산처리 프레임워크인 하둡과 스파크까지 설명하고 있습니다.

 

거의 요약 수준이라서 초보자들은 이것만 가지고는 실제로 거의 이해를 하지 못할 것 같습니다. 데이터과학이 어떤 것인지 전체적으로 개념을 파악하는데는 유용합니다. 하지만 직접 분석을 하는 방법을 배우고자 하는 분들에게는 적합하지 않을 수도 있습니다.

 

 

List of Articles
제목 글쓴이 날짜 조회 수sort
채용담당자가 공개하는 AI면접 합격 기술 file 깊은바다 2019-07-08 463
바닥부터 배우는 강화 학습 file 다코미 2021-01-20 462
실용적 예제로 본 게임 인공지능 file [1] 깊은바다 2016-03-25 462
만화로 쉽게 배우는 선형대수 file 깊은바다 2019-06-29 457
자연어 처리 쿡북 with 파이썬 file 깊은바다 2019-04-15 443
파이썬으로 챗봇 만들기 file 다코미 2021-01-20 437
잡아라! 텍스트 마이닝 with 파이썬 file 깊은바다 2019-07-12 437
인공지능 투자가 퀀트 file 깊은바다 2017-10-05 424
미술관에 GAN 딥러닝 실전 프로젝트 file [1] 깊은바다 2020-07-05 422
처음 만나는 AI 수학 with Python file 다코미 2021-01-14 421
만화로 쉽게 배우는 회귀분석 file 깊은바다 2019-08-05 421
처음 배우는 인공지능 file 깊은바다 2017-09-17 411
추천 엔진을 구축하기 위한 기본서 file 깊은바다 2018-05-27 406
케라스 창시자에게 배우는 딥러닝 file 깊은바다 2018-11-25 405
머신러닝 탐구생활 file 깊은바다 2019-01-31 401