레플리
글 수 126

처음 배우는 데이터 과학

조회 수 919 추천 수 0 2018.07.02 14:33:09


177729881.jpg

 

http://www.yes24.com/24/goods/58543297?scode=032&OzSrank=1

 

 

 

최근 들어 데이터과학이란 말이 많이 사용되고 있습니다. 데이터를 분석한다는 것이 전통적인 통계학과 비슷하긴 하지만 머신러닝 기법이 중요하게 사용되고 특히 빅데이터를 많이 다룬다는 점에서 차이점이 있습니다.

 

또한 통계학자들과 다르게 프로그램을 직접 작성하는 경우가 자주 있습니다. 데이터 전처리의 경우 자동으로 수행하기가 힘들기 때문에 각 데이터에 맞게 코드를 짜서 원하는 형식으로 변환해야 합니다. 또한 이렇게 정제한 데이터를 머신러닝 알고리즘으로 학습하고 결과를 그래프로 시각화하는 프로그램을 개발합니다.

 

빅데이터나 데이터과학에는 크게 두 가지 종류가 있습니다. 하나는 데이터를 분석하여 의사결정을 하는데 도움을 주는 것입니다. 예를 들어, 고객의 구입 패턴을 통해 맥주와 기저귀가 연관이 있는 것을 파악하고 같은 진열대에 놓아 매출을 높일 수 있습니다. 다른 하나는 자동화된 서비스를 제공하는데 사용하는 것입니다. 아마존이나 넷플릭스에서 유저 성향에 따라 제품을 추천하는 것이 대표적입니다.

 

 

 

이 책은 데이터과학에 대한 입문서입니다. 하지만 400 페이지 정도의 많지 않은 분량인데 다루고 있는 영역이 너무 넓습니다. 파이썬 언어, 소프트웨어 공학, 확률/통계, 심지어 분산처리 프레임워크인 하둡과 스파크까지 설명하고 있습니다.

 

거의 요약 수준이라서 초보자들은 이것만 가지고는 실제로 거의 이해를 하지 못할 것 같습니다. 데이터과학이 어떤 것인지 전체적으로 개념을 파악하는데는 유용합니다. 하지만 직접 분석을 하는 방법을 배우고자 하는 분들에게는 적합하지 않을 수도 있습니다.

 

 

List of Articles
제목 글쓴이 날짜 조회 수sort
수학 없이 배우는 데이터 과학과 알고리즘 file 깊은바다 2019-01-10 71259
밑바닥부터 시작하는 딥러닝 file [3] 깊은바다 2018-05-01 1308
인공지능을 만드는 법 - 게임 AI file [2] 깊은바다 2017-12-03 998
머신러닝 실무 프로젝트 file 깊은바다 2019-10-18 919
처음 배우는 데이터 과학 file 깊은바다 2018-07-02 919
PyTorch를 활용한 강화학습/심층강화학습 실전 입문 file 깊은바다 2019-03-17 809
매출 올리는 데이터 사이언티스트 file Dfinite 2022-07-31 795
인공지능을 위한 수학 file 깊은바다 2019-07-29 766
집단지성 프로그래밍 file 깊은바다 2017-08-29 685
파이썬과 자연어처리 file 깊은바다 2018-01-03 650
EBS 수학과 함께하는 AI 기초 file 깊은바다 2020-09-15 636
텐서플로와 머신러닝으로 시작하는 자연어 처리 file 깊은바다 2019-02-28 627
처음 배우는 딥러닝 수학 file 깊은바다 2018-09-25 603
AI 메이커스, 인공지능 전쟁의 최전선 file 깊은바다 2022-06-04 594
파이썬과 케라스를 이용한 딥러닝/강화학습 주식투자 file 깊은바다 2018-07-13 593