글 수 78

처음 배우는 데이터 과학

조회 수 324 추천 수 0 2018.07.02 14:33:09


177729881.jpg

 

http://www.yes24.com/24/goods/58543297?scode=032&OzSrank=1

 

 

 

최근 들어 데이터과학이란 말이 많이 사용되고 있습니다. 데이터를 분석한다는 것이 전통적인 통계학과 비슷하긴 하지만 머신러닝 기법이 중요하게 사용되고 특히 빅데이터를 많이 다룬다는 점에서 차이점이 있습니다.

 

또한 통계학자들과 다르게 프로그램을 직접 작성하는 경우가 자주 있습니다. 데이터 전처리의 경우 자동으로 수행하기가 힘들기 때문에 각 데이터에 맞게 코드를 짜서 원하는 형식으로 변환해야 합니다. 또한 이렇게 정제한 데이터를 머신러닝 알고리즘으로 학습하고 결과를 그래프로 시각화하는 프로그램을 개발합니다.

 

빅데이터나 데이터과학에는 크게 두 가지 종류가 있습니다. 하나는 데이터를 분석하여 의사결정을 하는데 도움을 주는 것입니다. 예를 들어, 고객의 구입 패턴을 통해 맥주와 기저귀가 연관이 있는 것을 파악하고 같은 진열대에 놓아 매출을 높일 수 있습니다. 다른 하나는 자동화된 서비스를 제공하는데 사용하는 것입니다. 아마존이나 넷플릭스에서 유저 성향에 따라 제품을 추천하는 것이 대표적입니다.

 

 

 

이 책은 데이터과학에 대한 입문서입니다. 하지만 400 페이지 정도의 많지 않은 분량인데 다루고 있는 영역이 너무 넓습니다. 파이썬 언어, 소프트웨어 공학, 확률/통계, 심지어 분산처리 프레임워크인 하둡과 스파크까지 설명하고 있습니다.

 

거의 요약 수준이라서 초보자들은 이것만 가지고는 실제로 거의 이해를 하지 못할 것 같습니다. 데이터과학이 어떤 것인지 전체적으로 개념을 파악하는데는 유용합니다. 하지만 직접 분석을 하는 방법을 배우고자 하는 분들에게는 적합하지 않을 수도 있습니다.

 

 

List of Articles
제목 글쓴이 날짜 조회 수
리얼월드 머신러닝 file 깊은바다 2018-10-20 21
파이썬 자연어 처리의 이론과 실제 file 깊은바다 2018-10-09 92
의료 인공지능 file 깊은바다 2018-10-08 52
처음 배우는 딥러닝 수학 file 깊은바다 2018-09-25 124
이것이 우리에게 딱 맞는 딥러닝 with 텐서플로 file 깊은바다 2018-09-15 98
커넥톰, 뇌의 지도 file 깊은바다 2018-09-11 70
마이크로소프트 봇 프레임워크 프로그래밍 file 깊은바다 2018-09-03 92
트랜스휴머니즘 file 깊은바다 2018-08-22 53
아무것도 모르고 시작하는 인공지능 첫걸음 file 깊은바다 2018-08-16 125
스마트한 인공지능 챗봇 개발 file 깊은바다 2018-08-13 89
파이썬과 케라스를 이용한 딥러닝/강화학습 주식투자 file 깊은바다 2018-07-13 188
누구나 쉽게 배우는 챗봇 서비스 file [1] 깊은바다 2018-07-10 163
한 권으로 정리하는 4차산업혁명 file 깊은바다 2018-07-06 105
처음 배우는 데이터 과학 file 깊은바다 2018-07-02 324
R을 이용한 텍스트 마이닝 file 깊은바다 2018-06-28 108