레플리
글 수 126

처음 배우는 데이터 과학

조회 수 919 추천 수 0 2018.07.02 14:33:09


177729881.jpg

 

http://www.yes24.com/24/goods/58543297?scode=032&OzSrank=1

 

 

 

최근 들어 데이터과학이란 말이 많이 사용되고 있습니다. 데이터를 분석한다는 것이 전통적인 통계학과 비슷하긴 하지만 머신러닝 기법이 중요하게 사용되고 특히 빅데이터를 많이 다룬다는 점에서 차이점이 있습니다.

 

또한 통계학자들과 다르게 프로그램을 직접 작성하는 경우가 자주 있습니다. 데이터 전처리의 경우 자동으로 수행하기가 힘들기 때문에 각 데이터에 맞게 코드를 짜서 원하는 형식으로 변환해야 합니다. 또한 이렇게 정제한 데이터를 머신러닝 알고리즘으로 학습하고 결과를 그래프로 시각화하는 프로그램을 개발합니다.

 

빅데이터나 데이터과학에는 크게 두 가지 종류가 있습니다. 하나는 데이터를 분석하여 의사결정을 하는데 도움을 주는 것입니다. 예를 들어, 고객의 구입 패턴을 통해 맥주와 기저귀가 연관이 있는 것을 파악하고 같은 진열대에 놓아 매출을 높일 수 있습니다. 다른 하나는 자동화된 서비스를 제공하는데 사용하는 것입니다. 아마존이나 넷플릭스에서 유저 성향에 따라 제품을 추천하는 것이 대표적입니다.

 

 

 

이 책은 데이터과학에 대한 입문서입니다. 하지만 400 페이지 정도의 많지 않은 분량인데 다루고 있는 영역이 너무 넓습니다. 파이썬 언어, 소프트웨어 공학, 확률/통계, 심지어 분산처리 프레임워크인 하둡과 스파크까지 설명하고 있습니다.

 

거의 요약 수준이라서 초보자들은 이것만 가지고는 실제로 거의 이해를 하지 못할 것 같습니다. 데이터과학이 어떤 것인지 전체적으로 개념을 파악하는데는 유용합니다. 하지만 직접 분석을 하는 방법을 배우고자 하는 분들에게는 적합하지 않을 수도 있습니다.

 

 

List of Articles
제목 글쓴이 날짜sort 조회 수
잡아라! 텍스트 마이닝 with 파이썬 file 깊은바다 2019-07-12 437
채용담당자가 공개하는 AI면접 합격 기술 file 깊은바다 2019-07-08 463
AI 마인드 file 깊은바다 2019-07-07 495
자연어 텍스트 처리를 통한 검색 시스템 구축 file 깊은바다 2019-06-30 375
만화로 쉽게 배우는 선형대수 file 깊은바다 2019-06-29 456
21세기를 위한 21가지 제언 file 깊은바다 2019-06-23 136
수학의 아름다움 - 자연어처리 알고리즘 file 깊은바다 2019-06-04 520
로봇 설계자 신시아 브리질 file 깊은바다 2019-05-26 217
머신러닝 비즈니스 - 애저 머신러닝 스튜디오 file 깊은바다 2019-04-30 251
자연어 처리 쿡북 with 파이썬 file 깊은바다 2019-04-15 443
PyTorch를 활용한 강화학습/심층강화학습 실전 입문 file 깊은바다 2019-03-17 811
텐서플로와 머신러닝으로 시작하는 자연어 처리 file 깊은바다 2019-02-28 627
대학에 가는 AI VS 교과서를 못 읽는 아이들 file 깊은바다 2019-02-28 279
머신러닝 탐구생활 file 깊은바다 2019-01-31 401
수학 없이 배우는 데이터 과학과 알고리즘 file 깊은바다 2019-01-10 71286