Description
이 책은 모두 15개의 장으로 구성돼 머신러닝의 각종 개념의 설명과 함께 실제로 데이터를 다룰 때 발생하는 여러 문제점과 그 문제점을 해결할 수 있는 실질적 방안을 제공하고 있다.
1장은 머신러닝의 전체 개념을 설명해 주고, 2장부터 9장까지는 최근접 이웃, 나이브 베이즈, 회귀기법, 결정 트리, 랜덤 포레스트, 서포트 벡터 머신, 연관 규칙을 사용한 시장 바스켓 분석, 신경망, K-평균화를 사용한 군집화 등 머신러닝에서 보편적으로 사용되는 반드시 알아야 하는 여러 개념들을 자세히 그러나 비유를 통해 친절하게 설명하고 있다.
모든 장에서 설명한 개념을 실제로 수행해 볼 수 있는 예제가 R로 제공되며, 심화학습을 위한 참고 도서를 알려 준다.
한편 각종 예제는 3판에 비해 예제 자체가 신설 혹은 보강되거나 설명이 대폭 보강됐다.
10장은 특히 모델의 성능을 평가하는 여러 방법과 그 장단점을 설명하며 구축된 모델을 현업에 배포하는 것이 적절한지에 대해 이야기한다.
11장부터는 모델을 실세계에 배포하기 위해 고려해야 하는 여러 사항과 함께 데이터를 준비하고 그 무결성 여부에 따라 처리해야 하는 여러 기법을 설명한다.
특히 15장에서는 빅데이터란 무엇인지 빅데이터를 다룰 때 발생할 수 있는 여러 고려 사항들과 함께 그를 극복하기 위해서는 어떤 점을 유념해야 하는지에 대해 다루고 있다.
1장은 머신러닝의 전체 개념을 설명해 주고, 2장부터 9장까지는 최근접 이웃, 나이브 베이즈, 회귀기법, 결정 트리, 랜덤 포레스트, 서포트 벡터 머신, 연관 규칙을 사용한 시장 바스켓 분석, 신경망, K-평균화를 사용한 군집화 등 머신러닝에서 보편적으로 사용되는 반드시 알아야 하는 여러 개념들을 자세히 그러나 비유를 통해 친절하게 설명하고 있다.
모든 장에서 설명한 개념을 실제로 수행해 볼 수 있는 예제가 R로 제공되며, 심화학습을 위한 참고 도서를 알려 준다.
한편 각종 예제는 3판에 비해 예제 자체가 신설 혹은 보강되거나 설명이 대폭 보강됐다.
10장은 특히 모델의 성능을 평가하는 여러 방법과 그 장단점을 설명하며 구축된 모델을 현업에 배포하는 것이 적절한지에 대해 이야기한다.
11장부터는 모델을 실세계에 배포하기 위해 고려해야 하는 여러 사항과 함께 데이터를 준비하고 그 무결성 여부에 따라 처리해야 하는 여러 기법을 설명한다.
특히 15장에서는 빅데이터란 무엇인지 빅데이터를 다룰 때 발생할 수 있는 여러 고려 사항들과 함께 그를 극복하기 위해서는 어떤 점을 유념해야 하는지에 대해 다루고 있다.
R을 활용한 머신러닝 : 데이터 준비부터 모델 조정, 평가, 빅데이터 작업까지 - 에이콘 데이터 과학 시리즈
$52.11