이보다 더 쉬울 수 없는 자바 머신러닝 with Weka (코딩의 압박에서 벗어나는 새로운 머신러닝 예제 학습)

이보다 더 쉬울 수 없는 자바 머신러닝 with Weka (코딩의 압박에서 벗어나는 새로운 머신러닝 예제 학습)

$35.63
Description
웹을 넘어 모바일로 전환될 때 Java가 큰 역할을 했듯이, 데이터 분석에도 Java는 큰 역할을 할 것으로 예상됩니다. 더 이상 머신러닝을 무시하거나 무서워할 필요가 없습니다. 이제는 머신러닝을 어디에 적용할지를 고민해야 할 때입니다. 머신러닝 분야는 현재 파이썬이나 R이 상대적으로 강세이지만, 향후 iOS와 같이 파이썬, R과 Java가 양립하면서 확대될 것으로 예상됩니다. 이 책의 최종 목적은 도메인 전문가와 IT 종사자 간에 협업 체계를 구축하는 것입니다. 설계와 코딩 모두 구현할 수 있도록 UI와 API를 제공하는 Weka를 통해 실무에 적용해도 전혀 손색이 없는 예제를 제공합니다.

이 책의 특징
- 머신러닝을 아는 도메인 전문가와 코딩을 아는 자바 개발자 간 협업 체계 구축
- 코딩 없는 머신러닝이 가능한 Weka 학습
- Weka Explorer, Experimenter, Knowledge Flow 사용을 통한 상호 유기적인 연계

이 책이 필요한 독자
- 코딩을 모르는 도메인 전문가 및 머신러닝 기획자
- Java 실무 1년 이상 개발자
- Weka Experimenter, Knowledge Flow 사용법 습득을 원하는 분

독자대상
초중급

소스코드 다운로드
https://github.com/bjpublic/weka
저자

자바라머신러닝

블레텐(자바라머신러닝)

기계공학전공,정보통신공학부전공을계기로2000년부터20년이지난지금까지Java와함께제조IT분야에종사중이다.처음10년동안은웹(JSP),모바일(Android)분야에서개발및운영경험을쌓았고,데이터기반의업무진단과예산,조직,전략을담당하는IT기획직무를거치면서10년이더흘렀다.정보처리기사와ADsP(데이터분석준전문가)자격증을취득했으며,그동안의Java개발및데이터진단경험을접목하여사용자친화적인머신러닝기술을전파하고자현재온라인교육플랫폼인프런에서강의(https://www.inflearn.com/users/@javaraml)를진행하고있다.

목차

Chapter01Why:Weka를사용하는이유
1.1왜데이터분석인가?임계의가시화
1.2왜자바머신러닝인가?Web→모바일→분석(?)
1.3왜Weka인가?무료/쉽고/신속적용가능
1.3.1장점:무료/쉽고/신속적용가능
1.3.2단점:메모리문제,무료s/w한계,한글인코딩
1.4먼저알아야할2개지표(정분류율,상관계수)

Chapter02What:설치프로그램
2.1jre/jdk(OpenJDK)
2.2Weka3.8.3또는Weka3.9.3
2.3Eclipse
2.4다운로드자료강의활용

Chapter03What:Weka3.9.3
3.1Weka
3.1.1DIKW관점활용(why)
3.1.2Weka소개(what)
3.1.3본서구성(how)
3.1.4학습기대효과(IF)
3.2학습방법예시
3.2.1실습:LinearRegression알고리즘,regression_outliers.csv/arff데이터셋
3.2.2KnowledgeFlow설계
3.2.3Explorer실습
3.2.4Java프로그래밍:W5_L1_OutlierWithCSV.java

Chapter04How:Weka사용(전반)
4.1인트로:arff포맷,필터링,알고리즘,시각화
4.1.1소개
4.1.2KnowledgeFlow
4.1.3Explorer사용
4.1.4Datasets살펴보기
4.1.5분류알고리즘학습하기
4.1.6필터사용하기
4.1.7Dataset을시각화로확인하기
4.2모델평가
4.2.1모델평가를먼저설명하는이유
4.2.2분할검증(Holdout):훈련데이터와테스트데이터를처음부터나눠서검증한다
4.2.3RandomSeed:무작위로데이터를훈련과테스트데이터로나눠검증한다
4.2.4가장성능이낮은ZeroR알고리즘보다정분류율이높은지비교한다
4.2.5nCross-Validation:훈련및테스트데이터를균등분할하여교차검증한다
4.3결측값(pitfall)과이상값(pratfall)처리
4.4초등분류알고리즘
4.4.1OneR:모든목표변수는단한개속성으로결정된다
4.4.2NaiveBayes-모든속성을중시함
4.4.3J48:대중적인의사결정나무But과적합은운명
4.4.4IBk:k군집거리측정알고리즘,적정군집수선별이목적이다
4.5중등분류학습알고리즘
4.5.1BoundaryVisualizer:2개속성의의사결정경계를시각화한다
4.5.2M5P:선형회귀분석과의사결정나무분석을동시에학습한다
4.5.3회귀분류1:모든숫자속성을선으로분석한다(목표변수가2가지의경우)
4.5.4회귀분류2:모든숫자속성을선으로분석한다(목표변수가3가지이상의경우)
4.5.5로지스틱회귀분석:모아니며도의구분을알아낸다
4.5.6서포트벡터머신:SVM,데이터군집을얼마나떨어뜨릴것인가?
4.5.7앙상블학습:과적합을피하기위해여러알고리즘결과를투표로선별한다

Chapter05IF:전반부정리
5.1후반부에서배울것들

Chapter06What:후반부시작
6.1전반부복습
6.2Experimenter(원시적인AI)
6.2.1기본개념
6.2.2통계적유의미성개념
6.2.3분류알고리즘비교:비교자동화=원시적A
6.2.4CommandLineInterface및JavaDoc
6.3Weka빅데이터(BigData)

Chapter07How:Weka사용(후반)
7.1ROC(성능판별추가지표)
7.2텍스트마이닝
7.2.1StringToWordVector
7.2.2FilteredClassifier
7.2.3MultiFilter
7.2.4NaiveBayesMultinomial
7.3이산화
7.3.1비지도이산화
7.3.2지도이산화
7.4비지도학습연관/군집분석
7.4.1지도학습vs.비지도학습
7.4.2의사결정나무비교
7.4.3연관분석기초
7.4.4연관분석응용
7.4.5군집분석개념
7.4.6군집분석평가
7.5속성선택과결과집중(개입)
7.5.1중요속성기여도선별(기초)
7.5.2중요속성기여도선별(응용)
7.5.3라벨결과가중치개입
7.6인공신경망(딥러닝)
7.6.1WekaDeeplearning4j(why)
7.6.2Weka패키지(what)
7.6.3WekaDeeplearning4j실습(how)
7.6.4WekaDeeplearning4j결론(if)
7.7추가적인성능향상기법
7.7.1학습곡선
7.7.2성능최적화
7.7.3arff파일추가소개
7.7.4학습알고리즘(모델)재사용

Chapter08IF:후반부정리

출판사 서평

인터넷과모바일혁명이도래하면서수많은IT시스템들이탄생했고상당한IT시스템들이Java로구축되었습니다.R과파이썬으로구축된데이터분석모듈이Java에서돌아가기위해서는이기종간의데이터연동이필요하고구축비용이나투입되는인력도더많이소요될것입니다.그렇다고java로구축된IT시스템을버리고파이썬으로고치는것은천문학적인비용이들어갈수있습니다.

Weka는다양한UI를제공하고코딩을몰라도기본적인머신러닝이가능하며,설계후에머신러닝을배포하고시스템에체계화하기위한Java코딩까지가능하도록해줍니다.앞으로데이터분석에서코딩이란보이지않는장벽때문에개발자들이과도한작업시간을강요받지않도록,이책이Java로순조롭게데이터분석기술을전달할수있는환경을만들기를기대합니다.