빅데이터를 활용한 통계분석

빅데이터를 활용한 통계분석

$17.28
Description
빅데이터를 활용한 인공지능 개발
Artificial Intelligence Development Using Big Data

빅데이터는 데이터 형식이 복잡하고 방대할 뿐만 아니라 그 생성속도가 매우 빨라 기존의 데이터 처리방식이 아닌 새로운 관리 및 분석 방법을 필요로 한다. 이에 따라 방대한 데이터를 수집·관리하면서 복잡하고 다양한 사회현상을 분석할 수 있는 능력을 지닌 데이터 사이언티스트의 역할은 그 중요성이 더해가고 있다.

그동안 우리 주변의 사회현상을 예측하기 위해 모집단을 대표할 수 있는 표본을 추출하여 표본에서 생산된 통계량으로 모집단의 모수를 추정해 왔다. 모집단을 추정하기 위해 표본을 대상으로 예측하는 방법은 기존의 이론모형이나 연구자가 결정한 모형에 근거하여 예측하기 때문에 제한된 결과만 알 수 있고, 다양한 변인 간의 관계를 파악하는 데는 한계가 있다. 특히 빅데이터 시대에는 해당 주제와 연관된 모든 데이터를 대상으로 하기 때문에 표본으로 모수를 추정하기 위해 준비된 모형을 적용하고 추정하는 가설검정의 절차가 생략될 수도 있다. 따라서 빅데이터를 학습하여 모형(인공지능)을 개발하는 머신러닝 방법이 다양한 변인들의 관계를 보다 정확히 예측할 수 있다. 머신러닝으로 인공지능을 개발하기 위해서는 다양한 분야에서 데이터의 잡음이 제거된 양질의 학습데이터가 생산되어야 한다.

저자들은 그동안 급속히 변화하는 사회현상을 예측하여 선제적으로 대응하기 위해 정형화된 빅데이터와 소셜 빅데이터를 활용한 연구에 노력을 경주해 왔다. 이 책 역시 그러한 연구의 결과로, 실제로 공공 빅데이터를 분석하여 미래를 예측하기 위한 인공지능을 개발하고 활용하기 위한 전 과정을 자세히 담았다.

빅데이터 분석을 통하여 급속히 변화하는 사회현상을 예측하고 창조적인 결과물을 이끌어내고자 하는 모든 분들에게 이 책이 실질적인 도움이 되기를 바란다. 나아가 머신러닝을 활용한 빅데이터 분석을 통하여 관련 분야의 인공지능 개발 및 학문적 발전에 일조할 수 있기를 진심으로 희망한다.
저자

송주영

한양대학교법학과를졸업하고동대학원에서형사법전공석사학위를받았다.미시간주립대학교형사사법학대학에서형사정책/형사사법박사학위를받았다.웨스트조지아주립대학교범죄학과조교수와한국형사정책연구원부연구위원으로재직하였고,현재펜실베이니아주립대학교범죄학과조교수로재직중이다.
해외저서로는CambridgeScholarsPublishing에서출판예정인《BigDataAnalysisUsingMachineLearningforSocialScientistsandCriminologists》,주요국내저서로는《빅데이터를활용한범죄예측》,《머신러닝을활용한소셜빅데이터분석과미래신호예측》,《R을활용한소셜빅데이터연구방법론》,《빅데이터연구한권으로끝내기》,《빅데이터분석방법론》이있다.
주요연구분야로는청소년범죄특히학교폭력과사이버폭력,청소년성매매등이고,JournalofAdolescentHealth,CyberpsychologyBehaviorandSocialNetworking,JournalofCriminalJustice,InternationalJournalofOffenderTherapyandComparativeCriminology,ComputersinHumanBehavior등에관련논문을게재하였다.

목차

머리말

1장R과SPSS설치및활용

01R의설치와활용
1.1R설치
1.2R활용
1)패키지설치및로딩
2)값의할당및연산
3)R의기본데이터형
4)R의자료구조
5)R의함수사용
6)R기본프로그램(조건문과반복문)
7)R데이터프레임의변수이용방법
8)R데이터프레임작성
9)변수및관찰치선택
10)R의주요GUI(GraphicUserInterface)메뉴활용
연습문제

02SPSS의설치와활용
2.1SPSS설치
2.2SPSS활용
1)SPSS의기본구성
2)SPSS의자료입력
3)SPSS의자료선택/변환
4)SPSS의명령문활용

2장빅데이터를활용한통계분석

01과학적연구설계
1.1연구의개념
1.2변수측정
1)척도
2)변수
1.3분석단위
1.4표본추출과가설검정
1)조사설계
2)표본추출
3)가설검정

02통계분석
2.1기술통계분석
1)중심위치(centraltendency)
2)산포도(dispersion)
(1)중심위치와산포도분석
(2)범주형변수의빈도분석
(3)연속형변수의빈도분석
2.2추리통계분석
(4)교차분석(crosstabulationanalysis)
(5)평균의검정(일표본T검정)
(6)평균의검정(독립표본T검정)
(7)평균의검정(대응표본T검정)
(8)평균의검정(일원배치분산분석)
(9)평균의검정(이원배치분산분석)
(10)산점도(scatterdiagram)
(11)상관분석(correlationanalysis)
(12)편상관분석(partialcorrelationanalysis)
(13)단순회귀분석(simpleregressionanalysis)
(14)다중회귀분석(multipleregressionanalysis)
(15)요인분석(factoranalysis)
(16)신뢰성분석(reliabilityanalysis)
(17)다변량분산분석(multivariateanalysisofvariance)
(18)이분형로지스틱회귀분석(binarylogisticregressionanalysis)
(19)다항로지스틱회귀분석(multinomiallogisticregressionanalysis)
연습문제

참고문헌
찾아보기

출판사 서평

첫째,이책의내용은2권으로구성되어있다.제1권은빅데이터를활용하여인공지능을개발하기위해필요한지식인통계분석의전과정을설명한《빅데이터를활용한통계분석》이고,제2권은인공지능을개발하기위해머신러닝예측모델링의전과정을설명한《머신러닝을활용한인공지능개발》이다.
둘째,제1권의통계분석에는오픈소스프로그램인R과SPSS를비교하여설명하였다.

셋째,제2권의머신러닝모델링은오픈소스프로그램인R을사용하였다.