오렌지로 쉽게 배우는 머신러닝과 데이터 분석
저자

장원두,황순욱,진예지

저자:장원두
부산대학교정보컴퓨터공학부와컴퓨터공학과에서학사및석사학위를,일본Aizu대학에서컴퓨터이공학박사학위를받았다.한양대학교의공학교실에서포닥/연구교수로,몽골국제대학교IT학부,동명대학교전자및의용공학부에서조교수로근무하였으며,현재는국립부경대학교컴퓨터·인공지능공학부에서부교수로재직중이다.패턴인식과분류알고리즘의개발에관심을가지고연구를수행하고있으며,이미지,생체전기신호,해상레이더,수중음향등다양한데이터를다루고있다.

저자:황순욱
인하대학교컴퓨터공학과에서학사학위를,고려대학교전기전자컴퓨터공학과에서석사학위를받았으며,일본Aizu대학정보시스템학과에서박사학위중퇴후부경대학교과학기술정책학과에서박사학위를취득하였다.현재는인공지능을활용하는데이터분석회사인데이터클래식의대표로파이썬,R등을통해데이터를분석하는프로젝트를진행하고있다.또한,동아대학교,인제대학교등에서데이터과학프로그래밍,웹프로그래밍등을강의중이다.

저자:진예지
동아대학교컴퓨터공학과에서학사학위를,국립부경대학교인공지능융합학과와일본Yamanashi대학에서공학석사학위를받았으며,현재는국립부경대학교와일본Yamanashi대학에서공동박사과정을진행중이다.주요연구분야는뇌파및생체전기신호에서의패턴인식이며,VR을활용하는HCI연구를함께진행하고있다.

목차


CHAPTER01오렌지,노코딩,머신러닝
1.1노코딩데이터분석과오렌지
1.2인공지능개념잡기
1.3설치방법
1.4화면구성
1.5위젯
연습문제

CHAPTER02오렌지기초와기초통계분석
2.1꽃의종류별특징조사(오렌지의기초통계위젯)
2.2수강학생들의분포를분석해보자(피벗테이블)
연습문제

CHAPTER03데이터시각화
3.1음주운전을가장많이하는시간대는언제일까?(히스토그램)
3.2와인은품종에따라성분차이가있을까?(막대그래프와Boxplot)
3.3전복도나이를먹을까?(산점도와상관계수)
3.4.타이타닉호의생존자데이터분석(MosaicDisplay)
연습문제

CHAPTER04데이터전처리
4.1우리나라에서가장더운도시는?(Impute)
4.2전기자동차가가장활성화된지역을찾아보자(Melt)
4.3보이스피싱은줄어들고있을까?(FeatureConstructor)
4.4감기에제일많이걸리는지역은어디?(MergeData,Concatenate)
연습문제

CHAPTER05비지도학습과데이터분석
5.1비지도학습이란?
5.2비슷한성적패턴을가진학생들을찾아보자(계층적군집분류)
5.3동물원의동물들을비슷한동물끼리모아보자(K-평균알고리즘)
5.4이번겨울에방문할유럽스키장은어디?(자기조직화지도)
5.5재무데이터로우량기업을찾아보자(주성분분석)
연습문제

CHAPTER06지도학습과데이터분류
6.1지도학습이란?
6.2주택가격을예측해보자(회귀분석)
6.3건강검진데이터로흡연여부를알수있을까?(로지스틱회귀분석과나이브베이즈)
6.4이번펀딩은성공할수있을까?(K-NN,의사결정트리,랜덤포레스트)
6.5심장병이있는지예측해보자(서포트벡터머신과인공신경망)
연습문제

CHAPTER07딥러닝과이미지분류
7.1사진데이터와딥러닝
7.2오렌지와이미지데이터
7.3이꽃의이름은?(이미지임베딩과합성곱신경망)
7.4내컴퓨터의사진을정리해보자(이미지와비지도학습)
7.5차량종류를분류해보자(이미지학습응용(1))
7.6반려동물의표정을분류해보자(이미지학습응용(2))
연습문제

CHAPTER08자연어처리
8.1자연어처리란?
8.2미국대선후보들이가장많이쓴단어는?(워드클라우드)
8.3스팸메일을자동으로분류해보자(자연어처리+머신러닝)
8.4이상품을좋아하는사람은얼마나될까?(텍스트감성분석)
8.5오늘나온뉴스기사의중심키워드는?(동시출현네트워크)
연습문제

CHAPTER09시계열데이터분석
9.1시계열데이터란?
9.2주가정보를시각화해보자(시계열데이터시각화)
9.3다음달판매량은얼마일까?(시계열예측모델-ARIMA)
9.4시대별,나라별기대수명과GDP(시각화지도)
연습문제

출판사 서평


인공지능은어느새우리의삶에매우밀접하게자리잡았습니다.학생들은복습과과제준비에ChatGPT의도움을받고있으며,생성AI로만든이미지와영상들이각종미디어를통해우리의눈을사로잡습니다.많은학생들이인공지능모델을만들고일상속다양한데이터를분석하고싶어하지만,대부분의AI모델이파이썬과같은프로그래밍언어로개발된다는것은학생들이인공지능을배우기로결심하는데에큰걸림돌이되곤합니다.파이썬,R등을사용하는기존의학습과정에서는텍스트기반의코딩언어에적응하기위한시간이제법필요합니다.특히,컴퓨터관련전공이아닌학생들에게는텍스트기반의코딩을익히는것자체도어려운일이될수있습니다.

이책에서소개하는오렌지는위젯을드래그앤드롭하는비주얼코딩방식을가지고있어,이를활용하면복잡한텍스트코딩없이도머신러닝기법을활용하여데이터를쉽게분석할수있습니다.파이썬의머신러닝패키지인scikit-learn라이브러리를내부적으로사용하기때문에다른데이터분석소프트웨어에비해자유도도매우높은편입니다.

하지만기존의오렌지관련책들은주로프로그램의기능을익히는데집중하거나몇개의실습을수행하는정도에그쳐,머신러닝과데이터분석을하고자하는연구자나학생들에게는다소아쉬운부분이있었습니다.반면,이책은코딩을전혀모르는상태에서도15주간의짧은시간동안머신러닝과데이터분석을전반적으로학습할수있다는큰장점이있습니다.시간이많이소요되는코딩과정이생략되기때문에,머신러닝모델을활용하는방법에좀더집중하여공부할수있습니다.다양한예제를통해머신러닝의주요개념과데이터를실제로분석해가는과정을차근차근경험할수있으며,스스로의힘으로다양한데이터들을쉽고빠르게분석하는능력을갖출수있습니다.

머리말을쓰며미래의코딩도구가어떤모습을가지게될지상상의나래를펼쳐봅니다.많은것이점차자동화되고있는시대의흐름속에서,언젠가텍스트기반의코딩이구시대의유물로인식되는날도오게되지않을까요?이책을통해다양한전공의학생들이머신러닝과데이터분석에쉽게접근할수있게되길바랍니다.

이책의특징
*비주얼코딩을통한직관적분석:통상적으로사용되는텍스트코딩이아니라,아이콘의드래그앤드롭으로이루어지는비주얼코딩기법으로데이터를쉽게분석하고인공지능을활용할수있게하였다.
*다양한종류의머신러닝모델을간단히구성:위젯을추가하고연결시키는간단한방법을통해새로운인공지능모델을구성할수있으므로짧은시간동안다양한인공지능모델을공부하고여러문제에적용해볼수있다.
*그림을통한인공지능기초개념의쉬운설명: 복잡한인공지능의개념을그림을통해쉽고간결하게설명하여데이터분석등에필요한기초지식을직관적으로이해할수있도록구성하였다.
*[더알아보기]를통한인공지능기법설명:복잡한인공지능이론을그림과함께한페이지로간결하게설명하여인공지능이론을개념적으로이해할수있도록하였다.
*실제데이터기반의다양한데이터분석실습:음주운전단속현황,세계의기대수명변화등다양한실제데이터를가져와서실습하고분석하며,데이터분석능력을향상할수있도록구성하였다.
*연습문제:인공지능이론과데이터분석시에필요한실무적인지식들을얼마나이해하고있는지를확인할수있도록연습문제를제공한다.학습한인공지능기술을적용해볼수있는새로운데이터도함께제시해서배운것을스스로응용해볼수있도록구성하였다.