저자

송경빈

저자:송경빈

한국지능정보사회진흥원인공지능융합본부AI융합확산팀수석연구원.ICT(정보통신기술)정책사업을20년째해오고있다.서울시심야버스노선개발,데이터기반감염병대응등사회적으로의미있는과제를다수발굴해지원했다.

디지털전환사업에필수요소로자리잡은인공지능과제반기술에관심이많아AI공부를계속해왔다.사람들이인공지능을향한과도한기대나우려에빠지지않고,기술과데이터를근거로인공지능의진짜모습을이해하기를바란다.올바른이해가있어야미래를제대로준비할수있다고믿기때문이다.

이같은신념을바탕으로공공기관대상강연을하고,정책사업을추진하는등인공지능사업집행을직간접적으로돕고있다.‘빅데이터질문을명확히하라’‘빅데이터이렇게쓸수있다’등의글을썼으며,고등학교교과서《데이터과학과머신러닝》개발에도참여했다.

목차

머리말인공지능의구조와원리를제대로이해하는길잡이

I인공지능의부상
컴퓨터가그림을읽다니
인공지능의정의
인공지능용어의오용
인공지능기술의역사
인공지능주요사례

Ⅱ데이터와인공지능
데이터의유형별구분
데이터를분석하고활용하는법
손이많이가는데이터
빅데이터와인공지능
데이터분석모델이란?
데이터분석활용의주요사례

III머신러닝
머신러닝의정의
일차함수의등장
가설식의의미
가중치구하기의어려움
선형회귀
손실비용산출
경사하강법
기계학습실습해보기
다항선형회귀
이진분류
다중분류
그림을읽는컴퓨터
MNIST데이터세트
이미지인식하기

IV딥러닝
뉴런
퍼셉트론
퍼셉트론검증하기①
퍼셉트론검증하기②
다층퍼셉트론의등장
다층퍼셉트론의의의
DNN
개발패러다임의변화
CNN①
CNN②
CNN③
RNN
RNN의활용

V비지도학습
기계학습의3대유형
글자·단어예측모델의지도학습
비지도학습의개념
K-means
GAN

VI강화학습
강화학습의원리
강화학습의활용사례
온실속강화학습?

Ⅶ대규모언어모델
ChatGPT의등장
머신러닝의이슈가된LLM
자연어처리
자연어처리로구현되는주요기능들
자연어처리기술의도약
워드임베딩의기본개념
워드임베딩이단어를표현하는방법
전이학습의기본개념
자연어처리분야에서의전이학습
대규모언어모델의전이학습
다양도로전이학습되는대규모언어모델
언어모델의기본개념
언어모델개념의확장
인코더-디코더모델
컨텍스트벡터
어텐션이필요한이유
어텐션메커니즘
트랜스포머
트랜스포머의어텐션
트랜스포머메커니즘의특징
대규모언어모델-BERT와GPT
BERT와GPT의출력
고성능언어모델의비결①
고성능언어모델의비결②
대규모언어모델의한계
대규모언어모델출현의의의
결국똑같은기초원리

Ⅷ고성능기계,그리고사람
AI기술의취약점①
AI기술의취약점②
AI기술의취약점③
AI기술의극악한(?)속성
인공지능은결국,데이터
데이터정제와레이블링
언어모델을위한데이터확보
인공지능은지능을갖췄는가
강인공지능과약인공지능
강인공지능의출현가능성
범용인공지능
행동모델의가능성
휴머노이드와함께하는세상
AI서비스의개발과정
AI전문가가되려면
우리는앞으로어떻게대응해야할까?

참고문헌
그림및사진출처
찾아보기

출판사 서평

인공지능을이해한자만이살아남는다!
AI리터러시를높여주는인공지능해설서

바야흐로인공지능시대다.인공지능이모든것이고,모든곳에인공지능이존재할것이다.이같은주변환경의변화에따라IT개발자나기획자,실무자는언제든인공지능관련업무에투입될수있다.만약AI초보자가업무에투입된다면무엇부터해야할까.기초를닦을새도없이현장에서일해야한다면,대개난감함에빠진다.게다가인공지능분야는공부해야할내용이다양하고분량도많다.여기,인공지능기술을밑바닥부터빠르고쉽게이해할방법이있다.《인공지능구조원리교과서》가어려움에빠진많은이에게구원의손길이돼줄것이다.

현장에서부딪치며발굴한
AI에얽힌오해와궁금증에관해말한다

이책은한국지능정보사회진흥원AI융합확산팀에서일하는송경빈수석연구원이현장에서관련사업을진행하며공부한바를정리한것이다.한마디로인공지능의핵심원리와구조를누구나익힐수있도록구성한AI개념해설서다.
인터넷에산재하는단편적인정보로는인공지능을온전히파악하지못함은물론이고,올바르게이해하지도못한다는현실에저자는이책의집필을결심했다고한다.특히현재인공지능이기술의한계상‘지적활동의능력’으로정의되는지능을갖추지못했는데도,인공지능을마치지능을지닌개체로다루는뉴스나인터뷰를볼때마다불편함을느꼈다고한다.AI에얽힌오해와궁금증을직접설명해야겠다고마음먹은것이다.
올바르게알아야올바르게대처할수있다.이책은당장실무에뛰어들어야하지만기초가전혀없다고느끼는사람이나일반인과학생중에서인공지능을알고싶은사람에게AI를올바로알려실질적인도움을주는것을목표로한다.

인공지능은중학교수학에서시작한다
머신러닝·딥러닝기술의핵심원리와구조

누구나인공지능공부를수월하게시작할수있도록이책은단계별구성을취했다.쉬운개념을설명한후에그를기반으로전개되는어려운개념을설명한다.저자의말에따르면초등학생도이해할수있는책을집필하려했으나본인의역량부족(?)으로중학생이이해할수있는수준에서만족했다고한다.비전공자는물론이고문과출신도충분히인공지능기술을이해할수있다고말하는저자의자신감이엿보이는대목이다.
한장씩이책을읽어나간독자는남들이복잡하다고포기했던인공지능이해의한가운데에어느새들어서게된다.인공지능의간략한역사를돌아본후,데이터유형과분석에서시작해머신러닝과딥러닝기술이어떻게등장하고어떤원리로발전해서지금에이르렀는지,그기술적흐름과역사를제대로파악한다.
머신러닝의원리를설명할때,이책은일차함수에서시작한다.일차함수는중학교에서배우는수식으로중학생도인공지능을이해할수있다는저자의말이허언이아님을여기서부터증명해간다.책에서는사괏값을구하는가장간단한머신러닝모델(선형회귀)을예시로들어살펴본다.
선형회귀는어떤현상을그래프상의직선으로표현한모델이다.책의예시에서사괏값은사과개수에따라선형적으로증가하며,이를수식으로표현하면y=ax+b다.여기서x는사과개수,y는사괏값이다.이를머신러닝에서쓰는가설식형태로바꾸면y=wx+b가된다.가설식은학습데이터를기반으로예측결과를계산하는수식을의미한다.식의모습을보면알겠지만결국일차함수의형태다.
머신러닝에서학습이란,이수식의w와b를알아내는과정이다.사과개수와가격데이터를가설식y=wx+b에대입해w와b를최적화한다.즉정답을내놓는w와b의값을찾아내는것이다.이과정을거친머신러닝모델은사과5개가얼마인지를예측할수있다.
이처럼가설식을세우고,가설식의가중치를찾아내는것이인공지능학습의토대다.어떤특정한규칙이나절차없이오로지데이터만으로답을찾아야하는머신러닝기술은가중치를조정하며정답을향해나아간다.
이때사용하는알고리즘이바로경사하강법인데,머신러닝을이해하는핵심중의핵심이라고할수있다.경사하강법은사괏값을찾는비교적단순한모델에서부터무지막지하게복잡한대규모언어모델에이르기까지머신러닝학습에모두적용되기때문이다.
인공지능을온전히이해하려면,이밖에도다양한개념을알아야한다.특히ChatGPT같은대규모언어모델에는더욱복잡한개념이쓰인다.책에서는가장많은분량을대규모언어모델을본격적으로다루는데할애한다.복잡한내용이지만,독자는이를통해워드임베딩,트랜스포머모델의어텐션,셀프어텐션등의기술개념을익힐수있다.언어모델이어떻게단어,문장,단락등은물론이고그사이의관계까지이해하는지기술적으로파악할수있다.

올바르게이해하면보이는
인공지능의참모습과활용방향

저자는인공지능기술의핵심에해당하는원리를기초부터제대로이해할필요가있다고말한다.그렇지않으면‘인공지능에오롯한지능이있다는’오해에빠져막연한두려움이나불안또는과도한기대나낙관에빠지는일이벌어질수있어서다.ChatGPT3가처음등장했을때를떠올려보자.많은뉴스미디어에서는매개변수가1,750억개라는둥,뉴런과비슷하다는둥여러설명을붙였지만,그기술적본질과원리를명쾌하게설명한경우가많지않았다.막연하고두루뭉술한설명은시간이꽤지난지금도언론기사에서종종보일정도다.이처럼기술적이해가떨어지는설명은인공지능과관련한여러오해를부채질하기도한다.
이때문에불필요한비용과갈등이발생할수도있다.예를들어AI프로젝트에투입된실무자가인공지능을잘못이해해‘스스로학습하는인공지능’을목표로삼는다면큰일이다.현재인공지능에이런기술개념은없으니완전히방향을잘못잡은셈이다.반면인공지능이인간을완전히대체할것이라는불안에기술변화를거부하고21세기러다이트운동같은엉뚱한행위에관심을보인다면,본인의경쟁력상실로이어질뿐이다.
이때우리에게올바른이해가필요하다.인공지능의기초를상기해보자.어떤머신러닝기술이든가설식에서출발한다.아무리발달한인공지능이라도결국정교한가중치를지닌수식에불과하다는점을알아야한다.요즘사람들의이목을집중시키는대규모언어모델만봐도그렇다.유창한문장생성능력과달리상식이부족하고,학습데이터에따라편향도발생한다.언어모델이내놓은결괏값이어떻게나왔는지설명하지못한다는점도계속문제점으로지적된다.
이처럼올바른기술적이해를바탕으로한다면,실무자는인공지능프로젝트를올바른방향으로진행하고,개발자는기술습득과이해를더빨리할수있을것이다.AI분야와직접적인접점이없는일반인이라면쓸데없는걱정과불안을내려놓고,자신이속한분야에서인공지능을활용할방법을차분히고민하면된다.

발전가능성이무궁무진한인공지능기술
기본원리를이해하고,현명하게사용하는방법

인공지능은결국가중치를찾아가는자동화기술일뿐이다.그렇다고마냥무시할수도없다.전에는할수없었던일들을놀라울정도로잘처리하기때문이다.그특유의처리방식,즉데이터만으로해결책을찾아가는기술은놀라운잠재력을지녔다.이는ChatGPT등장이후,다양한모델이등장하면서증명하고있는현실이다.단순히대화만이아니라금융,의학,신약개발,번역,자율주행에이르는여러분야에서탁월한성과를보이며언젠가는인간의업무를많은부분에서대체할가능성을보여준다.
이제막발전하고있는인공지능,즉정확히말해머신러닝기술은앞으로더욱발전할가능성이크다.물론앞에서언급한대로한계와문제도많다.이때문에인공지능을현명하게활용하려면AI의기본원리와구조를제대로알아야한다고저자가계속주장하는것이다.이책으로인공지능의핵심원리를제대로이해하자.인공지능시대를슬기롭게준비하는데분명도움이될것이다.