인공지능만 믿고 공부는 안 해도 될까요? - 10대 이슈톡 7

인공지능만 믿고 공부는 안 해도 될까요? - 10대 이슈톡 7

$14.17
저자

이여운

저자:이여운

서울대학교독어독문학과를졸업했다.언어를배우다자연어처리에마음을빼앗겨컴퓨터언어학전공으로언어학석사학위를받았다.현재카카오엔터테인먼트에서데이터사이언티스트로근무하고있다.매일코딩을하면서지내지만,여전히문과생의정체성을간직하고있다.글쓰기를좋아하고,잘나가는ChatGPT보다언어학이론을차용한Word2vec모델을더좋아한다.

목차

들어가며

1장.인공지능이무엇인가요?
1.인공지능은뭘먹고크나요?
2.인공지능의성장과정
하나를알려주면하나만아는규칙기반인공지능|스스로규칙을알아내는머신러닝|사람의뇌를닮은딥러닝

2장.인공지능은어떻게똑똑해질까요?
1.학습데이터를다듬어주자,전처리
인공지능은숫자만아는바보|MBTI로알아보는벡터와행렬
[똑똑이아이템1]코사인유사도
뭐든지숫자로바꿀수있는주문,원핫인코딩|숫자도전처리가필요해
2.인공지능의공부비법
정답을알려주고학습하는지도학습|정답없이학습하는비지도학습|당근과채찍으로학습하는강화학습
[똑똑이아이템2]미분과경사하강법
3.인공지능의시험성적표
몇문제맞혔니?정확도|3번으로만찍으면안돼!정밀도,재현율,F1|한눈에들어오는성적표,혼돈행렬
[똑똑이아이템3]정밀도와재현율의상충관계
[똑똑이아이템4]번역인공지능의성적표,BLEU
[똑똑이아이템5]인공지능과체리의상관관계

3장.인공지능에는어떤것이있나요?
1.언어학이인공지능에미친영향
단어로덧셈과뺄셈하기,Word2vec
[똑똑이아이템6]요점만공부하자,불용어
추천템으로덧셈과뺄셈하기,Item2vec
[똑똑이아이템7]처음보는단어도끄떡없는Fasttext
2.유튜브알고리즘은내취향을어떻게알까?
친구의피드를참고하는협업필터링|행렬더알아보기|취향을알아내는행렬분해
[똑똑이아이템8]매개변수와초매개변수
3.다음말을예측해봐,ChatGPT
ChatGPT의할머니,트랜스포머
[똑똑이아이템9]함수와행렬
[똑똑이아이템10]단어와토큰
국어를잘해야공부를잘하는이유,사전학습과미세조정
[똑똑이아이템11]트랜스포머와<세서미스트리트>
ChatGPT의엄마,GPT
[똑똑이아이템12]알쏭달쏭인공지능용어풀이
ChatGPT
[똑똑이아이템13]인공지능도원샷을한다

4장.우리가만들어나가야할인공지능윤리
1.인공지능판사는인간판사보다공정할까?
2.데이터도둑,인공지능
3.인간의희생이필요한인공지능
4.인공지능의거짓말에속는우리
[똑똑이아이템14]인공지능이쓴글에숨은워터마크
5.인공지능이더럽히는지구
[똑똑이아이템15]유럽연합의인공지능규제법안

5장.인공지능이그려갈미래를알아봐요
1.취업한인공지능,실직한우리?
2.인공지능과함께하는일상
3.인공지능의미래

맺음말
부록_인공지능연구원이되고싶다면?
미주
참고문헌

출판사 서평

인공지능시대를상상하려면인공지능을제대로알아야한다

인공지능이연일화두에오르고있다.2016년구글의인공지능알파고가바둑경기에서이세돌을이겨세상을떠들썩하게하더니,2022년오픈AI의ChatGPT가등장해세상을다시한번놀라게했다.우리는알파고의무한한학습능력에감탄한지얼마지나지않아,이제는ChatGPT의무한한창작능력에경이로움을느끼고있다.
앞으로인공지능은세상을어떻게바꿀것인지상상해보았는가?인공지능이다알아서해주니일상은편해질까?아니면인공지능이우리의일자리를빼앗고심지어인간을지배하는끔찍한세상이오고말까?그런데우리가인공지능을제대로알지못하고하는상상은그저허무맹랑한공상과학이될수도있다.따라서앞으로인공지능시대의주역이될청소년들에게인공지능은알아도그만몰라도그만인지식이아니라세상을살아가는데꼭알아야할필수지식이되었다.

데이터사이언티스트가알려주는인공지능에관한거의모든것!

이책은청소년들이꼭알아야할인공지능에관한거의모든것을담고있다.데이터사이언티스트로일하며전문지식과현장경험을겸비한저자는인공지능이어떤방식으로데이터를학습하고가공하는지부터더똑똑한모델을어떻게평가하는지까지인공지능의원리를친절하고자세하게알려준다.그리고역대가장유명한인공지능모델인ChatGPT를비롯해이미모두의일상에스며든추천모델등에관한심층적인설명도덧붙였다.이러한이해를바탕으로인공지능이지켜야할윤리와인공지능이바꿀미래를함께고민해본다.
인공지능의학습은대부분아무의미없는초깃값으로시작한다.그래서처음에는의미없는오답을계속뱉어낸다.하지만계속오답이정답에가까워지도록값을조정해주면인공지능은금세채팅도하고책도쓰고그림도그리게된다.청소년여러분도처음에는잘모르는지식을배우는일이두려울수있다.물론당장에는정답에도달하지못하더라고계속시행착오를겪다보면어느새이전오답보다는그럴듯한오답을향해나아갈수있다.그런의미에서이책이‘인공지능이해하기’라는목표에좀더가까워지는여정이되길바란다.

저자의말
“인공지능이휩쓸고나면나의미래는어떻게될까?”
“인공지능에밀려취업도못하고열심히공부한보람도없게되는건아닐까?”

인공지능이무엇인지정확히알지못하고다른사람의말만듣다보면,인공지능은한없이두려운존재가된다.인공지능이가장무서울때는인공지능을잘알지못할때다.
인공지능을알지못하면다른사람의예측을그대로믿을수밖에없다.처음엔화가나작가처럼인간고유의창의성이필요한직업은인공지능이대체할수없다고했다.그렇게믿고만있었는데금방나보다그림잘그리는인공지능,나보다글잘쓰는인공지능이나타났다.그러자운동선수나기술자처럼직접몸을움직이는직업은인공지능이대체하기어렵다고한다.이번엔믿을수있을까?
다른사람의예측에휘둘리지않으려면인공지능을직접이해하고,스스로생각해야한다.하지만청소년을위한인공지능도서는대부분인공지능이대체할직업,인공지능윤리등인공지능의겉모습만다룬다.인공지능을속속들이알고싶어펼친어른을위한인공지능도서는아직배우지도않은수학기호로가득차있다.
이책은청소년의눈높이에맞춰인공지능을소개한다.인공지능은어떤데이터를보고학습하는지,인공지능이학습을통해어떻게똑똑해지는지,인공지능중가장똑똑한모델은어떻게가리는지,ChatGPT말고또다른인공지능모델은어떤것이있는지등인공지능을누구보다깊게알수있게된다.깊게알기위해항상머리를쥐어짜내야하는건아니다.인공지능의세상도우리의세상과크게다르지않다.벡터를알아보기위해MBTI를,정밀도와재현율을알아보기위해보드게임할리갈리를,추천모델의학습원리를알아보기위해스도쿠를예시로사용한다.MBTI,할리갈리,스도쿠만알아도인공지능을이해할수있다.
인공지능을이해하고나면,인공지능이어떤윤리적문제를제기하는지,우리의미래를어떻게바꿔놓을지함께고민할수있다.뻔해보였던인공지능윤리문제도새롭게다가올것이다.한없이무서웠던인공지능이바꿀미래도,어떤일에어떤데이터로어떻게학습한인공지능을활용할수있을지알고한층더선명한미래로바뀌어보일것이다.

책속에서

여러분이시험공부를할때공부할교과서,8시간은거뜬히버틸수있는체력까지준비되었다고가정해봅시다.그러나공부하는방법을몰라서무작정교과서를한장씩뜯어먹었다면어떨까요?전혀머리에남는게없고시험은망치게될것입니다.여기서교과서는데이터,체력은컴퓨터성능이라고본다면,공부하는방법은인공지능알고리즘에해당합니다.
-14~15쪽

‘딥러닝(DeepLearning)’은머신러닝의한종류입니다.그러나더복잡한문제의규칙을잘찾아낼수있도록인간의뇌를본떠만든‘인공신경망(ArtificialNeuralNetwork)’을이용합니다.딥러닝은기존머신러닝이처리하기어려웠던비정형데이터를잘처리하고학습할수있습니다.ChatGPT도이딥러닝방식으로학습되었습니다.비정형데이터가무엇이냐고요?데이터는크게정형데이터와비정형데이터로나눌수있습니다.정형데이터는구조화된데이터로,학생들의나이,성적,키,객관식문제의정답등이해당합니다.비정형데이터는구조화되지않은데이터로,오늘의급식메뉴,자기소개서내용,서술형문제의정답등이해당합니다.
-19~20쪽

여러분은혹시반려견을키우고있나요?강아지에게‘앉아’를가르치고싶으면어떻게하세요?‘앉아’라고말했을때강아지가앉는다면간식을주고,앉지않는다면간식을주지않으면서가르칩니다.강화학습(ReinforcementLearning)도같은방식으로인공지능을학습시킵니다.이세돌을이긴알파고가강아지와같은방식으로학습했다는사실이신기하지않나요?
-42쪽

인공지능이얼마나잘학습했는지평가하려면어떻게해야할까요?바로시험을보면됩니다.여러분이공부한후에시험을보는것과같은이치입니다.그런데문제집에서봤던문제와똑같은문제가시험에출제된다면,이걸시험이라고볼수있을까요?진짜이해하고그문제를풀이한것이아니라,문제의답을외우기만하면되니이런문제를맞히는건의미가없습니다.그래서인공지능을학습하기위해모은데이터는일반적으로80%는학습용,나머지20%는시험용으로나눕니다.
-48쪽

GPT-1은2018년,GPT-2는2019년,GPT-3는2020년,ChatGPT와함께공개된GPT-3.5는2022년,GPT-4는2023년에공개되었습니다.버전이높아질수록학습에사용한데이터양도,모델매개변수의개수도크게늘었는데요.매개변수가많을수록더크고복잡한모델이라고생각하면됩니다.GPT-1은1억개,GPT-2는15억개,GPT-3는무려1,750억개의매개변수를갖고있습니다.일대일대응이되지는않겠지만,인간뇌의뉴런이약1,000억개라고하니이와맞먹는수치입니다.
-112~113쪽

ChatGPT는다음과같은과정으로학습되었습니다.우선GPT를채팅에최적화시키기위해미세조정을합니다.랜덤하게채팅시작문구를선택하면,사람이직접적절한답변문장을적습니다.이를정답으로보고지도학습방식으로미세조정을진행합니다.다음으로강화학습에사용할수있는보상모델을학습합니다.하나의채팅시작문구를주면,여러모델로부터각기다른답변문장을받아냅니다.이후사람이직접여러답변중가장적절한순서로순위를매깁니다.이를바탕으로보상모델을학습해특정시작문구에가장적절한답변이무엇인지,가장부적절한답변이무엇인지가르칩니다.마지막으로임의로채팅시작문구를선택하면,모델이답변문장을생성하고,보상모델이이문장이얼마나적절한지판단한다음,이에따른보상을제공합니다.이러한강화학습을통해ChatGPT는점점더적절한문장을생성하게됩니다.
-116쪽

여러분은인공지능이사람보다공정한판단을내릴수있다고생각하나요?사람은이런저런편견에휘둘리지만,인공지능은공정한법칙에따라판단할것이라고생각하기쉽습니다.물론그런인공지능도있을수있습니다.아주정교한규칙기반모델은규칙이공정하다면항상공정한판단을내리게될것입니다.하지만앞서살펴봤듯이규칙기반모델은실제로활용하기힘듭니다.이세상의문제는너무복잡한데그복잡한문제를일일이규칙으로만드는건사실상불가능하니까요.그래서등장한딥러닝에는규칙이없습니다.그리고딥러닝모델이아는세상은인간이제공하는데이터가전부입니다.다양한편견으로얼룩진그데이터가전부라는의미입니다.그래서기본적으로인공지능은인간의편견을그대로답습하게됩니다.
-120~121쪽

인공지능은인간을전부대체할수있을까요?같은직업을가진사람들끼리도각각더잘할수있는영역과부족한영역이있습니다.같은축구선수라도공격수는골키퍼보다골결정력이좋고,골키퍼는공격수보다펀칭을잘하는것처럼요.인공지능과인간도그런관계라고생각합니다.인공지능이더빠르게잘할수있는부분이있는가하면,인간이인공지능보다뛰어난부분도있습니다.
-147쪽