NYT,FinancialTimes,TheEconomicst2025년올해의책
2025년AI분야최대의화제도서
★★★전세계14개언어로출간★★★
★★★대런아세모글루(2014년노벨경제학상수상),쇼샤나주보프(하버드경영대학원)강력추천★★★
챗GPT의대성공,광풍과도같은생성형AI개발경쟁
견제받지않는기술권력은어떻게세상을재편하는가?
오픈AI가2022년11월출시한챗GPT는두달만에사용자2억명에도달하며역사상가장빠르게성장한앱으로등극했다.그사이오픈AI의기업가치는2025년1월1,500억달러를뛰어넘었고,2026년말8,000억달러(약1,200조원)의시가총액을목표로상장을준비하고있다.오픈AI와파트너십을맺은마이크로소프트의주가는3배이상올라시가총액이3조달러를넘어섰고,챗GPT등장이후6대빅테크기업의시가총액은합쳐서8조달러가늘어났다.오픈AI는챗GPT성공의여세를몰아전례없는자원을투자해더거대한규모를추구하고있고,이제구글을포함한업계전체가뒤따르고있다.
같은시기,생성형AI개발자들은할리우드작가들과아티스트의작업물수백만건을그들의동의없이무단으로가져다모델을훈련시킴으로써사실상그들을대체할수있는제품을만들어냈다(스칼릿조핸슨은GPT-4o의음성이영화〈허〉에서의자신의목소리와같다며법적대응에나섰다).이런식으로수많은탄탄한중산층일자리가사라질위험에처해있다.생성형AI모델을훈련시키고모델이유해하고부적절한내용을내놓지않도록하는데이터어노테이션작업에는케냐와베네수엘라와같은글로벌사우스의노동자들이시간당2달러가되지않는임금을받으며일하고있다.그런데도샘올트먼은이렇게이야기한다.“우리의사명은AGI가인류전체에이익이되도록보장하는것입니다.”“그경제적혜택을모두와나누는것입니다.”
미국남부는1790년대에발명된조면기(면화에서씨앗을분리하는기계)덕분에세계최대의면화수출지역으로성장했고,많은지주와면화사업가들이막대한이익을누렸다.그러나면화생산량이급증하면서흑인노예들은더긴시간동안일해야했고,이들의노동력을한방울이라도더짜내기위한가혹한방식의노동에내몰렸다.조면기를통해더큰이익을누리게된이들은이후70년간이비인간적이고끔찍한착취시스템(노예제)을훨씬강화했다.그런데도그들은조면기덕에노예들이더행복해진것처럼묘사했다.“지구상에이들보다더행복하고만족스러워하는인종은없다고장담할수있습니다”(당시사우스캐롤라이나의한의원).
스케일,스케일,스케일!
“AI업계에선가장큰컴퓨터를가진사람이가장큰이익을얻습니다”
(2019년,오픈AI의첫CTO그렉브로크만)
오픈AI는설립(2015년12월)이후업계최고의인재들을끌어모으며여러프로젝트를벌렸지만아무런진전을보지못했다.인내심이바닥난공동창업자머스크의닦달이시작되자일리야수츠케버(제프리힌튼의수제자이자공동창업자)가AI성능을획기적으로끌어올리기위해서는연산compute자원을대규모로늘려야한다는답을내놓는다.연산자원의규모는개별칩의처리능력(대략18개월에2배씩늘어난다는무어의법칙과관련)과사용가능한칩의수에의존한다.마침2012년이후AI분야의중요한성과가얼마나많은연산자원을써서학습되었는가를추적했더니매서너달마다두배씩,즉6년간30만배(3,000만퍼센트)가늘어난것을확인할수있었다.오픈AI경영진은이를‘오픈AI의법칙’이라고부르며,이새로운법칙의속도에맞춰서연산자원의규모를확장scale할필요가있다고믿게되었다.즉훨씬더많은칩이필요해졌다.
그렇다면무엇을확장할것인가?2017년8월에구글이내놓은트랜스포머Transformer가장거리패턴을인식하는데뛰어난성능을보이자수츠케버는이를자신들이확장시킬신경망모델의출발점으로삼았다.그결과로2018년에‘사전학습된생성형트랜스포머’,즉GPT-1이나왔다.
연산자원의규모를오픈AI의법칙에맞추어늘리기위해막대한투자가필요한상황이되자,당초내걸었던사명에서슬쩍벗어나회사내에영리부문인오픈AILP를만든다.그러자일론머스크와샘올트먼이서로CEO가되겠다고나섰고,이대결에서승리한올트먼이빌게이츠앞에서GPT-2를시연하며마이크로소프트의대규모투자를이끌어냈다(2019년4월).
이제스케일링의법칙이등장한다.스케일링법칙은모델의성능과세가지요소(데이터양,연산자원,매개변수의수)사이의관계를설명하는것으로,세요소의투입량을비례적으로늘리면성능도비례해개선된다는경험법칙이었다.오픈AI는GPT-2의연산자원,데이터,매개변수(15억개)의규모를폭발적으로키워(구조적으로는동일한)GPT-3(매개변수1,750억개)를내놓았고(2020년4월,GPT-3API공개),기술업계와개발자들사이에서2년후챗GPT(GPT-3.5에서출발)가불러일으킨것같은열광적인반응을얻었다.오픈AI의이결정과성공은AI개발의경로를완전히바꿔놓았다.이제개발에필요한자원의양이압도적으로많아졌기때문에생성형AI개발경쟁은소수의기업에게집중된다.
GPT-3(와이후챗GPT)의성공으로스케일링은이제하나의교리가되었다.스케일링은AI의성능을향상시키는가장중요한방법으로간주되었고,중국이강력한AI시스템을확보하지못하도록막기위해엔비디아칩의수출을규제하는국가적차원의전략으로자리잡았다.(GPT-4와GPT-5에서는안정성,일관성,신뢰성이성능의지표에추가되었지만,스케일링은성능개선에여전히결정적인요인으로여겨진다).
머릿속에악마를들여놓지않고서는할수없는콘텐츠모더레이션,
신음하는글로벌사우스의노동자들
생성형AI모델을만들기위해서는데이터어노테이션(데이터에주석을달아기계가데이터를더잘이해하고학습할수있도록돕는작업)노동자들이필요하다.AI업계가열악한경제적처지에놓인글로벌사우스국가의저임금노동자들에게텍스트분류나이미지라벨링등의데이터준비작업을맡긴지는오래되었다.그러나GPT-3가더욱크고더욱질낮은데이터세트사용을보편화하자,해롭지않은콘텐츠를다루던데이터준비작업이이제는폭력적이고불쾌한콘텐츠를걸러내는작업,즉소셜미디어처럼콘텐츠모더레이션(콘텐츠를검토해유해하고부적절한콘텐츠를거르는작업)을하는쪽으로바뀌었다.
그런데페이스북의콘텐츠모더레이션과생성형AI의그것은질적으로다르다.페이스북과같은소셜미디어에서는사용자가올린콘텐츠가폭력,혐오,성적이슈에해당하는지를노동자들이판단하여쓰레기를치우는청소부와같이해로운컨텐츠를삭제하면됐다.하지만생성형AI의경우에는노동자가아직벌어지지않은AI모델의잠재적행위를사전에통제해야한다.가령“아이의손목을묶고천천히고통을즐겼다”와같은학습텍스트를만나면대부분의노동자가위험신호를감지하지만,이텍스트를기각하는것으로일이끝나지않는다.단순히기각하면폭력이나유해한성적콘텐츠자체를설명하지못하게되고그것을예방하기위한답도내놓을수없게된다.노동자는해당내용이범죄소설속의묘사인지이런행동을유도하려는것인지를판단해야한다.또이문장이어떻게악용될수있는지도생각해야한다.즉생성형AI의콘텐츠모더레이션노동자는유해한데이터를기각하는것이아니라,AI모델이폭력,혐오,성적콘텐츠를언제어떻게말할지를설계해야한다.이는노동자의머릿속에악마를들여놓지않고서는하기어려운작업이라고도할수있다.
우리는불길한제국의시대에들어섰다
누가이기술의미래를결정할것인가?
겉으로만봤을때생성형AI는마법과도같다.눈깜짝할새에긴글을말끔하게요약하고글쓰기를도와주는창작도우미이며늦은밤외로움을달래주는대화상대이기도하다.하지만매혹적인겉모습과는다른이면이있다.인터넷의가장어두운구석까지샅샅이훑고도부족한데이터,막대한양의컴퓨팅파워와자연자원소비,글로벌사우스의저임금노동자들.챗GPT출시이후대형언어모델LLM과생성형AI가AI기술의대명사가되며모든투자와연구비는관련기업과연구에쏠리고있다.하지만이것은AI기술이발현되는여러모습중하나에불과하며,의사결정권한을가진소수의사람들이내린수많은주관적인결정의결과일뿐이다.마찬가지로,앞으로나올AI기술역시미리결정된것이아니다.그렇다면누가이기술의미래를결정할것인가?
오늘날생성형AI기술경쟁을주도하는기업들의본질을가장잘포착하는단어는‘제국’이다.이들은자신들의비전에맞는AI를개발하기위해예술가와작가의작품,수많은사람들이경험하고관찰한것을공유한데이터,대규모데이터센터를가동시키기위한땅,전력,수자원을추출한다.또자신들이저지르고있는프라이버시침해,절도,자동화를통해수없이많은경제적기회를앗아가는행위를정당화하고지속한다.
이제모든빅테크기업들이오픈AI가열어젖힌생성형AI의규모경쟁에뛰어들었다.하지만AI가꼭현재의길을갈필요는없다.기술발전을위해꼭전무후무한규모와자원동원이필수적이라는논리를받아들일필요도없다.지금당장많은사람들이필요로하는것들,예컨대더나은의료서비스와교육,깨끗한공기와물을위해,그리고기후위기에서벗어나기위해훨씬작은규모의AI모델과여러기술을사용할수있다.
그러기위해서는기술의미래를소수의AI제국들이아니라많은사람들이통제할수있어야한다.우선데이터프라이버시와투명성법규를강화하고지적재산권법을통해사람들이자신의데이터와작업물에대한권리를강화할수있다.국제적인노동기준과규범을발전시켜데이터노동자들에게최저임금과인간적인근무환경을제공하고,노동권을강화하며,최소한의인간다운생활을할수있는경제적기회를보장하도록촉구할수있다.또AI연구의다양성을촉진시킴으로써현재와는본질적으로다른대안을모색하는데기여할수있다.마지막으로우리는오픈AI와AI업계가진보라는미명하에감춰둔사회적,환경적비용을직시해야한다.