AI 모델 성능 평가, LLM·VLM과 미래 AI 모델

AI 모델 성능 평가, LLM·VLM과 미래 AI 모델

$13.10
Description
기존 지표로는 LLM과 VLM의 창의성과 추론 능력을 온전히 설명할 수 없다. 최신 AI 모델의 평가 지표, 산업별 적용, 윤리와 안전까지 아우르며 미래 AI 평가 패러다임을 제시한다. 인공지능총서. aiseries.oopy.io에서 필요한 인공지능 지식을 찾을 수 있다.
저자

이정헌

경희대학교컴퓨터공학과교수다.1999년부터2011년까지3번스타트업을창업해투자금을회수(exit)했고,한국정보화진흥원프로젝트매니저(PM)를거쳐2013년부터현재까지경희대학교컴퓨터공학과교수로재직중이다.2018년부터전문개인투자자로활동하고있으며,AC(액셀러레이터)/VC(벤처캐피탈)투자사를설립해스타트업을발굴하고투자하고성장을지원하는투자활동을활발히하고있다.2017년부터4년간중소벤처기업부성능검증연구협의회사무국장을지냈다.중소벤처혁신기업협회협회장과국가지식재산위원회신지식재산분과에서전문위원으로활동했다(2013∼2017).과기부,산업부,문체부,중기부등에서국책과제최고평가단및AI관련신규과제기획위원으로활동중이다.AI,빅데이터,AR/VR,영상처리분야에서다수의국책연구개발프로젝트를수행했으며,세계인명사전에도전문가로등재되어있다.주요저서로《애즈어서비스다!비트경제의게임체인저》(2021),《4차산업시대의역량강화를위한생성형AI그리고산업자동화》(2024),《개인투자자와AI서비스》(2025)등이있다.

목차

AI모델성능평가의새로운패러다임시작

01대규모언어모델의성능평가
02비전언어모델의성능평가
03생성AI모델의성능평가
04파운데이션모델의성능평가
05산업별LLM·VLM성능평가
06로봇일상화를위한CoT성능검증
07AI모델의안전성과윤리적평가
08AI모델의효율성과지속가능성평가
09미래AI모델성능평가패러다임
10AI모델성능평가의미래전망

출판사 서평

AI모델평가,새로운기준을세우다
챗GPT의등장은기존성능평가지표의한계를드러냈다.정확도나BLEU점수만으로는창의성,추론능력,윤리성까지포괄하는대규모언어모델(LLM)과비전언어모델(VLM)의능력을설명하기어렵다.
이책은LLM과VLM,이미지생성모델등최신AI를평가하는지표와프레임워크를체계적으로정리한다.퍼플렉시티,ROUGE,FID,CLIP스코어같은기술적기준은물론,산업별특화사례와로봇의체화된추론평가까지다룬다.더나아가AI의안전성·윤리성·지속가능성을핵심평가축으로제시하고,AGI를향한새로운패러다임을탐구한다.연구개발제안서작성과정책기획에필요한지표를제공하면서도,단순한기술측정이아닌사회적책임과가치에맞는평가의필요성을강조한다.AI가인류의미래에기여할수있는방향을찾고자하는연구자,개발자,정책담당자에게필요한정보를담았다.