생성형 AI를 위한 컴퓨터 비전 (파이토치를 활용한 딥러닝과 비전 생성 모델)

생성형 AI를 위한 컴퓨터 비전 (파이토치를 활용한 딥러닝과 비전 생성 모델)

$33.69
Description
수식으로 이해하고, 코드로 습득하고, 결과물로 알아보는
파이토치를 활용한 딥러닝과 비전 생성 모델
이제는 누구나 쉽게 접할 수 있는 각종 생성형 AI 서비스는 컴퓨터 비전, 그중에서도 비전 생성 모델의 기술적 산물입니다. 인공지능과 관련된 전문가로 성장하기 위해서는 단순히 완성형으로 개발된 서비스를 이용해보기에 앞서 동작의 원리를 깨쳐야 합니다. 이에 『생성형 AI를 위한 컴퓨터 비전』은 미드저니, 빙 이미지 크리에이터, 스테이블 디퓨전, 스노우 앱 등의 서비스를 개발할 때 사용되는 이미지 및 영상 생성 관련 컴퓨터 비전 기술의 근간을 설명합니다.

비전 생성 모델과 관련된 각종 모델에 대해 수학 공식을 통해 수리적인 배경을 이해하고 소스코드를 한 줄씩 따라가며 동작 기술을 습득할 수 있습니다. 또한 텍스트 입력을 처리하는 트랜스포머, 이미지와 텍스트 프롬프트의 정보를 연결하는 CLIP 모델, 파이프라인 및 응용 기법 등을 지원하는 허깅페이스의 Diffuser 라이브러리와 함께 멀티 모달 비전 생성 모델의 결과 도출 방식을 알 수 있습니다. 이제는 생성형 AI 제품 및 서비스를 경험해보는 것을 넘어 책에서 제시하는 전망과 미래 잠재력에 동참해보도록 합시다.
저자

최재웅

대학교에서전자공학을전공하던중인공지능에흥미가생겨대학원진학을결심하였습니다.그리고인하대학교의컴퓨터비전및이미지프로세싱(ComputerVisionandImageProcessing,CVIP)연구실에서가장흥미롭게생각한비전분야의생성모델을연구해석사학위를취득하였습니다.

NHN에서는스타일변환모델에대한서비스개발을진행했고생성모델관련특허를여러개출원하였으며,현재는LGCNS에서생성모델관련연구및개발업무를수행하고있습니다.이밖에,공부한것을나누기를좋아하여멘사코리아의개발자모임에서스터디를주관하기도하며좋은영향력을펼칠길을찾아나가고있습니다.

現)LGCNS-멀티모달AI팀
前)NHN-AI선행연구팀

- 깃허브github.com/jaewoong1
- 인스타그램instagram.com/chlwodnd500

저술사항
- 논문「Style-GuidedandDisentangledRepresentationforRobustImage-to-ImageTranslation」,(AAAI,2022),9.
- 저널「Synthesizedrainimagesforderainingalgorithms」,(NeuroComputing,2022),sciencedirect.com/science/article/pii/S0925231222004040
- 논문「EPrOD:EvolvedProbabilisticObjectDetectorwithDiverseSamples」,(ECCV,2020),10.

목차

1장비전생성모델
_1.1비전생성모델이란?
__1.1.1영상생성모델
__1.1.2영상변환모델
__1.1.3스타일변환모델
__1.1.4영상품질개선모델
_1.2비전생성모델의활용분야
__1.2.1예술및디자인
__1.2.2엔터테인먼트
__1.2.3의료및산업분야
__1.2.4게임개발
_1.3비전생성모델이해를위한배경지식
__1.3.1평균과분산
__1.3.2정규분포
__1.3.3최대가능도추정
__1.3.4쿨백-라이블러발산
__1.3.5MAE손실함수와MSE손실함수
_1.4구현및실습을위한도구
__1.4.1CUDA와CuDNN설치
__1.4.2아나콘다설치
__1.4.3파이토치란?

2장비전생성모델링방식및특징
_2.1오토인코더
__2.1.1소개및이론
__2.1.2구현및실습
__2.1.3정리
_2.2변이형오토인코더
__2.2.1소개및이론
__2.2.2구현및실습
__2.2.3정리
_2.3생성적적대신경망
__2.3.1소개
__2.3.2GAN
__2.3.3WGAN
__2.3.4cGAN
__2.3.5DCGAN
__2.3.6구현및실습
__2.3.7정리
_2.4확산모델
__2.4.1소개및이론
__2.4.2구현및실습
__2.4.3정리

3장생성적적대신경망기반응용모델
_3.1영상생성모델
__3.1.1PGGAN
__3.1.2StyleGAN
__3.1.3정리
_3.2영상변환모델
__3.2.1pix2pix
__3.2.2CycleGAN
__3.2.3정리
_3.3스타일변환모델
__3.3.1AdaIN
__3.3.2StarGAN
__3.3.3정리
_3.4영상품질개선모델
__3.4.1초해상도:SRGAN
__3.4.2디블러링:DeblurGAN
__3.4.3정리

4장확산모델기반응용모델
_4.1트랜스포머
_4.2CLIP
_4.3Diffusers라이브러리란?
_4.4멀티모달비전생성모델
__4.4.1미드저니
__4.4.2빙이미지크리에이터
__4.4.3스테이블디퓨전
__4.4.4정리
_4.5응용및확장기법
__4.5.1드림부스
__4.5.2컨트롤넷
__4.5.3정리

5장최신연구및서비스동향
_5.1관련서비스및응용분야소식
_5.2비전생성모델의전망과미래

출판사 서평

비전생성모델의수리적배경부터
응용모델의사용법과결과도출원리까지

1장에서는컴퓨터비전영역에속한생성형AI관련모델인비전생성모델에대해용어를정의하고수리적인배경을학습한후구현및실습에필요한도구를설치합니다.

2장에서는대표적인생성모델링방식인오토인코더,변이형오토인코더(VAE),생성적적대신경망(GAN),그리고확산모델(DiffusionModel)에대해이론부터실습까지코드를한줄씩따라가며꼼꼼하게살펴봅니다.

3장에서는영상생성모델(PGGAN,StyleGAN),영상변환모델(pix2pix,CycleGAN),스타일변환모델(AdalN,StarGAN),영상품질개선모델(초해상도:SRGAN,디블러링:DeblurGAN)에대해수학공식을통한수리적인배경부터소스코드를통한설명과결과이미지확인까지세밀하게고찰해봅니다.

4장에서는텍스트입력을처리할수있게하는트랜스포머,이미지와텍스트프롬프트의정보를연결하는CLIP모델,파이프라인및응용기법등을지원하는허깅페이스의Diffuser라이브러리에대해알아봅니다.그리고미드저니,빙이미지크리에이터,스테이블디퓨전등의생성서비스에사용된멀티모달비전생성모델에대해각서비스를기준으로수리적인배경과결과도출방식을살펴봅니다.

5장에서는모바일애플리케이션스노우(SNOW),어도비의생성형AI플랫폼젠스튜디오(GenStudio),오픈AI의Text-to-Video생성모델소라(Sora)등을소개하며비전생성모델의전망과미래잠재력을조망해봅니다.

이책이필요한독자

-딥러닝과영상변환모델기술에대해궁금한분
-비전생성모델을처음접하는대학생또는대학원생
-이미지및영상생성관련인공지능기술을직접적인수식과코드로학습하고싶은분
-비주얼분야에서의인공지능에대해학습하고싶은분
-디자인및그래픽관련분야에서인공지능모델을활용해보고싶은분