딥러닝 프로젝트를 위한 허깅페이스 실전 가이드 - 위키북스 데이터 사이언스 시리즈 97

딥러닝 프로젝트를 위한 허깅페이스 실전 가이드 - 위키북스 데이터 사이언스 시리즈 97

$32.00
Description
허깅페이스를 활용한 최신 인공지능 기술의 핵심 개념과 실무 능력을 제공합니다!
허깅페이스는 현대 딥러닝 분야, 특히 자연어 처리와 컴퓨터 비전 영역에서 널리 사용되는 강력한 도구입니다. 이 책은 허깅페이스를 활용하여 다양한 딥러닝 프로젝트를 구축하는 방법을 상세히 다룹니다. 트랜스포머 모델의 기본 개념부터 시작하여 자연어 처리, 컴퓨터비전, 멀티모달까지 폭넓은 주제를 다루며, 실제 프로젝트 구현을 통해 실용적인 지식을 제공합니다.

이 책은 허깅페이스를 활용해 모델 설정, 토크나이저 사용, 데이터세트 처리, 모델 학습 및 평가 등 프로젝트 전 과정을 상세히 다룹니다. 또한 최신 모델인 BERT, BART, RoBERTa, T5, LLaMA-3.1 등을 활용한 다양한 자연어 처리 모델과 CLIP, OWLv2, SAM 등을 이용한 컴퓨터 비전 모델, 그리고 BLIP-2, LayoutLM, ViLT, Stable-diffusion 등의 멀티모달 모델을 실습합니다.

허깅페이스를 이용해 최신 딥러닝 기술을 실제 프로젝트에 적용하고자 하는 개발자, 연구자, 그리고 데이터 사이언티스트 모두에게 강력하게 이 책을 추천합니다!

★ 이 책에서 다루는 내용 ★

◎ 허깅페이스 이해 및 활용 방법
◎ 트랜스포머 모델의 구조와 작동 원리 이해
◎ 허깅페이스 허브와 리포지터리를 활용한 모델 공유 및 관리
◎ 허깅페이스 트랜스포머 라이브러리를 이용한 모델 설정, 학습, 평가
◎ 자연어 처리 프로젝트(텍스트 분류, 요약, 질의 응답, 기계 번역, 텍스트 생성) 실습
◎ 컴퓨터비전 프로젝트(이미지 분류, 객체 검출, 이미지 세그먼테이션) 실습
◎ 멀티모달 프로젝트(이미지 캡셔닝, 문서 질의 응답, 시각적 질의 응답, 이미지 생성) 실습
◎ 고급 기능(이미지 매칭, 하이퍼파라미터 최적화, 모델 양자화, 분산 학습) 실습

저자

윤대희,김동화,송종민,진현두

저자:윤대희
카카오스타일의데이터사이언스팀리더로현재데이터리터러시,데이터패브릭,MLOps프로젝트를진행하고있다.이전에는어반베이스의머신러닝팀리더를맡아컴퓨터비전과딥러닝을활용해2D도면을3D로변환하는프로젝트를수행했다.머신러닝딥러닝을비롯해데이터품질관리,데이터통합,비즈니스인텔리전스등데이터통합에관심이있으며,기술공유및확장플러그인배포등으로개인이나조직이기술을보다쉽게이용하고활용할수있도록도움을주고있다.

저자:김동화
고려대학교에서산업경영공학박사학위를취득했다.데이터기반으로제조,IT,금융분야에서발생하는다양한기술적문제를해결했으며,머신러닝딥러닝분야에총6편의SCI논문을게재했다.카카오스타일에서컴퓨터비전과딥러닝을담당했으며패션속성추출,유사이미지추천및코디추천을수행했다.현재는우아한형제들에서다양한푸드/이커머스플랫폼과제를진행하고있다.컴퓨터비전,자연어처리,멀티모달학습을연구하고활용하는데관심이있다.

저자:송종민
동국대학교에서전자전기공학석사학위를취득했다.아크릴회사에서선임연구원으로근무하면서빅데이터포렌식및AI모델소형화프로젝트를진행했다.현재는카카오스타일의데이터사이언스팀에서컴퓨터비전과딥러닝을담당하며이미지데이터분석,유사이미지추천,모델서빙및배포자동화관련프로젝트를진행하고있다.인공지능기술을활용한생산성향상과비용최적화에관심이있다.

저자:진현두
학부생시절머신러닝한번공부해보지않겠냐는선배의권유로데이터사이언티스트의길로들어섰다.대학원시절특허를비롯한텍스트데이터를이용한경험을바탕으로주식회사공팔리터의AILab에서커머스리뷰데이터를이용한여러모델을구축했다.현재는공팔리터에서의경험을이용해카카오스타일의데이터사이언스팀에서사용자리뷰,상품정보등텍스트데이터를활용한딥러닝프로젝트를진행하고있다.AI콜로키움,AWSCommunityDay등에서발표하며경험을나누는것의즐거움을배웠다.지능형검색시스템과가상시착(VirtualTry-On)등에관심이있다.

목차

01장:허깅페이스알아보기
1.1인공지능과허깅페이스
___1.1.1머신러닝과딥러닝
___1.1.2딥러닝을위한허깅페이스
1.2트랜스포머
___1.2.1트랜스포머모델구조
___1.2.2멀티헤드어텐션
___1.2.3마스크드멀티헤드어텐션
1.3파이토치설치및환경설정
___1.3.1윈도우/리눅스
___1.3.2리눅스(ROCm)
___1.3.3맥
___1.3.4구글코랩
1.4허깅페이스허브
___1.4.1허깅페이스알아보기
___1.4.2Models페이지알아보기
___1.4.3사전학습된모델다운로드
1.5허깅페이스리포지터리
___1.5.1모델리포지터리생성
___1.5.2모델파일업로드
___1.5.3push_to_hub메서드를통한업로드
___1.5.4Git을통한업로드

02장:허깅페이스트랜스포머
2.1라이브러리소개
___2.1.1트랜스포머
___2.1.2토크나이저
___2.1.3데이터세트
___2.1.4디퓨저
___2.1.5가속화
2.2모델설정
___2.2.1PretrainedConfig클래스
___2.2.2ModelConfig클래스
2.3토크나이저
___2.3.1PreTrainedTokenizer클래스
___2.3.2ModelTokenizer클래스
2.4모델
___2.4.1PreTrainedModel클래스
___2.4.2ModelModel클래스
2.5특징추출
___2.5.1ImageFeatureExtractor클래스
___2.5.2AudioFeatureExtractor클래스
2.6이미지프로세서
___2.6.1ImageProcessor클래스
2.7오토클래스
___2.7.1주요Auto클래스
2.8파이프라인
___2.8.1파이프라인종류와예시
___2.8.2pipeline함수
2.9데이터세트
___2.9.1선택,분리,병합
___2.9.2필터및맵
___2.9.3기타메서드
___2.9.4데이터업로드
2.10트레이너
___2.10.1트레이너클래스
___2.10.2트레이닝아규먼트
___2.10.3토큰분류-개체명인식
2.11모델평가
___2.11.1평가라이브러리

03장:자연어처리
3.1텍스트분류:BERT
___3.1.1BERT
___3.1.2BertTokenizer
___3.1.3BertModel
___3.1.4텍스트분류모델학습
3.2요약문생성:BART
___3.2.1BART
___3.2.2BartTokenizer
___3.2.3BartModel
___3.2.4요약문생성모델학습
3.3질의응답:RoBERTa
___3.3.1RoBERTa
___3.3.2추출질의응답모델학습
3.4기계번역:T5
___3.4.1T5
___3.4.2기계번역모델학습
3.5텍스트생성:LLaMA-3.1
___3.5.1LLaMA-3시리즈
___3.5.2텍스트생성모델실습
___3.5.3텍스트생성모델학습

04장:컴퓨터비전
4.1제로샷이미지분류:CLIP
___4.1.1CLIP
___4.1.2제로샷이미지분류수행
4.2제로샷객체검출:OWLv2
___4.2.1OWLv2
___4.2.2제로샷객체검출수행
4.3이미지세그먼테이션:SAM
___4.3.1SAM
___4.3.2이미지세그먼테이션수행

05장:멀티모달
5.1이미지캡셔닝:BLIP-2
___5.1.1BLIP
___5.1.2이미지캡셔닝수행
5.2문서질의응답:LayoutLM
___5.2.1LayoutLM
___5.2.2문서시각질의응답수행
5.3시각적질의응답:ViLT
___5.3.1ViLT
___5.3.2시각적질의응답수행
5.4이미지생성:Stable-Diffusion
___5.4.1확산모델
___5.4.2Stable-Diffusion3
___5.4.3이미지생성수행

부록A:이미지매칭
A.1이미지특징벡터
A.2FAISS
A.3인덱스유형

부록B:레이튠
B.1하이퍼파라미터최적화수행
B.2하이퍼파라미터최적화결과비교
B.3하이퍼파라미터검색알고리즘

부록C:GPTQ
C.1GPTQConfig클래스
C.2모델양자화

부록D:가속화
D.1Accelerator클래스
D.2모델분산학습수행

출판사 서평

★이책에서다루는내용★

허깅페이스이해및활용방법
트랜스포머모델의구조와작동원리이해
허깅페이스허브와리포지터리를활용한모델공유및관리
허깅페이스트랜스포머라이브러리를이용한모델설정,학습,평가
자연어처리프로젝트(텍스트분류,요약,질의응답,기계번역,텍스트생성)실습
컴퓨터비전프로젝트(이미지분류,객체검출,이미지세그먼테이션)실습
멀티모달프로젝트(이미지캡셔닝,문서질의응답,시각적질의응답,이미지생성)실습
고급기능(이미지매칭,하이퍼파라미터최적화,모델양자화,분산학습)실습