GPT-5와 ChatGPT로 시작하는 멀티모달 AI 프로그래밍 실전 입문 (OpenAI API부터 멀티모달, AI 에이전트, 파인튜닝까지 한권으로 끝내기)

GPT-5와 ChatGPT로 시작하는 멀티모달 AI 프로그래밍 실전 입문 (OpenAI API부터 멀티모달, AI 에이전트, 파인튜닝까지 한권으로 끝내기)

$32.00
Description
GPT-5 시대, AI 프로그래밍의 새로운 기준!
GPT-5의 등장으로 AI는 텍스트를 넘어 이미지, 음성, 실시간 대화까지 아우르는 진정한 멀티모달 시대에 진입했습니다. 이 책은 ChatGPT와 OpenAI API의 기초부터 최신 기능까지, 실제 코드를 작성하며 배울 수 있도록 안내하는 실전 입문서입니다.

저자

후루카와히데카즈

1999년,《JAVAPRESS》(기술평론사)에서휴대폰앱개발방법에대한연재를시작했다.2001년,주식회사DWANGO에서Java탑재휴대폰503i의출시타이틀인‘사무라이로마네스크’개발에참여했다.이후새로운단말기의신기능을활용한앱을만들면서기술서적을계속집필하여25년간약50권을출간했다.현재는주식회사젤펨(Zelpminc.)에서사람과AI의공생환경실현을목표로인공지능연구개발에힘쓰고있다.
주요저서로는《제미나이인공지능프로그래밍》(길벗),《GPT-4,ChatGPT,라마인덱스,랭체인을활용한인공지능프로그래밍》(위키북스),《BERT/GPT-3/DALL-E자연어처리·이미지처리·음성처리인공지능프로그래밍실전입문》《Unity로시작하는ROS·인공지능로봇프로그래밍실전입문》《알파제로를분석하며배우는인공지능》(제이펍),《Unity로시작하는머신러닝·강화학습UnityML-Agents실전게임프로그래밍v2.2대응판》《OpenAIGym/Baselines딥러닝·강화학습인공지능프로그래밍실전입문》(본디지털)등이있다.
공저로는《Unity게임프로그래밍바이블》《Unity게임프로그래밍바이블2ndGeneration》(본디지털)이있다.

목차

▣01장:GPT-5와ChatGPT의개요
1-1GPT-5와ChatGPT의개요
__ChatGPT의개요
__ChatGPT의작동원리
__GPT-5의개요
__OpenAIAPI의개요
__ChatGPT의이용요금
__인공지능과머신러닝과딥러닝의개요
1-2인공지능과머신러닝과딥러닝
__뉴런과신경망
__모델생성과학습과추론
__자연어처리딥러닝모델의진화
1-3자연어처리딥러닝모델
__이미지생성딥러닝모델
__음성/음악생성딥러닝모델

▣02장:ChatGPT사용법
2-1ChatGPT사용법
__ChatGPT의화면구성
__ChatGPT의기본기능
__ChatGPT의주요활용사례
__ChatGPT의도구그룹
__음성입력과음성모드
__임시채팅
__대화내용을학습시키지않는설정
2-2ChatGPTAgent사용법
__ChatGPTAgent란
__ChatGPTAgent의사용제한
__ChatGPTAgent의주요용도
__ChatGPTAgent의이용절차
__ChatGPTAgent의커넥터
__안전성및프라이버시대책
2-3Codex사용법
__Codex란
__Codex의사용제한
__Codex의설정
__Codex의실행
__Codex의작업예
__고급설정
__프롬프트힌트
2-4Sora사용법
__Sora란
__Sora의사용제한
__Sora에의한동영상생성
__Storyboard에의한동영상생성
2-5GPT사용법
__GPT란
__GPT사용법
__GPT만드는법
2-6Playground사용법
__Playground시작하기
__OpenAIAPI의이용요금
__Playground의화면구성
__Chat
__Images
__Audio
__Assistants
__Dashboard
2-7gpt-oss사용법
__gpt-oss개요
__gpt-oss시험해보기

▣03장:파이썬개발환경준비
3-1파이썬개요
__파이썬이란
3-2구글코랩준비
__구글코랩이란
__구글코랩시작하기
__파이썬스크립트실행
__파이썬패키지설치
__텍스트추가
__구글코랩의툴바
__구글코랩메뉴
__GPU사용
__구글드라이브마운트
__구글코랩의제한과대책
__12시간규칙대책
__GPU사용제한대책
__데이터영구저장
__할당된GPU확인
__구글코랩플랜
__플랜업그레이드혜택
3-3로컬머신의파이썬환경준비
__윈도우에파이썬개발환경설치
__macOS에파이썬개발환경설치
3-4파이썬문법
__문자열출력
__변수와연산자
__문자열
__리스트
__딕셔너리
__튜플
__제어구문
__함수와람다식
__클래스
__패키지임포트와컴포넌트직접호출

▣04장:OpenAIAPI
4-1텍스트생성
__텍스트생성(TextGeneration)이란
__텍스트생성모델의입출력
__텍스트생성모델이용요금
__OpenAIAPI키발급
__OpenAIAPI사전준비
__텍스트생성실행
__텍스트생성의주요태스크
__스트리밍
__대화상태관리
__구조화출력
__프롬프트캐시
4-2Reasoning
__Reasoning이란
__GPT-5의작동메커니즘
__Reasoning모델의입출력
__OpenAIAPI사전준비
__Reasoning실행
__ReasoningEffort
__ReasoningSummary
__Verbosity
__Reasoning모델프롬프팅모범사례
__Reasoning의주요태스크
4-3이미지인식
__이미지인식이란
__이미지인식모델의입출력
__이미지인식모델이용요금
__OpenAIAPI사전준비
__이미지에대한질문응답:이미지URL
__이미지에대한질문응답:Base64
__이미지인식의제한사항
4-4이미지생성
__이미지생성(ImageGeneration)이란
__이미지생성모델의입출력
__이미지생성모델이용요금
__APIOrganizationVerification
__OpenAIAPI사전준비
__텍스트로부터이미지생성
__이미지출력사용자정의
__참조이미지를사용한이미지편집
__마스크를사용한이미지편집
4-5음성합성
__음성합성이란
__음성합성모델의입출력
__음성합성모델이용요금
__OpenAIAPI사전준비
__음성합성실행
__지시에의한출력스타일변경
__실시간오디오스트리밍
4-6음성인식
__음성인식(SpeechtoText)이란
__음성인식모델의입출력
__음성인식모델이용요금
__OpenAIAPI사전준비
__음성인식실행
__프롬프트에의한품질향상
4-7임베딩
__임베딩이란
__임베딩모델의입출력
__임베딩모델이용요금
__OpenAIAPI사전준비
__임베딩실행
__최근접이웃탐색
4-8모더레이션
__모더레이션이란
__모더레이션모델의입출력
__모더레이션모델이용요금
__OpenAIAPI사전준비
__모더레이션실행

▣05장:내장도구
5-1Websearch
__내장도구의개요
__Websearch의개요
__Websearch의이용요금
__OpenAIAPI사전준비
__Websearch의실행
__인용출처확인
5-2Filesearch
__Filesearch의개요
__Filesearch의이용요금
__OpenAIAPI사전준비
__벡터스토어의생성
__Filesearch의실행
__인용출처확인
5-3Computeruse
__Computeruse개요
__Computeruse이용요금
__Computeruse실행
__코드해설
5-4Imagegeneration
__Imagegeneration개요
__Imagegeneration의이용요금
__OpenAIAPI사전준비
__이미지생성의실행
__멀티턴이미지생성실행
__수정프롬프트확인
__스트리밍
5-5CodeInterpreter
__CodeInterpreter개요
__컨테이너에의한샌드박스환경
__CodeInterpreter이용요금
__OpenAIAPI사전준비
__CodeInterpreter의실행
__CodeInterpreter의파일조작
__CodeInterpreter의지원파일
5-6MCPTool
__MCPTool의개요
__MCPTool의이용요금
__OpenAIAPI사전준비
__MCPTool의실행
__도구의확인
__도구의필터링
__인가
__인증
5-7FunctionCalling
__FunctionCalling의개요
__FunctionCalling의이용요금
__OpenAIAPI사전준비
__FunctionCalling의실행
__외부함수의정의
__모범사례

▣06장:RealtimeAPI
6-1RealtimeAPI개요
__RealtimeAPI란
__Realtime모델이용요금
__OpenAIRealtimeConsole실행
__OpenAIRealtimeConsole코드해설
6-2실시간대화
__실시간대화개요
__셋업
__실시간대화구현
6-3실시간전사
__실시간전사개요
__셋업
__실시간전사구현

▣07장:AgentsSDK
7-1AgentsSDK의개요
__AgentsSDK란
__셋업
__에이전트실행
__핸드오프실행
__가드레일실행
7-2고객서비스구현
__고객서비스구현의개요
__셋업
__고객서비스의구현
7-3리서치봇구현
__리서치봇구현개요
__셋업
__리서치봇구현

▣08장:파인튜닝
8-1파인튜닝개요
__파인튜닝이란
__파인튜닝기법
__파인튜닝절차
__파인튜닝이용요금
8-2지도파인튜닝
__지도파인튜닝개요
__학습데이터형식
__학습데이터준비
__파인튜닝실행
__모델의실행
__파인튜닝모델의조정
__비전파인튜닝
8-3직접선호최적화
__직접선호최적화개요
__학습데이터형식
__학습데이터준비
__파인튜닝실행
__모델실행
__강화파인튜닝개요
8-4평가
__평가개요
__벤치마크용데이터셋
__평가데이터준비
__평가의실행
8-5증류
__증류개요
__학습데이터준비
__파인튜닝실행
__평가실행

출판사 서평

★이책에서다루는핵심내용★

◎GPT-5와ChatGPT의구조이해:통합형AI시스템의개요와발전과정
◎OpenAIAPI완전정복:텍스트생성,Reasoning,구조화된JSON출력,이미지인식·생성,음성합성·인식
◎7가지내장툴활용:Websearch,Filesearch,Computeruse,ImageGeneration,CodeInterpreter,MCPTool,FunctionCalling
◎RealtimeAPI로실시간대화:사람과이야기하듯자연스러운음성상호작용구현
◎AgentsSDK로AI에이전트구축:항공사고객서비스,DeepResearch리포트자동생성
◎파인튜닝실습:SFT,DPO,이미지파인튜닝,증류(Distillation)기법

★이런분들께추천합니다★

◎AI의구조와가능성을직접코드로확인하고싶은분
◎업무자동화나AI기반서비스를개발하려는분
◎대화로봇,AITuber등대화엔진을만들고싶은분
◎자신의애플리케이션에자연스러운채팅인터페이스를내장하고싶은분

구글코랩과로컬파이썬환경에서바로실행할수있는샘플코드를제공하여,환경설정부터실습까지막힘없이진행할수있습니다.