2024 초거대 생성AI 시대의 AI학습데이터 DB총람

2024 초거대 생성AI 시대의 AI학습데이터 DB총람

$400.00
Description
머 리 말

2023년은 ICT산업을 넘어 전산업에 걸쳐 인공지능(AI) 기술이 글로벌 이슈로 부상한 해로 기억 될 것으로 보인다. 연초부터 오픈AI가 공개한 초거대 AI기반 생성형 챗GPT 열풍으로 구글, MS 등 글로벌 빅테크와 플랫폼 기업, 스타트업을 망라한 기업과, IT업계 뿐 아니라 전산업에 걸친 차세대 인공지능(AI) 기술 개발과 서비스 모델 개발, 도입 및 활용 경쟁에 속도가 붙으면서 전례 없는 열기로 국내외에서 상용화 경쟁이 가속화 하고 있다. 특히 텍스트(언어) 외에도 이미지, 비디오 그리고 다양한 데이터 형식(생체신호 등)을 포함한 멀티모달로 진화하면서, 향후 생성형 AI 시장은 무한 확장 될 것으로 예측되고 있어 기업 생존의 열쇠로 주목받고 있다.

초거대 AI 개발·운영에는 막대한 컴퓨팅 자원, 인적자원이 필수적이어서 진입장벽이 있지만, 오픈AI가 챗GPT의 상당 부분을 무료로 제공하면서 플랫폼 확장에 나선 것처럼, 기존 빅테크 기업들도 자사 생태계 확대를 목적으로 자사 AI 모델을 기반으로 다양한 전문적이고, 밎춤형 특화 서비스가 가능한 비즈니스 모델을 만들 수 있도록 지원을 강화하고 있어, 초기 생성 AI 생태계는 상대적으로 스타트업에게도 많은 사업기회를 제공 할 것으로 기대되고 있다.

이러한 환경변화에 대응하고자 정부는 AI일상화와 고도화를 위한 다양한 정책을 마련하여 관련 산업 육성과 생태계 조성에 나서고 있으며, AI반도체와 클라우드, 양질의 데이터 확보와 보급 등 신시장 확대와 인프라 확충에도 드라이브를 걸고 있다. 대표적인 사업중에는 AI 기계학습용 데이터베이스 구축 지원사업과 AI를 적용하고자 하는 수요기업이 단기간 내 최적의 AI를 도입할 수 있도록 지원하고, 인공지능 솔루션을 개발한 공급기업에게는 새로운 시장 창출의 기회를 제공하는 ‘AI 바우처 지원사업’을 들 수 있다.

KISDI의 분석에 따르면 기업에서 인공지능 도입의 장애요인으로 기계학습용 데이터 부족 문제가 24.2%를 차지하는 등 고품질 대규모 데이터의 구축과 확보는 AI 기술 개발에 있어 매우 중요한 문제이기에 과기정통부는 한국지능정보사회진흥원(NIA)를 통해 다양한 기계학습용 데이터베이스 구축에 많은 자금을 투입하여 구축, 공개해 오고 있으며 2023년에도 지정분야로만 94개 분야 118종의 DB를 구축 중이다. 또한 정보통신산업진흥원(NIPA)은 AI를 활용한 기업의 디지털 전환을 지원코자 2020년부터 ‘AI 바우처 지원사업’을 시행중으로 2023년에는 [일반/의료/AI반도체/소상공인/글로벌] 5개 분과를 운영하며 수요기업과 공급기업을 지속적으로 발굴 매칭해오고 있다.

이에 당사에서는 초거대 AI기반 생성형 AI 기술이 가져온 산업 환경에 대응하여 사업모델을 고도화해야하는 기업의 니즈에 대응하여, AI용 고품질 대용량 학습 데이터베이스 총람과 AI 수요기업과 솔루션 보유기술 기업을 효율적으로 발굴 활용하는데 도움을 드리고자 국내 AI기술기업 2000사 디렉토리를 출간하게 되었으며, 모쪼록, 본서가 향후 다양하게 확대될 AI관련 기술개발과 비즈니스 고도화를 도모하는 모든 기업과 관계자 분께 조금이나마 도움이 되길 기대해 본다.
저자

씨에치오얼라이언스(CHOAlliance)편집부

목차

Ⅰ.2023년분야별,인공지능학습용데이터구축현황 57

1.한국어 58
1-1.라이브스트리밍영상통번역데이터 58
1)라이브스트리밍영상영어통번역데이터(초거대AI) 58
(1)데이터개요 58
(2)데이터구성 58
(3)데이터구축방법 59
2)라이브스트리밍영상중국어통번역데이터(초거대AI) 59
(1)데이터개요 59
(2)데이터구성 60
(3)데이터구축방법 60
3)라이브스트리밍영상일본어통번역데이터(초거대AI) 61
(1)데이터개요 61
(2)데이터구성 61
(3)데이터구축방법 62
1-2.다국어일상대화실시간통번역데이터 62
1)다국어일상대화실시간통번역데이터(초거대AI) 62
(1)데이터개요 62
(2)데이터구성 62
(3)데이터구축방법 63
1-3.국제학술대회용전문분야한영/영한통번역데이터 63
1)국제학술대회용전문분야한영/영한통번역데이터(초거대AI) 63
(1)데이터개요 63
(2)데이터구성 64
(3)데이터구축방법 64
1-4.K-콘텐츠멀티턴한-영페르소나데이터 65
1)K-콘텐츠멀티턴한-영페르소나데이터초거대AI 65
(1)데이터개요 65
(2)데이터구성 65
(3)데이터구축방법 65
1-5.다국어기계번역치명적오류탐지및교정데이터 66
1)다국어기계번역치명적오류탐지및교정데이터(초거대AI) 66
(1)데이터개요 66
(2)데이터구성 66
(3)데이터구축방법 67
1-6.다국어번역품질평가데이터 69
1)다국어번역품질평가데이터(초거대AI) 69
(1)데이터개요 69
(2)데이터구성 69
(3)데이터구축방법 70
1-7.분야별한국어멀티세션데이터 71
1)전문분야(기술과학)한국어멀티세션데이터(초거대AI) 71
(1)데이터개요 71
(2)데이터구성 71
(3)데이터구축방법 72
2)전문분야(사회과학)한국어멀티세션데이터(초거대AI) 72
(1)데이터개요 72
(2)데이터구성 73
(3)데이터구축방법 74
3)일상대화한국어멀티세션데이터(초거대AI) 74
(1)데이터개요 74
(2)데이터구성 75
(3)데이터구축방법 75
1-8.한국어SNS멀티턴대화데이터 76
1)한국어SNS멀티턴대화데이터(초거대AI) 76
(1)데이터개요 76
(2)데이터구성 76
(3)데이터구축방법 77
1-9.동화데이터 77
1)동화이해도테스트를위한질의응답쌍생성데이터(초거대AI) 77
(1)데이터개요 77
(2)데이터구성 78
(3)데이터구축방법 78
2)동화삽화생성데이터(이미지캡션) 79
(1)데이터개요 79
(2)데이터구성 79
(3)데이터구축방법 80
3)동화줄거리생성데이터(초거대AI) 80
(1)데이터개요 80
(2)데이터구성 81
(3)데이터구축방법 81
1-10.다양한소음원에서의GroundTruth지식정보데이터 82
1)다양한소음원에서의GroundTruth지식정보데이터(초거대AI) 82
(1)데이터개요 82
(2)데이터구성 82
(3)데이터구축방법 83
1-11.한국어텍스트-비디오-사운드데이터 83
1)한국어텍스트-비디오-사운드데이터 83
(1)데이터개요 83
(2)데이터구성 84
(3)데이터구축방법 84
1-12.음성인식에의한영상요약데이터 85
1)음성인식에의한영상요약데이터(초거대AI) 85
(1)데이터개요 85
(2)데이터구성 85
(3)데이터구축방법 86
1-13.한국어지식그래프및다중이벤트추출데이터 86
1)지식그래프-투-텍스트데이터(초거대AI) 86
(1)데이터개요 86
(2)데이터구성 87
(3)데이터구축방법 87
2)한국어다중이벤트추출데이터(초거대AI) 88
(1)데이터개요 88
(2)데이터구성 88
(3)데이터구축방법 89
1-14.AI응답결과에대한품질평가데이터 89
1)AI응답결과에대한품질평가데이터(초거대AI) 89
(1)데이터개요 89
(2)데이터구성 90
(3)데이터구축방법 90
1-15.법률안검토보고서및국회회의록데이터 91
1)법률안검토보고서요약데이터초거대AI 91
(1)데이터개요 91
(2)데이터구성 92
(3)데이터구축방법 92
2)국회회의록기반지식검색데이터(초거대AI) 92
(1)데이터개요 92
(2)데이터구성 93
(3)데이터구축방법 93
1-16.아동·청소년상담데이터 94
1)아동·청소년상담데이터 94
(1)데이터개요 94
(2)데이터구성 94
(3)데이터구축방법 95
1-17.고령자근현대경험기반스토리구술데이터 96
1)고령자근현대경험기반스토리구술데이터(초거대AI) 96
(1)데이터개요 96
(2)데이터구성 96
(3)데이터구축방법 97

2.영상이미지 98
2-1.한국인얼굴3D데이터 98
1)3차원안면데이터 98
(1)데이터개요 98
(2)데이터구성 98
(3)데이터구축방법 99
2)한국인표정3D데이터(이미지캡션) 99
(1)데이터개요 99
(2)데이터구성 99
(3)데이터구축방법 100
2-2.한국인피부상태측정데이터 100
1)한국인피부상태측정데이터 100
(1)데이터개요 100
(2)데이터구성 100
(3)데이터구축방법 101
2-3.물체조작손동작3D데이터 101
1)물체조작손동작3D데이터 101
(1)데이터개요 101
(2)데이터구성 102
(3)데이터구축방법 102
2-4.한국인전신및포즈데이터 103
1)한국인전신및포즈데이터(이미지캡션) 103
(1)데이터개요 103
(2)데이터구성 103
(3)데이터구축방법 104
2-5.표/차트이미지해석데이터 104
1)차트이미지-텍스트쌍데이터(이미지캡션) 104
(1)데이터개요 104
(2)데이터구성 105
(3)데이터구축방법 105
2)표이미지-텍스트쌍데이터(이미지캡션) 105
(1)데이터개요 105
(2)데이터구성 106
(3)데이터구축방법 106
2-6.다중언어OCR데이터 107
1)다중언어OCR데이터 107
(1)데이터개요 107
(2)데이터구성 107
(3)데이터구축방법 107
2-7.한국어GQA데이터 108
1)한국어GQA데이터(이미지캡션) 108
(1)데이터개요 108
(2)데이터구성 108
(3)데이터구축방법 109
2-8.한국형텍스트-3D객체쌍데이터 109
1)한국형텍스트-3D객체쌍데이터(이미지캡션) 109
(1)데이터개요 109
(2)데이터구성 110
(3)데이터구축방법 110
2-9.한국전통수묵채색화제작데이터 111
1)한국전통수묵채색화제작데이터(이미지캡션) 111
(1)데이터개요 111
(2)데이터구성 111
(3)데이터구축방법 112
2-10.의류스케치-패턴도면쌍데이터 112
1)의류스케치-패턴도면쌍데이터(이미지캡션) 112
(1)데이터개요 112
(2)데이터구성 112
(3)데이터구축방법 113
2-11.음식3D데이터 113
1)음식3D데이터(이미지캡션) 113
(1)데이터개요 113
(2)데이터구성 114
(3)데이터구축방법 114
2-12.가상실내공간3D합성데이터 115
1)가상실내공간3D합성데이터(이미지캡션) 115
(1)데이터개요 115
(2)데이터구성 115
(3)데이터구축방법 116
2-13.교량3D외관점검영상데이터 116
1)교량3D외관점검영상데이터 116
(1)데이터개요 116
(2)데이터구성 117
(3)데이터구축방법 117
2-14.낙상사고위험동작영상-센서쌍데이터 118
1)낙상사고위험동작영상-센서쌍데이터 118
(1)데이터개요 118
(2)데이터구성 118
(3)데이터구축방법 119
2-15.스트레스상황바이오이미지복합데이터 119
1)스트레스상황바이오이미지복합데이터 119
(1)데이터개요 119
(2)데이터구성 120
(3)데이터구축방법 120
2-16.대용량동영상콘텐츠데이터(고도화) 121
1)대용량동영상콘텐츠데이터(고도화) 121
(1)데이터개요 121
(2)데이터구성 121
(3)데이터구축방법 122

3.헬스케어 123
3-1.혈관데이터 123
1)경동맥혈관CT및MRI데이터 123
(1)데이터개요 123
(2)데이터구성 123
(3)데이터구축방법 124
2)말초혈관초음파데이터 124
(1)데이터개요 124
(2)데이터구성 124
(3)데이터구축방법 125
3-2.관절및관절염데이터 125
1)경추CT데이터 125
(1)데이터개요 125
(2)데이터구성 125
(3)데이터구축방법 126
2)무릎관절염켈그렌-로렌스분류(K-Lgrade)데이터 126
(1)데이터개요 126
(2)데이터구성 127
(3)데이터구축방법 127
3)족부족관절체중부하CT데이터 127
(1)데이터개요 127
(2)데이터구성 128
(3)데이터구축방법 128
3-3.난소및배아데이터 128
1)난소암데이터 128
(1)데이터개요 128
(2)데이터구성 129
(3)데이터구축방법 130
2)배아이미지합성데이터 130
(1)데이터개요 130
(2)데이터구성 130
(3)데이터구축방법 131
3-4.내시경이미지합성데이터 131
1)내시경이미지합성데이터 131
(1)데이터개요 131
(2)데이터구성 132
(3)데이터구축방법 132
3-5.구강이미지합성데이터 133
1)구강이미지합성데이터 133
(1)데이터