인사이드 머신러닝 인터뷰 : 빅테크에서 자주 묻는 194가지 문제로 ML 면접 완벽 대비하기

인사이드 머신러닝 인터뷰 : 빅테크에서 자주 묻는 194가지 문제로 ML 면접 완벽 대비하기

$25.57
저자

펑샤오

저자:펑샤오

15년동안소셜미디어,광고기술,핀테크,전자상거래등다양한분야에서ML리더십직책을맡아천명에가까운지원자를면접했다.트위터(현재X)에서스태프ML엔지니어로근무하면서추천알고리즘과광고예측및랭킹을위한ML시스템을설계했으며그전에는록시(Roxy)라는AI스타트업을공동창업해벤처캐피탈에서수백만달러의투자를받았다.경력초기에아마존과팩트셋(FactSet)에서ML팀을이끌며기계번역,표형식정보추출,개체명인식,토픽모델링등다양한ML시스템의개발을감독했다.



역자:정원창

전자공학과전산학을공부하고국내외의크고작은하드웨어와소프트웨어회사에서다양한경험을쌓았다.현재는자연어처리에중점을둔ML엔지니어로일하고있으며『개발자의하루를바꾸는코파일럿&챗GPT』(한빛미디어,2023)를번역했다.

목차


1장ML면접에임하기
테크니컬폰스크린
ML기본지식면접
ML코딩면접
ML시스템설계면접
기타면접
우수한답변의필수요소

2장ML기본지식
Q2.1데이터셋수집단계
Q2.2데이터수집시문제
Q2.3데이터수집시고려사항
Q2.4레이블불균형처리
Q2.5누락된레이블처리
Q2.6입력피처유형
Q2.7피처선택과중요도
Q2.8피처선택방법
Q2.9누락된피처값
Q2.10모델링알고리즘
Q2.11로지스틱회귀작동방식
Q2.12로지스틱회귀손실함수
Q2.13경사하강법최적화
Q2.14하이퍼파라미터튜닝
Q2.15모델과적합처리
Q2.16정규화기법
Q2.17선형회귀와로지스틱회귀
Q2.18신경망활성화함수
Q2.19의사결정트리,랜덤포레스트,그래디언트부스팅결정트리
Q2.20부스팅과배깅
Q2.21비지도학습기법
Q2.22k-평균작동방식
Q2.23준지도학습기법
Q2.24손실함수유형
Q2.25손실함수볼록성
Q2.26분류모델평가지표
Q2.27회귀모델평가지표
Q2.28모델최적화
Q2.29모델성능개선

3장ML코딩
Q3.1k-평균
Q3.2k-최근접이웃
Q3.3의사결정트리
Q3.4선형회귀
Q3.5평가지표
Q3.6저수지샘플링
Q3.7확률문제
Q3.8해시테이블과분산프로그래밍문제
Q3.9그래프문제
Q3.10문자열문제
Q3.11배열문제

4장ML시스템설계1-추천시스템
Q4.1시스템목적
Q4.2시스템지표
Q4.3추천콘텐츠유형
Q4.4추천콘텐츠혼합
Q4.5시스템운영매개변수
Q4.6시스템구성요소
Q4.7콜드스타트문제
Q4.8데이터셋유형
Q4.9데이터셋수집기법
Q4.10데이터셋편향
Q4.11서빙편향완화
Q4.12위치편향완화
Q4.13추천후보출처
Q4.14추천후보생성단계
Q4.15추천후보생성알고리즘
Q4.16임베딩기술
Q4.17대규모추천시스템의후보스코어링
Q4.18신규콘텐츠색인화
Q4.19추천후보병합및정리
Q4.20사전랭킹모델학습
Q4.21사전랭킹모델평가지표
Q4.22사전랭킹모델알고리즘
Q4.23사전랭킹모델최적화
Q4.24랭킹모델주요피처
Q4.25텍스트또는ID기반피처
Q4.26횟수기반피처
Q4.27헤비랭킹모델학습
Q4.28헤비랭킹모델알고리즘
Q4.29랭킹모델아키텍처
Q4.30랭킹모델예측값보정
Q4.31랭킹모델평가지표
Q4.32다중작업모델과개별모델
Q4.33모델서빙시스템
Q4.34캐싱
Q4.35모델업데이트
Q4.36온라인실험
Q4.37모델로드
Q4.38모델실험고려사항
Q4.39오프라인평가지표
Q4.40온라인성능저하

5장ML시스템설계2-응용
Q5.1문서파싱
Q5.2감성분석
Q5.3토픽모델링기법
Q5.4문서요약
Q5.5자연어이해
Q5.6지도학습레이블
Q5.7비지도학습피처
Q5.8판별적문제피처
Q5.9생성모델피처
Q5.10정보추출모델구축
Q5.11정보추출평가지표
Q5.12분류모델구축
Q5.13회귀모델구축
Q5.14토픽할당
Q5.15토픽모델링평가지표
Q5.16문서클러스터링모델구축
Q5.17클러스터링평가지표
Q5.18텍스트생성모델구축
Q5.19텍스트생성평가지표
Q5.20모델링워크플로
Q5.21오프라인예측

6장ML인프라설계
Q6.1모델개발가속화
Q6.2모델학습가속화
Q6.3모델학습분산
Q6.4모델학습파이프라인평가
Q6.5분산학습오류
Q6.6모델업데이트
Q6.7모델최적화
Q6.8서빙시스템구성요소
Q6.9서빙시문제
Q6.10피처수화개선
Q6.11지연시간개선
Q6.12많은요청처리하기
Q6.13서빙시모델업데이트
Q6.14모델배포와롤백
Q6.15서버모니터링
Q6.16서빙시성능저하

7장고급ML문제
Q7.1지연된레이블
Q7.2레이블없이학습하기
Q7.3가격모델

부록A생성모델:노이지채널모델에서LLM까지
A.1기계번역(MT)
A.2자동음성인식(ASR)
A.3트랜스포머로의수렴
A.4현실의과제를위한미세조정

참고자료
찾아보기

출판사 서평

아마존과트위터,AI스타트업을거친베테랑면접관이자
ML엔지니어가제시하는성공적인ML면접을위한노하우

ML면접을앞둔지원자라면어떤역량을개발해야할지,어떤주제를중점으로학습해야할지,답변할때무엇을고려해야할지등고민이많을겁니다.이책은ML분야취업에필요한역량정리부터실무중심의탄탄한문제해결전략,최신기술을반영한부록과참고자료까지제공합니다.

첫째,ML분야취업에꼭필요한실무워크플로핵심지식
FAANG을비롯한빅테크기업의ML면접에서자주묻는질문194가지를담았습니다.간결한질문과키워드중심의명쾌한답변으로구성되어있어면접에앞서내용을정리하는데유용합니다.이해를돕기위해어려운개념이나모호한표현에는풍부한역자주를더했습니다.

둘째,기본부터심화문제까지대비하기위한단계별지침
다섯가지면접세션(ML기본지식-ML코딩-ML시스템설계-ML인프라설계-고급ML문제)으로구성되어있어각자지원하는포지션과난이도,필요에따라내용을찾아보기쉽습니다.

셋째,핵심키워드중심으로강력한답변을구성하는전략
질문에관한핵심키워드를뽑아내고,여러가지접근방식을비교하고,장단점과트레이드오프를논하는등ML면접에서높은점수를얻기위한답변구성전략을소개합니다.

넷째,실제시나리오기반의실무중심문제해결방식
ML수명주기전반에걸친실용적인개념과시나리오를다루므로면접을준비하는구직자뿐아니라숙련된실무자가기본기를확실히다지는데도움이됩니다.

이책이필요한독자

-ML관련직군을희망하는취업준비생
-ML분야에서경쟁력을높이고싶은실무자