실전! 프로젝트로 배우는 딥러닝 컴퓨터비전 (ebook)
28,000원
중급
도서 소개
《실전! 컴퓨터비전을 위한 머신러닝》은 머신러닝 모델을 활용해 이미지에서 정보를 추출하는 법을 알려주는 실용적인 책이다. 머신러닝(ML) 엔지니어와 데이터 사이언티스트는 검증된 ML 기법으로 이미지 분류, 객체 검출, 오토인코더, 이미지 생성, 계수, 캡션 생성 등의 다양한 이미지 문제를 해결하는 법을 배울 수 있다. 데이터셋을 만드는 것부터 시작해서 전처리, 모델 설계, 훈련, 검증, 배포, 해석가능성까지, 딥러닝의 모든 과정에 관한 훌륭한 소개가 담겨 있다.
구글의 엔지니어인 3명의 저자는 유연하고 지속가능한 방식의 강건한 ML 아키텍처를 사용해 정확하고 설명 가능한 컴퓨터 비전 ML 모델을 개발하고 대규모 프로덕션에 투입하는 법을 보여준다. 독자는 텐서플로와 케라스로 작성한 모델을 가지고 설계, 훈련, 검증, 예측하는 법을 배울 수 있다.
★ 이 책에서 다루는 내용 ★
- 컴퓨터비전 과업을 위한 ML 아키텍처를 설계
- 과업에 알맞는 모델(ResNet, SqueezeNet, EfficientNet 등)을 선택
- 모델을 훈련, 검증, 배포, 설명하는 전 구간 ML 파이프라인 만들기
- 이미지 전처리를 통해 데이터를 증강하고 학습 가능성을 향상
- 설명 가능성과 책임 있는 AI 모범 사례
- 이미지 모델을 웹 서비스 또는 에지 디바이스에 배포
- ML 모델을 모니터링하고 관리
도서 상세 이미지

저자 소개
발리아파 락슈마난 (Valliappa Lakshmanan)
구글 클라우드의 분석 및 인공지능 솔루션 디렉터로, 여러 비즈니스 부문을 관통하는 문제들을 해결하는 솔루션을 만든다. 머신러닝을 민주화하여 누구나 활용할 수 있게 하는 것을 사명으로 삼고 있다.
마틴 괴르너 (Martin Görner)
케라스/텐서플로의 제품 관리자다. 최첨단(state-of-the-art) 모델을 편리하게 활용할 수 있도록 개발자 경험을 개선하려 애쓴다. 과학, 기술, 코딩, 알고리즘과 관련한 모든 주제에 열정을 품고 있다.
라이언 길라드 (Ryan Gillard)
의료·헬스케어 분야의 연구자로 커리어를 시작했고, 지금은 구글 클라우드의 전문가 서비스(Professional Services) 조직의 AI 엔지니어로서 폭넓은 산업군에 적용되는 머신러닝 모델을 만든다. 신경과학 및 물리학 학위를 갖고 두 분야의 접점에서 일하면서, 수학을 통한 지적 탐험을 즐긴다.
역자 소개
최용
프로그래밍 책을 사면 소스 코드를 CD롬에 넣어주던 시절에 파이썬 책을 쓴 것을 시작으로, 컴퓨터 프로그래밍, 데이터 과학, IoT, 사이버 보안, 블록체인 분야의 책을 집필·번역했다. 최근작은 《Hello IT 파이썬을 제대로 활용해보려고 해》(패스트캠퍼스, 2022), 《파이썬 데이터 클리닝 쿡북》(위키북스, 2021) 등이다.
목차
- ▣ 01장: 컴퓨터비전을 위한 머신러닝
- 머신러닝
- 딥러닝 활용 사례
- 정리
- ▣ 02장: 컴퓨터비전에 쓰이는 ML 모델
- 기계 인식을 위한 데이터셋
- __5-Flowers 데이터셋
- __이미지 데이터를 읽기
- __이미지 데이터를 시각화
- __데이터셋 파일 읽기
- 케라스를 사용한 선형 모델
- __케라스 모델
- __모델 훈련 실습
- 케라스를 사용한 신경망
- __신경망
- __심층 신경망
- 정리
- 주요 용어
- ▣ 03장: 이미지 비전
- 미리 훈련된 임베딩
- __미리 훈련된 모델
- __전이학습
- __파인튜닝
- 컨볼루션망
- __컨볼루션 필터
- __컨볼루션 레이어 쌓기
- __풀링 레이어
- __알렉스넷(AlexNet)
- 깊게, 더 깊게
- __필터 분해
- __1×1 컨볼루션
- __VGG19
- __전역 평균 풀링
- 모듈식 아키텍처
- __인셉션(Inception)
- __스퀴즈넷(SqueezeNet)
- __레즈넷(ResNet)과 스킵 연결
- __덴스넷(DenseNet)
- __깊이 분리 가능 컨볼루션
- __엑셉션(Xception)
- 신경 아키텍처 검색(Neural Architecture Search) 설계
- __나스넷(NASNet)
- __모바일넷군
- 컨볼루션 너머: 트랜스포머 아키텍처
- 모델 고르기
- __성능 비교
- __앙상블
- __권장되는 전략
- 정리
- ▣ 04장: 객체 검출과 이미지 세분화
- 객체 검출
- __YOLO
- __레티나넷(RetinaNet)
- 세분화
- __마스크 R-CNN과 인스턴스 세분화
- __U-Net과 의미론적 세분화
- 정리
- ▣ 05장: 비전 데이터셋 만들기
- 이미지 수집
- __사진
- __이미징
- __개념 증명
- 데이터 타입
- __채널
- __지리 공간 데이터
- __오디오와 비디오
- 수동 라벨링
- __다중 라벨
- __객체 검출
- 대규모 라벨링
- __라벨링 UI
- __다중 과업
- __투표와 크라우드 소싱
- __라벨링 서비스
- 자동 라벨링
- __관련 데이터의 라벨
- __‘떠드는 학생’ 모델
- __자체 지도 학습
- 편향
- __편향의 원인
- __선택 편향
- __측정 편향
- __확증 편향
- __편향 감지
- 데이터셋 만들기
- __데이터 분할
- __텐서플로 레코드(TFRecord)
- __텐서플로 레코드 읽기
- 정리
- ▣ 06장: 전처리
- 전처리를 하는 이유
- __모양 변환
- __데이터 품질 개선
- __모델 품질 향상
- 크기와 해상도
- __케라스 전처리 레이어 사용
- __텐서플로 이미지 모듈 사용
- __케라스와 텐서플로를 혼용
- __모델 훈련
- 훈련-서빙 왜곡
- __함수 재사용
- __모델 내 전처리
- __tf.transform 사용
- __공간적 변환
- 색상 왜곡
- __정보 삭제
- 입력 이미지 형성
- 정리
- ▣ 07장: 훈련 파이프라인
- 효율적인 수집
- __데이터를 효율적으로 저장
- __병렬로 데이터 읽기
- __GPU 활용 극대화
- 모델 상태 저장
- __모델 익스포팅
- __체크포인팅
- 분배 전략
- __전략 선택
- __전략 만들기
- 서버리스 ML
- __파이썬 패키지 작성
- __훈련 작업 제출
- __하이퍼파라미터 튜닝
- __모델 배포
- 정리
- ▣ 08장: 모델 품질과 지속적인 평가
- 모니터링
- __텐서보드
- __가중치 히스토그램
- __디바이스 위치
- __데이터 시각화
- __훈련 이벤트
- 모델 품질 지표
- __분류를 위한 지표
- __회귀 지표
- __객체 검출 지표
- 품질 평가
- __슬라이스 평가
- __공정성 모니터링
- __지속적인 평가
- 정리
- ▣ 09장: 모델 예측
- 예측하기
- __모델 익스포팅
- __메모리 내 모델 사용
- __추상화 개선
- __효율성 향상
- 온라인 예측
- __텐서플로 서빙
- __서빙 함수 수정
- __이미지 바이트 처리
- 배치 예측과 스트림 예측
- __아파치 빔 파이프라인
- __배치 예측을 위한 관리형 서비스
- __온라인 예측 호출
- 에지 ML
- __제약 및 최적화
- __텐서플로 라이트
- __텐서플로 라이트 실행
- __이미지 버퍼 처리
- __연합 학습
- 정리
- ▣ 10장: 프로덕션 머신러닝 트렌드
- 머신러닝 파이프라인
- __파이프라인의 필요성
- __큐브플로 파이프라인 클러스터
- __코드베이스 컨테이너화
- __컴포넌트 작성
- __컴포넌트 연결
- __실행 자동화
- 설명 가능성
- __기법
- __설명 가능성 부여하기
- 노코드 컴퓨터비전
- __노코드를 사용하는 이유
- __데이터 로딩
- __훈련
- __평가
- 정리
- ▣ 11장: 고급 비전 문제
- 객체 측정
- __참조 객체
- __세분화
- __회전 수정
- __비율 및 측정
- 개수 세기
- __밀도 추정
- __패치 추출
- __입력 이미지 시뮬레이션
- __회귀
- __예측
- 포즈 추정
- __퍼슨랩
- __포즈넷 모델
- __여러 사람의 포즈를 식별
- 이미지 검색
- __분산 검색
- __빠른 검색
- __더 나은 임베딩
- 정리
- ▣ 12장: 이미지 및 텍스트 생성
- 이미지 이해
- __임베딩
- __보조 학습 과업
- __오토인코더
- __변분 오토인코더
- 이미지 생성
- __생성적 적대 네트워크
- __GAN 개선
- __이미지 대 이미지 변환
- __그림 수정(인페인팅)
- __이상 탐지
- __딥페이크
- 이미지 캡션 생성
- __데이터셋
- __캡션 토큰화
- __배치 처리
- __캡션 모델
- __훈련 루프
- __예측
- 정리