지능형 웹 알고리즘

지능형 웹 서비스 개발을 위한 머신러닝, 통계 분석, 신경망, 딥러닝 알고리즘과 추천엔진 구축

《지능형 웹 알고리즘》 제2판은 사용자, 웹 애플리케이션, 웹 사이트 로그에서 수집한 데이터를 처리하고 가공하고 분석하는 머신러닝 애플리케이션을 구축하는 방법을 가르쳐 준다. 완전히 개정된 이 개정판에서는 데이터에서 실제 가치를 뽑아내는 지능형 알고리즘을 살펴본다. 또한 머신러닝의 주요 개념을 파이썬 사이킷런(scikit-learn)으로 작성된 코드 예제와 함께 설명하고, 웹에서 흘러 들어오는 데이터를 포착하고 저장하고 구조화하는 알고리즘을 안내한다. 나아가 추천 엔진을 탐구하고 통계적 알고리즘, 신경망, 딥러닝을 통해 분류에 대해 자세히 알아본다.

★ 이 책에서 다루는 내용 ★

  • 머신러닝 소개
  • 데이터 구조 추출
  • 딥러닝과 신경망
  • 추천 엔진의 작동 원리

 

도서 상세 이미지

더글라스 매킬레이스 (Douglas McIlwraith)

더글라스 매킬레이스 박사는 캠브리지 대학에서 컴퓨터 과학을 전공했으며 왕립 런던 대학에서 박사 학위를 취득했다. 현재 런던 소재의 광고 네트워크 회사에서 데이터 과학자로 일하고 있는 머신러닝 전문가이다. 분산 시스템, 유비쿼터스 컴퓨팅, 퍼베이시브 센싱 그리고 로보틱스 및 보안 분야에 대한 연구에 기여했으며, 기술이 인간의 삶에 긍정적인 영향을 줄 때 열광하는 사람이다.

하라람보스 마르마니스 (Haralambos Marmanis)

하라람보스 마르마니스 박사는 산업 솔루션에 머신러닝 기술을 채택하는 데 있어 개척자이다. 소프트웨어 전문 개발자로서 25년간 일해 왔다.

드미트리 바벤코 (Dmitry Babenko)

드미트리 바벤코는 은행, 보험, 공급사슬망 관리, 비즈니스 인텔리전스 회사들을 위해 다양한 애플리케이션과 인프라 프레임워크를 설계하고 구축했다. 벨라루스 국립 정보/무선전자 대학교에서 컴퓨터 과학 석사 학위를 받았다.

김광일

한국과학기술원 경영과학과에서 수학적 알고리즘을 경제학의 수리 모델에 적용한 논문으로 석사학위를 받았다. 졸업 후 금성사(지금의 LG전자)에 입사해 소프트웨어를 개발했다. 이후 몇몇 소프트웨어 개발 회사를 경영하기도 했으며, 경영 활동을 하는 동안 대학에서 강의를 하기도 했다. 수년 전 한 중소기업의 연구소에서 딥러닝을 연구하기 시작한 것을 계기로 딥러닝 연구에 몰두하면서, 현재는 경희대학교 대학원과 한국외국어대학교에서 머신러닝 및 딥러닝을 강의하고 있으며, 차세대 챗봇(Chatbot) 개발 프로젝트에 초청 전문가로 참여하고 있다.

  • ▣ 01장: 지능형 웹을 위한 애플리케이션 구축
    • 1.1 실제 사용 중인 지능형 알고리즘: 구글 나우
    • 1.2 지능형 알고리즘의 라이프 사이클
    • 1.3 지능형 알고리즘의 다른 예들
    • 1.4 지능형 애플리케이션이 아닌 것들
      • 1.4.1 지능형 알고리즘은 만능으로 생각할 수 있는 기계가 아니다
      • 1.4.2 지능형 알고리즘은 편리한 인간 대체품이 아니다
      • 1.4.3 지능형 알고리즘은 우연히 발견된 것이 아니다
    • 1.5 지능형 알고리즘의 분류
      • 1.5.1 인공지능
      • 1.5.2 머신러닝
      • 1.5.3 예측분석
    • 1.6 지능형 알고리즘의 성능 평가
      • 1.6.1 지능 평가
      • 1.6.2 예측 평가
    • 1.7 지능형 알고리즘에 관한 중요 사항
      • 1.7.1 데이터는 신뢰할 수 없다
      • 1.7.2 추론은 즉시 생기지 않는다
      • 1.7.3 크기가 중요하다!
      • 1.7.4 알고리즘이 다르면 확장 방식이 달라진다
      • 1.7.5 모든 문제가 못은 아니다
      • 1.7.6 데이터가 전부는 아니다
      • 1.7.7 학습 시간은 변동적이다
      • 1.7.8 일반화하는 일을 목표로 삼는다
      • 1.7.9 인간의 직관에는 문제가 있다
      • 1.7.10 새로운 특징을 뽑아 낼 생각을 하라
      • 1.7.11 다양한 모델을 학습하라
      • 1.7.12 상관관계와 인과관계는 같지 않다
    • 1.8 요약
    •  
  • ▣ 02장: 군집화와 변환을 통한 데이터 구조 추출
    • 2.1 데이터, 구조, 편향 및 잡음
    • 2.2 차원의 저주
    • 2.3 k 평균
      • 2.3.1 k 평균 실행
    • 2.4 가우스 혼합모형
      • 2.4.1 가우스 분포란?
      • 2.4.2 기댓값 최대화와 가우스 분포
      • 2.4.3 가우스 혼합모형
      • 2.4.4 가우스 혼합모형을 이용한 학습의 예
    • 2.5 k 평균과 가우스 혼합모형 간의 관계
    • 2.6 데이터 축 변환
      • 2.6.1 고유벡터와 고윳값
      • 2.6.2 주성분 분석
      • 2.6.3 주성분 분석의 예
    • 2.7 요약
    •  
  • ▣ 03장: 콘텐츠 추천
    • 3.1 장면 설정: 온라인 영화 사이트
    • 3.2 거리 및 유사도
      • 3.2.1 거리와 유사도에 대한 심층 탐구
      • 3.2.2 최선의 유사도 공식은?
    • 3.3 추천 엔진은 어떻게 동작하는가?
    • 3.4 사용자 기반 협업 필터링
    • 3.5 특잇값 분해를 이용한 모델 기반 추천
      • 3.5.1 특잇값 분해
      • 3.5.2 특잇값 분해를 이용한 추천: 사용자에 대한 영화 선택
      • 3.5.3 특잇값 분해를 이용한 추천: 주어진 영화에 대한 사용자 선정
    • 3.6 넷플릭스 현상 공모
    • 3.7 추천기 평가
    • 3.8 요약
    •  
  • ▣ 04장: 분류 - 사물을 속한 곳에 갖다 놓기
    • 4.1 분류의 필요성
    • 4.2 분류기의 개요
      • 4.2.1 구조적 분류 알고리즘
      • 4.2.2 통계적 분류 알고리즘
      • 4.2.3 분류기의 수명주기
    • 4.3 로지스틱 회귀를 사용한 부정행위 탐지
      • 4.3.1 선형 회귀 입문
      • 4.3.2 선형 회귀에서 로지스틱 회귀로
      • 4.3.3 부정행위 탐지 구현
    • 4.4 결과를 믿을 만한가?
    • 4.5 대규모 데이터셋을 사용한 분류
    • 4.6 요약
    •  
  • ▣ 05장: 사례 연구 - 온라인 광고를 위한 클릭 예측
    • 5.1 역사및 배경
    • 5.2 광고거래소
      • 5.2.1 쿠키 일치
      • 5.2.2 입찰
      • 5.2.3 낙찰 또는 패찰 통지
      • 5.2.4 광고 지면
      • 5.2.5 광고 모니터링
    • 5.3 입찰기는 무엇인가?
      • 5.3.1 입찰기 요건
    • 5.4 의사결정 엔진이란?
      • 5.4.1 사용자 정보
      • 5.4.2 광고 지면 정보
      • 5.4.3 상황 정보
      • 5.4.4 데이터 준비
      • 5.4.5 의사결정 엔진 모델
      • 5.4.6 예측된 클릭률을 입찰 가격으로 매핑
      • 5.4.7 특징 공학
      • 5.4.8 모델 훈련
    • 5.5 보우팔 왜빗을 사용한 클릭 예측
      • 5.5.1 보우팔 왜빗 데이터 형식
      • 5.5.2 데이터셋 준비
      • 5.5.3 모델 테스트
      • 5.5.4 모델 보정
    • 5.6 의사결정 엔진 구축의 복잡성
    • 5.7 실시간 예측의 미래
    • 5.8 요약
    •  
  • ▣ 06장: 딥러닝과 신경망
    • 6.1 딥러닝에 대한 직관적 접근방법
    • 6.2 신경망
    • 6.3 퍼셉트론
      • 6.3.1 훈련
      • 6.3.2 사이킷런으로 퍼셉트론 훈련시키기
      • 6.3.3 두 개의 입력을 위한 퍼셉트론의 기하학적 해석
    • 6.4 다층 퍼셉트론
      • 6.4.1 역전파를 이용한 학습
      • 6.4.2 활성화 함수
      • 6.4.3 역전파의 이면을 직관하기
      • 6.4.4 역전파 이론
      • 6.4.5 사이킷런에서 MLNN
      • 6.4.6 학습된 다층 퍼셉트론
    • 6.5 더 깊은 곳으로: 다층 신경망에서 딥러닝으로
      • 6.5.1 제한 볼츠만 머신
      • 6.5.2 베르누이 제한 볼츠만 머신
      • 6.5.3 실제의 RBM류
    • 6.6 요약
    •  
  • ▣ 07장: 적절한 선택
    • 7.1 A/B 테스트
      • 7.1.1 이론
      • 7.1.2 코드
      • 7.1.3 A/B의 적합성
    • 7.2 MAB
      • 7.2.1 MAB 전략
    • 7.3 실무에서의 베이즈 밴딧
    • 7.4 A/B 대 베이즈 밴딧
    • 7.5 MAB 확장
      • 7.5.1 상황적 밴딧
      • 7.5.2 적대적 밴딧
    • 7.6 요약
    •  
  • ▣ 08장: 지능형 웹의 미래
    • 8.1 지능형 웹의 미래 응용
      • 8.1.1 사물 인터넷
      • 8.1.2 홈 헬스케어
      • 8.1.3 자율 주행 자동차
      • 8.1.4 개인화된 물리적 광고
      • 8.1.5 시맨틱 웹
    • 8.2 지능형 웹의 사회적 함의
    •  
  • ▣ 부록
    • 동기부여를 위한 예: 온라인 광고 노출
    • 데이터 수집: 나이브한 접근방법
    • 대규모 수집 데이터 관리
    • 카프카에 대한 평가: 대규모 데이터 수집
    • 카프카의 설계 유형