데이터 분석을 떠받치는 수학(개정판)

엑셀과 수학, 통계로 배우는 데이터 과학의 기술

데이터 분석을 위한 첫 걸음을 도와드립니다!

이 책은 데이터 분석을 하고 싶지만 어디서 어떻게 시작할지를 모르는 사람과 관련 수학 지식이 부족해 어려워하는 사람을 위해 압축, 분류, 예측 알고리즘 중에 가장 많이 사용되는 알고리즘을 골라 엑셀만으로 충분히 이해할 수 있도록 구성했다. 엑셀은 데이터 관리 및 분석에 특화된 최고의 도구로 R이나 파이썬 같이 설치가 필요한 데이터 분석 프로그램과 달리 대부분의 컴퓨터에 기본으로 설치돼 있어 간편하게 사용할 수 있다.

실습 예제로는 데이터 분석 입문할 때 가장 많이 사용되는 보스턴 주택 가격 데이터를 이용한 다중 선형 회귀 분석과 주성분 분석을 통해 주택 가격을 예측해 보면서 실제 데이터 분석이 어떻게 진행되는지 체험할 수 있다.

이 책으로 차근차근 실습을 진행한다면 압축, 분류, 예측 알고리즘에 대해 충분히 이해할 수 있을 것이다. 학습한 내용을 바탕으로 경험을 쌓는다면 멋진 데이터 과학자가 될 수 있을 것이다.

 

도서 상세 이미지

손민규

소니 반도체에서 데이터 분석을 활용한 알고리즘 및 시스템 개발 업무를 했다. 현재 삼성전자에서 관련 데이터 분석 업무를 하고 있으며 사원을 대상으로 통계 알고리즘 강의를 진행했다. 일본 규슈대학교에서 인공지능의 한 분야인 Reinforcement Learning 알고리즘 개발로 박사학위를 받았으며 관심 분야는 Reinforcement Learning, Neural Network, Genetic Algorithm 등 Machine Learning Algorithm을 활용한 시스템 개발이다.

저서로는 『기초부터 시작하는 강화학습/신경망 알고리즘(2019)』과 『데이터 분석을 떠받치는 수학(2018)』이 있으며 『정석으로 배우는 딥러닝(2017)』을 감수하였고 『가장 쉬운 딥러닝 입문 교실(2018), 실전! 딥러닝(2019)』을 번역하였다.

  • ▣ 01장: 데이터 분석이란?
    • 1.1 데이터 분석 프로세스
      • 1.1.1 문제 정의
      • 1.1.2 데이터 수집
      • 1.1.3 데이터 분석
      • 1.1.4 검증 및 고찰
    • 1.2 데이터 분석 알고리즘의 특징과 종류
    •  
  • ▣ 02장: 데이터 분석을 위한 기초
    • 2.1 기초 통계량
      • 2.1.1 평균
      • 2.1.2 중앙값
      • 2.1.3 최빈값
      • 2.1.4 최댓값, 최솟값, 범위
    • 2.2 분산과 표준편차
      • 2.2.1 표준오차
      • 2.2.2 분산
      • 2.2.3 표준편차
      • 2.2.4 모집단의 개수와 표본집단의 개수
      • 2.2.5 엑셀로 분산과 표준편차를 계산하는 방법
      • 2.2.6 정규분포
      • 2.2.7 정규분포를 이용한 이상점 검출
    • 2.3 데이터 표준화
    • 2.4 공분산과 상관계수
      • 2.4.1 공분산
      • 2.4.2 상관계수
    • 2.5 행렬
      • 2.5.1 정방행렬
      • 2.5.2 영행렬
      • 2.5.3 대각행렬과 단위행렬
      • 2.5.4 삼각행렬
      • 2.5.5 전치행렬
    • 2.6 행렬 연산
      • 2.6.1 행렬의 덧셈과 뺄셈
      • 2.6.2 행렬의 곱셈
      • 2.6.3 공분산 행렬과 상관행렬
      • 2.6.3 역행렬
    • 2.7 데이터 분석과 행렬
      • 2.7.1 연립 방정식과 행렬
      • 2.7.2 좌표변환과 행렬
    • 2.8 미분과 편미분
      • 2.8.1 미분
      • 2.8.2 편미분
    •  
  • ▣ 03장: 압축 기법: 주성분분석
    • 3.1 주성분분석 개요
    • 3.2 주성분분석 실습
      • Step 0 데이터 표준화
      • Step 1 상관행렬을 구한다
      • Step 2 상관행렬의 고윳값, 고유벡터를 구한다
      • Step 3 고유벡터를 이용해 표준화된 데이터를 주성분 공간으로 이동시킨다
    • 3.3 주성분분석 활용
      • 3.3.1 차원축소
      • 3.3.2 데이터 분석
    •  
  • ▣ 04장: 분류 기법: 마할라노비스 -다구찌 시스템
    • 4.1 개요
    • 4.2 MTS 분석 실습
      • 4.2.1 모델 구축
      • 4.2.2 모델 활용(이상 감지)
    • 4.3 역행렬을 이용한 MTS 구축
      • 4.3.1 모델 구축
      • 4.3.2 모델 활용(이상 감지)
    •  
  • ▣ 05장: 예측기법: 회귀 분석
    • 5.1 선형회귀분석
      • 5.1.1 단순 선형 회귀
      • 5.1.2 다중회귀
    • 5.2 주성분회귀분석
      • 5.2.1 데이터 표준화
      • 5.2.2 상관행렬 계산
      • 5.2.3 고윳값, 고유벡터 계산
      • 5.2.4 좌표변환
      • 5.2.5 다중회귀 계산
      • 5.2.6 변환행렬 A 계산
    • 5.3 부분최소제곱법 분석
      • 5.3.1 데이터 표준화
      • 5.3.2 가중치 행렬 W 계산
      • 5.3.3 잠재변수 T 계산
      • 5.3.4 다중회귀 계산
      • 5.3.5. 표준화 회귀계수 계산
      • 5.3.6 회귀계수 계산
    •  
  • ▣ 06장: 데이터 분석 실습
    • 6.1 보스턴 주택 가격 데이터
    • 6.2 다중 선형 회귀 분석
    • 6.3 주성분 분석을 이용한 특징 선택