돈 되는 파이썬 인공지능 프로그래밍

회사 매출을 올리는 AI 도입과 활용법

내방 고객 수, 주말 수요, 상품 추천…등의 인공지능 기술로 영업과 마케팅이 완전히 새로워진다!
업무에 유용하고 매출에 도움이 되는 진짜 ‘쓸모 있는 AI’를 직접 만들어 보자!

업무에 유용한 ‘쓸모 있는 AI’를 만들려면 ‘업무를 보는 안목’과 ‘기술을 보는 안목’이 함께 필요하다. 업무에서 개선이 필요한 부분을 파악하고 그 개선 방안을 도출하는 ‘업무를 보는 안목’은 기존 IT 시스템 도입에도 필요한 능력이었지만, AI를 구축하려면 여기에 더해 업무 개선 방안을 AI를 이용해 구현 가능한지 판단하는 ‘기술을 보는 안목’이 필요하다. 이 책과 함께하는 파이썬 실습을 통해 ‘AI 기술을 보는 안목’을 키워 실질적으로 도움이 되는 유용한 AI를 직접 만들어 볼 수 있다.

  • 수식 없이도 알고리즘 선택과 모델 튜닝
  • 현장의 눈으로 AI를 최적화
  • 웹 브라우저만 있으면 사용할 수 있는 파이썬 실습 환경(Google Colab)
  • XGBoost, Prophet 등 화제의 AI 기술 활용
  • 예제 코드 전체를 Google Colab에서 사용할 수 있는 노트북으로 제공

 

도서 상세 이미지

★ 이 책에서 다루는 내용

- 다섯 가지 사례를 통해 실전 AI 개발 방법을 익힌다
영업 성공률이 높은 고객을 추려내는 등의 다섯 가지 실무와 밀접한 업무를 대상으로 파이썬을 이용해 AI를 직접 구현한다. AI를 만드는 법과 AI로 어떤 일을 할 수 있는지 구체적으로 익힌다.

- 적용 대상 업무 선택부터 구현까지 혼자 해낼 수 있다
이 책을 읽으면 현장의 도메인 전문가 역할은 물론이고 간단한 수준이라면 AI 구현을 직접 할 수 있다. 데이터 사이언티스트와 같은 전문가를 필요로 했던 기존과 비교해, 개념 검증 수준의 구현 검증 주기를 훨씬 빠르게 할 수 있다. ‘AI 프로젝트를 보는 안목’ 또한 기를 수 있다.

- AI 개발의 다섯 가지 주요 개발 단계를 설명한다
‘데이터 확인’부터 ‘튜닝’까지 파이썬 코드를 직접 실행해보며 AI 개발의 주요 다섯 단계를 자세히 설명한다. 그중에서도 AI가 도출한 결과를 평가하는 ‘평가’ 단계가 매우 중요하다. 단순히 정답을 맞힌 비율인 ‘정확도’ 외에 ‘정밀도’, ‘재현율’ 등 다양한 평가지표를 용도에 맞춰 사용하며 AI를 업무에 활용할 수 있게 한다.

- 수학적 지식이 없어도 AI를 이용할 수 있다
AI 알고리즘의 구체적인 내용을 몰라도 모델을 최적화할 수 있다. 알고리즘의 역치를 조금 변경하는 정도로도 예측 결과에서 ‘영업 성공률이 높은 고객’의 수를 원하는 대로 조절할 수 있다. 이런 식으로 AI 모델을 자유롭게 활용하는 여러 가지 테크닉을 제공한다.

- 웹 브라우저만 있어도 파이썬 코드를 실행할 수 있다
복잡한 환경 설정 없이 웹 브라우저에서 곧바로 파이썬 코드를 실행할 수 있다. 구글에서 제공하는 클라우드 서비스인 Google Colab에서 사용할 수 있는 노트북 파일 형태로 예제 코드를 제공하기 때문이다. 예측 결과나 분석 결과를 그래프나 표로 일목요연하게 출력할 수 있다.

아카이시 마사노리

1985년 도쿄대학 공학부 계수공학과 졸업. 1987년 동 대학원 석사 과정 수료 후, 일본 IBM에 입사해 도쿄기초연구소에서 수식 처리 시스템 연구 개발에 종사. 1993년 SE 부문으로 이동, 개방형 시스템 인프라 설계 구축 및 애플리케이션 설계를 담당. 2013년 스마터 시티 사업 참여, 2016년 이후 왓슨 사업부 근무. 현재는 왓슨 스튜디오 등 데이터사이언스 계통 제품의 기술 영업에 종사. 교토정보대학원대학교 객원교수. 저서로 《최단 코스로 배우는 딥러닝 수학》(닛케이BP), 《현장에서 바로 쓰는 파이썬 자연언어처리 입문》(쇼에이샤), 《왓슨 스튜디오로 시작하는 머신러닝, 딥러닝》(릭텔레콤) 등이 있다.

심효섭

연세대학교 문헌정보학과를 졸업하고 모교 중앙도서관과의 인연으로 도서관 솔루션 업체에서 일하면서 개발을 시작했다. 네이버에서 웹 서비스 개발 업무를 맡았으며, 웹 서비스 외에 머신러닝에 대한 공부도 꾸준히 하고 있다. 최근 관심사는 회사에 속하지 않고도 지속 가능한 삶이다. 옮긴 책으로 『도메인 주도 설계 철저 입문』 『Vue.js 철저 입문』 『도커/쿠버네티스를 활용한 컨테이너 개발 실전 입문』 『PyTorch를 활용한 강화학습/심층강화학습 실전 입문』 『PyTorch를 활용한 머신러닝, 딥러닝 철저 입문』 등이 있다.

  • ▣ 01장: 업무와 머신러닝 프로젝트
    • 1.1 이 책의 목적
    • 1.2 머신러닝 프로젝트의 주요 역할 및 대상 독자
    • 1.3 머신러닝 개발 프로세스
    • 1.4 앞으로 도메인 전문가에게 필요하게 될 스킬
    • 1.5 이 책의 구성
    •  
  • ▣ 02장: 머신러닝 모델의 처리 패턴
    • 2.1 AI와 머신러닝의 관계
    • 2.2 머신러닝의 세 가지 학습 방식
    • 2.3 지도 학습에 속하는 처리 패턴
      • 2.3.1 분류
      • 2.3.2 회귀
      • 2.3.3 시계열 분석
    • 2.4 비지도 학습에 속하는 처리 패턴
      • 2.4.1 연관 분석
      • 2.4.2 클러스터링
      • 2.4.3 차원축소
    • 2.5 처리 패턴을 선택하는 방법
    • 2.6 딥러닝과 구조화/비구조화 데이터
    •  
  • ▣ 03장: 머신러닝 모델을 개발하는 순서
    • 3.1 모델을 개발하는 순서
    • 3.2 예제에 사용할 데이터와 모델의 목적
      • 3.2.1 예제에 사용할 데이터
      • 3.2.2 모델의 목적
    • 3.3 모델 구현하기
      • 3.3.1 (1) 데이터 읽어 들이기
      • 3.3.2 (2) 데이터 확인
      • 3.3.3 (3) 데이터 전처리
      • 3.3.4 (4) 데이터 분류
      • 3.3.5 (5) 알고리즘 선택하기
      • 3.3.6 (6) 학습
      • 3.3.7 (7) 예측
      • 3.3.8 (8) 평가
      • 3.3.9 (9) 튜닝
    •  
  • ▣ 04장: 머신러닝 모델 개발의 중요 포인트
    • 4.1 데이터 확인
      • 4.1.1 수치적·통계적으로 분석하는 방법
      • 4.1.2. 시각적인 분석 및 데이터 확인 방법
    • 4.2 데이터 전처리
      • 4.2.1 불필요한 필드 삭제하기
      • 4.2.2 누락 값 처리하기
      • 4.2.3 이진 레이블값 필드를 숫자 값 필드로 만들기
      • 4.2.4 다중 레이블값 필드를 숫자 값 필드로 만들기
      • 4.2.5 데이터 정규화
      • 4.2.6 그 외 데이터 전처리 기법
    • 4.3 알고리즘 선택하기
      • 4.3.1 대표적인 분류 알고리즘과 특징
      • 4.3.2 예제 코드에서 사용할 데이터
      • 4.3.3 로지스틱 회귀
      • 4.3.4 서포트 벡터 머신 (커널)
      • 4.3.5 신경망 알고리즘
      • 4.3.6 결정 트리
      • 4.3.7 랜덤 포레스트
      • 4.3.8 XGBoost
      • 4.3.9 알고리즘을 선택하는 방법
    • 4.4 평가
      • 4.4.1 혼동행렬
      • 4.4.2 정확도, 정밀도, 재현율, F-점수
      • 4.4.3 확률값과 역치
      • 4.4.4 PR 곡선과 ROC 곡선
      • 4.4.5 입력 필드의 중요도
      • 4.4.6 회귀 모델을 평가하는 방법
    • 4.5 튜닝
      • 4.5.1 알고리즘 선택하기
      • 4.5.2 하이퍼파라미터 최적화
      • 4.5.3 교차 검증법
      • 4.5.4 그리드 서치
      • 4.5.5 그 외의 튜닝 기법
    •  
  • ▣ 05장: 업무의 요구 조건과 처리 패턴
    • 5.1 영업 성공 예측(분류)
      • 5.1.1 처리 패턴에 적합한 업무 분야
      • 5.1.2 예제 데이터의 설명 및 유스케이스
      • 5.1.3 모델의 개요
      • 5.1.4 데이터 읽어 들이기부터 데이터 확인까지
      • 5.1.5 데이터 전처리 및 데이터 분할
      • 5.1.6 알고리즘 선택하기
      • 5.1.7 학습, 예측, 평가 단계
      • 5.1.8 튜닝
      • 5.1.9 중요도 분석
    • 5.2 날씨를 이용한 매출 예측 (회귀)
      • 5.2.1 처리 패턴에 적합한 업무 분야
      • 5.2.2 예제 데이터의 설명 및 유스케이스
      • 5.2.3 모델의 개요
      • 5.2.4 데이터 읽어 들이기부터 데이터 확인까지
      • 5.2.5 데이터 전처리와 데이터 분할
      • 5.2.6 알고리즘 선택하기
      • 5.2.7 학습 및 예측
      • 5.2.8 평가
      • 5.2.9 튜닝
      • 5.2.10 중요도 분석
    • 5.3 계절 등 주기성 필드로 매출 예측하기 (시계열 분석)
      • 5.3.1 처리 패턴에 적합한 업무 분야
      • 5.3.2 예제 데이터에 대한 설명 및 유스케이스
      • 5.3.3 모델의 개요
      • 5.3.4 데이터 읽어 들이기부터 데이터 확인까지
      • 5.3.5 데이터 전처리와 데이터 분할
      • 5.3.6 알고리즘 선택하기
      • 5.3.7 학습 및 예측
      • 5.3.8 평가
      • 5.3.9 튜닝 (1단계)
      • 5.3.10 튜닝 (2단계)
      • 5.3.11 회귀와 시계열 분석 처리 패턴의 용도
    • 5.4 추천 상품 제안 (연관 분석)
      • 5.4.1 처리 패턴에 적합한 업무 분야
      • 5.4.2 예제 데이터의 설명 및 유스케이스
      • 5.4.3 모델의 개요
      • 5.4.4 데이터 읽어 들이기부터 데이터 확인까지
      • 5.4.5 데이터 전처리
      • 5.4.6 알고리즘 선택 및 분석
      • 5.4.7 튜닝
      • 5.4.8 관계 그래프 시각화하기
      • 5.4.9 고급 연관 분석
    • 5.5 계층별 고객 판매 전략 (클러스터링, 차원 축소)
      • 5.5.1 처리 패턴에 적합한 업무 분야
      • 5.5.2 예제 데이터의 설명 및 유스케이스
      • 5.5.3 모델의 개요
      • 5.5.4 데이터 읽어 들이기부터 데이터 확인까지
      • 5.5.5 클러스터링
      • 5.5.6 클러스터링 결과 분석
      • 5.5.7 차원축소
      • 5.5.8 차원축소를 활용하는 방법
    •  
  • ▣ 06장: AI 프로젝트를 성공시키기 위한 프로젝트 초기 요령
    • 6.1 머신러닝 적용 분야 선택하기
      • 6.1.1 처리 패턴과 적합한 업무 분야
      • 6.1.2 지도 학습의 생명은 정답 데이터
      • 6.1.3 AI는 정확도 100%를 달성할 수 없다
    • 6.2 업무 데이터 수집 및 확인
      • 6.2.1 데이터의 소재 파악
      • 6.2.2 타 부서의 데이터 협조 구하기
      • 6.2.3 데이터의 품질
      • 6.2.4 원-핫 인코딩 문제
    •  
  • ▣ 부록1: Google Colaboratory 기본 사용법
    •  
  • ▣ 부록2: 머신러닝을 위한 파이썬 입문 - 부록 2.1 넘파이 입문 - 부록 2.2 판다스 입문 - 부록 2.3 matplotlib 입문