서브메뉴

본문

머신러닝·딥러닝 문제해결 전략 (캐글 수상작 리팩터링으로 배우는 문제해결 프로세스와 전략)
머신러닝·딥러닝 문제해결 전략 (캐글 수상작 리팩터링으로 배우는 문제해결 프로세스와 전략)
저자 : 신백균
출판사 : 골든래빗(주)
출판년 : 20220413
ISBN : 9791191905076

책소개

문제해결 방식에 정답은 없어도 패턴은 있습니다.

이 책에는 수많은 캐글 수상자의 노트북을 리팩터링하며 찾아낸 공통된 패턴이 담겨 있습니다. 이 책과 함께 체계적인 머신러닝·딥러닝 문제해결 프로세스를 숙달해보세요. 단순 따라하기에서 벗어나 어떤 점을 분석해야 하는지, 분석 결과를 어떻게 적용하는지, 이 기법이 왜 유용하고 어떻게 활용하는지까지 친절하게 알려드립니다. 기본이 몸에 익으면 새로운 문제가 주어져도 쉽게 응용할 수 있습니다. 엄선한 7가지 대회와 별책부록인 〈공략집〉을 통해 기본기와 문제해결 능력을 확실하게 길러드립니다.
[교보문고에서 제공한 정보입니다.]

출판사 서평

이 책은 수많은 캐글 수상자의 노트북을 수집/분석하여 여러분께 공통된 문제해결 패턴을 안내해줍니다. 총 7개의 경진대회를 이 패턴에 따라 함께 진행하면서 자연스럽게 효과적인 프로세스와 전략을 체득할 수 있게 꾸렸습니다.

머신러닝·딥러닝 문제를 하나 해결하려면 데이터 분석부터 시작하여 적합한 모델을 설계하고 최적화를 반복하는 긴 여정을 완주해야 합니다. 체계적인 프로세스를 따르더라도 몸에 익기 전까지는 도중에 길을 잃기 쉽다는 뜻입니다.

그래서 여러분이 외롭게 표류하지 않게끔 책 자체의 구성은 물론 외적으로도 여러 장치를 마련했습니다. 대표적으로 〈공략집〉과 〈미니맵〉, 〈체크리스트〉가 있습니다.

★ 공략집(with 미니맵)
공략집은 두꺼운 이 책을 초심자도 잘 따라 오실 수 있도록 안내하는 별책부록입니다.
월드맵(책의 전체 구성)과 미니맵(장별 구성)을 통해, 항상 숲을 보면서 나의 위치와 집중할 영역을 분명하게 알 수 있도록 도와드립니다. 저자 깃허브에서 최신 버전을 확인하실 수 있습니다.

★ 체크리스트
문제해결 과정에서 짚어봐야 할 사항들을 프로세스 단계별로 정리한 표입니다. 저자 깃허브에서 최신 버전을 확인하실 수 있습니다. 사본을 만드신 후 자유롭게 수정·개선하여 여러분만의 비밀 무기로 활용해주세요.

★ 책의 구성
이 책은 총 3부로 구성됩니다.

1부에서는 머신러닝·딥러닝 문제해결 역량을 키우는 데 캐글이 최적인 이유를 알아보고, 2부와 3부에서 본격적으로 대회를 공략하는 데 필요한 채비를 갖춥니다.

1장과 2장은 캐글 소개와 튜토리얼이니 캐글에 이미 익숙하신 분은 건너뛰어도 크게 상관없습니다. 3장은 중요합니다. 바로 이 책에서 반복 숙달할 문제해결 프로세스의 틀을 설명하기 때문입니다. 상위권 캐글러들의 공통된 패턴을 정리한 것이니 한 번씩 꼼꼼히 정리해보시면 좋을 것 같습니다. 4장은 데이터 유형을 나누고 각 유형에 유용한 시각화 기법들을 간단히 소개합니다.

2부에서는 머신러닝 모델을 사용하는 캐글 경진대회에 익숙해질 수 있습니다. 먼저 머신러닝의 주요 개념들을 정리해본 다음, 총 4개의 경진대회를 공략하면서 머신러닝 프로젝트 방법론을 터득하게 됩니다. 중점적으로 익힐 내용이 학습 흐름과 난이도에 맞춰 분배되도록 경진대회들을 선별해 배치했습니다. 2부부터는 본격적인 문제해결에 나서는 만큼 별책부록인 공략집의 미니맵이 큰 도움이 되리라 생각합니다.

마지막 3부에서는 비정형 데이터를, 그중에서도 이미지 데이터를 분류하는 딥러닝 문제들을 공략합니다. 전체적인 구성 방식은 2부와 같습니다. 대회를 하나하나 정복할수록 레벨업되는 느낌이 확실히 느껴지도록 구성했습니다.
[교보문고에서 제공한 정보입니다.]

목차정보

추천의 말
독자께 드리는 편지
이 책의 구성과 공략법

[1부] 머신러닝 레벨업의 지름길, 캐글
01장 왜 캐글인가?
__1.1 왜 캐글을 해야 하는가?
__1.2 캐글 구성요소
__1.3 캐글러 등급
__학습 마무리

02장 캐글 정복 첫걸음
__2.1 캐글 가입
__2.2 경진대회 참여
__2.3 주피터 노트북 설정
__2.4 결과 제출하기
__2.5 컨트리뷰터 되기
__2.6 예제 코드 캐글 노트북 복사하기
__학습 마무리

03장 문제해결 프로세스 및 체크리스트
__3.1 머신러닝 문제해결 프로세스
__3.2 머신러닝 문제해결 체크리스트
__3.3 딥러닝 문제해결 프로세스
__3.4 딥러닝 문제해결 체크리스트

04장 데이터를 한눈에 : 주요 시각화 그래프
__4.1 데이터 종류
__4.2 탐색적 데이터 분석과 그래프
__4.3 수치형 데이터 시각화
__4.4 범주형 데이터 시각화
__4.5 데이터 관계 시각화

[2부] 머신러닝 문제해결

05장 다시 살펴보는 머신러닝 주요 개념
__5.1 분류와 회귀
__5.2 분류 평가지표
__5.3 데이터 인코딩
__5.4 피처 스케일링
__5.5 교차 검증
__5.6 주요 머신러닝 모델
__5.7 하이퍼파라미터 최적화

06장 [경진대회] 자전거 대여 수요 예측 ★☆☆
__6.1 경진대회 이해
__6.2 경진대회 접속 방법 및 세부 메뉴
__6.3 탐색적 데이터 분석
__분석 정리 및 모델링 전략
__6.4 베이스라인 모델
__6.5 성능 개선 I : 릿지 회귀 모델
__6.6 성능 개선 II : 라쏘 회귀 모델
__6.7 성능 개선 III : 랜덤 포레스트 회귀 모델
__학습 마무리
__실전 문제

07장 [경진대회] 범주형 데이터 이진분류 ★★☆
__7.1 경진대회 이해
__7.2 탐색적 데이터 분석
__분석 정리 및 모델링 전략
__7.3 베이스라인 모델
__7.4 성능 개선 I
__7.5 성능 개선 II
__학습 마무리
__실전 문제

08장 [경진대회] 안전 운전자 예측 ★★☆
__8.1 경진대회 이해
__8.2 탐색적 데이터 분석
__분석 정리 및 모델링 전략
__8.3 베이스라인 모델
__8.4 성능 개선 I : LightGBM 모델
__8.5 성능 개선 II : XGBoost 모델
__8.6 성능 개선 III : LightGBM과 XGBoost 앙상블
__학습 마무리

09장 [경진대회] 향후 판매량 예측 ★★★
__9.1 경진대회 이해
__9.2 탐색적 데이터 분석
__분석 정리 및 모델링 전략
__9.3 베이스라인 모델
__9.4 성능 개선
__9.5 머신러닝 경진대회를 마치며
__학습 마무리

[3부] 딥러닝 문제해결

10장 다시 살펴보는 딥러닝 주요 개념
__10.1 인공 신경망
__10.2 합성곱 신경망(CNN)
__10.3 성능 향상을 위한 딥러닝 알고리즘

11장 [경진대회] 항공 사진 내 선인장 식별 ★☆☆
__11.1 경진대회 이해
__11.2 탐색적 데이터 분석
___분석 정리 및 모델링 전략
__11.3 베이스라인 모델
__11.4 성능 개선
___학습 마무리

12장 [경진대회] 병든 잎사귀 식별 ★★☆
__12.1 경진대회 이해
__12.2 탐색적 데이터 분석
___분석 정리 및 모델링 전략
__12.3 베이스라인 모델
__12.4 성능 개선
___학습 마무리
___실전 문제

13장 [데이터셋] 흉부 엑스선 기반 폐렴 진단 ★★☆
__13.1 경진대회 이해
__13.2 탐색적 데이터 분석
___분석 정리 및 모델링 전략
__13.3 베이스라인 모델
__13.4 성능 개선
___학습 마무리

부록 A 캐글 생활백서
__A.1 피처 요약표
__A.2 메모리 절약을 위한 데이터 다운캐스팅
__A.3 디버깅을 위한 간단한 팁
__A.4 훈련된 모델 저장하고 불러오기
[교보문고에서 제공한 정보입니다.]

QuickMenu

  • TOP