서브메뉴

본문

실시간 분석의 모든 것 (스트리밍 데이터 분석 및 시각화 시스템 구축 가이드)
실시간 분석의 모든 것 (스트리밍 데이터 분석 및 시각화 시스템 구축 가이드)
저자 : 바이런 엘리스
출판사 : 한빛미디어
출판년 : 2015
ISBN : 9788968482298

책소개

실시간 분석 솔루션을 구축하기 위한 지침서 !

빠른 비즈니스 의사결정을 위해 실시간 분석에 대한 관심이 고조되고 있다. 이 책은 스트리밍 데이터의 분석에서 시각화까지 전 단계를 망라하는 가성비 높은 솔루션을 제시한다. 1부는 아파치 주키퍼, 카프카, 플룸, 스톰, 얀, 삼자, 레디스, 몽고DB, 카산드라 등으로 실시간 분석 서비스를 구성하고 데이터를 처리 및 저장하는 방법을 다룬다. 2부는 SVG와 D3.js를 활용하여 데이터를 시각화하고 모니터링하고 실시간에 맞게 최적화하는 방법을 살펴본다. 실무 관점에서 다양한 기술의 활용 및 구성 로드맵을 제시하여, 나무가 아니라 숲을 볼 수 있게 해주는 책이다.
[교보문고에서 제공한 정보입니다.]

출판사 서평

빅데이터 분석의 새로운 패러다임 실시간 분석 솔루션 구축 가이드
많은 기업이 실시간으로 발생하는 데이터로부터 빠른 비즈니스 인사이트를 얻기 위해 부단히 노력하고 있다. 데이터를 저장한 후 분석하는 기존 배치 방식은 인사이트 확보 타이밍을 제대로 맞추기 어려웠다. 이에 적시에 신속히 중대 의사결정을 내릴 수 있도록 프로세스 시간을 획기적으로 단축해주는 실시간 분석 솔루션에 대한 관심이 고조되고 있다.
이 책은 이러한 트렌드에 맞춰, 스트리밍 데이터의 수집, 전달, 처리, 저장, 시각화까지 실시간 분석의 전 단계를 망라하는 가성비 높은 솔루션을 구축하는 지침을 제공한다. 스트리밍 데이터의 특성을 살펴본 다음(1장), 1부는 아파치 주키퍼, 카프카, 플룸, 스톰, 얀, 삼자, 레디스, 몽고DB, 카산드라 등으로 실시간 분석 서비스를 설계 및 구성하고(2~3장) 데이터를 처리 및 저장(4~6장)하는 방법을 알아본다. 2부는 SVG와 D3.js를 활용하여 데이터를 시각화하고(7~8장), 데이터를 표집하고 추정값을 얻어내는 데 사용하는 통계 기법과 알고리즘을 살펴본다(9~10장). 끝으로 실시간 데이터를 모니터링하고 실시간에 맞게 최적화하는 고급 기법을 살펴본다(11장).
관련 기술이 워낙 많고 빨리 변하다 보니 개별 기술은 알아도 그것을 실무에서 어떻게 사용할지 곤혹스러워하는 경우가 많다. 이에 실시간 처리에 꼭 필요한 기술이 어떤 흐름에 따라 유기적으로 활용되는지 길을 제시해주는 이 책의 가치가 더 크다. 실무 관점에서 다양한 기술의 활용 및 구성 로드맵을 제시하여, 나무가 아니라 숲을 볼 수 있게 해주는 책이다.

주요 내용
- 스트리밍 데이터 시스템의 구성요소를 이해하고 최대한 활용하는 방법
- 스트리밍 데이터의 분석 및 저장과 관련된 아키텍처와 모범 사례
- 오픈소스 및 상업 툴을 이용하여 데이터 집계, 전달, 웨어하우징 시스템 구축
- 스트리밍 애플리케이션에 필요한 고급 알고리즘 및 자료구조의 구현 및 응용

예제 소스
http://www.hanbit.co.kr/exam/2229
[교보문고에서 제공한 정보입니다.]

목차정보

1. 스트리밍 데이터 소개
__1.1 스트리밍 데이터의 원천
__1.2 스트리밍 데이터만의 특징
__1.3 인프라 및 알고리즘
__1.4 마치며

1부. 스트리밍 분석 아키텍처

2. 실시간 스트리밍 아키텍처 설계
__2.1 실시간 아키텍처의 구성요소
__2.2 실시간 아키텍처의 특징
__2.3 실시간 프로그래밍을 위한 언어
__2.4 실시간 아키텍처 체크리스트
__2.5 마치며

3. 서비스 구성 및 조정
__3.1 구성 및 조정 시스템의 출현 배경
__3.2 분산 상태 유지
__3.3 아파치 주키퍼
__3.4 마치며

4. 스트리밍 분석에서의 데이터 흐름 관리
__4.1 분산 데이터 흐름
__4.2 아파치 카프카: 높은 처리량을 가지는 분산 메시징
__4.3 아파치 플룸: 분산 로그 수집
__4.4 마치며

5. 스트리밍 데이터 처리
__5.1 분산 스트리밍 데이터 처리
__5.2 스톰을 이용한 데이터 처리
__5.3 삼자를 이용한 데이터 처리
__5.4 마치며

6. 스트리밍 데이터 저장
__6.1 일관된 해싱
__6.2 NoSQL 저장 시스템
__6.3 기타 저장 기술
__6.4 기술 선택하기
__6.5 웨어하우징
__6.6 마치며

2부. 분석 및 시각화

7. 스트리밍 메트릭 전달
__7.1 스트리밍 웹 애플리케이션
__7.2 데이터 시각화하기
__7.3 모바일 스트리밍 애플리케이션
__7.4 마치며

8. 정확한 집계와 전달
__8.1 특정 시점 카운팅과 합계
__8.2 다중 해상도 시계열 집계
__8.3 확률적 최적화
__8.4 시계열 데이터 전송
__8.5 마치며

9. 스트리밍 데이터의 통계적 근사
__9.1 수치 라이브러리
__9.2 확률과 분포
__9.3 분포 살펴보기
__9.4 난수 생성
__9.5 표집 절차
__9.6 마치며

10. 스케치를 이용한 스트리밍 데이터 근사
__10.1 레지스터와 해시 함수
__10.2 집합
__10.3 블룸 필터
__10.4 고유 값 스케치
__10.5 카운트-최소 스케치
__10.6 다른 애플리케이션
__10.7 마치며

11. 단순 집계를 넘어서는 고급 기법
__11.1 실시간 데이터를 위한 모형
__11.2 모형 예측
__11.3 모니터링
__11.4 실시간 최적화
__11.5 마치며
[교보문고에서 제공한 정보입니다.]

QuickMenu

  • TOP