상단으로 이동
상단으로 이동
회원리뷰[0)]

AI 분석을 위한 빅데이터 구축

저자 | 한희선 출판사 | 구민사
ISBN : 9791158138479   |  발행일 : 2020-06-15  |  520
  • 정가 24,000원
    판매가 21,600 (10% 할인)
  • 적립포인트 1,200 적립 [5% 적립]
  • 무이자할부 1월 무이자 할부
    배송비 무료배송 (20,000원 이상 구매시 배송비 무료)
  • 스프링분철
IT/베스트셀러 > 컴퓨터/IT도서


도서소개

이 책은 수집 및 저장된 데이터를 빅데이터 분석 목적을 달성하기 위하여 정제하고 변환하고 적재 및 검증하는 과정을 통하여 분석용 데이터셋이 구축된다. 본서를 보기 위한 구성은 아래 그림과 같다.
(1) 수집 및 저장
데이터 수집은 비정형 및 정형의 DBMS 데이터 등을 수집하고, 저장에서는 HDFS 및 Hbase에 데이터를 저장한다. 본서의 [Part 3. 외부 데이터 수집하기]를 보기 바란다.
(2) 전처리
전처리는 원본 데이터 로드가 정확히 되었는지 검토하기 위해 Data Type 및 텍스트형식으로 저장된 데이터의 Level을 확인한다. 본서의 [Part. 1 빅데이터로 무엇을 해야 할까, Part 2. R로 하는 빅데이터 전처리]를 보기 바란다.
(3) 정제
정제에서는 본격적으로 분석용 데이터셋을 구축하기 위하여 분석에 필요한 데이터를 식별하고, 식별된 데이터를 가공 및 오류 - 결측치 처리를 한다. 본서의 [Part 5. 분석에 적합하게 변환하기(데이터 가공), Part 7. 데이터 탐색]을 보기 바란다.
(4) 변환 / 적재
데이터 변환 및 적재는 정제된 데이터를 빅데이터 분석에 용이한 형태로 적재한다. 변환기법에는 데이터를 평활화(smoothing), 집계(aggregation), 일반화(generalization), 정규화(normalization), 파생 속성생성 등이 있다. 본서의 [Part 4. 다양한 형식의 데이터 로딩하기, Part 5의 파생변수, Part 7 데이터 탐색의 chapter2] 등을 보기 바란다.
(5) 검증
검증은 정제된 분석용 데이터의 적재가 정합성 있게 되었는지 확인한다(데이터 품질 포함). 이 책의 [Part 6. 데이터 정제]를 보기 바란다.

도서목차

PART 01 빅데이터로 무엇을 해야 할까
Chapter 1 빅데이터와 데이터 과학자

PART 02 R로 하는 빅데이터 전처리
Chapter 1 R환경(Environment)
Chapter 2 빅데이터 분석 R 환경 구성 및 입문
Chapter 3 패키지 사용
Chapter 4 데이터 구조와 메타 데이터 051
Chapter 5 R에 저장된 데이터 타입(Type)보기
Chapter 6 Vector Object
Chapter 7 범주형 데이터 Factor Object
Chapter 8 Matrix Object
Chapter 9 DataFrame Object
Chapter 10 List Object
Chapter 11 Arrary Object

PART 03 외부 데이터 수집하기
Chapter 1 분석프로그램에 내장된 데이터
Chapter 2 오픈 데이터
Chapter 3 날씨 json 파일 읽기
Chapter 4 웹페이지 가져오기

PART 04 다양한 형식의 데이터 로딩하기
Chapter 1 CSV 파일 로딩
Chapter 2 탭으로 구분된 파일 로딩
Chapter 3 엑셀 xls, xlsx 파일 로딩하기
Chapter 4 XML 파일 로딩
Chapter 5 데이터 파일로 저장하기

PART 05 분석에 적합하게 변환하기(데이터 가공)
Chapter 1 분석 마트
Chapter 2 파생 변수

PART 06 데이터 정제
Chapter 1 데이터 Value 검증(Validation)
Chapter 2 중복 관리
Chapter 3 정렬 및 그룹화

PART 07 데이터 탐색
Chapter 1 교차표(Crosstabs)로 데이터 특징 찾기
Chapter 2 데이터 속성(컬럼)관리 및 행관리

PART 08 텍스트 데이터 처리(자연어 처리)
Chapter 1 정규표현식 사용하기
Chapter 2 Corpus 및 Vectorsources
Chapter 3 문서-단어, 단어-문서 테이블 생성 및 사용하기
Chapter 4 한글 인코딩

해시태그

#AI #분석을 #위한 #빅데이터 #구축

도서 리뷰작성!

평점
답변상태 문의답변 작성자 작성일

도서 문의작성!

배송 - 월요일~토요일 오전9시 이전에 입금 확인 된 주문은 다음날 배송받으실 수 있습니다.
- 토요일 발송분은 오전9시 이전 주문에 한하여 월요일 수령 가능 합니다.
(일부 제작상품 및 재고부족 도서 제외)
- 재고가 부족한 일부 상품의 경우 1~3일 정도 배송이 지연될 수 있습니다.
교환/반품 방법 1:1 문의 글 등록, 고객만족센터 (1544-1356) 전화 후 교환/반품 문의하시면 됩니다.
교환/반품 가능기간 출고 완료 후 7일 이내에 교환/반품/환불이 가능합니다.
교환/반품 비용 고객님 변심에 의한 반품, 환불, 교환 시 택배비는 본인 부담입니다.
교환/반품 불가사유 - 상담원과의 상담 없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
- 상품이 훼손된 경우 반품 및 교환, 환불이 불가합니다.
- 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한됩니다.
서브노트, 스프링 분철 교재 등은 교환이나 반품이 불가합니다.
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로
안내해드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
- 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에
관한 사항은 소비자분쟁해결 기준 (공정거래위원회고시)에 준하여 처리됨
- 대금환불 및 환불지연에 따른 배상금 지급 조건, 절차등은 전자상거래 등에서의
소비자 보호에 관한 법률에 따라 처리됨