닫기
전체카테고리
  • -->
    국내도서
    국내도서
  • -->
    베스트셀러
    베스트셀러
  • -->
    새로나온도서
    새로나온도서
  • -->
    추천도서
    추천도서
  • -->
    할인/재정가 도서
    할인/재정가 도서
  • -->
    GIFT
    GIFT
R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (마스크제공) 이미지 확대 보기
  • R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (마스크제공)
  • R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (마스크제공)

R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (마스크제공)

공유
정가
28,000
판매가
25,200
배송비
무료 지역별추가배송비
택배
방문 수령지 : 서울특별시 영등포구 양산로 57-5 (양평동 이노플렉스) B101
자체상품코드
9791196014445
제조사
숨은원리
출시일
2022-01-14
구매혜택
할인 : 적립 적립금 :
짧은설명
R로 하는 빅데이터 분석 : 데이터 전처리와 시각화
R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (마스크제공)
0
총 상품금액
총 할인금액
총 합계금액

상품상세정보

21615d286a4b23fc9ded08f4bbbe3a95_192355.jpg
 


책소개

이 책은 어느 정도 프로그래밍 경험이 있는 독자를 대상으로, 오픈 소스 데이터 분석 도구인 R을 활용하여 데이터를 불러들이고, 가공하고, 시각화하는 방법을 설명한다. 이 책은 시중의 책들과 달리 특정한 기능을 하는 함수들을 설명하기 전에 데이터 전처리의 목적과 기능에 대한 개념적인 이해를 우선 할 수 있도록 도와준다. 그리고 날짜시간 자료형, 문자열 자료형, 정규표현식 등에 대한 원리와 응용 방법을 자세하게 설명하여 복잡한 전처리 과정에서도 논리적 오류를 범하지 않도록 한다. 분산처리 없이 빅데이터 처리를 할 수 있는 마지막 보류인...더보기이 책은 어느 정도 프로그래밍 경험이 있는 독자를 대상으로, 오픈 소스 데이터 분석 도구인 R을 활용하여 데이터를 불러들이고, 가공하고, 시각화하는 방법을 설명한다. 이 책은 시중의 책들과 달리 특정한 기능을 하는 함수들을 설명하기 전에 데이터 전처리의 목적과 기능에 대한 개념적인 이해를 우선 할 수 있도록 도와준다. 그리고 날짜시간 자료형, 문자열 자료형, 정규표현식 등에 대한 원리와 응용 방법을 자세하게 설명하여 복잡한 전처리 과정에서도 논리적 오류를 범하지 않도록 한다. 분산처리 없이 빅데이터 처리를 할 수 있는 마지막 보류인 데이터테이블을 dplyr 패키지의 함수와 비교하여 이해를 도왔고,ggplot2의 설명에서는 플롯의 수많은 옵션을 정하는 방법을 한 눈에 보기 싶게 보여준다. 그 밖에도 부록으로 RStudio의 치트시트를 수록하였다. 어느 정도 R에 익숙한 독자들에게도 R의 데이터 전처리와 시각화에 대해 좀 더 깊이 알 수 있게 하였다. 레퍼런스 북으로도 손색이 없다.

특이 사항

● R 최신 버전 4.1.2(Bird Hippie; 2021-11-01) 반영
● 빅데이터 분석을 위한 최선의 선택-data.table 패키지(최신버전 1.14.2)에 대한 설명 수록
● RStudio의 ggplot2 등 패키지 치트시트(cheatsheet) 수록
● 백과사전식의 나열이 아니라 개념 중심의 체계적인 이해 중시
● 좀 더 테크니컬한 심층 활용 방법과 오류를 사전에 방지하는 방법 설명
● 각종 참고 자료 및 표 수록
● 다양한 원서의 내용 종합
- Spector(2008). Data Manipulation with R.
- Kabacoff(2015). R in Action: Data Analysis and Graphics with R
- Wickham(2016). ggplot2: Elegant Graphics for Data Analysis.
- Lander(2017). R for Everyone: Advanced Analytics and Graphics.
- Wickham & Grolemund(2017). R for Data Science.
- Van Der Loo & De Jong(2018). Statistical Data Cleaning with Applications in R.
● ds.sumeun.org 홈페이지 운영닫기

목차

서문
3판 서문 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix
1판 서문 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii

1 들어가기
1.1 R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 R의 패키지(Packages)
2.1 패키지 설치 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 패키지 관련 정보 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 패키지 불러오기/확인하기/제거하기 . . . . . . . . . . . . . . . . . . 8
2.4 패키지 관리하기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.5 중복되는 함수와 변수 . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3 R의 변수, 자료형, 연산/함수
3.1 R의 변수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2 R의 데이터 타입(자료형) . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3 연산(Operations)과 함수(Functions) . . . . . . . . . . . . . . . . . 19
3.4 특별한 값 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4 데이터 구조
4.1 벡터(Vector) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.2 행렬(matrix), 배열(array), 데이터프레임(data.frame), 리스트(list)
만들기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3 행렬, 배열, 데이터프레임, 리스트의 부분선택하기 . . . . . . . . . . . . 46
4.4 행렬, 배열, 데이터프레임, 리스트 수정하기 . . . . . . . . . . . . . . . 50
4.5 CRUD(Create, Read, Update, Delete) . . . . . . . . . . . . . . . 51
4.6 3차 이상의 다차원 배열 . . . . . . . . . . . . . . . . . . . . . . . . . 53

5 dplyr 패키지를 활용한 데이터 가공
5.1 magrittr의 파이프 연산자 . . . . . . . . . . . . . . . . . . . . . . . 61
5.2 dplyr의 방식: 부분 선택(Subsetting) . . . . . . . . . . . . . . . . . 64
5.3 dplyr의 방식 : 수정 . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.4 dplyr의 기타 편의 기능 . . . . . . . . . . . . . . . . . . . . . . . . . 77

6 날짜와 시간
6.1 R의 날짜와 시간 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.2 날짜의 표기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
6.3 날짜 표기 변환 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.4 날짜시간 표기 인식 . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
6.5 날짜, 시간 연산 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
6.6 날짜(시간)의 특정한 정보 참조 . . . . . . . . . . . . . . . . . . . . . 94
6.7 날짜(시간) 갱신 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
6.8 몇 가지 유의사항 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.9 활용 예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.10 stringi 패키지 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
6.11 국경일과 공휴일 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.12 음력 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
6.13 먼 미래, 먼 과거, 그리고 기원 . . . . . . . . . . . . . . . . . . . . . . 103

7 팩터 자료형
7.1 팩터형의 중요성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
7.2 데이터 전처리에 있어서 팩터형 . . . . . . . . . . . . . . . . . . . . . 109
7.3 forcats 패키지 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

8 R로 데이터 읽어오기
8.1 R 내장 데이터 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.2 들어가기 : write.table/read.table, save/load . . . . . . . . . . . 117
8.3 텍스트로 저장된 데이터 파일 읽기 . . . . . . . . . . . . . . . . . . . 118
8.4 바이너리 파일 읽기 . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
8.5 압축 파일에서 읽어오기 . . . . . . . . . . . . . . . . . . . . . . . . . 133
8.6 EXCEL 파일 읽기 . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
8.7 그 밖의 통계 프로그램 데이터 파일 . . . . . . . . . . . . . . . . . . . 135
8.8 Web에서 데이터 긁어오기(Web scraping) . . . . . . . . . . . . . . . 138
8.9 JSON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
8.10 이미지에서 텍스트 인식 . . . . . . . . . . . . . . . . . . . . . . . . . 145
8.11 정리 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

9 데이터 가공
9.1 집단별로 함수 적용하기 . . . . . . . . . . . . . . . . . . . . . . . . . 150
9.2 여러 데이터 프레임 합치기 . . . . . . . . . . . . . . . . . . . . . . . 158
9.3 세로형/가로형 변환 . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

10 패키지 데이터테이블(data.table)
10.1 package:dplyr과 package:data.table의 비교 . . . . . . . . . . . . . 169
10.2 data.table의 키(key) 활용하기 . . . . . . . . . . . . . . . . . . . . 184
10.3 data.table을 활용한 병합 . . . . . . . . . . . . . . . . . . . . . . . 188
10.4 그 밖의 특수기호 : .SD, .GRP, .N, .I, .BY, .EACHI, .. . . . . . . . . . 197
10.5 데이터테이블 종합 . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

11 문자열(character)
11.1 인코딩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
11.2 대표적인 인코딩 방법 . . . . . . . . . . . . . . . . . . . . . . . . . . 206
11.3 인코딩 방법의 종류 . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
11.4 R에서 인코딩 다루기 . . . . . . . . . . . . . . . . . . . . . . . . . . 208
11.5 문자열 상수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
11.6 유니코드, 엔디언(endianness), BOM . . . . . . . . . . . . . . . . . 213
11.7 유니코드 정규화(Normalization) . . . . . . . . . . . . . . . . . . . 216
11.8 문자열의 정렬 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
11.9 문자열을 다루는 함수들 . . . . . . . . . . . . . . . . . . . . . . . . . 218
11.10패키지 stringr을 활용한 문자열 관리 . . . . . . . . . . . . . . . . . 225
11.11주요 인코딩 표 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

12 정규표현식
12.1 R과 정규표현식 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
12.2 확장정규표현식(ERE; Extended Regular Expressions) . . . . . . . 230
12.3 Perl 호환 정규표현식 . . . . . . . . . . . . . . . . . . . . . . . . . . 240
12.4 패키지 stringr, stringi . . . . . . . . . . . . . . . . . . . . . . . . 243
12.5 stringi 패키지와 정규표현식을 활용한 문자열 데이터 가공 . . . . . . . 244
12.6 활용 예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

13 흐름 제어와 함수
13.1 제어문: 조건과 반복 . . . . . . . . . . . . . . . . . . . . . . . . . . 249
13.2 함수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256

14 기술 통계량
14.1 1변수 기술 통계량 . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
14.2 데이터 프레임의 모든 변수(컬럼)에 대해 요약통계치 구하기 . . . . . . 266

15 간편 시각화
15.1 간편 시각화의 예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
15.2 조건부 이변수 플롯(등구간 구획) . . . . . . . . . . . . . . . . . . . . 274

16 ggplot2
16.1 들어가기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
16.2 시각적 맵핑(Aesthetic mapping) . . . . . . . . . . . . . . . . . . . 277
16.3 기하학적 대상(geom) . . . . . . . . . . . . . . . . . . . . . . . . . . 296
16.4 補助선(Auxillary lines) . . . . . . . . . . . . . . . . . . . . . . . . 305
16.5 좌표계(Coordinate system) . . . . . . . . . . . . . . . . . . . . . . 307
16.6 범례(Legends) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
16.7 제목과 테마(Title and Theme) . . . . . . . . . . . . . . . . . . . . 315
16.8 결과 정리 및 저장 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
16.9 ggplot2(gg = Grammar of Graphics) 총정리 . . . . . . . . . . . . 324

17 연습문제 해답
데이터 구조 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
데이터 불러들이기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
제어와 함수 I. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332

R에서 하는 벡터/행렬 연산
벡터연산 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
한 행렬 연산 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
두 행렬의 연산 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
선형(행렬) 대수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335

A 수 표기 방법
A.1 국제표준 ISO 80000-1 . . . . . . . . . . . . . . . . . . . . . . . . . 337
A.2 한글 맞춤법 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
A.3 다른 나라의 수 표기 . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
A.4 R에서 수 읽기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338

B 측정단위
B.1 단위와 관련된 ‘한글 맞춤법’ . . . . . . . . . . . . . . . . . . . . . . 344
B.2 주요 단위 및 접두어 . . . . . . . . . . . . . . . . . . . . . . . . . . . 344

C dplyr을 SQL로 번역하기
C.1 수기 번역 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
C.2 dbplyr 패키지를 사용한 자동 번역 . . . . . . . . . . . . . . . . . . . 351

D 화일과 디렉토리 관련 함수들
D.1 디렉토리 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
D.2 스크립트 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355
D.3 화일 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356

E R의 색, 세계 타임존

F 치트시트

작가

김권현 (지은이)

출판사리뷰


이 책은 어느 정도 프로그래밍 경험이 있는 독자를 대상으로, 오픈 소스 데이터 분석 도구인 R을 활용하여 데이터를 불러들이고, 가공하고, 시각화하는 방법을 설명한다. 이 책은 시중의 책들과 달리 특정한 기능을 하는 함수들을 설명하기 전에 데이터 전처리의 목적과 기능에 대한 개념적인 이해를 우선 할 수 있도록 도와준다. 그리고 날짜시간 자료형, 문자열 자료형, 정규표현식 등에 대한 원리와 응용 방법을 자세하게 설명하여 복잡한 전처리 과정에서도 논리적 오류를 범하지 않도록 한다. 분산처리 없이 빅데이터 처리를 할 수 있는 마지막 보류인...
더보기

상품필수 정보

도서명 R로 하는 빅데이터 분석 : 데이터 전처리와 시각화
저자/출판사 김권현 / 숨은원리
크기/전자책용량 상세설명참조 / 상세설명참조
쪽수 상세설명참조
제품 구성 상세설명참조
출간일 2022-01-14
목차 또는 책소개 상품상세참조

관련 상품

배송안내

- 배송비 : 기본 배송료는 2,000원입니다. (도서,산간,오지 일부 지역은 배송비가 추가될 수 있습니다)  10,000원 이상 구매 시 무료배송입니다.

- 본 상품의 평균 배송일은 2일입니다.(입금 확인 후) 설치 상품의 경우 다소 늦어질 수 있습니다.[배송 예정일은 주문 시점(주문 순서)에 따른 유동성이 발생하므로 평균 배송일과는 차이가 발생할 수 있습니다.]

- 본 상품의 배송 가능일은 7일입니다. 배송 가능일이란 본 상품을 주문하신 고객님들께 상품 배송이 가능한 기간을 의미합니다. (단, 연휴 및 공휴일은 기간 계산 시 제외하며 현금 주문일 경우 입금일 기준입니다.)

교환 및 반품안내

- 상품 택(tag)제거 또는 개봉으로 상품 가치 훼손 시에는 상품수령후 7일 이내라도 교환 및 반품이 불가능합니다.

- 저단가 상품, 일부 특가 상품은 고객 변심에 의한 교환, 반품은 고객께서 배송비를 부담하셔야 합니다(제품의 하자,배송오류는 제외)

- 일부 상품은 신모델 출시, 부품가격 변동 등 제조사 사정으로 가격이 변동될 수 있습니다.

- 신발의 경우, 실외에서 착화하였거나 사용흔적이 있는 경우에는 교환/반품 기간내라도 교환 및 반품이 불가능 합니다.

- 수제화 중 개별 주문제작상품(굽높이,발볼,사이즈 변경)의 경우에는 제작완료, 인수 후에는 교환/반품기간내라도 교환 및 반품이 불가능 합니다. 

- 수입,명품 제품의 경우, 제품 및 본 상품의 박스 훼손, 분실 등으로 인한 상품 가치 훼손 시 교환 및 반품이 불가능 하오니, 양해 바랍니다.

- 일부 특가 상품의 경우, 인수 후에는 제품 하자나 오배송의 경우를 제외한 고객님의 단순변심에 의한 교환, 반품이 불가능할 수 있사오니, 각 상품의 상품상세정보를 꼭 참조하십시오. 

환불안내

- 상품 청약철회 가능기간은 상품 수령일로 부터 7일 이내 입니다.

AS안내

- 소비자분쟁해결 기준(공정거래위원회 고시)에 따라 피해를 보상받을 수 있습니다.

- A/S는 판매자에게 문의하시기 바랍니다.

이미지 확대보기R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (마스크제공)

R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (마스크제공)
  • R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (마스크제공)
닫기

비밀번호 인증

글 작성시 설정한 비밀번호를 입력해 주세요.

닫기

장바구니 담기

상품이 장바구니에 담겼습니다.
바로 확인하시겠습니까?

찜 리스트 담기

상품이 찜 리스트에 담겼습니다.
바로 확인하시겠습니까?

  • 장바구니
  • 최근본상품
  • 위로
  • 아래로

최근 본 상품

  • R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (마스크제공)
    R로 하는 빅데이터 분석 : 데이터 전처...
    28,000 25,200
  • 당신은 꽃을 쓰세요 나는 시를 썰테니 (마스크제공)
    당신은 꽃을 쓰세요 나는 시를 썰테니 (...
    10,000 9,000
0/2
마이홈
고객센터

02-835-6872평일 오전 10:00 ~ 오후 06:00
점심 오후 12:30 ~ 오후 01:30
휴무 토/일/공휴일