Description
최신 버전의 타이디버스 패키지를 적용한 개정판!
타이디버스 접근법은 2010년대부터 R 이용자들 사이에서 점차 각광받으며 이제 완전히 주류로 자리매김하였다. 《R 기반 데이터 과학 tidyverse 접근》의 초판 발행 당시 버전 1.2.1이던 타이디버스 패키지도 2023년 8월 기준 버전 2.0.0으로 여러 차례 업데이트되었다. 새롭게 출간된 《R 기반 데이터 과학 tidyverse 접근 개정판》은 최신 타이디버스 패키지의 코드 작성 방식을 반영하고, R 초심자들도 쉽게 활용할 수 있도록 한층 더 사용자 친화적으로 재편하였다. 개정판의 주요 변경사항은 다음과 같다.
■ 첫째, ‘긴 형태 데이터(long format data)’와 ‘넓은 형태 데이터(wide format data)’ 변환을 위해 소개했던 gather() 함수와 spread() 함수 대신, pivot_longer() 함수와 pivot_wider() 함수를 소개한다. 데이터 형태 변환의 원리와 변환 방식은 변함없지만, 이용자 입장에서 pivot_longer() 함수와 pivot_wider() 함수를 훨씬 더 이해하기 쉽게 구성하였다.
■ 둘째, 이용자가 지정한 조건에 맞는 여러 변수들을 일괄 처리하는 방법이 크게 달라졌다. 1판에서 사용했던 mutate() 함수와 summarize() 함수는 여전히 사용 가능하지만 출력결과에서 경고문구가 나타나는 문제가 있었다. 개정판에서는 1판 출간 후 개발된 across() 함수를 활용하는 방법들을 소개한다.
■ 셋째, 범주형 변수로 집단구분된 하위데이터(subset)를 대상으로 지정된 모형을 추정할 때 purrr 패키지의 map() 함수 대신 dplyr 패키지의 group_modify() 함수를 교체하여 소개한다. 1판의 split() 함수를 활용하여 데이터를 집단별로 구분한 후 map() 함수와 map_dfr() 함수를 연이어 사용하는 방식은 R을 처음 접하는 독자에게는 다소 복잡할 수 있다. dplyr 패키지의 group_modify() 함수는 R 초심자들도 비교적 쉽게 이해할 수 있으며, 무엇보다 1판에서 소개한 broom 패키지의 tidy() 함수와 같이 활용할 경우 집단구분된 하위데이터들을 대상으로 일괄적으로 모형을 처리하는 데 매우 효과적이다.
■ 첫째, ‘긴 형태 데이터(long format data)’와 ‘넓은 형태 데이터(wide format data)’ 변환을 위해 소개했던 gather() 함수와 spread() 함수 대신, pivot_longer() 함수와 pivot_wider() 함수를 소개한다. 데이터 형태 변환의 원리와 변환 방식은 변함없지만, 이용자 입장에서 pivot_longer() 함수와 pivot_wider() 함수를 훨씬 더 이해하기 쉽게 구성하였다.
■ 둘째, 이용자가 지정한 조건에 맞는 여러 변수들을 일괄 처리하는 방법이 크게 달라졌다. 1판에서 사용했던 mutate() 함수와 summarize() 함수는 여전히 사용 가능하지만 출력결과에서 경고문구가 나타나는 문제가 있었다. 개정판에서는 1판 출간 후 개발된 across() 함수를 활용하는 방법들을 소개한다.
■ 셋째, 범주형 변수로 집단구분된 하위데이터(subset)를 대상으로 지정된 모형을 추정할 때 purrr 패키지의 map() 함수 대신 dplyr 패키지의 group_modify() 함수를 교체하여 소개한다. 1판의 split() 함수를 활용하여 데이터를 집단별로 구분한 후 map() 함수와 map_dfr() 함수를 연이어 사용하는 방식은 R을 처음 접하는 독자에게는 다소 복잡할 수 있다. dplyr 패키지의 group_modify() 함수는 R 초심자들도 비교적 쉽게 이해할 수 있으며, 무엇보다 1판에서 소개한 broom 패키지의 tidy() 함수와 같이 활용할 경우 집단구분된 하위데이터들을 대상으로 일괄적으로 모형을 처리하는 데 매우 효과적이다.
R 기반 데이터 과학 타이디버스(tidyverse) 접근
$35.63