Description
이 책은 R 언어를 가지고 해보는 노력의 일환이다. 숫자의 통계분석을 위해 만들어진 이 언어는 문자의 분석에도 유용하게 쓰이고 있다. 사실 데이터 의미를 보여주는 데에도 이 언어는 유용한다. R 기반 tm 패키지는 현재 찾아볼 수 있는 가장 쓸모가 있는 몇 개의 시각화 도구 가운데 하나이다. 많은 데이터가 빅데이터로 바뀌고 있다. 생활 속에 광범위하게 침투한 전자기기가 쏟아내는 실시간 정보는 날이 갈수록 좋아지는 컴퓨터 성능으로 손쉽게 처리된다. 따라서 이러한 빅데이터 문자를 처리하는 것은 실용적 중요성도 동시에 가지게 된다. 이러한 새로움에 적응해나가는 것이 개인이나 조직에게 실존적 의미를 던지는 경우도 나타나기 시작한다. R 언어의 기본 원리부터 시작해서 관련된 패키지로 넘어간다. tm 패키지를 사용하여 단어구름(word cloud) 만드는 방법을 다루고는, 문자를 조금 더 효율적으로 추출해내고 다루는 방법인 정규식(regular expression) 소개로 책이 마무리된다. 다른 책에서는 찾기 어려운 이 책만의 뚜렷한 세 가지 장점이 있다. 첫 번째로 R 원리를 중심으로 전개된다. 대표적인 것이 R 언어 최소단위 벡터이다. 예시를 들어가면서 원리를 깊이 있고 자세하게 설명한다. 그리고 이를 계속 응용해 나간다. 이 책은 쉽게 풀어서 원리를 제공하면서도 나중에 다루어도 될 주제는 생략하는 방식으로 진도를 쭉 나가고 있다. 두 번째로 R 코딩 원리와 문자 처리 실무를 같이 배울 수 있다. 기존 방식은 R 기초 과정이 끝난 다음에 더 수준 높은 과정으로서 문자열을 다룬다. 모든 컴퓨터 언어가 숫자뿐 아니라 문자 역시 자연히 다루게 되는 걸 생각해보면, 이러한 학습 방식은 인위적이다. 그래서 비효율적이다. 따라서 독자 입장에서는 문자 처리라는 실무를 R 코딩 원리 이해와 연결시킬 수 있다. 인문과학 사회과학 학술 분석뿐 아니라 일반 실무 작업을 수행할 때, 원리를 제대로 알고 분석을 해나갈 수 있게 된다. 세 번째로 이 책의 진행은 퀴즈를 푸는 듯한 느낌을 가질 수 있다. 근원적 R 코딩 원리와 관련된 부분은 질문을 먼저 던진다. 그리고 제일 마지막 장에는 열쇠에 해당하는 지식을 제공한다. 수업 시간에서 학생들과 같이 성장하는 과정이, 책에 반영되기 때문에 가능한 형식이다.
R 코딩과 문자
$18.93