가져오기 (Import)

책의 이 파트에서는 더 넓은 범위의 데이터를 R로 가져오는 방법과 이를 분석에 유용한 형태로 만드는 방법을 배웁니다. 때로는 적절한 데이터 가져오기 패키지의 함수를 호출하는 것만으로 충분할 수도 있습니다. 하지만 더 복잡한 경우에는 선호하는 깔끔한 직사각형(tidy rectangle) 형태를 만들기 위해 정리(tidying)와 변형(transformation)이 모두 필요할 수 있습니다.

가져오기(import)가 파란색으로 강조된 데이터 과학 모델 다이어그램.
Figure 1: 데이터 가져오기는 데이터 과학 프로세스의 시작입니다. 데이터가 없으면 데이터 과학을 할 수 없습니다!

책의 이 파트에서는 다음과 같은 방식으로 저장된 데이터에 접근하는 방법을 배웁니다:

여기서 다루지 않는 두 가지 중요한 tidyverse 패키지가 있습니다: haven과 xml2. SPSS, Stata, SAS 파일의 데이터를 작업한다면 haven 패키지(https://haven.tidyverse.org)를 확인하세요. XML 데이터를 작업한다면 xml2 패키지(https://xml2.r-lib.org)를 확인하세요. 그렇지 않은 경우 어떤 패키지를 사용해야 할지 알아내기 위해 조사가 필요할 것입니다. 구글(google)은 여러분의 친구입니다 😃.