본문 바로가기

Statistics

(2)
[R] R 기초 문법 변수(Variables) 변수는 데이터 값을 담는 상자입니다. =, 세 가지 대입 연산자(assignment operator)를 활용하여 변수에 값을 할당할 수 있습니다. R에서는 다른 프로그래밍 언어에는 없는 기호를 대입연산자로 쓸 수 있으며, 화살표 방향으로 값을 할당합니다. 아래 세가지 예시 중 두번째 형태를 가장 많이 사용합니다. name1 = "Kim" # 우변의 값을 좌변의 변수에 할당 name2 name3 # 좌변의 값을 우변의 변수에 할당 이제 변수에 할당한 값을 변수를 입력하여 사용할 수 있습니다. name1 # "Kim" 출력 name2 # "Lee" 출력 name3 # "Park" 출력 데이터 타입 R의 기본적인 데이터 타입은 다음과 같습니다. 숫자 - (10.5, 55, 787) 정..
Listwise deletion Listwise deletion은 통계 분석에서 결측값(missing values)을 처리하는 방법 중 하나입니다. 결측값은 데이터셋에서 일부 변수의 값이 누락되어 있는 경우를 말합니다. 이러한 결측값은 분석에 방해가 되기 때문에 처리해주어야 합니다. Listwise deletion은 결측값이 있는 레코드(행)을 분석에서 제외하는 방법입니다. 즉, 한 행에서 하나 이상의 변수 값이 누락된 경우 해당 행 전체를 데이터에서 삭제함으로써, 모든 변수에 대해 완전한 데이터만 남깁니다. 이 방법은 분석에 활용되는 데이터셋을 간단하게 만들어주기 때문에 상대적으로 간편하게 처리할 수 있습니다. 예를 들어, 만약 설문조사에서 몇 명의 응답자가 특정 질문에 답변하지 않았다면, 이러한 결측값을 처리하기 위해 listwis..