Article 3. 파생변수 생성 2123
Section 2. 분석 변수 처리
- 파생변수는 기존 변수에 특정 조건 혹은 함수 등을 사용하여 새롭게 재정의한 변수를 의미한다.
- 데이터에 들어 있는 변수만 이용해서 분석할 수도 있지만, 변수를 조합하거나 함수를 적용해서 새 변수를 만들어 분석한다.
- 변수를 생성할 때에는 논리적 타당성과 기준을 가지고 생성하도록 한다.
- 파생변수를 생성하는 방법은 다음과 같다.
-
단위변환
-
주어진 변수의 단위 혹은 척도를 변환하여 새로운 단위로 표현
예) 하루를 24시간을 12시간으로 변환
-
-
표현형식 변환
-
단순한 표현 방법으로 변환
예) 날짜로 요일 변환, 남/여 데이터를 0/1 이진 변수로 변환
-
-
요약 통계량 변환
-
요약 통계량 등을 활용하여 생성
예) 고객별 누적 방문 횟수 집계
-
-
변수 결합
-
다양한 함수 등 수학적 결합을 통해 새로운 변수를 정의
예) 매출액과 방문 횟수 데이터로 1회 평균 매출액 추출
-