Article 3. 파생변수 생성 2123

less than 1 minute read

Section 2. 분석 변수 처리

  • 파생변수는 기존 변수에 특정 조건 혹은 함수 등을 사용하여 새롭게 재정의한 변수를 의미한다.
  • 데이터에 들어 있는 변수만 이용해서 분석할 수도 있지만, 변수를 조합하거나 함수를 적용해서 새 변수를 만들어 분석한다.
  • 변수를 생성할 때에는 논리적 타당성과 기준을 가지고 생성하도록 한다.
  • 파생변수를 생성하는 방법은 다음과 같다.
  1. 단위변환

    • 주어진 변수의 단위 혹은 척도를 변환하여 새로운 단위로 표현

      예) 하루를 24시간을 12시간으로 변환

  2. 표현형식 변환

    • 단순한 표현 방법으로 변환

      예) 날짜로 요일 변환, 남/여 데이터를 0/1 이진 변수로 변환

  3. 요약 통계량 변환

    • 요약 통계량 등을 활용하여 생성

      예) 고객별 누적 방문 횟수 집계

  4. 변수 결합

    • 다양한 함수 등 수학적 결합을 통해 새로운 변수를 정의

      예) 매출액과 방문 횟수 데이터로 1회 평균 매출액 추출