Article 1. 분석 도구 선정 3121

1 minute read

Section 2. 분석 환경 구축

  • 빅데이터 분석을 위한 대표적인 도구로는 R과 Python이 있다.
  • R과 Python 모두 Open Source Programming 언어이고 많은 사용자층을 형성하고 있으며 빅데이터 분석 분야에서 많이 사용되고 있는 분석 도구이다

Paragraph 1. R

Subparagraph 1. R 개념

R은 통계 프로그래밍 언어인 S 언어를 기반으로 만들어진 오픈 소스 프로그래밍 언어이다.

Subparagraph 2. R 특징

R은 기능, 도구, 환경 측면 관점에서 다양한 특징을 가지고 있다.

특징 설명
기능 • 사용자가 제작한 패키지를 직접 추가하여 기능을 확장할 수 있음
• 다양한 그래프 패키지들을 통하여 강력한 시각화 기능을 제공
• R의 핵심 패키지는 R 설치와 함께 설치되고, 이외에도 추가로 다운로드하여 설치가 가능한 15,000개 이상의 패키지가 있음
도구 • R의 가장 큰 장점 중 하나는 방대한 양의 패키지와 즉시 사용 가능한 테스트 데이터를 CRAN(The Comprehensive R Archive Network)을 통하여 다운받을 수 있음
• R Studio는 R을 좀 더 쉽고 편하기 사용하기 위해 개발된 통합 개발 환경(IDE)
환경 • R은 Microsoft Windows, Mac OS, Linux 등 다양한 OS를 지원
• R은 인터프리터 언어라는 이유로 처리 속도가 느리다는 평가도 있으나, 사용버전인 S-PLUS보다 많은 경우에 있어 속도가 빠름

Paragraph 2. Python

Subparagraph 1. Python 개념

R과 거의 같은 작업 수행이 가능한 C언어 기반의 오픈 소스 프로그래밍 언어이다.

Subparagraph 2. Python 특징

파이썬은 학습, 분법, 기능, 도구, 환경 관점에서 다양한 특징을 가지고 있다.

특징 설명
학습 • 프로그래밍 언어 자체가 어렵지 않고 초보자도 쉽게 배울 수 있음
문법 • 파이썬은 다른 언어와는 다르게 들여쓰기를 이용하여 블록을 구분하는 문법을 사용
기능 • 파이썬에도 좋은 시각화 라이브러리가 있지만, R과 비교하면 선택의 폭이 좁음
도구 • R과 달리 파이썬은 대표적인 IDE가 없음
• 여러 배포 버전을 살펴보고 필요에 맞는 프로그램을 이용
환경 • 파이썬은 Microsoft Windows, Mac OS, Linux 등 다양한 OS를 지원
• 파이썬에도 PYP(Python Package Index)로 사용자들이 작성한 패키지 다운로드 및 설치가 가능