IT/빅데이터분석기사

[3과목] 분석 환경 구축 - 분석 도구 선정

김비서 2021. 9. 7. 23:53
728x90

1. R : 통계 및 그래프 작업을 위한 인터 프리터 프로그래밍 언어

※ 인터프리터 : 프로그래밍 언어의 소스 코드를 바로 실행하는 환경이다. 원시 코드를 기계어로 번역하는 컴파일러와 대비된다.

1993년 뉴질랜드 오클랜드 대학교 통계학과 교수들이 통계분석과 자료의 시각화를 위해 개발한 오픈 분석용 프로그래밍 언어로 다음과 같은 특징을 가지고 있다.

 

① 객체지향 언어 : 일반 데이터, 함수, 차트 등 모든 데이터가 객체 형태로 관리되어 효율적인 조작과 저장방법을 제공한다.

② 고속메모리 처리 : 모든 객체는 메모리로 로딩되어 고속으로 처리되고 재사용 가능하다.

③ 다양한 자료 구조 : 벡터, 배열, 행렬, 데이터프레임, 리스트 등 다양한 자료구조와 연산기능을 제공한다.

④ 최신패키지 제공 : 오픈소스 커뮤니티(www.r-project.org) CRAN 사이트를 통해 데이터 분석에 필요한 최신의 알고리즘과 방법론을 제공한다.

⑤ 시각화 : 데이터 분석과 표현을 위한 다양한 그래픽 도구를 제공

R의 장단점 [출처 : 이기적스터디카페]

 

 

2. 파이썬(Python)

1991년에 프로그래머 귀도 반 로섬(Guido van Rossum)이 발표한 오픈 분석용 프로그래밍 언어로, 플랫폼 독립적이며 인터프리터식, 객체지향적 대화형 언어이다.

 

① 배우기 쉬운 대화 기능의 인터프리터 언어 : 간결하고 쉬운 문법으로 컴파일, 실행, 테스트가 용이하다.

② 동적인 데이터타입 결정 지원 : 동적으로 데이터타입을 결정하므로 데이터 타입에 무관하게 코드 작성이 가능하다.

③ 플랫폼 독립적 언어 : 운영체제에 독립적으로 컴파일 없이 동작을 실행한다.

④ 내장 객체 자료형과 자동 메모리 관리 : 리스트, 사전, 튜플 등 유연한 내장 객체 자료형을 지원하며 메모리 자동할당 뒤 종료시 자동 해지하는 메모리 청소 (Garbage Collection) 기능을 제공한다.

 

파이썬의 장단점 [출처 : 이기적스터디카페]

- 파이썬 아나콘다(Anaconda)는 파이썬 기반의 데이터 분석에 필요한 오픈소스들의 통합 개발 플랫폼으로 가상환경과 패키지를 관리, 개별 프로젝트 개발환경을 효율적으로 구성할 수 있다.

 

반응형