파이썬은 여러 분야에 사용할 수 있는 다양한 패키지를 가지고 있다는 큰 장점이 있다. 그중 데이터 분석에 많
이 사용되는 몇 가지 유명한 패키지를 소개한다.

NumPy
NumPy("넘파이"라고 읽는다) 패키지는 파이썬에서 수치 해석, 특히 선형 대수(linear algebra) 계산 기능을 제
공한다. 자료형이 고정된 다차원 배열 클래스(n-dimensional array)와 벡터화 연산(vectorized operation)을 지
원하며 수학 연산을 위한 가장 기본적이고 중요한 패키지다.
원래는 파이썬에서 MATLAB과 같은 기능을 구현하고자 Numeric이라는 이름으로 프로젝트가 시작되었으나,
2005년 Travis Oliphant에 의해 Numarray 패키지와 통합되며 NumPy라는 이름으로 바뀌었다. 내부적으로는
BLAS(Basic Linear Algebra Subprograms)와 LAPACK(Linear Algebra Package)이라는 오픈 소스 선형 대수
라이브러리에 의존한다.

SciPy
SciPy("사이파이"라고 읽는다) 패키지는 고급 수학 함수, 수치적 미적분, 미분 방정식 계산, 최적화, 신호 처리
등에 사용하는 다양한 과학 기술 계산 기능을 제공한다. SciPy 패키지는 Numeric 패키지에 기반을 두고 만들
어진 다양한 수치 해석 패키지들을 2001년에 Travis Oliphant와 Pearu Peterson 등이 통합, 재정리하여 만들었
다.


SymPy
SymPy("심파이"라고 읽는다) 패키지는 숫자를 더하거나 빼는 수치 연산이 아니라 인수 분해, 미분, 적분 등 심
볼릭 연산 기능을 제공한다. SymPy 프로젝트는 파이썬의 Mathematica와 같은 심볼릭 연산 기능을 넣고자 하
는 노력으로 2006년에 Ondrej Certik에 의해 시작되었다. SymPy의 기능은 http://live.sympy.org/
(http://live.sympy.org/) 또는 http://www.sympygamma.com/ (http://www.sympygamma.com/) 웹사이트를 방문
하면 브라우저 상에서 바로 확인할 수 있다.


Pandas
Pandas("판다스"라고 읽는다) 패키지는 테이블 형태의 데이터를 다루는 데이터프레임(DataFrame) 자료형을
제공한다. 자료의 탐색이나 정리에 아주 유용하여 데이터 분석에 빠질 수 없는 필수 패키지다. 2008년도에
Wes McKinney에 의해 프로젝트가 시작되었다. 원래는 R 언어에서 제공하는 데이터프레임 자료형을 파이썬
에서 제공할 수 있도록 하는 목적이었으나 더 다양한 기능이 추가되었다.


Matplotlib
Matplotlib("맷플롯리브"라고 읽는다) 패키지는 파이썬에서 각종 그래프나 챠트 등을 그리는 시각화 기능을 제
공한다. Tkinter, wxPython, Qt, GTK+ 등의 다양한 그래픽 엔진을 사용할 수 있다. 또한, MATLAB의 그래프 기
능을 거의 동일하게 사용할 수 있는 pylab이라는 서브패키지를 제공하므로 MATLAB에 익숙한 사람들은 바로
Matplotlib을 사용할 수 있다.


Seaborn
Seaborn("시본"이라고 읽는다) 패키지는 Matplotlib 패키지에서 지원하지 않는 고급 통계 차트를 그리는 통계
용 시각화 기능을 제공한다.


StatsModels
StatsModels("스탯츠모델즈"라고 읽는다) 패키지는 통계 및 회귀 분석이나 시계열 분석용 패키지다.


Scikit-Learn
Scikit-Learn("사이킷런"이라고 읽는다)은 머신러닝 학습용 패키지다. 대부분의 머신러닝 모형을 제공하므로
파이썬으로 머신러닝을 공부하는 데 최적의 학습 도구다.

TensorFlow
TensorFlow("텐서플로우"라고 읽는다)는 신경망 모형 등의 딥러닝 모형을 위한 파이썬 패키지다. 심볼릭 연산
과 그래프 연산 모형, GPGPU를 사용한 연산 등을 제공하므로 대량 연산을 요하는 딥러닝 학습에 필수 패키지
다.

Keras
Keras("케라스"라고 읽는다) 패키지는 TensorFlow 패키지를 쉽게 사용할 수 있도록 도와주는 고수준 패키지
다. Keras를 사용하면 쉽게 신경망 모형을 구현할 수 있다. 원래 독자적인 패키지이지만 지금은 텐서플로에 통
합되었다.

PyTorch
PyTorch("파이토치"라고 읽는다.) 패키지는 딥러닝 라이브러리인 Torch에 기반하여 만들어진 패키지다. 텐서
플로와 같은 저수준 API와 케라스와 같은 고수준 API를 같이 제공한다.

pgmpy
pgmpy("피쥐엠파이"라고 읽는다.) 패키지는 확률론적 그래프 모형을 구현하는 파이썬 패키지다.

Posted by 화공쟁이
,