세상을 바꾸는 데이터

[Pandas] 판다스(Pandas)란?? 본문

ML/Pandas

[Pandas] 판다스(Pandas)란??

Industriousness 2022. 1. 19. 16:22

 

판다스(Pandas)는 파이썬에서 데이터 처리를 위해 존재하는 가장 인기 있는 라이브러리이다. 일반적으로 대부분의 데이터 세트는 2차원(행과 열로 구성된) 데이터이다. 행과 열의 2차원 데이터가 인기 있는 이유는 인간이 가장 이해하기 쉬운 데이터 구조이면서도 효과적으로 데이터를 담을 수 있는 구조이기 때문이다.

판다스란

 

판다스는 월스트리트 금융회사의 분석 전문가인 웨스 매키니(Wes Mckinney)가  회사에서 사용하는 분석용 데이터 핸들링 툴이 마음에 안 들어서 개발했다고 한다.

판다스 개발자 - Wes Mckinney

 

판다스의 핵심 객체는 DataFrame이다. DataFrame이란 여러 개의 행과 열로 이루어진 2차원 데이터를 담는 데이터 구조체이다. 판다스가 다루는 대부분의 영역은 바로 DataFrame과 관련된 부분이다. 

DataFrame을 이해하기 전에 IndexSeries를 이해하는 것도 중요하다.

IndexRDBMS의 PK처럼 개별 데이터를 고유하게 식별하는 Key값이며, Series 칼럼이 하나뿐인 데이터 구조체이다.

Series와 DataFrame의 가장 큰 차이는 Series는 칼럼이 한 개, DataFrame은 칼럼이 여러 개인 데이터 구조체라는 점이다.

판다스의 핵심 객체 DataFrame

 

다음 포스트부터 Pandas에 대해 자세히 다루어보겠다.

 

Reference


http://www.yes24.com/Product/Goods/69752484

https://ko.wikipedia.org/wiki/Pandas

https://mobile.twitter.com/wesmckinn

https://mmjourney.tistory.com/15

 

 

 

 

 

728x90
반응형
Comments