일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 공모주 청약
- 사회조사분석사 2급 독학
- 벽부수고이동하기 파이썬
- 사회조사분석사 2급 필기 요약정리
- BFS
- 사회조사분석사 2급
- 사회조사분석사 2급 필기 시험시간
- 시물레이션
- 그리디
- 백준
- 정렬
- 사회조사분석사 2급 필기 공부방법
- 사이킷런
- 알고리즘
- 너비우선탐색
- 머신러닝
- 오미크론 자가격리
- 사회조사분석사 2급 기출문제집
- 파이썬 정렬
- 사회조사분석사 2급 접수
- 현대엔지니어링 수요예측
- 공모주
- 사회조사분석사 2급 공부방법
- 현대엔지니어링
- 공모주청약
- 사회조사분석사2급실기신청
- 백준 알고리즘
- DFS
- 2월공모주
- 사회조사분석사2급실기신청꿀팁
- Today
- Total
세상을 바꾸는 데이터
[Pandas] 판다스(Pandas)란?? 본문
판다스(Pandas)는 파이썬에서 데이터 처리를 위해 존재하는 가장 인기 있는 라이브러리이다. 일반적으로 대부분의 데이터 세트는 2차원(행과 열로 구성된) 데이터이다. 행과 열의 2차원 데이터가 인기 있는 이유는 인간이 가장 이해하기 쉬운 데이터 구조이면서도 효과적으로 데이터를 담을 수 있는 구조이기 때문이다.
판다스는 월스트리트 금융회사의 분석 전문가인 웨스 매키니(Wes Mckinney)가 회사에서 사용하는 분석용 데이터 핸들링 툴이 마음에 안 들어서 개발했다고 한다.
판다스의 핵심 객체는 DataFrame이다. DataFrame이란 여러 개의 행과 열로 이루어진 2차원 데이터를 담는 데이터 구조체이다. 판다스가 다루는 대부분의 영역은 바로 DataFrame과 관련된 부분이다.
DataFrame을 이해하기 전에 Index와 Series를 이해하는 것도 중요하다.
Index는 RDBMS의 PK처럼 개별 데이터를 고유하게 식별하는 Key값이며, Series는 칼럼이 하나뿐인 데이터 구조체이다.
Series와 DataFrame의 가장 큰 차이는 Series는 칼럼이 한 개, DataFrame은 칼럼이 여러 개인 데이터 구조체라는 점이다.
다음 포스트부터 Pandas에 대해 자세히 다루어보겠다.
Reference
http://www.yes24.com/Product/Goods/69752484
https://ko.wikipedia.org/wiki/Pandas
https://mobile.twitter.com/wesmckinn
https://mmjourney.tistory.com/15
'ML > Pandas' 카테고리의 다른 글
[Pandas] 판다스 - DataFrame을 정렬, 집계, 그룹하는 방법 (2) | 2022.01.25 |
---|---|
[Pandas] 판다스 - 데이터 선택 및 필터링 (indexing) (9) | 2022.01.24 |
[Pandas] 판다스 - DataFrame 칼럼 데이터 생성, 수정, 삭제 (10) | 2022.01.23 |
[Pandas] 판다스 - 데이터프레임과 넘파이 상호 변환 (0) | 2022.01.23 |
[Pandas] 판다스 - 파일을 DataFrame으로 불러오기, 기본 API (2) | 2022.01.19 |