일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 사회조사분석사 2급 필기 시험시간
- 사회조사분석사 2급 기출문제집
- 공모주 청약
- 2월공모주
- 현대엔지니어링 수요예측
- DFS
- 사회조사분석사2급실기신청
- 그리디
- 사이킷런
- 벽부수고이동하기 파이썬
- 시물레이션
- 파이썬 정렬
- 너비우선탐색
- 사회조사분석사 2급 접수
- 백준 알고리즘
- 사회조사분석사2급실기신청꿀팁
- 공모주
- 알고리즘
- 사회조사분석사 2급 공부방법
- 머신러닝
- 사회조사분석사 2급
- 현대엔지니어링
- 백준
- 정렬
- 공모주청약
- BFS
- 오미크론 자가격리
- 사회조사분석사 2급 필기 요약정리
- 사회조사분석사 2급 필기 공부방법
- 사회조사분석사 2급 독학
- Today
- Total
세상을 바꾸는 데이터
[Pandas] 판다스 - DataFrame 칼럼 데이터 생성, 수정, 삭제 본문
캐글에서 사용되는 연습 데이터셋인 타이타닉 데이터를 이용한다.
데이터셋 및 자세한 내용은 다음 포스트를 참고하면 된다.
https://data-flower.tistory.com/9?category=949030
타이타닉 데이터 살펴보기
import pandas as pd
titanic_df = pd.read_csv('titanic_df.csv')
print(titanic_df.head(5)) # 5번째 행까지 출력
[Output]
DataFrame의 칼럼 데이터 세트 생성 및 수정
DataFrame의 칼럼 데이터 세트 생성 및 수정은 [ ] 연산자를 이용해 쉽게 할 수 있다. DataFrame [ ] 내에 새로운 칼럼명을 입력하고 값을 할당해주면 칼럼 데이터 세트 생성이 완료된다.
titanic_df['extra']= 0 # 새로운 컬럼 생성 및 모든 데이터값 0으로 할당
titanic_df.head(3)
[Output]
기존 칼럼에 값을 업데이트하려면 해당 칼럼에 업데이트 값을 그대로 지정하면 된다.
titanic_df['extra'] = titanic_df['extra'] + 50
titanic_df.head(3)
[Output]
DataFrame 데이터 삭제
- DataFrame.drop( )
DataFrame에서의 데이터 삭제는 drop( ) 메서드를 이용한다.
DataFrame.drop(lables=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')
drop( ) 메서드에 axis = 1을 입력하면 칼럼을 삭제, axis = 0을 입력하면 행을 삭제한다. 데이터 삭제는 칼럼 삭제를 주로 이용하는 편이며, axis = 0을 사용하는 경우는 이상치 데이터를 삭제하는 경우에 사용된다.
inplace가 False이면 자기 자신의 DataFrame의 데이터는 삭제하지 않으며, 삭제된 결과 DataFrame을 반환한다. (inplace의 기본 디폴트 값은 False이다.)
inplace=True로 설정한 채로 반환 값을 다시 자신의 DataFrame 객체로 할당하면 안 된다. (이는 반환 값이 None이 되기 때문)
titanic_drop_df = titanic_df.drop('extra', axis=1 ) # 칼럼이 'extra'인 데이터셋을 삭제
titanic_drop_df.head(3)
[Output]
drop_result = titanic_df.drop(['SibSp', 'Ticket'], axis=1, inplace=True)
print(' inplace=True 로 drop 후 반환된 값:', drop_result)
titanic_df.head(3)
[Output]
Reference
https://github.com/chulminkw/PerfectGuide
'ML > Pandas' 카테고리의 다른 글
[Pandas] 판다스 - DataFrame을 정렬, 집계, 그룹하는 방법 (2) | 2022.01.25 |
---|---|
[Pandas] 판다스 - 데이터 선택 및 필터링 (indexing) (9) | 2022.01.24 |
[Pandas] 판다스 - 데이터프레임과 넘파이 상호 변환 (0) | 2022.01.23 |
[Pandas] 판다스 - 파일을 DataFrame으로 불러오기, 기본 API (2) | 2022.01.19 |
[Pandas] 판다스(Pandas)란?? (4) | 2022.01.19 |