일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 2월공모주
- BFS
- 사회조사분석사 2급 공부방법
- 공모주
- 현대엔지니어링 수요예측
- 너비우선탐색
- 백준
- 사회조사분석사 2급 접수
- 사이킷런
- 머신러닝
- 공모주청약
- DFS
- 시물레이션
- 파이썬 정렬
- 백준 알고리즘
- 공모주 청약
- 현대엔지니어링
- 사회조사분석사 2급 기출문제집
- 사회조사분석사 2급 독학
- 사회조사분석사 2급 필기 요약정리
- 사회조사분석사 2급
- 알고리즘
- 벽부수고이동하기 파이썬
- 그리디
- 사회조사분석사2급실기신청꿀팁
- 정렬
- 오미크론 자가격리
- 사회조사분석사2급실기신청
- 사회조사분석사 2급 필기 시험시간
- 사회조사분석사 2급 필기 공부방법
- Today
- Total
목록전체 글 (86)
세상을 바꾸는 데이터

새로운 주피터 노트북을 생성하고 판다스 모듈을 임포트 한다. import pandas as pd 다음으로 데이터 파일을 판다스의 DataFrame으로 로딩할 것이다. 사용할 데이터 파일은 캐글의 대표 연습 파일인 타이타닉 탑승자 파일이다. 타이타닉 탑승자 데이터 파일은 https://www.kaggle.com/c/titanic에서 내려받을 수 있다. train 파일을 titanic_train으로 파일명을 변경한다. https://www.kaggle.com/c/titanic Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com ※주의※ 데이터 파일은 압축 후 주피터 노트북에서 코딩을 실행하고자 하는 폴더로 옮겨야 한다. 예를 들면 Pandas라..

판다스(Pandas)는 파이썬에서 데이터 처리를 위해 존재하는 가장 인기 있는 라이브러리이다. 일반적으로 대부분의 데이터 세트는 2차원(행과 열로 구성된) 데이터이다. 행과 열의 2차원 데이터가 인기 있는 이유는 인간이 가장 이해하기 쉬운 데이터 구조이면서도 효과적으로 데이터를 담을 수 있는 구조이기 때문이다. 판다스는 월스트리트 금융회사의 분석 전문가인 웨스 매키니(Wes Mckinney)가 회사에서 사용하는 분석용 데이터 핸들링 툴이 마음에 안 들어서 개발했다고 한다. 판다스의 핵심 객체는 DataFrame이다. DataFrame이란 여러 개의 행과 열로 이루어진 2차원 데이터를 담는 데이터 구조체이다. 판다스가 다루는 대부분의 영역은 바로 DataFrame과 관련된 부분이다. DataFrame을 이..

넘파이(Numpy)의 행렬(Matrix)에 대해 알아보자. 행렬 정렬 넘파이의 행렬 정렬은 대표적인 방법인 np.sort( )와 ndarray.sort( ), argsort( )가 있다. np.sort( ) ndarray.sort( ) argsort( ) np.sort( )의 경우 원 행렬은 그대로 유지한 채 원 행렬의 정렬된 행렬을 반환하며, ndarray.sort( )는 원 행렬 자체를 정렬한 형태로 변환하며 반환 값은 None이다. org_array = np.array([ 3, 1, 9, 5]) print('원본 행렬:', org_array) # [3 1 9 5] # np.sort( )로 정렬 sort_array1 = np.sort(org_array) print ('np.sort( ) 호출 후 반환..

넘파이에서 ndarray내의 일부 데이터 세트나 특정 데이터만을 선택할 수 있도록 하는 인덱싱에 대해 알아보자. Numpy 모듈 import import numpy as np 1차원 ndarray에서 단일 값 추출 1개의 데이터값을 선택하려면 ndarray 객체에 해당하는 위치의 인덱스 값을 [ ] 안에 입력하면 된다. # 1에서 부터 9까지의 1차원 ndarray 생성 array1 = np.arange(start=1, stop=10) print("array1의 데이터:", array1) # array1의 데이터: [1 2 3 4 5 6 7 8 9] # index(인덱스)는 0부터 시작하므로 array1[4]는 5번째 위치의 데이터값을 의미 value = array1[4] print('array1[4]의..

가장 먼저 넘파이 모듈 임포트 한다. import numpy as np np.array( ) 넘파이 array() 함수는 파이썬의 리스트와 같은 다양한 인자를 받아서 ndarray로 변환하는 기능을 수행한다. 생성된 ndarray 배열의 shape 변수는 ndarray의 크기와 ndarray 배열의 차원을 알 수 있다. ndarray 생성 및 크기 확인 array1 = np.array([1,2,3]) # 1차원 배열 print('array1 type:',type(array1)) print('array1 array 형태:',array1.shape) array2 = np.array([[1,2,3], [2,3,4]]) # 2차원 배열 print('array2 type:',type(array2)) print('..

Numpy를 이해하는 것은 파이썬 기반의 머신러닝에서 매우 중요하다. 많은 머신러닝 알고리즘이 Numpy를 기반으로 작성되어 있으며, 이들 알고리즘의 입력 데이터와 출력 데이터를 넘파이 배열 타입으로 사용하기 때문이다. 그렇다면 자주 사용하는 Numpy API에 관해 다음 포스트부터 알아보자. Reference https://ko.wikipedia.org/wiki/NumPy Numpy API에 관한 모든 소스코드 출처는 https://github.com/chulminkw/PerfectGuide에 있습니다. GitHub - chulminkw/PerfectGuide Contribute to chulminkw/PerfectGuide development by creating an account on GitHu..