일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 사회조사분석사 2급 필기 공부방법
- 사회조사분석사 2급
- 파이썬 정렬
- 사이킷런
- 현대엔지니어링 수요예측
- 공모주 청약
- 오미크론 자가격리
- 정렬
- 사회조사분석사 2급 공부방법
- 머신러닝
- DFS
- 공모주청약
- 사회조사분석사 2급 기출문제집
- 백준 알고리즘
- BFS
- 공모주
- 사회조사분석사2급실기신청
- 사회조사분석사 2급 접수
- 백준
- 사회조사분석사 2급 필기 시험시간
- 사회조사분석사 2급 독학
- 너비우선탐색
- 시물레이션
- 사회조사분석사 2급 필기 요약정리
- 알고리즘
- 현대엔지니어링
- 2월공모주
- 사회조사분석사2급실기신청꿀팁
- 그리디
- 벽부수고이동하기 파이썬
- Today
- Total
목록ML/scikit-learn(사이킷런) (3)
세상을 바꾸는 데이터
교차검증이란? 별도의 여러 세트로 구성된 학습 데이터 세트와 검증 데이터 세트에서 학습과 평가를 수행하는 것 용어 정리 학습 데이터 세트: 알고리즘을 학습시키는 데이터 세트 검증 데이터 세트: 학습된 모델의 성능을 1차 평가하는 데이터 세트 테스트 데이터 세트: 모든 학습/검증 과정이 완료된 후 최종적으로 성능을 평가하는 데이터 세트 교차검증을 하는 이유 알고리즘을 학습시키려면 학습 데이터와 예측 성능을 평가하기 위한 별도의 테스트 데이터가 있어야 한다. 하지만 이 방법은 과적합(Overfitting)에 취약한 단점이 있다. 과적합은 모델이 학습 데이터에만 과도하게 최적화되어, 실제 예측을 다른 데이터로 수행할 경우에는 예측 성능이 과도하게 떨어지는 것을 말한다. 고정된 데이터로만 학습하고, 이를 테스트..
사이킷런에 내장되어 있는 붓꽃 데이터 세트를 이용해 분류 예측 과정을 수행해보자. 이 프로젝트의 목표는 붓꽃 데이터 셋을 가지고 붓꽃 데이터 품종을 분류해보려고 한다. 붓꽃 데이터 세트는 꽃잎의 길이와 너비, 꽃받침의 길이와 너비 피처(feature)를 기반으로 꽃의 품종을 예측하기 위한 것이다. 사이킷런 라이브러리 설치 및 임포트하기 pip install scikit-learn import sklearn 붓꽃 예측을 위한 사이킷런 모듈 로딩 from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split sklearn...
사이킷런(scikit-learn)은 파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리이다. 사이킷런은 파이썬 기반의 머신러닝을 위한 가장 쉽고 효율적인 개발 라이브러리를 제공한다. 사이킷런 사이트: https://scikit-learn.org/stable/ scikit-learn: machine learning in Python — scikit-learn 1.0.2 documentation Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, me..