목록고등학생 (2)
운동하는 공대생

1. Intro 기본적인 분류 모델에서 사용되고 있는 이론들에 대하여 정리하고 직접 실습까지 진행하는 방식으로 진행하겠습니다. 2. Definition 2.1 결정 트리 규칙 노드 : 표시된 노드는 규칙 조건이 된다. 리프 노드 : 분류된 값 서브 트리 : 전체 트리가 아닌 일부분 => 하지만 트리 구조에서 깊이가 깊어질수록 결정 트리의 예측 성능이 저하될 가능성이 높다. 그래서 정확도를 높게 가지려면 최대한 많은 데이터 세트가 분류에 속하도록 특징으로는 직관적이라 룰이 명확하고 스케일링이나 정규화 작업이 필요하지 않는다. 하지만 결정 트리 모델의 단점은 과적합으로 정확도가 떨어진다. 실습 from sklearn.tree import DecisionTreeClassifier, export_graphviz..
1. Data https://www.kaggle.com/competitions/titanic/data Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 2. 수업 내용 머신러닝의 실습 과정에서 필요한 과정을 설명을 하겠습니다. 먼저 실습하는 과정에서는 제가 자주 사용하는 방식을 순서대로 설명을 하겠습니다. Data Preprocessing - 데이터 분석 import pandas as pd df=pd.read_csv('train.csv') df['Survived'].value_counts() df 데이터 전처리 과정에서는 먼저 데이터에 대한 분석을 진행을 해야 한다. 훈련을 위한 데이터와 예측을 하려는 데이터에 대하여 데이터의 분포(tar..