Python/빅데이터분석 6

SVC - Support Vector Classification

SVC - Support Vector Classification 2차원의 평면 직선으로 표현할 수 없는 분류를 3차원으로 계산 해 주는 알고리즘 데이터셋 1 : make_blobs from sklearn.datasets 데이터셋 2 : mglearn.tools.make_handcrafted_dataset 데이터셋 3 : load_breast_cancer from sklearn.datasets (유방암 데이터셋) In [1]: #-*- coding:utf-8 -*- %matplotlib inline import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.datasets import mak..

Regression, Tree

데이터셋 1 : make_forge from mglearn 데이터셋 2 : load_breast_cancer from sklearn.datasets (유방암 데이터셋) 함수 : plot_feature_importances_cancer (해당 모델을 이용한 예측에서 feature들의 중요도 출력) In [1]: #-*- coding:utf-8 -*- %matplotlib inline import matplotlib.pyplot as plt from sklearn.linear_model import LogisticRegression from sklearn.svm import LinearSVC import mglearn x, y = mglearn.datasets.make_forge() fig, axes = p..

LinearRegression, Ridge, Lasso 알고리즘

사용 데이터셋 : iris, forge, 사용 모델 : KNN, LinearRegression, Ridge, Lasso In [1]: from sklearn.model_selection import train_test_split from sklearn.datasets import make_blobs import mglearn # x값에 따른 y값 형태의 dataset을 생성 # 사용되는 데이터셋은 forge() 형태 x, y = mglearn.datasets.make_forge() # 전체 데이터셋을 train데이터와 test데이터로 생성 x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=0) In [2]: # KNN Class..

붓꽃데이터를 이용한 KNN 분류모델 사용

사용 데이터셋 : iris 사용 모델 : KNN 알고리즘 In [1]: # 아이리스 데이터셋 로드 from sklearn.datasets import load_iris # 데이터셋 선언 # 붓꽃의 데이터셋을 사용 iris_dataset = load_iris() In [2]: # 특성 확인 print("iris_dataset의 키 : {}".format(iris_dataset.keys())) iris_dataset의 키 : dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names']) In [3]: # 데이터셋의 정보 print(iris_dataset['DESCR'][:193]+"\n...") Iris Plants Database =====..