scikit-learn4 Scikit-Learn(사이킷런) 코드 완벽 분석 - Linear Regression csv 파일 이용하기 Scikit learn의 예시가 대부분 데이터를 만들거나 내장 데이터셋을 이용하기 때문에 실제 csv파일을 가지고 ML 예제를 다뤄보겠습니다. import matplotlib.pyplot as plt import numpy as np import pandas as pd from sklearn import datasets, linear_model from sklearn.metrics import mean_squared_error, r2_score %matplotlib inline 필요한 모듈을 가져옵니다. 내장 데이터셋의 디렉토리를 찾아 csv파일을 찾고 저장을 했는데 처리가 필요할 거 같습니다. 깔끔하게 정리해주고 X_2로 저장했습니다. diabetes_X = pd.read_csv('X_2.csv', e.. 2019. 10. 24. Scikit-Learn(사이킷런) 코드 완벽 분석 - Linear Regression Lasso import numpy as np import matplotlib.pyplot as plt %matplotlib inline from sklearn.metrics import r2_score 필요한 모듈을 가져옵니다. # ############################################################################# # Generate some sparse data to play with np.random.seed(42) n_samples, n_features = 50, 100 X = np.random.randn(n_samples, n_features) # Decreasing coef w. alternated signs for visualization idx =.. 2019. 10. 18. Scikit-Learn(사이킷런) 코드 완벽 분석 - Linear Regression Ridge # Author: Fabian Pedregosa -- # License: BSD 3 clause 코드 소스와 저작권은 위와 같음을 밝힙니다 import numpy as np import matplotlib.pyplot as plt from sklearn import linear_model %matplotlib inline 필요한 모듈을 가져옵니다. # X is the 10x10 Hilbert matrix X = 1. / (np.arange(1, 11) + np.arange(0, 10)[:, np.newaxis]) y = np.ones(10) 힐버트 행렬을 만들어줍니다. 힐버트 행렬은 다음과 같습니다. $H_{ij} = \frac {1}{i + j - 1}$ np.arange(1, 11) np.arrang.. 2019. 10. 16. Scikit-Learn(사이킷런) 코드 완벽 분석 - Linear Regression 내장 데이터셋 # Code source: Jaques Grobler # License: BSD 3 clause 코드 소스와 저작권은 위와 같음을 밝힙니다. import matplotlib.pyplot as plt import numpy as np from sklearn import datasets, linear_model from sklearn.metrics import mean_squared_error, r2_score %matplotlib inline 필요한 모듈을 가져옵니다. # Load the diabetes dataset diabetes = datasets.load_diabetes() datasets의 당뇨병 데이터를 불러옵니다. 참고로 sklearn의 datasets은 그림1과 같습니다. 만일 다른 data.. 2019. 10. 16. 이전 1 다음