본문 바로가기

전체 글346

파이썬의 대표 시각화 도구 Matplotlib 아래의 모든 내용은 파이썬으로 데이터 주무르기(저자 민형기)의 예시를 사용했습니다. ▶ 시각화에 필요한 모듈 불러오기, matplotlib.pyplot as plt # 모듈 불러오기 import matplotlib.pyplot as plt # 앞으로 plt란 값을 사용 %matplotlib inline # 그래프의 결과를 출력 세션에 나타나게 하는 설정 ▶간단한 그래프 그리기 plt.figure() plt.plot([1,2,3,4,5,6,7,8,9,8,7,6,5,4,3,2,1,0]) plt.show() ▶ sin함수 만들어보기 import numpy as np t = np.arange(0,12,0.01) # 0에서 12까지 0.01 간격으로 데이터 만들기, x축 y = np.sin(t) # np에 있는 .. 2019. 9. 17.
Chap02 모델정확도 평가하기(2) 오늘은 저번 시간에 이어서 학습하겠습니다. ● The Classification Setting 회귀 문제에서 MSE를 통계 학습 모델의 정확도를 평가하는 데 사용했습니다. 분류 문제에서는 error rate를 사용합니다. $Error Rate = \sum_{i=1}^{n}I(y_{i} \neq \hat {y_{i}})/n$ $I(y_{i} \neq \hat {y_{i}})$은 지시 함수(indicator function)입니다. 만약 $(y_{i} \neq \hat {y_{i}})$이 맞다면 1 그렇지 않다면 0 값을 가집니다. 따라서 error rate는 잘못된 분류 또는 오분류의 비율을 나타냅니다 ● Bayes Error Rate 베이즈 오차율은 가장 낮은 가능성의 오차율을 나타내는데, 데이터의 't.. 2019. 9. 17.
Pandas 기초 익히기 아래의 모든 내용은 파이썬으로 데이터 주무르기(저자 민형기)의 예시를 사용했습니다. ▶ 모듈 불러오기 # 모듈 불러오기 import pandas as pd import numpy as np ▶ Series 데이터 유형 # Series는 pandas의 데이터 유형 중 하나 # 대괄호로 만드는 파이썬의 list데이터로 만드는 것이 가능함 # 중간에 NaN도 넣어줌 s = pd.Series([1,3,5,np.nan,6,8]) s ▶ date_range 데이터 유형 # 날짜형 데이터인 date_range # 기본 날짜를 지정하고 periods 옵션으로 6일간이라고 지정 dates = pd.date_range('20130101', periods=6) dates ▶ DataFrame 데이터 유형 # 6행 4열의 랜.. 2019. 9. 16.
정규분포 - 평균과 분산 증명 정규분포 평균 증명 $\int_{-\infty}^{\infty} n(x;\mu,\sigma) dx = \frac {1}{\sqrt {2\pi}\sigma}\int_{-\infty}^{\infty} e^{-\frac {1}{2}(\frac {x-\mu}{\sigma})^{2}}dx = 1$ $E(X)= \frac {1}{\sqrt {2\pi}\sigma}\int_{-\infty}^{\infty} xe^{-\frac {1}{2}(\frac {x-\mu}{\sigma})^{2}}dx$ $z = \frac {x-\mu}{\sigma}$로 놓으면, $x = \sigma z + \mu$, $dx = \sigma dz$이고, $E(X) = \frac {1}{\sqrt {2\pi}}\int_{-\infty}^{\inf.. 2019. 9. 16.