붓꽃 데이터
https://github.com/pandas-dev/pandas/blob/master/doc/data/iris.data
Raw 클릭 -> 우클릭 -> 다른이름으로 저장 -> iris.csv 저장
붓꽃 품종 분류하기
이터 150 개 중 100개는 학습데이터, 50개는 테스트 데이터로 사용
scikit-learn의 메소드를 이용해서 간단하게 작성하기
pandas 를 통해 csv 파일을 읽어들인다. pandas의 DataFrame 타입
csv[['열 이름', '열 이름', ...]] 으로 필요한 열을 DataFrame 타입으로 불러올 수 있다.
MNIST - 손글씨 숫자 데이터
http://yann.lecun.com/exdb/mnist/
데이터 다운로드
CSV파일로 변환하기
우선 1000개만 테스트
데이터 학습시키기
외국어 판별하기
샘플데이터 : 위키피디아 데이터 추출. 영어(en), 프랑스어(fr), 인도네시아어(id), 타갈로그어(tl)를 사용
데이터의 분포를 그래프로 확인하기
bar plot
결과
line plot