일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 텍스트 분석
- 파이썬 철저 입문
- MySQL
- 프로젝트
- Cluster
- 내일배움캠프
- 스파르타코딩
- 웹 스크랩핑
- TiL
- 오블완
- SQL
- 스파르타
- 실전 데이터 분석 프로젝트
- 파이썬 완벽 가이드
- 파이썬 머신러닝 완벽가이드
- 회귀분석
- 스파르타 코딩
- 티스토리챌린지
- 파이썬 철저입문
- hackerrank
- R
- 프로그래머스
- wil
- 중회귀모형
- 미세먼지
- 내일배움
- harkerrank
- 파이썬
- 파이썬 머신러닝 완벽 가이드
- 내일배움카드
- Today
- Total
목록Cluster (3)
OkBublewrap

준지도학습(semisupervised learning) 일부 데이터만 target 변수값(label)을 갖고 있고 나머지 다수 데이터는 label이 없을 때 이용하는 학습 방법 from sklearn.datasets import load_digits X_digits, y_digits = load_digits(return_X_y = True) X_1 = X_digits[0,:].reshape(8, -1) X_1 plt.imshow(X_1); y_digits[0] # 0 array([[ 0., 0., 5., 13., 9., 1., 0., 0.], [ 0., 0., 13., 15., 10., 15., 5., 0.], [ 0., 3., 15., 2., 0., 11., 8., 0.], [ 0., 4., 12., ..

# 군집을 사용한 이미지 분할 import urllib url = "https://raw.githubusercontent.com/rickiepark/handson-ml2/master/images/unsupervised_learning/ladybug.png" urllib.request.urlretrieve(url, "lady.png") # 시각화 from matplotlib.image import imread image = imread("lady.png") image.shape # (533, 800, 3) plt.imshow(image) plt.show() 민들레에 무당벌레가 있는 사진이다. from matplotlib.image import imread image = imread("lady.png") p..

: 비지도 학습의 일종으로 고객분류, 차원 축소, 이상치 탐지, 준지도학습, 이미지 검색, 이미지 분할으로 쓰인다. K-means 알고리즘 : 특정한 임의의 지점을 선택해 그 중심으로 가장 가까운 개체를 선택하는 알고리즘 장점 : 일반적인 군집화에서 가장 많이 활용되는 알고리즘, 알고리즘이 쉽고 간결 단점 : 거리 기반 알고리즘으로 속성의 개수가 많으면 정확도가 떨어진다, 반복횟수가 많을 수록 수행시간 느려진다, 몇 개의 군집을 선택할지 어렵다. # 거리기반이므로 scale from sklearn.preprocessing import scale from sklearn.cluster import KMeans import matplotlib.pyplot as plt import seaborn as sns i..