비지도 학습 ( Unsupervised Learning ) 이해하기
비지도학습(Unsupervised Learning)을 이해하기 위해서는 지도학습(Supervised Learning)과 비교하지 않을 수 없다.
처음 이 용어를 적했을때 비지도가 뭐지? 매우 생소했는데 알고 보니 지도와 비지도가 서로 대비되는 용어로 주로 패턴인식의 한 분야로 이해하면 좀 더 쉽게 다가가질 수 있을 것 같다.
일단,
- 지도학습은 여러데이터의 답안지인 결괏값이 존재하는 데이터를 가지고 학습시킨 후 다른 데이터에 적용
- 비지도학습은 온갖 흩트러진 물건들에 대하여 스스로 분류기준을 찾아 나가는 것으로 비유하면 좀 더 쉽게 이해가 될 것 같다
1. 주요 알고리즘
- 차원축소 : 입력변수의 개수를 줄이는 방법으로 주로 주성분 분석(PCA)기법이 대표적
- 군집화 :데이터를 K개의 클러스터로 그룹화하는 알고리즘 ( K-Means Clustering )과 계층적 트리 구조로 데이터를 그룹화하는 Hierarchical Clustering 이 대표적
2. 연관분석 ; "기저귀를 산 고객 중 70%가 맥주도 함께 산다"와 같은 규칙은 이미 많이 알려져 있고 이는 장바구니 분석( Market Basket Analysis)에서 나오는 것인데 이런 규칙을 찾아내는 것이 연관분석의 목표
이런 분석들을 좀더 쉽게 해 볼 수 있는 Orange3 무료 툴이 있어 테스트해보려고 설치했다
오렌지3 (Orange3) 설치하기
1. 다운로드 (나는 윈도용으로 다운로드했음)
2. 설치과정
3. 미니콘다도 포함하여 설치됨
4. 바탕화면에 귀여운 오렌지 아이콘이 생김
5. 첫 실행화면
오렌지3 부가기능 설치
오렌지3에는 이미지분석이나 시계열분석기능이 기본기능이 아니라서 따로 설치해야 하기 때문에
1. 상단 메뉴 - Options - Add Ones 선택
2. 필요한 기능 선택
내가 테스트해보려고 하는 것은 Time Series 기능인데 혹시 몰라 다 설치했음
참고 : 오렌지3 실행 시 관리자권한으로 실행하면 아래와 같은 오류방지 할 수 있음
4. 오렌지 재실행
5. 좌측 메뉴란에 추가 기능바들이 새로이 추가됨
다음에는 오렌지를 활용한 예제들을 정리해야겠다.
'데이터 분석 환경' 카테고리의 다른 글
엑셀 데이터 DDE 연동 2 - 엑셀파일 자동저장 하는 방법 (0) | 2024.07.11 |
---|---|
엑셀데이터 DDE 연동 1 - 관심종목 실시간 현황판 만들기 (1) | 2024.07.08 |
LSTM 활용한 주식가격 예측 모델 만들기 첫걸음. (0) | 2023.11.14 |
주피터노트북(Jupyter Notebook) 가상환경 적용하기 (0) | 2023.09.05 |
댓글