본문 바로가기
  • 데이터야 놀자
데이터 분석 환경

비지도학습 맛보기와 오렌지3 (Orange3) 설치

by 데이터랑 2023. 12. 28.
728x90

 

 

비지도 학습 (  Unsupervised Learning  ) 이해하기

 

비지도학습(Unsupervised Learning)을 이해하기 위해서는 지도학습(Supervised Learning)과 비교하지 않을 수 없다.

처음 이 용어를 적했을때 비지도가 뭐지? 매우 생소했는데 알고 보니 지도와 비지도가 서로 대비되는 용어로 주로  패턴인식의 한 분야로 이해하면 좀 더 쉽게 다가가질 수 있을 것 같다.

 

일단,

  • 지도학습은 여러데이터의 답안지인 결괏값이 존재하는 데이터를 가지고 학습시킨 후 다른 데이터에 적용
  • 비지도학습은 온갖 흩트러진 물건들에 대하여 스스로 분류기준을 찾아 나가는 것으로 비유하면 좀 더 쉽게 이해가 될 것 같다

1. 주요 알고리즘 

 

  • 차원축소 : 입력변수의 개수를 줄이는 방법으로  주로 주성분 분석(PCA)기법이 대표적
  • 군집화 :데이터를 K개의 클러스터로 그룹화하는 알고리즘 ( K-Means Clustering )과 계층적 트리 구조로 데이터를   그룹화하는 Hierarchical Clustering 이 대표적

 

2. 연관분석 ;  "기저귀를 산 고객 중 70%가 맥주도 함께 산다"와 같은 규칙은 이미 많이 알려져 있고 이는 장바구니 분석( Market Basket Analysis)에서 나오는 것인데 이런 규칙을 찾아내는 것이 연관분석의 목표

 

 

이런 분석들을 좀더 쉽게 해 볼 수 있는 Orange3 무료 툴이 있어 테스트해보려고 설치했다

 

 

오렌지3 (Orange3) 설치하기

 

1. 다운로드 (나는 윈도용으로 다운로드했음)

 

 

https://orangedatamining.com/download/ 에서 다운로드

 

 

2. 설치과정

 

 

 

 

 

 

3. 미니콘다도 포함하여 설치됨

 

 

 

 

 

 

 

4. 바탕화면에 귀여운 오렌지 아이콘이 생김

 

 

 

5. 첫 실행화면

 

 

 

 

 

 

 

 

오렌지3 부가기능 설치

 

오렌지3에는 이미지분석이나 시계열분석기능이 기본기능이 아니라서 따로 설치해야 하기 때문에

 

1. 상단 메뉴 - Options - Add Ones 선택

 

 

 

2. 필요한 기능 선택

 

내가 테스트해보려고 하는 것은 Time Series 기능인데 혹시 몰라 다 설치했음

 

 

 

 

참고 : 오렌지3 실행 시 관리자권한으로 실행하면 아래와 같은 오류방지 할 수 있음

 

4. 오렌지 재실행

 

 

 

 

5. 좌측 메뉴란에 추가 기능바들이 새로이 추가됨

 

 

 

다음에는 오렌지를 활용한 예제들을 정리해야겠다.

 

728x90
728x90

댓글