음향 스터디

음향스터디 : Machine Learning with Matlab

innersound 2024. 1. 27. 10:17

Matlab에서 자기 Software로 ML하라고 만든 자료가 있다.

매번 대충보니 내 지식 안돼서 이해해보려함.

 

목차

1. 개요

2. 시작하기

3. 비지도 학습

4. 지도 학습

 

 

1. 개요

머신 러닝이란, 미리 결정된 방정식이 아니라, 데이터 정보를 학습한다. 데이터 개수 많을 수록 좋다.

작동 방식이,

비지도 학습(데이터에 의해 그룹화 혹은 데이터 해석)->클러스터링

지도학습(입출력 데이터에 기반해서 예측 모델 개발)->1)분류 2)회귀

출처, MatWorks

 

 

2)시작하기

워크 플로우를 보면,

데이터 불러와서 전처리하고 가공해서 특징 추출하고 학습하는 과정을 반복한다.

이 과정 마다 최적 값이 뭘지를 바꿔가면서 반복하는 것이다.

 

 

 

3) 비지도 학습, 구제적인 목표가 없는데, 이 정보들의 상관 관계를 찾는 것.

데이터를 클러스터하거나, 너무 복잡하면 저차원 데이터로 나눠서 분류를 하고 지도 학습진행.

 

 

 

4) 지도 학습

분류는 이메일이 스팸인지, 크기가 어떠한지, 등등을 분류하는 거고,

회귀는 연속적인 응답들(온도 변화, 수요 변동, 자필 인식, 음향 신호 처리) 같은 것들임.

 

분류는 당연하게 분류개수가 많아질수록 복잡하다. 2개(ex. 개냐 고양이냐) 보다 3개이상(ex. 개냐 고양이냐 사자냐)이 복잡.

분류 알고리즘은 많음. 그중에, 로지스틱 회귀 / kNN / SVM / 인공신경망 / 나이브 베이지안 / 판별 분석 / 의사결정 트리 / 배그드 등 많다.

회귀 알고리즘도, 선형 회귀 / 비선형 회귀 / 가우시안 프로세스 회귀 모델 / SVM 회귀 / 일산 선형 모델 / 회귀 트리 / 

 

 

학습을 뭘 하든, 모델을 개선해야하고, 아래 그림으로 분류함

특징 선택은 일반적으로, 단계적 회귀 / 순차적 특징 / 정규화 / NCA

특징 변환은 일반적으로, PCA / 음수 미포함 행렬 분해 / 인자 분석

하이퍼파라미터 튜닝은 일반적으로, 베이지안 회적화 / 그리드 검색 / 증감 기반 최적화

 

 

Matlab은 지도학습 하는 툴들에 대해 더 많이 제공하고 있네..

개론은 봤으니까. 나에게 뭐가 필요한 건지 고민 할것.