본문 바로가기
기계학습(Machine Learning)

[기계학습] '기계학습(Machine Learning)' 이란?

by Yeah_D 2023. 1. 10.

 '기계학습(Machine Learning)' 이란?

머신러닝 즉, '기계학습(Machine Learning)'은 컴퓨터가 경험을 통해 학습할 수 있도록 프로그래밍 하는 것이다.
새로운 데이터를 입력했을 때도 가장 정확하게 예측할 수 있는, '최적의 매개변수'를 찾는 작업인 것이다.
(여기서 '학습'이란, 경험의 결과로 나타나는, 비교적 지속적인 행동의 변화나 그 잠재력의 변화 또는 지식을 습득하는 과정을 말한다.)

 

이러한 기계학습이 푸는 문제는 매우 복잡하여 단순한 수학 공식으로 표현이 불가능하다.
그렇기에 자동으로 문제를 풀기 위해 적합한 모델을 찾아내는 과정이 필수적이다.
그러기 위해서는 기계가 충분히 학습할 수 있는 충분한 양의 데이터가 필요하다.
(데이터가 많으면 많을수록 추정 정확도가 높아진다.)

 

여기에 사용되는 개념이 과소적합과 과잉적합이다.
*과소적합: 모델의 용량이 작아, 오차가 클 수밖에 없는 현상 (즉, 데이터가 적어서 학습이 잘 안되는 상황)
*과잉적합: 모델의 용량이 커서, 잡음까지 수용하게 되어 부정확한 예측을 하게 되는 현상 (즉, 데이터가 많아서 로드가 많이 걸리는 현상)

 

이 둘의 개념을 숙지하여 낮은 바이어스와 낮은 분산을 가진 예측기 제작을 하는 것이 '기계학습'의 목표이다.

*바이어스: 예측값과 정답간의 관계
(즉, 오차가 크다=바이어스가 크다 / 오차가 작다=바이어스가 작다)
*분산: 예측값끼리의 관계
(즉, 예측의 변동폭이 작아, 비슷한 모델=분산이 작다 / 예측의 변동폭이 커, 크게 다른 모델=분산이 크다)

 

 기계학습의 유형

기계학습은 4가지의 학습 유형으로 구분되어진다.

아래의 4가지 유형은 기계학습의 주요 개념이기에, 필히 숙지해둬야 하는 내용이다.

지도 학습: 특징벡터 X와, 목표값 Y가 모두 주어진 상황 (회귀/분류 문제로 구분)
비지도 학습: X는 주어지는데, Y는 주어지지 않은 상황 (분류를 하기 위해 특징공간 변환이 이루어진다)
강화 학습: Y가 주어지는데, 지도학습과 다른 형태 (잘하면 보상을 준다. 보상을 주어, 계속 잘하게 만드는 것이다)
준지도 학습: 일부는 X, Y를 모두 가지지만, 나머지는 X만 가진 상황

 

위 내용은 각 학습별 주요 특징만을 정리한 것이며, 자세한 내용은 아래 포스팅 링크를 통해 확인할 수 있다.

*추후 업데이트 예정

 

댓글