https://developers.google.com/machine-learning/crash-course
Google에서 머신러닝 학습에 필요한 지식을 소개하는 단기 코스이다.
각 주제마다 영상 강의와 그와 관련된 구체적인 내용으로 학습을 도와주고,
머신러닝 문제를 맞추거나 직접 연습할 수 있는 과정을 제공한다.
머신러닝 이란
인공지능 > 머신러닝 > 인공신경망 > 딥러닝
인공지능의 기반 기술로 컴퓨터가스스로 데이터를 학습하여 새로운 데이터를 얻어 예측하는 기술
입력 데이터와 결과값(label)을 이용하여 모델(model)을 학습하고
이를 통해 새로운 데이터에 대한 결과값을 예측/추론 하는 것.
지도학습(Supervised Learning)
- 입력과 결과값(label)을 이용하여 학습한다.
- 분류(classification), 회귀(regression)
- (학습모델)SVM, Decision Tree, KNN, 선형/로지스틱 회귀
- [적용 분야] 질병, 기후, 부동산 등 예측 분석과 스팸 이메일 등의 분류 분석
비지도학습(Unsupervised Learning)
- 입력만을 이용한 학습
- 군집화(clusering), 압축(compression)
- clusering: 데이터를 비슷한 특성끼리 묶음
- (학습모델) K-means 클러스터링
- k-means(중심기반 군집분석(클러스터링) 알고리즘) : 주어진 데이터를 k개의 클러스터로 묶는 방법
- [적용 분야] 시장 바구니 분석(Market Basket Analysis), 시맨틱 클러스터링(Sementic Clustering), 배달 매장 최적화(Delivery Store Optimization), 사고취약지역 파악(Identifying Accident Prone Areas), 인물 사진 그룹화
- 데이터의 숨겨진 특징, 구조, 패턴 들을 파악
강화학습(Reinforcement Learning)
- 결과값 대신 리워드(reward) 주어짐
- ex) 리워드는 게임을 종료했을 때 승리하거나 패배하는것으로 정의
- Action Selection, Policy Learning
- (학습모델) MDP(Markov Decision Process)
- [적용 분야] ‘체스게임' ‘알파고’
Labels
- 해당 모델을 학습 시킬 때, 라벨(정답)을 제공한다.
- 예를 들어 라벨은 이메일 스팸 필터링의 경우 그 라벨은 ‘스팸’ / ‘스팸 아님’ 으로 나뉜다.
Features
- 데이터를 표현하는 방식이다.
- 예를 들어 특성은 이메일에 포함된 단어
- words in the email text
- sender's address
- time of day the email was sent
- email contains the phrase "one weird trick."
- 예를 들어 특성은 이메일에 포함된 단어
Examples
예 는 데이터(x)의 특정 인스턴스입니다.
라벨이 있는 예 / 라벨이 없는 예
Models
- 모델 features와 label 사이의 관계를 정의한다.
- Training(훈련)은 모델을 만들거나 학습하는 것을 의미한다. 즉, 예로 정답의 모델을 보여주고 모델이features와 label 사이의 관계를 점진적으로 학습할 수 있도록 한다.
- Inference(추론)은 라벨이 없는 예에 학습된 모델을 적용하는 것을 의미합니다. 즉, 학습된 모델을 사용하여 유용한 예측('y')을 할 수 있습니다. 예를 들어, 추론하는 동안 라벨이 없는 새로운 예에 대한 medianHouseValue를 예측할 수 있다.
지도학습(Supervised Learning)
Regression vs. classification
회귀(Regression) 모델은
- 연속적인 값은 예측한다.
- 예를 들어 ‘캘리포니아에서 집값은 얼마인가?’ / ‘사용자는 이 광고를 클릭할 확률 어느정도인가?’ 와 같은 질문에 대한 대답의 예측을 만든다.
분류(classification) 모델은
- 미리 정의된 여러 라벨 중 하나의 값을 예측한다.
- 예를 들어 ‘이 이메일이 스팸 or 스팸아님 인가?’ / ‘강아지, 고양이, 햄스터의 이미지인가?’
- 이진분류, 다중 분류 등
참고 : 존 매카시의 ‘인공지능’ 정의
출처 : 구글 머신러닝 집중과정