본문 바로가기

Archived(CSE Programming)/Machine Learning

Chap 4. Machine Learning Overview & An understanding of data

1) Python Ecosystem for ML

Anaconda 라는 상용 프로그램, 무겁기 때문에 miniconda 사용!

window에서는 CONDA라는 파이썬 가상환경 관리 패키지 활용

Pandas, Numpy 등과 같은 라이브러리 활용 예정


* How to learn machine Learning

기존의 Data -> 기계 학습 알고리즘 -> 모델 형성

새로운 Data -> 모델 -> 예측 


일반적인 1차 방정식을 통해 선형 예측은 

y= ax + b, 여기서 x는 독립변수이고 y는 종속 변수

그리고 a와 b를 구하기


그렇지만, 실제 독립변수는 수많이 존재. 그래서 여러가지 Feature Vector 활용


전체 테이블 - Data sample, 열 - Column 또는 Feature

한 명의 Data - Instance, Feature vector - 하나의 열들의 data


이러한 데이터를 처리하기 위해 Padas 사용

Pandas는 엑셀처럼 데이터를 핸들링할 수 있다


2) Representing a model

Numpy, Vector를 Array로 표현하기

W(^T)X

'Archived(CSE Programming) > Machine Learning' 카테고리의 다른 글

Chap 5-3. Visualization & Handling  (0) 2019.02.20
Chap 5-2. Pandas  (0) 2019.02.20
Chap 5-1. Numpy  (0) 2019.02.18
Chap 3. Assignment  (0) 2019.02.18
Chap 1~2. Pythonic Code  (0) 2019.02.18