์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- GE B650
- ๊ฒฝ์ง๋ํ
- ๋น ๋ฐ์ดํฐ
- ์๊ณ ๋ฆฌ์ฆ
- VitalRecorder
- ์์ฒด์ ํธ
- ์ ๋ณดํ์งํฅ์
- 1D CNN
- nvidia
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- Jetson
- ๋จธ์ ๋ฌ๋
- VitalDB
- Undersampling
- ๋ฐ์ดํฐ๋ถ์
- ํ๊ท
- ํ๊ท๋ถ์
- ๋์ด๋ธ๋ฒ ์ด์ฆ
- ๋ฅ๋ฌ๋
- MAE
- NIA
- R
- Data Imbalance
- 2D CNN
- CNN
- ๊ณต๋ถ
- edge computing
- ์ฃ์ง์ปดํจํ
- ๋ฐ์ดํฐ
- ์๋ฃ๋ฐ์ดํฐ
- Today
- Total
Doyun-lab
[ML] Naive Bayes (๋์ด๋ธ ๋ฒ ์ด์ฆ) ๋ณธ๋ฌธ
๐ก๐บ๐๐พ๐ ๐ฑ๐๐ ๐พ
e = event or evidence / H = Hypothesis
- Likelihood = hypothesis๊ฐ ์ฌ์ค์ด๋ผ๋ ์กฐ๊ฑด์์, evidence์ด ์ผ์ด๋ ํ๋ฅ
- Posterior = evidence๊ฐ ๊ด์ธก๋์์ ๋, hypothesis๊ฐ ์ผ์ด๋ ํ๋ฅ (์ฌํํ๋ฅ )
- Prior = evidence๋ฅผ ๊ด์ธก๋๊ธฐ ์ , hypothesis๊ฐ ์ผ์ด๋ ํ๋ฅ (์ฌ์ ํ๋ฅ )
- Marginal = ๋ชจ๋ ๊ฐ๋ฅํ hypothesis ์๋, ์๋ก์ด evidence๊ฐ ์ผ์ด๋ ํ๋ฅ
โ
* ์ค์ ์์
- ์ฅ์
- ํต๊ณ์ ์ถ๋ก ์ ์ํด ๊ท์น์ด ์ ํด์ง๊ณ ์ ์ฐํ๊ฒ ๋ฐ์๋จ
- ์ฌ์ ์ง์ ํตํฉ
ex) ๋ฐ๊ตฌ๋ ํฌ๊ธฐ์ ๋ํ ์ง์์ ๋ฐ๊ตฌ๋ ์ ํ ํ๋ฃฐ์ ๋ฐ์
โ
- ๋จ์
- ์ ํํ ๊ฐ ๊ณ์ฐ x, ์ถ๋ก
- feature๊ฐ ๋๊ฐ๋ก ๋์ด๋๋ฉด ๊ตฌํ์ง ๋ชปํจ
- 0์ด ๋์ฌ ์ ์๋คโ
<๊น์ง ๋ฌธ์ >
๐ญ๐บ๐๐๐พ ๐ก๐บ๐๐พ๐ ๐ข๐ ๐บ๐๐๐๐ฟ๐๐พ๐
- Assumption : Feature๋ค์ด ์๋ก ๋ ๋ฆฝ์
- ์์ธก ํ๋ฅ ๊ฐ์ด 0์ด ๋์ฌ ์ ์๋ ์ํ ์กด์ฌ (Normalization ์ ์ฉํ์ฌ ํด๊ฒฐ)
โ
๐ฆ๐บ๐๐๐๐๐บ๐ ๐ญ๐บ๐๐๐พ ๐ก๐บ๐๐พ๐ ๐ข๐ ๐บ๐๐๐๐ฟ๐๐พ๐
= P(x|class)๋ฅผ ๋จ์ํ ๋น๋์์๋ง ๊ธฐ๋ฐํ์ฌ ๊ณ์ฐํ์ง๋ง, ํน์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค๊ณ ๊ฐ์ ๊ฐ๋ฅ
· Gaussian Naive Bayes (GNB) Classifier
- GNB Classifier ์ ์ฉ
> ์ : NB
- ๋ชจ๋ i์ ๋ํด likelihood ๊ฒฝ์ฐ์ ์ ๊ณฑํ๊ธฐ
- k๋ผ๋ ๋ ์ด๋ธ์ ํ๋ฅ * k๋ผ๋ ๋ ์ด๋ธ์ผ ๋ ๋ชจ๋ ๊ฐ๋ฅํ Feature์ ๊ฒฝ์ฐ์ ํ๋ฅ
- arg max yk = ์ด๋ค ๊ฐ์ ๋ํด ์ต๋๊ฐ์ ๊ฐ๋ yk
โ
> ๋ฐ : GNB
* θijk = N(Xnew i; uik, oik)
- N() = Normalization
- k๋ฒ์งธ ๋ ์ด๋ธ ํ๋ฅ * k๋ฒ์งธ ๋ ์ด๋ธ์ ๋ํ M๊ณผ sd์ ๋ชจ๋ X ์ ๊ท๋ถํฌ ํ๋ฅ
โ
- P(Y = yk) = Prior (์๊ณ ์ถ์ ํ๋ฅ )
- ๋ท๋ถ๋ถ = Likelihood
โ
์ ์ฉ ์, y์ Label ๊ฐ์๊ฐ N๊ฐ๋ผ๊ณ ํ๋ฉด, estimate ํด์ผํ๋ P(y | Xnew)์ ์ค์ ๊ฐ์๋ ๋ช ๊ฐ์ธ๊ฐ?
- ์ต์ N-1 (ํ๋ฅ ์ ๋ชจ๋ ๋ํด 1 ์ด๋ฏ๋ก, ๋๋จธ์ง ํ๋๋ ๊ณ์ฐํ์ง ์์๋ ๋ต์ด ๋์ด)
โ
ํ์ต ๋, mean/variance ๊ฐ๋ค์ estimate ํ๋ ๋ฐฉ๋ฒ์ ?
MLE
- ๋ชจ์ข ์ ํจ์ δ : j๋ฒ์งธ ๋ ์ด๋ธ Y๊ฐ k๋ฒ์งธ ๋ ์ด๋ธ Y์ ๊ฐ์ผ๋ฉด 1, ๋ค๋ฅด๋ฉด 0 ๋ฐํ
- j : Train Data์ j๋ฒ์งธ Data (0 ~ N-1๊ฐ์ Data ๋ชจ๋ ๋ค๋ฃธ)
- μik : Feature์ ์์์ ๋ฐ๋ฅธ Label์ ์๋ฒ ๊ต์งํฉ ๋ถ๋ถ
โ
> ์ : ํ๊ท
- ๋ถ์ : k ๋ ์ด๋ธ์ธ ๋ฐ์ดํฐ j์ ๋ํ Feature i๋ฅผ ๋ชจ๋ ๋ํ ๊ฐ
- ๋ถ๋ชจ : j๋ฒ์งธ ๋ฐ์ดํฐ์ ๋ ์ด๋ธ๊ณผ k๋ฒ์งธ ๋ ์ด๋ธ์ด ๊ฐ์ผ๋ฉด 1, ๋ค๋ฅด๋ฉด 0์ ๋ฐํํ ๊ฐ๋ค์ ํฉ
โ
> ์๋ : ๋ถ์ฐ
- ๋ถ์ : (k ๋ ์ด๋ธ์ธ ๋ฐ์ดํฐ j์ ๋ํ Feature i ๊ฐ — k ๋ ์ด๋ธ์ Feature i์ ํ๊ท ๊ฐ)์ ํธ์ฐจ ๊ฐ์ ์ ๊ณฑ ํฉ
- ๋ถ๋ชจ : j๋ฒ์งธ ๋ฐ์ดํฐ์ ๋ ์ด๋ธ๊ณผ k๋ฒ์งธ ๋ ์ด๋ธ์ด ๊ฐ์ผ๋ฉด 1, ๋ค๋ฅด๋ฉด 0์ ๋ฐํํ ๊ฐ๋ค์ ํฉ
โ
- Decision Bounary
- Probability Distribution ๋ชจ์์ ๋ฐ๋ผ Boundary ๋ชจ์ ๋ฐ๋
- XOR๊ณผ ๊ฐ์ ๋น์ ํ ํจํด์ ๋ฌธ์ ๋ ํด๊ฒฐํ์ง ๋ชปํจ
โ
๐ก๐บ๐๐พ๐๐๐บ๐ ๐ญ๐พ๐๐๐๐๐
= ๋๋ค ๋ณ์์ ์งํฉ๊ณผ ๋ฐฉํฅ์ฑ ๋น์ํ ๊ทธ๋ํ๋ฅผ ํตํด ์งํฉ์ ์กฐ๊ฑด๋ถ ๋ ๋ฆฝ์ผ๋ก ํํํ๋ ํ๋ฅ ์ ๊ทธ๋ํฝ ๋ชจ๋ธ
- ๋ณต์กํ ๊ฒฐํฉ ๋ถํฌ๋ณด๋ค ์ง์ ์ ์ธ ์์กด์ฑ๊ณผ ์ง์ญ ๋ถํฌ๋ฅผ ์ดํดํ๋๋ฐ ์ง๊ด์
Feature A์ Feature B๋ก๋ถํฐ ์ํฅ์ ๋ฐ์ Feature C
- ๋ฐฉํฅ์ด ์๋ ์ : Direct Dependence
- ์ ์ด ์๋ ๊ฒ : Conditional Independence (์กฐ๊ฑด๋ถ ๋ ๋ฆฝ)
โ
- Bayesian Network์ 6๊ฐ์ง ๊ธฐ๋ณธ ๊ท์น
- Conditional Independence
- N์ G์ ๋ ๋ฆฝ (R์ด ์ฃผ์ด์ ธ ์์ ๋)
- N๊ณผ G๋ ๋ ๋ฆฝ ์๋ (R๊ณผ D๊ฐ ์ฃผ์ด์ ธ ์์ ๊ฒฝ์ฐ, D๊ฐ ์ ํด์ง ๊ฐ์ด๋ฉด N๊ณผ G๋ ์๋ก ์ํฅ์ ์ค — Explaining Away)
- R, G, D๊ฐ ์ฃผ์ด์ง๋ฉด N๊ณผ S๋ ๊ฒฐ์ ๋๋ฏ๋ก ๋ ๋ฆฝ
โ
* Explaining Away
- ์๋ก ์ฐ๊ด ์๋ S์ R์ด W๋ฅผ ์ค๋ช ํ๊ธฐ ์ํด ์ ์ด๋ค
- W = 1, R = 1 ์ผ๋, S = 0 ํ๋ฅ ์ด ์ปค์ง
'Study > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Data Imbalance Problem (๋ฐ์ดํฐ ๋ถ๊ท ํ ๋ฌธ์ ) (0) | 2021.06.24 |
---|---|
[ML] Perceptron (ํผ์ ํธ๋ก ) (0) | 2021.06.21 |
[ML] SVD / PCA / LDA (0) | 2021.06.21 |
[ML] Decision Tree (์์ฌ๊ฒฐ์ ๋๋ฌด) (0) | 2021.06.21 |
[ML] ๋จธ์ ๋ฌ๋ ๊ธฐ์ด (0) | 2021.06.21 |