일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Data Imbalance
- 엣지컴퓨팅
- 2D CNN
- Jetson
- 경진대회
- 딥러닝
- VitalDB
- CNN
- 빅데이터
- nvidia
- 데이터불균형
- 회귀분석
- 생체신호
- 공부
- Undersampling
- 회귀
- R
- GE B650
- MAE
- 1D CNN
- NIA
- 머신러닝
- 데이터
- 알고리즘
- 데이터분석
- 정보화진흥원
- 의료데이터
- edge computing
- 나이브베이즈
- VitalRecorder
- Today
- Total
목록회귀분석 (3)
Doyun-lab

Subject : Development of a Classification Model for High Blood Pressure and Diabetes Patients with Health Examination Data Language : R Data : ‘표본코호트 2.0 DB’ 데이터 Model : Logistic Regression Train Data : row — 473,524 / column — 89 1. Data Preprocessing 2. Data Visualization 저소득층은 당뇨병이 많이 걸리는 것을 파악 고소득에서는 다른 소득층에서 찾을 수 없는 습진과 역류성 식도염 발견 주 4일 음주하는 사람은 많은 고혈압 발병을 기록했고, 주 7일 음주하는 사람은 적은 고혈압 발병을 기록했다..

Subject : Predicting real estate prices in Korea with various variables Language : R Data : ‘직방’ 데이터 train.csv : Apartment transaction data (1.6 million) school.csv : Elementary, middle and high school information (1,100) subways.csv : Subway information (400) 1. Data preprocessing colnames(train)

𝖱𝖾𝗀𝗋𝖾𝗌𝗌𝗂𝗈𝗇 - Classification의 예측 결과 값 = Class or Label - Regresion의 예측 결과 값 = 실수 𝖫𝗂𝗇𝖾𝖺𝗋 𝖱𝖾𝗀𝗋𝖾𝗌𝗌𝗂𝗈𝗇 = Linear Model 표현 - Sum of Squared Error를 최소화하기 위해, 미분하여 얻은 Parameter 수식 𝖱𝗂𝖽𝗀𝖾, 𝖫𝖺𝗌𝗌𝗈 𝖱𝖾𝗀𝗋𝖾𝗌𝗌𝗂𝗈𝗇 - Ridge Regression : Linear Regression에서 얻어지는 Parameter가 너무 커지지 않도록, L2 norm으로 제한 > Overfitting 막아줌 > 위 Cost 함수에 대하여 편미분을 통해 최적의 값 찾기 - Lasso Regression : L1 norm 제한 > 미분 불가능 — 여러 기법 적용하여 최적화 > Feature..