(원*진)(강의노트 23장) 정규분포 vs 고른분포 데이터학습 성능

<img width="835" height="716" alt="Image" src="https://github.com/user-attachments/assets/806a3240-4456-4194-9c93-93ea99deb871" />

오늘 강의시간
머신러닝 모델이 학습한 데이터가 정규분포 곡선에 가까울 수록 예측값이 개선된다 하셨고,
정규분포에 가까운 예시로density와 pH를 말씀하셨습니다.
residual sugar, chlorides처럼 한 곳에 치우친 그래프는 치우치지 않은 범위에서의 데이터가 적은만큼 예측하기 어렵다 라고 설명해주셨습니다.


<img width="695" height="468" alt="Image" src="https://github.com/user-attachments/assets/b3dc1c84-1229-46df-a9b4-d4eecbe7c9df" />

그렇다면, 반대로 이런식으로 고르게 분포하는 그래프를 갖는 데이터가 있다면, 
정규분포 그래프에 비해 예측능력이 더 떨어지는지, 만약 그렇다면 고르게 분포하는 그래프는 왜 예측에 불리한지 궁금합니다.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

(원*진)(강의노트 23장) 정규분포 vs 고른분포 데이터학습 성능 #170

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

(원*진)(강의노트 23장) 정규분포 vs 고른분포 데이터학습 성능 #170

Description

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions