오늘 강의시간
머신러닝 모델이 학습한 데이터가 정규분포 곡선에 가까울 수록 예측값이 개선된다 하셨고,
정규분포에 가까운 예시로density와 pH를 말씀하셨습니다.
residual sugar, chlorides처럼 한 곳에 치우친 그래프는 치우치지 않은 범위에서의 데이터가 적은만큼 예측하기 어렵다 라고 설명해주셨습니다.
그렇다면, 반대로 이런식으로 고르게 분포하는 그래프를 갖는 데이터가 있다면,
정규분포 그래프에 비해 예측능력이 더 떨어지는지, 만약 그렇다면 고르게 분포하는 그래프는 왜 예측에 불리한지 궁금합니다.
오늘 강의시간
머신러닝 모델이 학습한 데이터가 정규분포 곡선에 가까울 수록 예측값이 개선된다 하셨고,
정규분포에 가까운 예시로density와 pH를 말씀하셨습니다.
residual sugar, chlorides처럼 한 곳에 치우친 그래프는 치우치지 않은 범위에서의 데이터가 적은만큼 예측하기 어렵다 라고 설명해주셨습니다.
그렇다면, 반대로 이런식으로 고르게 분포하는 그래프를 갖는 데이터가 있다면,
정규분포 그래프에 비해 예측능력이 더 떨어지는지, 만약 그렇다면 고르게 분포하는 그래프는 왜 예측에 불리한지 궁금합니다.