오버샘플링1 언더 샘플링(Undersampling)과 오버 샘플링(Oversampling) 이번시간에는 비대칭 데이터 문제를 해결할 수 있는 방법인 언더 샘플링과 오버 샘플링의 개념에 대하여 알아보도록 하겠습니다. 언더 샘플링과 오버 샘플링 언더 샘플링은 많은 데이터 세트를 적은 데이터 세트 수준으로 감소시키는 방식입니다. CPU만 사용하여 데이터를 학습시키게 되면 매우 많은 시간이 소요되기 때문에 적은 데이터 셋의 수준으로 감소시켜 학습속도를 증가시키는 방법인데 이러한 방법 또한 데이터의 특징적인 부분들을 잘추출해서 놓치는 정보를 최소화 해야하기 때문에 데이터의 특징들을 잘 살피는 것이 중요하겠습니다. 오버 샘플링은 적은 데이터셋을 많은 데이터셋의 수준으로 증가시키는 방식입니다. 이 방법은 똑같은 데이터가 만들어지는 것이 아니라 SMOTE같은 방법들을 통해서 비슷한 데이터를 만들어 내는 것이.. 2021. 1. 29. 이전 1 다음