본문 바로가기

전체 글

(89)
Machine Learning 모델 종류 정리 고전적인 Machine Learning은 딥러닝의 화려한 발전에 묻혀버렸지만 모델의 성능이 데이터의 질에 많은 영향을 받아서 데이터 분석 관점에서는 공부하기 너무 좋은 기술들이다. 특히, tabuler 데이터 셋에서는 여전히 고전적인 Machine Learning이 많이 사용되고 있는데 오늘은 주요 모델들을 발전순으로 정리해 보자. 0. 모델 종류 1. Decision Tree2. RandomForest3. AdaBoost4. Gradient Boost Machine(GBM)5. XGBoost Machine(XGBM)6. Light Gradient Boost(LGBM)7. CatBoost많은 모델들이 있지만 주요 모델들은 위 7 가지이다. 그 중에서도 현업에서는 거의 LightGBM 과 CatBoost ..
MNIST데이터 RNN, LSTM, GRU로 분류기 만들기(pytorch lightning) MNIST 데이터 셋 MNIST데이터 셋은 0~9 까지 손글씨로 적은 숫자로 구성된 데이터 셋이다.Train dataset은 6만개 Test dataset은 1만개 로 구성되어 있습니다.import torchvision.transforms as Timport torchvisionimport torchfrom torch.utils.data import DataLoaderdownload_root = './MNIST_DATASET'mnist_transform = T.Compose([ T.ToTensor(),])train_dataset = torchvision.datasets.MNIST(download_root, transform=mnist_transform, train=True, download=True..
결측치 처리하는 방법 데이터 실습 데이터는 그림과 같습니다.실습을 위해 큰 데이터가 아닌 6개 데이터만 있는 작은 데이터 셋 입니다.데이터를 다운 받은 후 가져오기 위한 코드import pandas as pddf = pd.read_csv("path")df 문제 먼저 풀어보기!실제 실습을 들어가기전 데이터를 보고 아래 질문을 코드로 풀어 봅시다!.[결측치 탐색]- 각 열의 결측치를 가지고 있는 데이터의 수는?- 결측치가 존재하는 행만 뽑아 내는 코드.- 결측치가 존재하는 feature는 무엇이 있는가?[결측치 처리]- age 와 measurement 열의 결측치가 있는 행을 제거해 주세요.- age 와 measurement 열의 결측치를 0으로 바꿔주세요.- age 와 measurement 열의 결측치를 평균값으로 바꿔주세요...