본문 바로가기

EDA

(7)
결측치 처리하는 방법 데이터 실습 데이터는 그림과 같습니다.실습을 위해 큰 데이터가 아닌 6개 데이터만 있는 작은 데이터 셋 입니다.데이터를 다운 받은 후 가져오기 위한 코드import pandas as pddf = pd.read_csv("path")df 문제 먼저 풀어보기!실제 실습을 들어가기전 데이터를 보고 아래 질문을 코드로 풀어 봅시다!.[결측치 탐색]- 각 열의 결측치를 가지고 있는 데이터의 수는?- 결측치가 존재하는 행만 뽑아 내는 코드.- 결측치가 존재하는 feature는 무엇이 있는가?[결측치 처리]- age 와 measurement 열의 결측치가 있는 행을 제거해 주세요.- age 와 measurement 열의 결측치를 0으로 바꿔주세요.- age 와 measurement 열의 결측치를 평균값으로 바꿔주세요...
데이터 시각화 연습 문제 ) 삼성전자 매출액 데이터를 시각화 해보자! 데이터 출처와 설명데이터는 Dart에 올라온 2023 삼성전자 사업보고서에서 크롤링을 통해 받아왔습니다. 삼성전자는 사업을 크게 4가지 부문으로 나누어 하고 있습니다.해당 데이터는 기타까지 포함하여 총 5가지 부문에서 가각의 매출액과 비중 데이터를 가지고 있습니다.세모( △ )는 마이너스를 의미합니다.문제 설명1 전처리 : 매출액은 int형으로 비중은 float형으로 저장해주세요.2 시각화 세팅 : 그래프에 한국어가 보일 수 있도록 세팅하는 코드를 작성해주세요.3 매출액 시각화 : x축은 각 부문을 나타내고 y축은 각 부문별 매출액을 나타내는 막대그래프를 그려주세요. 이때 각 막대의 색상은 달리하며 막대 위에는 수치를 적어주세요.4 비중 시각화 : 각 부문별 비중을 나타내는 파이 그래프를 그려주세요. 이..
Seaborn 사용법 과 그래프 정리 : 예제와 함께 알아보자 seaborn은 데이터 시각화에 있어 많이 사용되는 라이브러리 이다.matplotlib와 함께 많이 사용되며 seaborn 자체도 matplotlib를 기반으로 만들어 졌다.seaborn에는 다양한 종류의 그래프가 있는데 각 그래프의 사용법을 알아보자.1. 그래프 종류1. 막대 그래프: histplot, displot, barplot, countplot2. 선 그래프: lineplot3. IQR그래프(박스 그래프):boxplot4. 점 그래프:scatterplot, pointplot, pairplot5. 히트맵:heatmap선 그래프를 histplot,displot 등 다른 plot을 이용해서 그리지 못하는 것은 아니다.(kde 속성을 사용하면 막대 그래프 그리는 함수로도 그릴 수 있음.) 그러나 주로 ..
데이터 과학자가 세 집단이 서로 다르다는 것을 증명하는 과정 데이터 한번 배워봤다면 다들 아는 그 데이터!!!맞다 seaborn에 들어 있는 iris 데이터를 사용해서 데이터 과학자들은 붓꽃의 종류별로 꽃 받침의 너비가서로 다르다는 것을 증명하는하찮지만 엄청 멋있게 증명하는 과정을 적어볼 것이다.일단 데이터가 어떻게 주어지는지 부터 보자.import pandas as pdfrom sklearn.datasets import load_irisiris = load_iris()iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)target_df = pd.DataFrame(data = iris.target, columns=['target'])df = pd.concat([iris_df, target_df], ..
STR 자동 예매 후 카톡 보내는 매크로 만들기! (selenium + PyKakao) 패스트 캠퍼스 AI LAB 3기 과정 2주차에 하는 SRT 자동 예매 예제 입니다.실제는 Slack에 보내는 법을 배우는데 솔찍히 slack보다는 카톡 으로 알려줘야 하지 않겠나 싶어 따로 PyKakao를 공부했습니다.뭐 메세지 보내는 API야 대충 블로그들 보고 따라하니 너무 좋더라구요.아무튼 하는 방법 하나씩 정리해 보겠습니다!!1. KAKAO DEVELOPER 설정https://developers.kakao.com/ Kakao Developers카카오 API를 활용하여 다양한 어플리케이션을 개발해보세요. 카카오 로그인, 메시지 보내기, 친구 API, 인공지능 API 등을 제공합니다.developers.kakao.com카카오 디벨로퍼에 들어가서 설정 붙어 해야해요!!들어가면 아래 같은 화면이 나올거에..
selenium 라이브러리 함수 정리 selenium을 colab에서 실행 해야 하는 경우 부가적인 설정들을 해줘야 한다.colab이 selenium에서 창 여는것 자체를 막고 있다나 뭐라나...너무 귀찮다... colab pro샀는데 ㅜㅜ그래서 VSCode같은 local 환경에서 .ipynb 파일로 작성하거나 anaconda 설치하면 딸려오는 jupyter notebook을 사용하자.(저는 jupyter notebook 환경에서 합니다.) 기본 설정-  jupyter notebook에서 설치!pip install selenium!pip install webdriver-manager- 기본 라이브러리 importfrom selenium import webdriverfrom webdriver_manager.chrome import Chrome..
selenium으로 크롤링 하기(실습 예제) 아름다운 스프4(beautifulsoup4) 만 알고 있던 나에게 Selenium이란 라이브러리를 알아버렸다.미쳤다. 그저 GOAT.이말 저말 필요없이 실제로 구현 해보자.먼저 문제를 제시하니 혹시 selenium을 알고 있으셨던 분들은 직접 한번 구현해보면서 연습하면 좋을 것 같다.참고로 colab 환경에서하면 이래저래 설정할게 많아서 local이나 jupyter notebook 활용합시다.이번주 날씨 변화를 그래프로 나타내자!1. selenium과 webdriver-manager를 설치하고 필요 라이브러리들(webdriver, ChromeDriverManager, By, Keys)을 import 하시오.2. 네이버 날씨 페이지("https://weather.naver.com/") 를 selenium을..