본문 바로가기

전체 글

(32)
데이터 시각화 연습 문제 ) 삼성전자 매출액 데이터를 시각화 해보자! 데이터 출처와 설명데이터는 Dart에 올라온 2023 삼성전자 사업보고서에서 크롤링을 통해 받아왔습니다. 삼성전자는 사업을 크게 4가지 부문으로 나누어 하고 있습니다.해당 데이터는 기타까지 포함하여 총 5가지 부문에서 가각의 매출액과 비중 데이터를 가지고 있습니다.세모( △ )는 마이너스를 의미합니다.문제 설명1 전처리 : 매출액은 int형으로 비중은 float형으로 저장해주세요.2 시각화 세팅 : 그래프에 한국어가 보일 수 있도록 세팅하는 코드를 작성해주세요.3 매출액 시각화 : x축은 각 부문을 나타내고 y축은 각 부문별 매출액을 나타내는 막대그래프를 그려주세요. 이때 각 막대의 색상은 달리하며 막대 위에는 수치를 적어주세요.4 비중 시각화 : 각 부문별 비중을 나타내는 파이 그래프를 그려주세요. 이..
Seaborn 사용법 과 그래프 정리 : 예제와 함께 알아보자 seaborn은 데이터 시각화에 있어 많이 사용되는 라이브러리 이다.matplotlib와 함께 많이 사용되며 seaborn 자체도 matplotlib를 기반으로 만들어 졌다.seaborn에는 다양한 종류의 그래프가 있는데 각 그래프의 사용법을 알아보자.1. 그래프 종류1. 막대 그래프: histplot, displot, barplot, countplot2. 선 그래프: lineplot3. IQR그래프(박스 그래프):boxplot4. 점 그래프:scatterplot, pointplot, pairplot5. 히트맵:heatmap선 그래프를 histplot,displot 등 다른 plot을 이용해서 그리지 못하는 것은 아니다.(kde 속성을 사용하면 막대 그래프 그리는 함수로도 그릴 수 있음.) 그러나 주로 ..
데이터 과학자가 세 집단이 서로 다르다는 것을 증명하는 과정 데이터 한번 배워봤다면 다들 아는 그 데이터!!!맞다 seaborn에 들어 있는 iris 데이터를 사용해서 데이터 과학자들은 붓꽃의 종류별로 꽃 받침의 너비가서로 다르다는 것을 증명하는하찮지만 엄청 멋있게 증명하는 과정을 적어볼 것이다.일단 데이터가 어떻게 주어지는지 부터 보자.import pandas as pdfrom sklearn.datasets import load_irisiris = load_iris()iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)target_df = pd.DataFrame(data = iris.target, columns=['target'])df = pd.concat([iris_df, target_df], ..