본문 바로가기

DALYs3

Streamlit - Kaggle DALYs 데이터 분석 & 시각화 - 3 베하~ 안녕하세요! 현상수배범입니다. 지난 시간에는 streamlit을 DALYs 데이터의 각각의 변수(질병/재해) 간의 상관 관계 확인 및 시각화를 해보았습니다. 이번 시간에는 이번에는 좀 더 발전된 시각화를 위해 GeoPandas와 Pydeck 라이브러리를 활용해보려고 합니다. GeoPandas란? GeoPandas는 기본적으로 GeoDataFrame이라는 데이터 구조를 사용합니다. 이것은 Pandas의 DataFrame을 확장한 것으로, 각 행이 공간적 객체와 연관된 데이터를 가질 수 있습니다. 공간적 객체는 주로 포인트, 라인, 폴리곤 등을 의미합니다. 주요 기능 1. 공간 데이터 로딩: 다양한 형식의 공간 데이터 파일 (예: GeoJSON, Shapefile)을 쉽게 읽을 수 있습니다. 2. 데.. 2023. 9. 15.
Streamlit - Kaggle DALYs 데이터 분석 & 시각화 - 2 베하~ 안녕하세요! BTC_현상수배범 입니다. 지난번에는 Streamlit을 활용하여, DALYs 데이터에 대해 시각화(box plot)를 해보았습니다. 이번에는 각각의 변수(질병/재해) 간의 상관 관계를 확인해보고 시각화해보고자 합니다. 상관계수란? 상관계수(Correlation Coefficient)는 두 변수 간의 관계의 정도와 방향을 수치적으로 표현한 값입니다. 상관계수의 값은 -1부터 1까지 범위를 가집니다. 1에 가까울수록 두 변수가 강한 양의 상관관계를 가짐 (하나의 변수가 증가하면 다른 변수도 증가) -1에 가까울수록 두 변수가 강한 음의 상관관계를 가짐 (하나의 변수가 증가하면 다른 변수는 감소) 0에 가까울수록 두 변수가 거의 무상관 (하나의 변수의 변화가 다른 변수의 변화에 큰 영향을.. 2023. 8. 31.
Streamlit - Kaggle DALYs 데이터 분석 & 시각화 - 1 베하~ 안녕하세요! BTC_현상수배범 입니다. 오늘은 지난 시간에 배웠던 Streamlit을 활용하여, DALYs 데이터에 대해 Boxplot을 그려보고자 합니다. 분석에 사용할 데이터는 에서 다운로드할 수 있고, 1990년 ~ 2019년 까지의 데이터가 있습니다. 해당 데이터는 여러 질병, 재해에 대한 DALY 수치가 저장된 데이터프레임입니다. DALYs란? DALYs(Disability-adjusted life years)는 사람들이 얼마나 오래 건강하게 살았는지에 대해 나타내는 지표입니다. DALYs는 주요한 두 가지 지표(YLL, YLD)로 구성됩니다. 1. YLL(Years of Life Lost): 사람들이 질병, 건강 문제 등으로 인해 일찍 사망하여, 건강했을 때에 비해 잃은 연수(n년)을 .. 2023. 8. 16.