안녕하세요 !! 1Tier팀의 One입니다 😉
여러분은 Apache Superset에 대해 아시나요?
저는 처음 접하기 전까진 굉장히 생소했는데요
Superset은 데이터 소스에서 쿼리를 실행하고, 결과를 시각적으로 표현하기 위해 다양한 차트, 대시보드 및 보고서를 제공하는 웹 기반의 데이터 시각화 및 비지니스 인텔리전스(BI) 툴입니다.
Apache Software Foundation의 오픈 소스 프로젝트로 개발되어있고
비교적 경제적이고 높은 유연성을 제공한다고 합니다.
Superset은 사용하기 쉬운 UI를 갖추고 있으며, 다양한 데이터 소스에서 데이터를 가져와 시각화 할 수 있습니다.
그렇기 때문에 데이터 사이언스, 분석가 및 비지니스 사용자 모두에게 적합하다고 합니다.
Superset은 다양한 차트 유형을 제공함 ex) 막대차트, 선 그래프, 산점도, 히트 맵, 파이 차트 등
또한 다양한 필터링, 그룹화 및 정렬 기능도 제공한다고 하네요!
이러한 기능들을 사용해 데이터를 분석하고 대시보드를 만들 수 있다고 합니다.
그럼 이런 좋은 Tool을 사용안해 볼 수 없겠죠?!
설치 까지 같이 진행해보도록 합시다.
저는 공식 문서를 참고하여 설치하였습니다!
설치 환경
Ubuntu 22.04
1. 의존성 패키지 설치
Superset은 의존성 패키지가 매우매우 많은데요!!
다 설치를 해주시면 됩니다
sudo apt update
sudo apt install build-essential libssl-dev libffi-dev python3-dev python3-pip \
libsasl2-dev libldap2-dev libxi-dev libmysqlclient-dev libpq-dev
2. 가상 환경 설정
그리고 파이썬 의존성 패키지 또한 요구를 많이 하는데요,
그렇기 때문에 가상환경에 설치하는 것을 권장합니다!!
sudo apt install python3.10-venv
python3 -m venv superset
. superset/bin/activate
3. Superset 설치
pip install wheel
pip install apache-superset
superset --version
superset은 flask를 기반으로 만들어졌기 때문에 flask 버전이 보입니다!
⚠ AttributeError: module 'sqlparse.keywords' has no attribute 'FLAGS' 에러 발생한다면?
sqlparse 패키지를 다운그레이드 해주면 됩니다!
pip install sqlparse=='0.4.3'
4. 환경 변수 설정 & 초기화 작업 진행
superset을 사용하기 위해선 환경 변수를 설정해줘야합니다!
환경변수는 재부팅을 하면 사라지기 때문에 영구적으로 사용하시려면 ~/.bashrc에 넣어주세요!
export FLASK_APP=superset
export PYTHONPATH=/home/ubuntu/superset
superset db upgrade
superset init
- user 설정
슈퍼셋에 접속할 superuser를 생성해주면 됩니당!!
superset fab create-admin
superset load_examples #예제 불러오기, 선택사항
5. 실행
--with-threads, --reload, --debugger 옵션은 개발 중에만 사용해야 합니다!
실제 운영환경에서는 옵션을 빼주셔야 해요
superset run -h 0.0.0.0 -p 8080 --with-threads --reload --debugger
설치 어렵지 않죠?!
다음 시간엔 Superset 차트를 어떻게 그리는지에 대해
자세히 알아봅시다!
베바 👋
'Database' 카테고리의 다른 글
Airflow Operator와 Task (0) | 2023.05.19 |
---|---|
[SQL] 쿼리 사용시 주의사항 (0) | 2023.05.19 |
Airflow 란? (0) | 2023.05.15 |
Hadoop이란? (0) | 2023.03.06 |
REDIS (1) | 2022.12.27 |
댓글