본문 바로가기
Database

Apache Superset & 설치

by BTC_One 2023. 5. 15.

안녕하세요 !! 1Tier팀의 One입니다 😉

 

여러분은 Apache Superset에 대해 아시나요?

저는 처음 접하기 전까진 굉장히 생소했는데요

 

Superset은 데이터 소스에서 쿼리를 실행하고, 결과를 시각적으로 표현하기 위해 다양한 차트, 대시보드 및 보고서를 제공하는 웹 기반의 데이터 시각화 및 비지니스 인텔리전스(BI) 툴입니다. 

 

Apache Software Foundation의 오픈 소스 프로젝트로 개발되어있고

비교적 경제적이고 높은 유연성을 제공한다고 합니다. 

 

Superset에서 지원하는 데이터베이스

Superset은 사용하기 쉬운 UI를 갖추고 있으며, 다양한 데이터 소스에서 데이터를 가져와 시각화 할 수 있습니다.

그렇기 때문에 데이터 사이언스, 분석가 및 비지니스 사용자 모두에게 적합하다고 합니다. 

 

Superset은 다양한 차트 유형을 제공함 ex) 막대차트, 선 그래프, 산점도, 히트 맵, 파이 차트 등

또한 다양한 필터링, 그룹화 및 정렬 기능도 제공한다고 하네요!

 

이러한 기능들을 사용해 데이터를 분석하고 대시보드를 만들 수 있다고 합니다.

그럼 이런 좋은 Tool을 사용안해 볼 수 없겠죠?! 

설치 까지 같이 진행해보도록 합시다.

 

저는 공식 문서를 참고하여 설치하였습니다!

https://superset.apache.org/docs/installation/installing-superset-from-scratch/#python-virtual-environment

 

Installing From Scratch | Superset

Installing Superset from Scratch

superset.apache.org

 

설치 환경

Ubuntu 22.04

 

1. 의존성 패키지 설치

Superset은 의존성 패키지가 매우매우 많은데요!!

다 설치를 해주시면 됩니다

sudo apt update
sudo apt install build-essential libssl-dev libffi-dev python3-dev python3-pip \
libsasl2-dev libldap2-dev libxi-dev libmysqlclient-dev libpq-dev

 

2. 가상 환경 설정

그리고 파이썬 의존성 패키지 또한 요구를 많이 하는데요,

그렇기 때문에 가상환경에 설치하는 것을 권장합니다!! 

sudo apt install python3.10-venv
python3 -m venv superset
. superset/bin/activate

 

3. Superset 설치

pip install wheel
pip install apache-superset
superset --version

superset은 flask를 기반으로 만들어졌기 때문에 flask 버전이 보입니다! 

 

⚠ AttributeError: module 'sqlparse.keywords' has no attribute 'FLAGS' 에러 발생한다면?

sqlparse 패키지를 다운그레이드 해주면 됩니다! 

pip install sqlparse=='0.4.3'

 

4. 환경 변수 설정 & 초기화 작업 진행

superset을 사용하기 위해선 환경 변수를 설정해줘야합니다!

환경변수는 재부팅을 하면 사라지기 때문에 영구적으로 사용하시려면 ~/.bashrc에 넣어주세요! 

export FLASK_APP=superset
export PYTHONPATH=/home/ubuntu/superset

superset db upgrade
superset init
  • user 설정

슈퍼셋에 접속할 superuser를 생성해주면 됩니당!!

superset fab create-admin
superset load_examples #예제 불러오기, 선택사항

 

5. 실행

--with-threads, --reload, --debugger 옵션은 개발 중에만 사용해야 합니다!

실제 운영환경에서는 옵션을 빼주셔야 해요

superset run -h 0.0.0.0 -p 8080 --with-threads --reload --debugger

 

설치 어렵지 않죠?! 

다음 시간엔 Superset 차트를 어떻게 그리는지에 대해

자세히 알아봅시다!

 

베바 👋

'Database' 카테고리의 다른 글

Airflow Operator와 Task  (0) 2023.05.19
[SQL] 쿼리 사용시 주의사항  (0) 2023.05.19
Airflow 란?  (0) 2023.05.15
Hadoop이란?  (0) 2023.03.06
REDIS  (1) 2022.12.27

댓글