스토리지, 컨테이너
- GCP의 스토리지와 컨테이너
안녕하세요. BTC GCP팀 소속 손지수, 박은혜입니다.
벌써 4번째 주제로 찾아뵙게 됐습니다. 시간이 굉장히 빨리 흘러가는 기분입니다. 여러분은 어떠신가요?
최근 글로벌 IT 시장에서 가장 주목받고 있는 기술 중 하나는 바로 클라우드입니다. 특히 정부 및 행정기관의 민간 클라우드 도입이 높은 성장세를 보이고 있습니다. 글로벌 시장조사업체 '모르도르 인텔리전스(Mordor Intelligence)’에 따르면, 2020년 228.6억 달러(약 26조 원)였던 전 세계 공공부문 클라우드 시장 규모는 연평균 17.4% 성장하여 2026년 597.4억 달러(약 74조 원)에 달할 전망입니다.
우리나라 역시 과기부의 '제3차 클라우드컴퓨팅 기본계획', 행안부의 '행정·공공기관 정보자원 클라우드 전환·통합 추진계획' 등으로 공공영역에서의 클라우드 활용을 강조해오고 있습니다.
이렇듯 향후 디지털 사회에서 클라우드가 핵심적 역할을 하게 될 것이고, 클라우드 산업의 구성원인 우리가 성장하여 그 역할을 할 수 있기를 기대해봅니다.
MODULE 04
스토리지, 컨테이너
GCP의 스토리지
GCP는 클라우드 사용 시 다양한 스토리지, 데이터베이스 서비스를 제공하고 있습니다. 해당 서비스와 관련된 제품들을 소개해드리려고 합니다.
그전에 간단한 데이터베이스 아키텍처를 살펴보겠습니다.
- 데이터베이스 예시 아키텍처
BTC 사원 손태풍 님이 홈페이지를 운영한다고 해보겠습니다. 홈페이지 어플리케이션을 개발 후, 웹서버에 설치를 할 것입니다. 고객들은 서버에 접속해서 서비스를 이용하게 됩니다. 이때 클라이언트가 홈페이지에 방문해서 남긴 정보들을 저장할 필요가 있습니다. 이 것을 데이터베이스라고 부르게 됩니다. 조금 더 정확히 Transactional Database(OLTP)라고 합니다.
홈페이지를 운영하는 운영자는 이 데이터들을 통해서 수익은 얼마인지, 고객의 성향은 어떤지 분석하고 싶을 것입니다.
분석을 위해 Transactional Databases(OLTP)에 저장된 데이터는 ETL(Extract, Transform, Load : 추출, 변환, 적재) 과정을 거쳐 Analytical Databases(OLAP)에 저장됩니다. ETL 과정을 거친 데이터는 분석가들이 자유롭게 분석이 가능한 데이터 형태가 됩니다.
분석한 결과는 대시보드로 연결해서 사용하게 됩니다. 고객에게 제공하거나, 보고용으로 활용될 수 있습니다.
- 다양한 스토리지 옵션
위에서 살펴본 아키텍처를 바탕으로 GCP 스토리지 제품을 소개해드리겠습니다.
일반적으로 데이터는 크게 두 가지로 나눌 수 있습니다.
- STRUCTURED DATA : 정형 데이터
- UNSTRUCTURED DATA : 비정형 데이터
이미지, 오디오, 텍스트 등이 UNSTRUCTURED DATA 즉, 비정형 데이터에 해당됩니다. 이런 경우 Cloud Storage를 이용하시면 됩니다. PB 단위로 굉장히 용량이 크며, 이미지 데이터, 텍스트 데이터 등 모두 저장이 가능합니다.
STRUCTURED DATA : 정형 데이터의 경우 한 번 더 구분이 됩니다.
- STRUCTURED DATA
- TRANSACTIONAL DATA
- SQL(RELATIONAL DATA) , NO-SQL(KEY-VALUE,DOCUMENT)
- ANALYTICAL DATA
- DATA Format - RELATIONAL DATA, KEY-VALUE
- LATENCY - MILLISECOND LATENCY , LATENCY IN SECONDS
- TRANSACTIONAL DATA
TRANSACTIONAL DB에 저장하는 경우, SQL을 사용할 때, 즉 데이터가 표의 형태로 된 RELATIONAL DATA : 관계형 데이터라면 Cloud SQL 또는 Cloud Spanner를 사용하시면 됩니다.
데이터가 KEY-VALUE 형태 또는 DOCUMENT 형태인 NO-SQL 라면 Cloud Datastore/Firestore을 사용하시면 됩니다.
ANALYTICAL DATA를 사용하는 경우, 데이터가 표의 형태로 되어있고, LATENCY가 조금 느려도 되지만 더 복잡한 분석이 필요할 때 BigQuery를 사용해주시면 됩니다. SQL을 사용할 수 있기 때문에 복잡한 분석이 가능하게 됩니다. 만약 실시간 데이터와 같이 데이터의 양이 많고 LATENCY가 중요한 경우 Bigtable 사용을 추천드립니다.
이번 포스팅에서는 GCP의 스토리지 옵션을 전체적으로 알아봤습니다.
긴 글 읽어주셔서 감사합니다.
곧 저녁 시간이네요, 오늘 하루도 정말 정말 수고하셨습니다.^^
'CSP (Cloud Service Provider) > GCP' 카테고리의 다른 글
GKE로 배포 관리하기 (3) Blue/Green 배포 (0) | 2022.05.26 |
---|---|
[GCP] Cloud pub/sub (0) | 2022.05.20 |
GKE로 배포 관리하기 (2)Canary 배포 (0) | 2022.05.20 |
[Qwiklab] ETL Processing on Google Cloud Using Dataflow and BigQuery (0) | 2022.05.18 |
[Google Cloud Platform] Google Compute Engine, GCE (0) | 2022.05.13 |
댓글