본문 바로가기
CSP (Cloud Service Provider)/GCP

[Google Cloud Platform] BigQuery

by BTC_박은혜 2022. 9. 30.

 

안녕하세요~ 할부로애틋하게 BTC_손지수, 박은혜 입니다!

앞 선 포스팅들을 통해, 빅데이터와 머신러닝에 관하여 알려드렸습니다.

이번 포스팅에선 빅데이터에선 빠질 수 없는

 Big query에 대하여 알려드리고자 합니다.

그럼 이번 한 주도 GCP에 더 가까워져 봅시다 ~!

 


BigQuery란 무엇일까요?

 

BigQuery는 머신러닝, 지리정보 분석, 비즈니스 인텔리전스와 같은 기본 제공 기능으로

데이터를 관리하고 분석할 수 있게 해주는 완전 관리형 엔터프라이즈 데이터 웨어하우스입니다.

BigQuery의 서버리스 아키텍처에서는 SQL 쿼리를 사용하여

제로 인프라 관리에 관한 조직의 가장 큰 질문을 해결할 수 있습니다.

BigQuery의 확장 가능한 분산형 분석 엔진을 통해 테라바이트급 쿼리를 초 단위로 수행하고

페타바이트급 쿼리를 분 단위로 쿼리할 수 있습니다.

 

BigQuery는 데이터를 분석하는 Compute Engine을 스토리지 옵션과 구분함으로써 유연성을 극대화합니다.

BigQuery 내에서 데이터를 저장 및 분석하거나 BigQuery를 사용하여 저장된 위치에서 데이터에 액세스할 수 있습니다.

통합 쿼리를 통해 외부 소스의 데이터를 읽고 스트리밍으로 연속 데이터 업데이트를 지원합니다.

BigQuery ML 및 BI Engine과 같은 강력한 도구를 사용해서 해당 데이터를 분석하고 이해할 수 있습니다.

 

BigQuery 인터페이스에는 Google Cloud 콘솔 인터페이스 및 BigQuery 명령줄 도구가 포함됩니다.

개발자 및 데이터 과학자는 Python, 자바, 자바스크립트, Go는 물론 BigQuery의 REST API 및 RPC API와 같은 익숙한 프로그래밍 언어의 클라이언트 라이브러리를 사용하여 데이터를 변환 및 관리할 수 있습니다.

ODBC 및 JDBC 드라이버는 타사 도구 및 유틸리티를 포함하여 기존 애플리케이션과 상호작용할 수 있습니다.

 

데이터 분석가, 데이터 엔지니어, 데이터 웨어하우스 관리자, 데이터 과학자는

BigQuery ML 문서를 통해 데이터 도구를 검색, 구현, 관리하여 중요한 비즈니스 의사결정을 내릴 수 있습니다.

 

 

그렇다면 이러한 BigQuery를 사용함으로 얻을 수 있는 이점에는 어떤 것들이 있을까요?

 

첫 번째로, 실시간 분석과 예측 분석으로 유용한 정보를 확보할 수 있다는 점 입니다.

스트리밍 데이터를 실시간으로 쿼리하고 전체 비즈니스 프로세스에 대한 최신 정보를 얻을 수 있습니다.

뿐만 아니라 내장된 머신러닝 기능으로 데이터를 이동하지 않고도 비즈니스 성과를 쉽게 예측할 수 있습니다!

 

두 번째로, 손쉬운 데이터 액세스 및 유용한 정보의 공유가 가능하다는 점 입니다.

BigQuery를 사용한다면, 클릭 몇 번만으로 유용한 분석 정보에 안전하게 액세스하고 조직 내에서 공유할 수 있습니다.

또 널리 사용되는 비즈니스 인텔리전스 도구를 활용하여, 보고서와 대시보드도 쉽게 만들 수 있습니다.

 

세 번째로, 데이터 보호 및 신뢰할 수 있는 운영이 가능하다는 점 입니다.

고가용성과 99.99% 업타임 SLA를 제공하는 Bigquey의 강력한 보안, 거버넌스, 안정성 제어를 활용하여

기본 암호화 및 고객 관리 암호화 키로 데이터를 보호할 수 있습니다.

 

 

정말 다양한 이점들이 존재하죠?

 

 

다음으로는 주요 특징들에 대해 알아보고자 합니다.

 

첫 번째 Bigquery ML을 활용한 ML 및 예측 모델링 입니다.

BigQuery ML을 활용하는 데이터 과학자와 데이터 분석가는 BigQuery 내에서 바로 간편한 SQL을 이용해 글로벌 규모의 정형 또는 반정형 데이터를 기반으로 하는 ML 모델을 신속하게 빌드 및 운용할 수 있습니다.

 

두 번째, BigQuery Omni를 활용한 멀티 클라우드 데이터 분석입니다.

BigQuery Omni는 AWS 및 Azure 같은 여러 클라우드 내 데이터를 비용 효율적으로 안전하게 분석할 수 있는 유연한 완전 관리형 멀티 클라우드 분석 솔루션입니다. 표준 SQL 및 BigQuery의 익숙한 인터페이스를 사용하여 여러 데이터 세트에 대한 단일 제어 창에서 신속하게 질문에 대한 답을 구하고 결과를 공유할 수 있습니다.

 

세 번째, BigQuery BI Engine을 활용한 대화형 데이터 분석입니다.

BigQuery BI Engine은 BigQuery에 내장된 인메모리 분석 서비스로서, 1초 미만의 쿼리 응답 시간과 높은 동시성으로 사용자가 대용량의 복잡한 데이터 세트를 대화형으로 분석할 수 있도록 지원합니다. BI Engine은 BI Engine 단일 노드를 사용하여 Google 데이터 스튜디오와 통합되며, BI Engine SQL 인터페이스를 사용하여 기본적으로 기타 모든 비즈니스 인텔리전스 도구를 가속화합니다.

 

이 외에도 서비리스, 자연어 처리, 내장된 ML 및 AI 통합, 실시간 분석, 실시간 변경 데이터 캡처 및 복제 등

다양한 특징들이 존재합니다!

 

마지막으로 가격 측면에 대해 알아보고자 합니다!

가격은 사용한 만큼만 지불하는 방식으로 1TB당 $5 이며, 매달 처음 1테라바이트(1TB)는 무료입니다!

정액제의 경우 최저가 $1,700/월(전용 슬롯 100개 예약), 가변 슬롯 100개에 시간당 $4 입니다.

 

 


 

지금까지 빅쿼리에 대해 알아보았습니다!

빅데이터에선 빠질 수 없는 빅쿼리인데요~ 많은 도움이 되셨길 바랍니다.

그럼 오늘 하루도 수고 많으셨고, 행복한 금요일 보내시길 바랍니다!

저희는 다음 주에 더욱 유익한 포스팅으로 찾아뵙겠습니다!

감사합니다~~

'CSP (Cloud Service Provider) > GCP' 카테고리의 다른 글

[GKE 사용하기] 쿠버네티스 핵심 기능  (0) 2022.10.06
Time Travel을 이용한 Table 복구 방법 가이드  (0) 2022.10.04
VPC Service Control  (1) 2022.09.26
Cloud Composer  (0) 2022.09.22
[GCP] Ops Agent  (1) 2022.09.15

댓글