안녕하세요~ 할부로애틋하게 BTC_손지수, 박은혜 입니다!
저번 주 포스팅으로 GCP의 스토리지와 컨테이너에 대해 알아보았습니다.
그 중 데이터는 큰 틀로 두 가지가 나뉘어진다고 했었는데요~ 혹시 기억하시나요?
바로 STRUCTURED DATA(정형 데이터)와 UNSTRUCTURED DATA(비정형 데이터)입니다!
저희는 오늘 이 UNSTRUCTURED DATA(비정형 데이터) 에 대해서 더 자세하게 알아보고자 합니다.
그럼 이번 한 주도 GCP에 대해 더 가까이 다가가봅시다~!
비정형 데이터란 무엇일까요?
쉽게 말해 비정형 데이터는 그림이나 비디오, 오디오, 문서처럼 구조화 되지 않은 데이터 입니다.
일정한 규격이나 형태를 지난 숫자 데이터가 아닌, 형태와 구조가 다른 데이터들을 일컫습니다.
(고정된 구성 원칙이 없기 때문에 흔히 원시 데이터라고도 불립니다.)
이러한 비정형 데이터는 빅데이터의 85% 가량을 차지하고 있고,
소셜 네트워크 이용자 수의 증가에 따라 비정형 데이터는 급속도로 확산되고 있습니다.
이에 비정형 데이터의 비중이 높아지고 클라우드 기술과 빅데이터 및 인공지능 분석 기술의 보편화로
쓰임새가 극대화 되고 있으며 이 때문에 비정형 데이터를 쉽게 저장하고
빠르게 검색할 수 있는 저장소가 중요해지고 있습니다.
그렇다면 비정형 데이터의 저장는 어떤 형태를 가지고 있는지 알아보고자 합니다.
우선 비정형 데이터를 저장하는 저장소엔 Object storage(오브젝트 스토리지)가 존재합니다!
그렇다면 오브젝트 스토리지는 무엇을 말하는 걸까요?
오브젝트 스토리지는 기존 스토리지와 근본적으로 다른 접근 방식을 취합니다.
파일 스토리지가 데이터를 파일 규칙에 따라 관리하고,
블록 스토리지가 특정 영역과 구간을 나눠 데이터를 블록 단위로 관리하는 것과 달리,
오브젝트 스토리지는 '오브젝트'로 불리는 각각의 데이터 단위가 개별 단위로 저장되는 데이터 저장소 유형이며,
이러한 오브젝트는 PDF, 비디오, 오디오, 텍스트, 웹사이트 데이터나 기타 다른 파일 유형 등
사실상 거의 모든 데이터 유형이 될 수 있습니다.
또한 파일에 대한 상세 정보를 포함한 메타데이터를 자동으로 생성·보관·관리할 수도 있습니다.
따라서 오브젝트 스토리지는 구조화되지 않은 데이터의 대량 저장을 위한 데이터 스토리지 아키텍처로서,
각 데이터 조각을 하나의 객체로 개별 저장소에 보관하며 메타데이터와 고유 식별자를 함께 저장하므로
데이터 액세스와 검색이 용이한 스토리지 저장방식이라고 볼 수 있습니다.
그렇다면 이러한 오브젝트 스토리지의 특징은 무엇이 있을까요?
오브젝트 스토리지 내 오브젝트는 API(Application Programming Interface) 를 통해 접근할 수 있습니다.
기본적으로 HTTP 기반의 RESTful API를 지원하기 때문에
네트워크 상에서 오브젝트에 HTTP 명령어(PUT, GET, DELETE)를 사용 할 수 있습니다.
이를 통해 Web application 이 API 를 통해 오브젝트 스토리지의 데이터에 직접적으로 접근할 수 있게 됩니다.
전체적으로 클라우드 연동성과 확장성, 메타데이터의 유연성 등을 고려했을 때
가파르게 성장하는 비정형 데이터를 담기에 최적의 스토리지로 꼽히고 있습니다.
그렇다면 GCP 내의 오브젝트 스토리지(Object Storage)는 무엇이 있을까요?
바로 Cloud Storage 입니다.
Cloud Storage는 모든 규모의 기업을 위한 객체 스토리지로,
Cloud Storage는 Google Cloud에 객체를 저장하는 서비스입니다.
객체란 모든 형식의 파일로 구성된 변경할 수 없는 데이터 조각이며, 객체는 버킷이라는 컨테이너에 저장합니다.
모든 버킷은 프로젝트와 연결되고, 프로젝트를 조직 아래에 그룹화할 수 있습니다.
프로젝트를 만든 후 Cloud Storage 버킷을 만들고, 버킷에 객체를 업로드하고, 버킷에서 객체를 다운로드할 수 있습니다. 또한 지정된 주 구성원 또는 웹사이트 호스팅과 같은 특정 사용 사례의 경우 공개 인터넷의 모든 사용자가 데이터에 액세스 가능하도록 권한을 부여할 수 있습니다.
또한 이러한 Cloud Storage는 ID 및 액세스 관리, 데이터 암호화, 인증, 버킷 잠금, 객체 버전 관리 등을 통해 데이터 보안 관리도 가능하니, 보안이 필요한 경우 필요에 따라 옵션을 지정하면 됩니다~!
이렇게 비정형 데이터와 그 데이터가 저장되는 오브젝트 스토리지, Cloud Storage에 대해 알아보았습니다.
이번 포스팅도 여러분들께 도움이 됐길 바라며,
이번 한 주도 수고 많으셨고 저희는 다음에 더욱 더 알찬 내용으로 돌아오겠습니다!
감사합니다 ~!
'CSP (Cloud Service Provider) > GCP' 카테고리의 다른 글
[GCP]Cloud Asset Inventory (0) | 2022.06.02 |
---|---|
GCP Network Service Tier (0) | 2022.05.30 |
Google Kubernetis Engine 구성 (0) | 2022.05.27 |
GKE로 배포 관리하기 (3) Blue/Green 배포 (0) | 2022.05.26 |
[GCP] Cloud pub/sub (0) | 2022.05.20 |
댓글