본문 바로가기

Categories1735

Kubeflow 설치하기 베하~! 안녕하세요 1-Tier팀 입니다.오늘은 Kubeflow를 설치하는 방법에 대해 알아보도록 하겠습니다.혹시 kubeflow에 대해 궁금하신 분들은 제가 이전에 작성한 포스팅을 참고 부탁드립니다.https://btcd.tistory.com/1169 Kubeflow 개요 및 특징베하~! 1Tier 팀 입니다. Kubeflow~! 혹시 들어보셨나요? Kubeflow는 End-toEnd AI 플랫폼으로, MLOps를 위한 머신러닝 워크플로우로 점차 상용화 되어가고 있는데요, 이번에는 Kubeflow를 한번 알아보겠습니다btcd.tistory.comKubeflow 설치하기1. Git Repository 다운로드export KUBEFLOW_RELEASE_VERSION=v1.7.0export AWS_RELEA.. 2024. 5. 2.
Elastic의 벡터 서치를 위한 HNSW와 다중 계층 기능 안녕하세요. BTC_기범입니다.오늘은 Elastic에서 벡터 서치를 할 때 사용되는 Hierarchical Navigable Small World graphs(이하 HNSW)와 벡터 서치 성능을 높이는데 영향을 미치는 다중 계층 기능에 대해 알아보겠습니다.HNSW (Hierarchical Navigable Small World graphs)HNSW는 Elasticsearch 8.x 버전에서 도입된 고성능 벡터 검색 알고리즘입니다. 데이터 볼륨과 벡터 유사성 검색에서 차원이 증가하면서 발생하는 성능 문제를 해결하기 위해 고안되었습니다.HNSW의 주요 특징은 다음과 같습니다.계층적 그래프 구조: 데이터 포인트를 계층적 그래프로 구성하여, 유사한 벡터를 빠르게 찾을 수 있도록 합니다.탐색 가능한 작은 세상 (.. 2024. 4. 30.
Deployments 와 StatefulSets 베하~! 안녕하세요 1-Tier팀 입니다. Kubernetes 환경을 운영하면서 대부분 Deployment로 관리되고 운영되는데, MySQL, Jenkins 등 일부는 StatefulSet을 사용하는것에 궁금증이 생겼고 비슷한 역할을 하는 리소스이긴 하나 분명 다른점이 있을 것인데 명확하게 설명하기 어려워 두 개의 차이점을 알아보고자 찾아보면서 정리하기 위해 해당 포스팅을 작성하게 되었습니다. 차이점을 이해하기 전에, 먼저 상태 저장의 의미인 Stateful 과 Non-Stateful 를 이해해야 합니다. Stateful / Non-Stateful Stateful 상태를 지속적으로 유지하는 상태 DB, 캐싱 등 데이터를 영구적으로 저장하고 관리해야 하는 경우에 사용되며 각각의 인스턴스가 고유 식별자를 가.. 2024. 4. 17.
Apache Iceberg 베하~! 안녕하세요 1-Tier팀 입니다. 이번에는 대규모 데이터 레이크 관리를 위한 오픈소스인 Apache Iceberg에 대해 알아보겠습니다. Apache Iceberg Apache Iceberg는 페타바이트 기반의 데이터를 위한 오픈소스로, Netflix에서 개발하여 2020년부터 오픈소스로 사용되었습니다. Apache Iceberg는 데이터 레이크에 저장된 대규모 데이터 세트를 테이블로 관리할 수 있고 데이터 처리를 위한 지원을 해준다는 것입니다. 기존 Apache Hive 기반의 빅데이터 처리 방식은 ACID 트랜잭션을 지원하지 않아 데이터의 일관성과 무결성 보장을 하지 않았지만, Apache Iceberg는 ACID를 보장하여 데이터의 일관성과 무결성을 보장할 뿐만 아니라 데이터 변경 시 레코.. 2024. 4. 8.
Bigquery UDF 활용 베하~ 반갑습니다!! 인사통의 BTC_김회장, 최총무입니다. 오늘은 Bigquery UDF를 사용해보겠습니다! 개념부터 간단한 활용문을 작성할테니 함께 진행해보시죠 Bigquery UDF란? Bigquey UDF(User-Defined Function)란 SQL 표현식이나 JavaScript 코드를 활용하여 간단한 함수를 생성하는것으로 UDF를 통해 함수를 만들어 두게 되면 복잡한 로직을 더욱 간결하게 표현할 수 있고, 코드의 일관성을 유지할 수 있어 빅쿼리 활용에 도움이 됩니다!! UDF 자체의 저장비용은 없으며, 데이터 처리에 따라 비용이 발생하게 됩니다!! 하지만 저장 비용이 없다고 무분별하게 많이 생성하게 되면 디버깅이나 유지관리에 어려움이 있을 수 있으니 이런점 고려하여 사용이 필요하겠습니다 B.. 2024. 3. 31.
Amazon Aurora MySQL version 3 Upgrade 베하~! 안녕하세요 1-Tier팀 입니다. 오늘은 Aurora MySQL을 Version 3 로 업그레이드를 하기 위한 준비 과정과 방법에 대해 알아보고자 합니다. Amazon Aurora MySQL 버전 3는 가장 최신화 된 메이저 버전으로 MySQL 8.0과 호환 됩니다. 버전 3에서는 Amazon Aurora Serverless v2, Amazon Aurora zero-ETL, AWS Graviton3 지원, 향상된 바이너리 로그 및 Amazon Aurora I/O-Optimized와 같은 새로운 기능에 대한 지원이 포함되며 기존의 버전 2 (MySQL 5.7 호환)는 2024년 10월 31일에 표준 지원이 종료됩니다. 지원 종료 후 최대 3년간 기존 버전을 확장 지원 받을 수 있습니다. 확장 지원.. 2024. 3. 26.
Vault by HashiCorp 베하~! 1-Tier팀 입니다. 기업에서 API Key, PW, 인증서 등 다양한 중요 정보들과 산출물들을 관리하게 되는데 산개되어 있는 데이터는 유출 위험이 있고 동적으로 운영되는 클라우드 환경에서는 데이터 관리에 더욱 어렵습니다. 이때 Vault를 사용하면 중요 정보들을 중앙에서 통합 관리할 수 있도록 클라우드 보안 기반을 제공합니다. Vault의 워크플로우는 다음과 같습니다. 먼저, 사용자가 누구인지 확인하고 인증에 성공하면 Vault Token을 생성합니다. 그 다음 여러 검증 소스를 통해 사용자를 검증하고 생성된 Token에 보안 정책을 부여하고 권한을 부여합니다. 그 후 사용자는 Token을 이용하여 비밀, 키, 기능 등에 접근하여 액세스 할 수 있는 권한을 부여받게 됩니다. 예로 들어, 우리.. 2024. 3. 7.
[Mysql] 프로시저 기초 사용법 베하! 오랜만이네요 여러분! 그동안 무척 바빴답니다 ㅎㅎ 그리웠다고 말해줘요 오늘 가져온 주제는 프로시저 사용법입니다! 두둥! 많은 분들이 쿼리문을 사용하여 DB의 내용을 조회하거나 변경하는 등의 작업은 익숙하실 거예요. 하지만 프로그래밍처럼 코드를 짜서 DB 서버에 무언가 실행하는 프로시저 방법은 생소할 것이라고 생각하여 들고온 주제입니다. 프로시저(Procedure)란? 본격적으로 설명하기에 앞서 프로시저란 정확하게 무엇일까요. 일련의 쿼리를 마치 하나의 함수처럼 실행하기 위한 쿼리의 집합을 의미 데이터베이스에 대한 일련의 작업을 정리한 절차를 관계형 데이터베이스 관리 시스템에 저장한 것으로, 영구저장모듈(Persistent Storage Module)이라고도 불립니다. 만약 여러 개의 칼럼을 조회하.. 2024. 3. 7.