타란툴라 레이크하우스

타란툴라 Lakehouse
다양한 원천 데이터를 유연하게 수집하여 고성능 스토리지에 저장하고 
BI/AI/ML로 연계하는 개방형 통합 빅데이터 저장소입니다.

개방형 통합 빅데이터 플랫폼 : Lakehouse

타란툴라 Lakehouse 주요기능

 1. 통합된 SQL 쿼리 엔진

Oracle, SAP Hana 등 기업의 다양한 데이터 소스를 하나의 SQL 인터페이스로 조회하고 분석할 수 있습니다.

2. ACID 트랜잭션 지원

데이터 쓰기, 업데이트, 삭제 등 모든 작업에 대해 정합성, 일관성, 복구 가능성을 보장합니다.

3. 고급 쿼리 최적화 

조건자 푸시다운, 프루닝, 메타Data 및 파티션 최적화 등, 다양한 기술을 통해 대용량 데이터도 빠르고 효율적으로 처리합니다.

4. 스토리지-컴퓨팅 영역분리 아키텍처 

저장은 오브젝트 스토리지에, 처리는 필요할 때 유연하게-
리소스 낭비 없이 빠르고 안정적인 분석이 가능합니다

타란툴라 Lakehouse 구성요소

글로벌 No.1 오픈소스 컴포넌트로 구성되어 성능, 확장성, 개방성이 뛰어납니다.

1. 쿼리 엔진 – Trino

다양한 데이터 소스를 대상으로 SQL을 사용해 빠르게 분석하는 분산형 *MPP SQL 쿼리 엔진

2. 오브젝트 스토리지 저장소 – Minio AIStor

AI 및 대규모 데이터 워크로드를 위해 설계된 온프레미스 고성능 오브젝트 스토리지 플랫폼

3. 메타저장소/BI DB – TarantulaDB

ICEBERG 카탈로그 저장 Meta DB로 ICEBERG 테이블 조회 용도(Trino Bridge 자체 개발) 및 향후 Vector DB Extension

타란툴라 Lakehouse 특장점

 1. 하나로 끝내는 데이터 플랫폼

Tarantula Lakehouse는 빅데이터 시스템을 구성요소로 포함하고 있어 별도로 빅데이터 시스템 구축이 불필요합니다.

2. 온프렘 기반의 대규모 분석성능과 보안성

보안 데이터는 내부에 보관하여 안전하게 처리할 수 있으며, 클라우드 컴퓨팅 파워 없이도 대규모 분석이 용이합니다.

3. 뛰어난 개방성과 유연성 

AWS, Snowflake 등 클라우드 서비스와 실시간 연동할 수 있으며, 기업 내부의 AI/ML 연동이 용이합니다.

4. 비용은 합리적, 서비스는 엔터프라이즈급 

글로벌 No.1 오픈소스 컴포넌트로 이루어져 합리적인 비용과 성능, 안정성을 제공하며, 엔터프라이즈급의 탄탄한 기술지원을 받으실 수 있습니다.