본문 바로가기

개발/GCP certification

[GCP PDE] 서비스별 비교 및 특징 정리

Database관련 서비스

Cloud SQL

- 정형 관계형 데이터

- 가장 간단하고 쉬운 데이터베이스

- OS 설정 / DBMS 설치 및 관리 / 자동백업 / 수직 Scaling / Availability(Failover, Read replicas) / 모니터링 / 네트워크, proxy, SSL 서비스 제공

- Read replicas 기능은 기존 서버와 같은 지역에서만 제공되는 서비스 (글로벌 접근 불가)

- 최대 저장 용량 10TB

- 추천 용도 : 블로그 포스팅, 의료 기록

 

- 속도

---- 큰 테이블 몇 개 보다는 작은 테이블 여러개가 빠르다.

---- SELECT ALL 보다 SELECT [FEILD NAMES] 가 빠르다.

---- join할 때, WHERE 말고 INNER JOIN을 쓰는 것이 빠르다.

 

- 기존 데이터베이스에서 Cloud SQL로 이전하는 방법 : Cloud Storage를 Staging ground로 이용

---- 기존 DB를 SQL dump 또는 CSV file로 내보내기

---- Cloud Storage 에서 내보낸 파일 불러오기

---- Cloud SQL에서 Cloud Storage 불러오기

Cloud Spanner

- 정형 관계형 데이터

- Cloud SQL에 scalability 추가. 글로벌 read replicas 가능

- 글로벌 공급망, 소매업

- Bigtable과 비슷한 아키텍처

- Horizontal scaling 가능

- SQL과 drop in 교체가 불가능

Cloud Datastore

- 정형 비관계형 데이터 (Json, XML 등)

- OS 설정, CPU설정 등 추상화한 서비스 제공

- Multi-region acces / Sharding / Replication 자동화로 Scalability 향상

- NoSQL/비 관계형 데이터베이스 : 유연한 구조 및 관계

- highly available structured data를 대량으로 서비스해야하는 작업에 적합

- ACID 기능 지원

- 추천 용도 : 제품 카탈로그, 게임 상태, 유저프로필, 인벤토리

 

- 적합하지 않은 분야

---- Analytics -> Bigquery에 적합. Datastore는 transactional database임.

---- Extreme scale (10M+ read/writes per sec) -> Bigtable에 적합

---- ACID가 불필요하거나 data가 완전 정형이 아닌 경우 -> Bigtable에 적합

---- 기존재하는 데이터 마이그레이션 작업 -> Cloud SQL

---- latency가 0에 수렴해야함 -> Redis 등의 in-memory database

Cloud Bigtable

- 정형 데이터

- 분석용 데이터

- 잦은 업데이트와 빠른 속도에 적합 

- High throughput analytics

- Huge dataset

- no-ops 아님. 직접 서버 설정 필요

- 그래프, IoT, 금융

Cloud Storage

- 비정형데이터

- 멀티미디어 분석, 재난 복구

Bigquery

- 정형데이터

- 분석용 데이터

- 아카이빙용 (업데이트, 속도 Bad)

- Fully managed data warehouse

- petabyte 수준 데이터베이스에 대한 실시간 분석 제공

- no-ops(serverless)

- petabyte 수준 auto-scaling

- Storage 겸 Analysis

- SQL을 이용한 빅데이터 분석

'개발 > GCP certification' 카테고리의 다른 글

[GCP PDE]기본 개념 및 관련 서비스  (0) 2021.12.23
Professional Data Engineer 준비과정  (0) 2021.12.23