이 글은 "데이터분석을 위한 SQL 레시피 (가사키 나가토, 다미야 나오토 지음)"을 읽고 주관적으로 작성된 글입니다. 1. 시스템 1) PostgreSQL 오픈소스 RDB MySQL등 다른 오픈소스 RDB에 비해 표준 SQL을 잘 준수하고 있음 윈도 함수, CTE(WITH 구문) 등 분석에 필수적으로 사용하는 구문을 모두 구현 특유의 확장 기능을 많이 제공하여 편리함 소규모 데이터 분석 / SQL 학습 목적으로 사용 2) Apache Hive 대용량 데이터에 대한 RDBMS의 한계(bottle neck) 빅데이터 시스템에서는 일반적으로 저렴한 디스크를 사용 따라서, 디스크의 데이터 I/O 속도와 CPU의 처리 속도의 gap이 큼 이를 위한 아키텍처로 분산 파일 시스템이 고안됨 Apache Hive HD..