반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 데이터 엔지니어링
- Schema Registry
- kafka
- 레드시프트
- Parquet
- 대용량 처리
- Data Warehouse
- 스파크 스트리밍
- kafka rest api
- Data engineering
- airflow
- AWS
- 카프카 구축
- 데이터 웨어하우스
- spark
- 컬럼 기반
- spark streaming
- Data Engineer
- 데이터
- 카프카
- docker
- s3
- 에어플로우
- delta lake
- MySQL
- 스파크
- 데이터 엔지니어
- Redshift
- 델타레이크
- Zookeeper
Archives
- Today
- Total
목록분산 쿼리 (1)
데이터 엔지니어 기술 블로그
[Trino] 트리노(프레스토) 기본 개념 이해 및 사용하기
About 트리노는 빅데이터를 쿼리하기 위한 분산 SQL 쿼리 엔진이다. 기존에는 HDFS를 쿼리하도록 설계되었지만 지금은 그것에만 국한되지 않는다. Trino라는 이름은 Presto라는 이름을 리브랜딩 한 것으로 같은 쿼리 엔진이다. 트리노는 범용 데이터베이스가 아니기 때문에 MySQL과 같이 OLTP(Online Transaction Processing)가 아닌 OLAP(Online Analytics Processing)로 설계되었다. Concepts Server types 트리노는 두 가지의 서버 타입이 있다. 하나는 Coordinator로 다른 하나는 Worker이다. 이름과 같이 Coordinator는 구문 분석, 쿼리 계획, 작업자 노드 관리와 같은 일을 하고 Worker는 실제 작업을 실행하..
데이터 엔지니어링
2022. 2. 4. 14:04