반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 레드시프트
- 카프카 구축
- Data engineering
- delta lake
- 카프카
- Data Engineer
- MySQL
- 데이터 웨어하우스
- Data Warehouse
- 데이터 엔지니어링
- docker
- 컬럼 기반
- 데이터
- Schema Registry
- spark streaming
- Parquet
- 스파크
- kafka
- 델타레이크
- spark
- Zookeeper
- 대용량 처리
- 데이터 엔지니어
- 에어플로우
- AWS
- airflow
- kafka rest api
- 스파크 스트리밍
- s3
- Redshift
Archives
- Today
- Total
목록data (1)
데이터 엔지니어 기술 블로그
[Trino] 트리노(프레스토) 기본 개념 이해 및 사용하기
About 트리노는 빅데이터를 쿼리하기 위한 분산 SQL 쿼리 엔진이다. 기존에는 HDFS를 쿼리하도록 설계되었지만 지금은 그것에만 국한되지 않는다. Trino라는 이름은 Presto라는 이름을 리브랜딩 한 것으로 같은 쿼리 엔진이다. 트리노는 범용 데이터베이스가 아니기 때문에 MySQL과 같이 OLTP(Online Transaction Processing)가 아닌 OLAP(Online Analytics Processing)로 설계되었다. Concepts Server types 트리노는 두 가지의 서버 타입이 있다. 하나는 Coordinator로 다른 하나는 Worker이다. 이름과 같이 Coordinator는 구문 분석, 쿼리 계획, 작업자 노드 관리와 같은 일을 하고 Worker는 실제 작업을 실행하..
데이터 엔지니어링
2022. 2. 4. 14:04