반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Redshift
- s3
- MySQL
- spark streaming
- 스파크
- docker
- 데이터 엔지니어
- airflow
- kafka rest api
- 델타레이크
- Data engineering
- 레드시프트
- 스파크 스트리밍
- Schema Registry
- 데이터
- 데이터 웨어하우스
- Zookeeper
- delta lake
- 컬럼 기반
- AWS
- 데이터 엔지니어링
- 카프카 구축
- Data Engineer
- Parquet
- 대용량 처리
- 카프카
- Data Warehouse
- kafka
- spark
- 에어플로우
Archives
- Today
- Total
목록Data Enigneering (1)
데이터 엔지니어 기술 블로그
[Trino] 트리노(프레스토) 기본 개념 이해 및 사용하기
About 트리노는 빅데이터를 쿼리하기 위한 분산 SQL 쿼리 엔진이다. 기존에는 HDFS를 쿼리하도록 설계되었지만 지금은 그것에만 국한되지 않는다. Trino라는 이름은 Presto라는 이름을 리브랜딩 한 것으로 같은 쿼리 엔진이다. 트리노는 범용 데이터베이스가 아니기 때문에 MySQL과 같이 OLTP(Online Transaction Processing)가 아닌 OLAP(Online Analytics Processing)로 설계되었다. Concepts Server types 트리노는 두 가지의 서버 타입이 있다. 하나는 Coordinator로 다른 하나는 Worker이다. 이름과 같이 Coordinator는 구문 분석, 쿼리 계획, 작업자 노드 관리와 같은 일을 하고 Worker는 실제 작업을 실행하..
데이터 엔지니어링
2022. 2. 4. 14:04