반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- s3
- MySQL
- spark
- 레드시프트
- 에어플로우
- AWS
- 델타레이크
- 컬럼 기반
- 스파크
- 데이터 엔지니어링
- airflow
- Redshift
- spark streaming
- 데이터 웨어하우스
- 데이터 엔지니어
- 스파크 스트리밍
- Schema Registry
- kafka
- Data engineering
- Zookeeper
- Data Warehouse
- delta lake
- Parquet
- 카프카
- kafka rest api
- 대용량 처리
- docker
- 카프카 구축
- Data Engineer
- 데이터
Archives
- Today
- Total
목록컨슈머 (1)
데이터 엔지니어 기술 블로그

카프카 포춘 500대 기업의 1/3을 포함하여 많은 조직에서 사용되고 있다. 끊임없이 진화하고 성장하는 스트림으로 데이터를 처리하는데에 중점을 두었다. 카프카는 메세징 시스템이지만 클러스터로 실행되고 수동으로 연결하는 개별적인 메시징 브로커 대신에 회사의 모든 데이터 스트림을 처리를 위한 탄력적으로 확장할 수 있는 중심 플랫폼 역할을 한다. 실시간 버전의 하둡을 생각하고 만들어졌다. 메세지 발행과 구독하기(publish/subscribe) 이 구조에서는 데이터를 발행자가 구독자에게 직접 보내지 않고 중간에 브로커가 도와준다. Pub/Sub 구조가 아닌 곳에서는 여러 서버에서 나오는 로그, 메트릭 등을 사용해야 할 때 모니터링 서버, 분석 서버, UI 서버 등에 각자 연결해야 하지만 Pub/Sub구조라면 ..
데이터 엔지니어링
2021. 3. 12. 13:29