반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 데이터 엔지니어링
- 레드시프트
- docker
- kafka rest api
- 에어플로우
- AWS
- Redshift
- s3
- Parquet
- Zookeeper
- spark streaming
- Schema Registry
- 데이터
- MySQL
- 카프카
- 데이터 웨어하우스
- airflow
- Data Engineer
- Data Warehouse
- delta lake
- kafka
- 컬럼 기반
- 스파크
- 대용량 처리
- spark
- 델타레이크
- 데이터 엔지니어
- Data engineering
- 카프카 구축
- 스파크 스트리밍
Archives
- Today
- Total
목록rebalancing (1)
데이터 엔지니어 기술 블로그
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bBMnDp/btq2lCCC8zK/E7oy3sBmozpa5EmspC8Mkk/img.png)
About 이전에 카프카에서 Producer로 메시지를 보냈는데 메시지를 소비하기 위해 Consumer를 만들어보려고 한다. 컨슈머 그룹(Consumer Group) 프로듀서가 생산한 메시지를 하나의 컨슈머가 따라갈 수가 없다면 여러개의 컨슈머를 두어야 한다. 카프카 컨슈머는 컨슈머 그룹에 속한다. 하나의 컨슈머 그룹에서 파티션이 4개일 때 컨슈머가 2개라면 2개씩 나눠가지고, 컨슈머가 4개라면 파티션을 1개씩 나눠가진다. 만약 5개라면 컨슈머 하나는 메시지를 받을 수 없다. 컨슈머 그룹 하나에서는 서로 다른 메시지를 수신하여 처리를 한다. 실시간 처리를 하는 곳과 메시지의 데이터를 저장하는 곳을 따로 두고 싶다면 컨슈머 그룹은 두개가 필요하다. 리밸런싱(rebalancing) 토픽의 파티션 1개의 소유..
데이터 엔지니어링
2021. 4. 11. 18:52