데이터 엔지니어 기술 블로그

데이터 엔지니어 기술 블로그

  • 분류 전체보기 (73)
    • 데이터 엔지니어링 (48)
    • Infrastructure (1)
    • 기술 (3)
    • AWS (4)
    • 데이터 엔지니어링 위클리 (8)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

데이터 엔지니어 기술 블로그

컨텐츠 검색

태그

kafka MySQL airflow delta lake Data engineering docker 스파크 데이터 엔지니어 Data Engineer s3 에어플로우 spark streaming 데이터 데이터 엔지니어링 spark Redshift data engineering weekly Ai AWS 카프카

최근글

댓글

공지사항

아카이브

Databricks(1)

  • [Delta Lake] 데이터 레이크하우스: 테이블 활용하기

    1. 테이블 읽기 및 쓰기 1.1 테이블 생성하는 방법 spark.sql CREATE TABLE delta.`s3://bucket_name/foo/bar/table_name` ( id INT, firstName STRING, middleName STRING, lastName STRING, ) USING DELTA write df.write.format("delta").mode("overwrite").save("s3://bucket_name/foo/bar/table_name") 1.2 시간 여행 델타레이크에서는 timestamp와 version으로 시간 여행을 할 수 있다. 사용자의 실수로 테이블의 어떤 데이터를 삭제하나 업데이트 한 경우 시간 여행으로 과거의 테이블로 돌아가 다시 쓸 수 있다. df1 =..

    2022.03.18
이전
1
다음
아이템즈
© 2025 Items. All rights reserved.

티스토리툴바