데이터 엔지니어 기술 블로그

데이터 엔지니어 기술 블로그

  • 분류 전체보기 (73)
    • 데이터 엔지니어링 (48)
    • Infrastructure (1)
    • 기술 (3)
    • AWS (4)
    • 데이터 엔지니어링 위클리 (8)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

데이터 엔지니어 기술 블로그

컨텐츠 검색

태그

데이터 엔지니어링 카프카 데이터 엔지니어 에어플로우 Data Engineer s3 Data engineering spark 스파크 airflow 데이터 spark streaming kafka AWS docker data engineering weekly Ai MySQL Redshift delta lake

최근글

댓글

공지사항

아카이브

Databricks(1)

  • [Delta Lake] 데이터 레이크하우스: 테이블 활용하기

    1. 테이블 읽기 및 쓰기 1.1 테이블 생성하는 방법 spark.sql CREATE TABLE delta.`s3://bucket_name/foo/bar/table_name` ( id INT, firstName STRING, middleName STRING, lastName STRING, ) USING DELTA write df.write.format("delta").mode("overwrite").save("s3://bucket_name/foo/bar/table_name") 1.2 시간 여행 델타레이크에서는 timestamp와 version으로 시간 여행을 할 수 있다. 사용자의 실수로 테이블의 어떤 데이터를 삭제하나 업데이트 한 경우 시간 여행으로 과거의 테이블로 돌아가 다시 쓸 수 있다. df1 =..

    2022.03.18
이전
1
다음
아이템즈
© 2025 Items. All rights reserved.

티스토리툴바