분류 전체보기(71)
-
1 Page Proposal이란?
Intro 1 Page Proposal은 8가지 구성요소로 기획서를 단순하고 명확하게 작성하는 방법입니다. 1 Page Proposal 이란? 기획서는 보통 수십 페이지 분량으로 두껍고 화려하게 작성되는 경우가 많습니다. 그러나 사람들은 결정을 내려야 하는 상황에는 쉬운 결정 먼저 내린다고 합니다. 기획서를 보는 결정권자는 화려하고 두꺼운 기획서를 검토하며 핵심 내용을 추출할 시간이 없습니다. 1 Page Proposal의 핵심 특징 투명함: 나쁜 아이디어를 좋아 보이게 하지 않는다. 완벽함: 많은 리서치와 완벽한 논리로 완벽할 때까지 작성한다. 거부하기 어려운 제안을 만든다. 간결함: 읽는 데 걸리는 시간은 4분이며 400단어 내외로 이루어져 있으며 읽기 쉽게 작성된다. 1 Page Proposal의 ..
2024.02.19 -
데이터 레이크하우스의 개념
(Data lakehouse in action의 1, 2장을 요약한 글입니다.) Data Lakehouse in Action - 저자 Pradeep Menon 출판 Packt Publishing 출판일 2022.03.17 1. 데이터 분석 패턴의 진화 엔터프라이즈 데이터 웨어하우스(EDW) 시대 EDW 시대가 시작된 배경은 다음과 같았습니다. 분석은 리포팅과 같은 말이었습니다. 데이터베이스 구조를 리포팅하는데 최적화하는 것이 최우선 목표였습니다. Ralph Kimball, Bill Inmon에 의해 1990, 2000년대에 활성화되었습니다. EDW의 패턴은 다음과 같았습니다. Flat Files, Databases -> ETL -> EDW -> Data Marts -> BI EDW는 오랜 시간동안 자리를..
2024.01.15 -
[Chat GPT] GPT-4 Developer Livestream 번역
Source https://www.youtube.com/watch?v=outcGtbnMuQ GPT-4 Developer Livestream To the GPT-4 developer demo livestream. GPT-4 개발자 데모 라이브스트림에 오신 것을 환영합니다. Honestly, it's kind of hard for me to believe that this day is here. 솔직히 오늘이 왔다는 사실이 믿기지 않습니다. OpenAI has been building this technology really since we started the company, but for the past two years, we've been really focused on delivering GPT-4..
2023.03.15 -
[Kerberos] Kerberos Authentication Explained | A deep dive 번역
Source https://www.youtube.com/watch?v=5N242XcKAsM Kerberos Authentication Explained | A deep dive So you want to connect to an application over an insecure network, but you're a wee bit paranoid. 안전하지 않은 네트워크를 통해 애플리케이션에 연결하고 싶지만 편집증에 시달리고 있습니다. Someone may be listening in. 누군가 엿듣고 있을지도 모르기 때문입니다. How do you solve this problem? One possible solution is a protocol designed to provide secure auth..
2023.03.14 -
[Delta Lake] 데이터 레이크하우스: 프로토콜
1. 개요 1.1 Delta의 트랜잭션 구현 방법 다중 버전 동시성 제어(MVCC) 테이블이 변경될 경우 즉시 교체하지 않고 데이터의 여러 복사본을 유지한다. Reader는 트랜잭션 로그를 사용하여 처리할 데이터의 파일을 선택적으로 가져온다. Writer는 새 데이터 파일이나 기존 파일의 업데이트된 복사본을 작성한다. 그 후 커밋하고 로그에 새 항목을 추가하여 테이블의 새로운 버전을 생성한다. 이 로그에는 테이블에 대한 메타데이터 변경 사항과 함께 논리적으로 추가 및 제거할 데이터 파일이 기록된다. vacuum 명령을 사용하여 추후에 지연 삭제할 수 있다. 2. Delta Table Specification 2.1 테이블 스냅샷 테이블에는 연속적으로 증가하는 정수를 사용한 로그가 있다. 특정 버전에서 테..
2022.03.18 -
[Delta Lake] 데이터 레이크하우스: 테이블 활용하기
1. 테이블 읽기 및 쓰기 1.1 테이블 생성하는 방법 spark.sql CREATE TABLE delta.`s3://bucket_name/foo/bar/table_name` ( id INT, firstName STRING, middleName STRING, lastName STRING, ) USING DELTA write df.write.format("delta").mode("overwrite").save("s3://bucket_name/foo/bar/table_name") 1.2 시간 여행 델타레이크에서는 timestamp와 version으로 시간 여행을 할 수 있다. 사용자의 실수로 테이블의 어떤 데이터를 삭제하나 업데이트 한 경우 시간 여행으로 과거의 테이블로 돌아가 다시 쓸 수 있다. df1 =..
2022.03.18