점 창고 (1)- 점 창고란 무엇입니까?
창고 재고 (2) 에 대해 이야기하기-전통적인 창고 재고 및 인터넷 창고 재고
창고 인벤토리 (c)-창고 인벤토리 아키텍처에 대해 이야기하기
데이터웨어 하우스 (4)- 색인 사전에 대해 이야기하기
데이터 웨어하우스 (5)-날짜 차원의 가장 중요한 차원에 대해 이야기하십시오.
디지털 창고 (6) 에 대해 이야기하기-명명 규칙 정보
데이터웨어 하우스 이야기 (7)--데이터 거버넌스에 대해 이야기하기
인벤토리 창고 (8) 에 대해 이야기하기-증분 정보
여러 창고 (9)- 상류 및 하류 계약에 대해 이야기하기
창고 수 (10)- 작업 노트
즉, 규칙 없이는 방원 없습니다. 데이터 플랫폼을 구축할 때, 데이터 그룹 내에서는 먼저 각종 규범을 제정하고, 빠르면 빠를수록 좋으며, 여러분이 약속대로 집행하는지 여부를 지속적으로 감독해야 한다. 일단 모두가 자유롭게 발휘할 수 있게 되면, 후기 통일이나 재구조화는 대량의 인력과 시간을 낭비할 것이다. 기억해, 이건 모두 구덩이야.
다음은 현재 우리 회사의 경험 공유 중 일부입니다.
관례에 따르면, 몇 개의 창고의 구조는 몇 개의 창고의 계층 모델을 기반으로 개발되었다. 일부는 업무 라인에 따라 계층화하고, 각 업무 라인 아래에서 다시 계층화하여 각각 발전한다.
저는 아리운의 MaxCompute 를 사용합니다. 아리운은 데이터 플랫폼이며 알리가 제공하는 전체 개발 환경입니다. 사용하기가 매우 편리하여, 스스로 플랫폼을 만드는 번거로움을 덜어 주었다. MaxCompute 에는 프로젝트 개념이 있습니다. 처음에는 계층 모델의 설계에 따라 프로젝트를 직접 만들려고 했지만 어떤 이유로 업무 라인별로 프로젝트를 만들었습니다. 이 프로젝트의 이름에 대해 우리는 반드시 잘 생각해야 한다. 우리가 무엇을 근거로 설계하든지 간에, 우리는 그것을 자세히 고려하고 이해해야 한다. 우리가 결정한 후에는 변경해서는 안 되고, 바꿀 수도 없다.
"어원학" 이라고 부르는지 잊고 먼저 썼는데 나중에 이 책을 찾아 확인했다. 어원은 데이터 창고 건설의 규범에 속하며 메타데이터 관리의 범주에 속한다. 아, 이제 이것은 모두 데이터 거버넌스의 일부입니다.
일반적으로 전체 데이터 웨어하우스 구축에는 데이터 관리가 포함되지만 데이터 웨어하우스 모델링과 관련된 경우 데이터 사양과 데이터 관리가 더 많습니다.
먼저 우리의 주인공인 어원을 말하다.
우리가 영어를 배울 때, 우리는 이미 어근을 알고 있을 것이다. 이 단어는 가장 간단하고 입도가 가장 세밀한 단어이다. 우리는 주로 중국어와 영어 간의 매핑을 규제하는 데 사용합니다. 우리 회사의 일부 업무는 진열대에 관한 것이다. 영어 이름은 락입니다. Rack 은 루트이므로 모든 테이블과 필드에서 rack 이라고 불러야 합니다. 이것이 바로 어근의 작용으로, 이름을 통일하고 같은 뜻을 표현하는 데 쓰인다.
지표체계에는 많은' 율' 지표가 있는데, 이는 XXX+ 율로 분해될 수 있고, 비율은 비율을 부를 수 있기 때문에 우리의 모든 지표는 XX+율이라고 한다.
루트는 테이블 이름, 필드 이름, 주제 도메인 이름 등을 통합하는 데 사용할 수 있습니다.
테이블 이름은 그 이름을 통해 알 수 있어야 합니다. 어떤 업무 도메인인지, 왜 사용하는지, 그리고 어떤 세분성의 데이터를 사용할 수 있는지 알 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 테이블명언)
중간 테이블을 생성할 때 추가하고, 과거 중간 테이블을 보존하려는 경우 날짜 또는 타임스탬프를 추가할 수 있습니다.
포인터의 이름도 루트를 참조하여 동일한 포인터를 방지합니다. 10 사람은 10 명명 방식을 가지고 있습니다.
구체적인 작업은 회사의 실제 상황과 연계하여 가능한 한 빨리 제정해야 한다.
첨부 파일은 이전에 Ali DataWorks 에 있었던 사양의 예입니다.