Деректер қоймасын модельдеу - Data vault modeling

Деректер қоймасын модельдеу Бұл дерекқор ұзақ мерзімді тарихи сақтауды қамтамасыз етуге арналған модельдеу әдісі деректер бірнеше операциялық жүйелерден келеді. Бұл сонымен қатар аудит, деректерді іздеу, жүктеу жылдамдығы және өзгеріске төзімділік сияқты мәселелермен айналысатын тарихи деректерді қарау әдісі, сондай-ақ мәліметтер базасындағы барлық деректердің қайдан алынғандығын іздеу қажеттілігін атап көрсетеді. Бұл дегеніміз, әрқайсысы қатар Деректер қоймасында аудиторға дереккөзді дерек көзінен іздеуге мүмкіндік беретін жазба көзі және жүктеу датасы атрибуттары болуы керек. Ол әзірледі Даниэль (Дан) Линстедт 2000 жылы.

Деректерді қоймалық модельдеу жақсы және жаман деректерді ажыратпайды («жаман» дегеніміз бизнес ережелеріне сәйкес келмейді).[1] Бұл мәліметтерді сақтау қоймасы «фактілердің бір нұсқасын» сақтайды (сонымен қатар Дэн Линстедт «барлық деректер, барлық уақытта» деп атайды) сақтаудың басқа деректер қоймасында қолданылатын әдістермен салыстырғанда « а шындықтың жалғыз нұсқасы "[2] онда анықтамаларға сәйкес келмейтін деректер жойылады немесе «тазартылады».

Модельдеу әдісі құрылымдық ақпаратты сипаттамалық атрибуттардан нақты бөліп алу арқылы, деректер сақталынатын іскери ортадағы өзгерістерге төзімді болу үшін жасалған.[3] Деректер қоймасы мүмкіндігінше параллель жүктеуді қамтамасыз етуге арналған,[4] сондықтан өте үлкен жобалар ауқымды қайта құруды қажет етпестен кеңейе алады.

Тарих және философия

Жылы мәліметтер қоймасы модельдеу деректер сақталатын қабатты модельдеудің екі белгілі бәсекелес нұсқалары бар. Немесе сәйкес модель жасайсыз Ральф Кимбол, сәйкес келетін өлшемдермен және кәсіптік деректер шинасымен, немесе сіз сәйкесінше модельдеңіз Билл Инмон мәліметтер базасымен қалыпқа келтірілген[дәйексөз қажет ]. Екі әдісте де мәліметтер қоймасын беретін жүйелердегі өзгерістерге қатысты мәселелер бар[дәйексөз қажет ]. Сәйкес өлшемдер үшін сіз сонымен қатар деректерді тазалауыңыз керек (оған сәйкес келуіңіз керек) және бұл бірқатар жағдайларда қажет емес, өйткені бұл сөзсіз ақпаратты жоғалтады[дәйексөз қажет ]. Деректер қоймасы осы мәселелердің әсерін болдырмауға немесе оларды азайтуға арналған, оларды сақтау қоймасының тарихи сақтау аймағынан тыс жерлерге жылжыту арқылы (тазарту деректер маркаларында жасалады) және құрылымдық элементтерді (бизнес кілттері мен сипаттамалық атрибуттардан бизнес кілттер арасындағы байланыстар).

Әдістің құрушысы Дэн Линстедт алынған мәліметтер базасын былайша сипаттайды:

«Data Vault моделі - бұл егжей-тегжейлі бағдарланған, тарихи қадағалау және бизнестің бір немесе бірнеше функционалды бағыттарын қолдайтын бір-бірімен байланысты нормаланған кестелердің жиынтығы. Бұл 3-ші қалыпты форма (3NF) мен ең жақсы тұқымды қамтитын гибридтік тәсіл. жұлдыз схемасы. Дизайн икемді, масштабталатын, дәйекті және кәсіпорын қажеттіліктеріне бейімделген »[5]

Деректер қоймасының философиясы - бұл барлық анықталған анықтамалар мен іскери ережелермен сәйкес келмесе де, барлық мәліметтер маңызды мәліметтер. Егер деректер осы анықтамалар мен ережелерге сәйкес келмесе, онда бұл мәліметтер қоймасы емес, бизнес үшін қиындық тудырады. Деректерді «қате» деп анықтау дегеніміз - бұл белгілі бір көзқарастан туындайтын, барлығына немесе уақыттың кез-келген нүктесіне жарамсыз болуы мүмкін интерпретация. Сондықтан деректер қоймасы барлық деректерді қамтуы керек, тек есеп беру кезінде немесе деректер қоймасынан деректерді шығарған кезде ғана интерпретацияланатын болады.

Деректер қоймасы жауап беретін тағы бір мәселе - бұл мәліметтер қоймасындағы барлық деректердің толық тексерілуіне және қадағалануына қажеттіліктің көбеюі. Байланысты Сарбанес-Оксли АҚШ-тағы талаптар және Еуропадағы осыған ұқсас шаралар көптеген іскерлік интеллектті енгізу үшін өзекті тақырып болып табылады, сондықтан кез-келген деректерді сақтау қоймасы барлық ақпараттың толық бақылануы мен тексерілуіне бағытталған.

Data Vault 2.0 жаңа спецификация, ол an ашық стандарт.[6] Жаңа спецификацияда ең жақсы тәжірибелерді, әдістемені (SEI / CMMI, Six Sigma, SDLC, т.б.), архитектураны және модельді анықтайтын компоненттер бар. Data Vault 2.0 Big Data, NoSQL сияқты жаңа компоненттерді қосуға баса назар аударады және қолданыстағы модельдің өнімділігіне назар аударады. Ескі спецификация (көбінесе мұнда құжатталған) деректерді қоймалық модельдеуге жоғары бағытталған. Бұл кітапта келтірілген: Data Vault 2.0 көмегімен масштабталатын деректер қоймасын құру.

EDW және BI жүйелерін қазіргі заманғы бизнестің қажеттіліктері мен қажеттіліктерімен қатар ұстап тұру үшін ең жақсы тәжірибелермен бірге жаңа компоненттерді қосу үшін спецификацияны дамыту қажет.

Тарих

Деректер қоймаларын модельдеуді бастапқыда Дэн Линстедт 1990 жылдары ойлап тапқан және 2000 жылы қоғамдық доменде модельдеу әдісі ретінде шығарылған. Ақпараттық бюллетеньдегі бес мақалалар топтамасында Data Vault әдісінің негізгі ережелері кеңейтілген және түсіндірілген. Мұнда жалпы шолу бар,[7] компоненттерге шолу,[8] аяқталу күндері мен қосылу туралы пікірталас,[9] сілтеме кестелері,[10] және жүктеу тәжірибесі туралы мақала.[11]

Әдістің баламалы (және сирек қолданылатын) атауы - «Жалпыға ортақ интеграциялық модельдеу архитектурасы».[12]

Data Vault 2.0[13][14] 2013 жылға сахнаға шықты және кестеге Big Data, NoSQL, құрылымсыз, жартылай құрылымды жіксіз интеграцияны, әдіснамамен, архитектурамен және ең жақсы тәжірибені енгізумен бірге алып келеді.

Баламалы түсіндіру

Дэн Линстедтің айтуы бойынша, деректер моделі нейрондардың, дендриттердің және синапстардың қарапайым көрінісі арқылы шабыттандырылған (нейрондар хабтармен және хаб спутниктермен байланысты, сілтемелер - дендриттер (ақпарат векторлары) және басқа сілтемелер синапстар (қарсы бағыттағы векторлар). Деректерді жинау алгоритмдерінің жиынтығын пайдалану арқылы сілтемелер сенімділік пен беріктік рейтингтерімен жасалуы мүмкін. Оларды қазіргі уақытта жоқ қатынастар туралы білуге ​​сәйкес құруға және тастауға болады. Модель автоматты түрде өзгертілуі, бейімделуі және қолданылуы және жаңа құрылымдарды беру кезінде реттелуі мүмкін.[15]

Тағы бір көзқарас - деректер қоймасының моделі an онтология Кәсіпорынның доменіндегі терминдерді және олардың арасындағы байланыстарды (Сілтемелер) сипаттайтын мағынада, қажет болғанда сипаттамалық атрибуттарды (Спутниктерді) қосады.

Деректер қоймасының моделі туралы ойлаудың тағы бір тәсілі - графикалық модель. Деректер қоймасының моделі реляциялық мәліметтер қоры әлемінде хабтары мен байланыстары бар «графикке негізделген» модельді ұсынады. Осылайша, әзірлеуші ​​SQL-ді екінші секундтық жауаптармен графикалық қатынастарды алу үшін қолдана алады.

Негізгі түсініктер

Екі хаб (көк), бір сілтеме (жасыл) және төрт жерсерік (сары) бар қарапайым мәліметтер қоймасы моделі

Мәліметтер қоймасы қоршаған ортаны өзгерту мәселелерін іскери кілттерді (көбінесе мутацияланбайтын, өйткені олар кәсіпкерлік субъектісін ерекше түрде анықтайтындықтан) және сол кілттердің сипаттамалық атрибуттарынан ассоциацияларды бөлу арқылы шешуге тырысады. .

Іскери кілттер мен олардың бірлестіктері құрылымдық атрибуттар болып табылады, деректер моделінің қаңқасын құрайды. Деректерді сақтау әдісі өзінің негізгі аксиомаларының бірі болып табылады, нақты іскери кілттер бизнес өзгерген кезде ғана өзгереді, сондықтан тарихи мәліметтер базасының құрылымын шығаратын ең тұрақты элементтер. Егер сіз бұл кілттерді мәліметтер қоймасының негізі ретінде қолдансаңыз, қалған деректерді олардың айналасында орналастыруға болады. Бұл дегеніміз, хабтар үшін дұрыс кілттерді таңдау сіздің модельіңіздің тұрақтылығы үшін өте маңызды.[16] Кілттер құрылымда бірнеше шектеулер бар кестелерде сақталады. Бұл кілт кестелері хаб деп аталады.

Хабтар

Хабтарда өзгеруге бейімділігі бар бірегей бизнес кілттерінің тізімі бар. Хабтарда сонымен бірге әрбір хаб элементі үшін суррогат кілті және іскери кілттің пайда болуын сипаттайтын метадеректер бар. Хабтағы ақпараттың сипаттамалық атрибуттары (мысалы, кілттің сипаттамасы, мүмкін бірнеше тілде) спутниктік кестелер деп аталатын құрылымдарда сақталады, олар төменде талқыланады.

Хабта кем дегенде келесі өрістер бар:[17]

  • басқа құрылымдарды осы кестеге қосу үшін қолданылатын суррогат кілт.
  • іскери кілт, осы хабтың драйвері. Іскери кілт бірнеше өрістен тұруы мүмкін.
  • әр бизнес кілтін қандай жүйе бірінші жүктегенін көруге болатын жазба көзі.
  • қаласаңыз, қолмен жаңартулар (пайдаланушы / уақыт) және шығарылатын күн туралы ақпараты бар метадеректер өрістеріне ие бола аласыз.

Хабта бірнеше іскери кілттердің болуына жол берілмейді, тек екі жүйе бірдей іскери кілтті жеткізетін жағдайларды қоспағанда, әр түрлі мағынадағы коллизиялармен.

Әдетте концентраторларда кем дегенде бір спутник болуы керек.[17]

Хаб мысалы

Бұл «Автокөлік» (H_CAR) деп аталатын автомобильдерден тұратын хаб-кестеге арналған мысал. Жүргізуші кілт көлік құралының сәйкестендіру нөмірі.

Өріс атыСипаттамаМіндетті ме?Түсініктеме
H_CAR_IDРеттік идентификатор және хаб үшін суррогат кілтЖоқҰсынылған, бірақ міндетті емес[18]
VEHICLE_ID_NRБұл хабты басқаратын іскери кілт. Композициялық кілт үшін бірнеше өрістер болуы мүмкінИә
H_RSRCАлғаш жүктелген кезде осы кілттің жазба көзіИә
LOAD_AUDIT_IDАудиторлық ақпараты бар кестеге идентификатор, мысалы жүктеу уақыты, жүктеме ұзақтығы, сызық саны және т.б.Жоқ

Сілтемелер

Іскери кілттер арасындағы ассоциациялар немесе транзакциялар (мысалы, сатып алушы мәміле арқылы тұтынушыға және өнімге арналған хабтарға қатысты) сілтеме кестелері арқылы модельденеді. Бұл кестелер, негізінен, көптеген метамәліметтермен біріктірілген кестелерден тұрады.

Сілтемелер түйіршіктіліктің өзгеруімен күресу үшін басқа сілтемелерге сілтеме жасай алады (мысалы, деректер кестесіне жаңа кілт қосу мәліметтер қоры кестесінің түйірін өзгертеді). Мысалы, егер сізде тапсырыс беруші мен мекен-жайдың байланысы болса, өнім мен көлік компаниясы үшін түйіндер арасындағы сілтеме туралы анықтама қосуға болады. Бұл «Жеткізу» деп аталатын сілтеме болуы мүмкін. Сілтемені басқа сілтемеде сілтеме жасау жаман тәжірибе болып саналады, өйткені параллельді жүктеуді қиындататын сілтемелер арасындағы тәуелділіктерді енгізеді. Басқа сілтемеге сілтеме басқа сілтемедегі хабтармен жаңа сілтеме сияқты болғандықтан, бұл жағдайда басқа сілтемелерге сілтеме жасамай сілтемелерді жасау дұрыс шешім болып табылады (қосымша ақпарат алу үшін жүктеу тәжірибесі бөлімін қараңыз).

Сілтемелер кейде хабты өздігінен хаб құру үшін жеткіліксіз ақпаратпен байланыстырады. Бұл сілтеме арқылы байланысқан іскери кілттердің бірі нақты іскери кілт болмаған кезде пайда болады. Мысал ретінде «тапсырыс нөмірі» бар тапсырыс формасын кілт ретінде алыңыз, және оларды бірегей ету үшін жартылай кездейсоқ цифрмен басылған сызықтарға тапсырыс беріңіз. Айталық, «бірегей нөмір». Соңғы кілт нақты іскери кілт емес, сондықтан ол хаб емес. Дегенмен, сілтеме үшін дұрыс түйіршіктілікке кепілдік беру үшін оны пайдалану қажет. Бұл жағдайда біз суррогат кілті бар хабты қолданбаймыз, бірақ сілтемеге бизнес кілтін «бірегей нөмір» қосамыз. Бұл бизнес кілтін басқа сілтеме үшін немесе спутниктегі атрибуттар үшін кілт ретінде пайдалану мүмкіндігі болмаған кезде ғана жасалады. Бұл құрылысты Дэн Линстедт өзінің (қазір жұмыс істемейтін) форумында «қазық сілтеме» деп атады.

Сілтемелерде байланыстырылған хабтардың суррогатты кілттері, сілтеме үшін өзіндік суррогат кілті және қауымдастықтың пайда болуын сипаттайтын метадеректер бар. Қауымдастық туралы ақпараттың сипаттамалық сипаттамалары (мысалы, уақыты, бағасы немесе мөлшері) аталған құрылымдарда сақталады спутниктік үстелдер төменде талқыланады.

Сілтеме мысалы

Бұл автомобильдерге арналған екі концентраторлар (H_CAR) мен адамдар (H_PERSON) арасындағы сілтеме кестесінің мысалы. Сілтеме «Драйвер» (L_DRIVER) деп аталады.

Өріс атыСипаттамаМіндетті ме?Түсініктеме
L_DRIVER_IDСілтеме үшін реттік идентификатор және суррогат кілтЖоқҰсынылған, бірақ міндетті емес[18]
H_CAR_IDавтомобиль хабы үшін суррогат кілт, сілтеменің алғашқы якорыИә
H_PERSON_IDадам хабы үшін суррогат кілт, сілтеменің екінші якорыИә
L_RSRCАлғаш жүктелген кезде осы бірлестіктің жазбаша көзіИә
LOAD_AUDIT_IDАудиторлық ақпараты бар кестеге идентификатор, мысалы жүктеу уақыты, жүктеме ұзақтығы, сызық саны және т.б.Жоқ

Жерсеріктер

Хабтар мен сілтемелер модель құрылымын құрайды, бірақ уақытша атрибуттары жоқ және сипаттайтын атрибуттары жоқ. Бұлар деп аталатын бөлек кестелерде сақталады жерсеріктер. Бұл метамәліметтерді оларды өздерінің негізгі хабына немесе сілтемесімен байланыстыратын метамәліметтерден, ассоциацияның шығу тегі мен атрибуттарын сипаттайтын метадеректерден, атрибуттың басталу және аяқталу күндерінен тұратын уақыт шкаласынан тұрады. Хабтар мен сілтемелер модель құрылымын қамтамасыз ететін жерде, серіктер модельдің «етін», концентраторлар мен сілтемелерде түсірілетін бизнес-процестердің контекстін ұсынады. Бұл атрибуттар мәселенің егжей-тегжейіне де, уақыт кестесіне де қатысты сақталады және өте күрделіден (клиенттердің толық профилін сипаттайтын барлық өрістерден) қарапайымға дейін (сілтемедегі спутник тек жарамды индикаторы бар) дейін болуы мүмкін. және уақыт кестесі).

Әдетте атрибуттар спутниктерде бастапқы жүйе бойынша топтастырылған. Сонымен, өлшем, шығын, жылдамдық, мөлшер немесе түс сияқты сипаттамалық атрибуттар әр түрлі жылдамдықта өзгеруі мүмкін, сондықтан сіз олардың өзгеру жылдамдығына қарай әр түрлі спутниктерге бөле аласыз.

Барлық кестелерде метамәліметтер бар, ең болмағанда бастапқы жүйені және осы жазбаның жарамды болған күнін минималды түрде сипаттайды және мәліметтер қоймасына кірген кезде деректерге толық тарихи көрініс береді.

Спутниктік мысал

Бұл «Драйверлерді сақтандыру» (S_DRIVER_INSURANCE) деп аталатын автомобильдер мен адамдарға арналған хабтар арасындағы драйверлер арасындағы байланыс спутнигіне мысал. Бұл спутникте автомобиль мен оны басқаратын адам арасындағы қатынастарды сақтауға тән атрибуттар бар, мысалы, бұл негізгі драйвер екендігі туралы көрсеткіш, осы көлік пен адамға арналған сақтандыру компаниясының атауы (сонымен қатар бөлек болуы мүмкін) хаб) және көлік құралы мен жүргізушінің тіркесіміндегі апаттар санының қысқаша мазмұны. Сондай-ақ, R_RISK_CATEGORY деп аталатын іздеуге немесе сілтеме кестесіне сілтеме қосылады, онда осы қатынастар төмендейді деп саналатын тәуекел санатына арналған кодтар бар.

Өріс атыСипаттамаМіндетті ме?Түсініктеме
S_DRIVER_INSURANCE_IDСілтемедегі спутниктің реттік идентификаторы және суррогат кілтЖоқҰсынылған, бірақ міндетті емес[18]
L_DRIVER_ID(суррогат) драйвер сілтемесі үшін негізгі кілт, спутниктің ата-анасыИә
S_SEQ_NRТапсырыс немесе реттік нөмір, егер бір басты кілт үшін бірнеше жарамды жерсерік болса, бірегейлікті қамтамасыз ету үшінЖоқ (**)Бұл, мысалы, сізде хаб бар болса, орын алуы мүмкін, ал егер курс атауы атрибут болса, бірақ бірнеше түрлі тілдерде.
S_LDTSL_DRIVER_ID ата-аналық кілтіне арналған атрибуттар мәндерінің бұл тіркесімінің жүктелу күні (басталу күні)Иә
S_LEDTSL_DRIVER_ID кілтіне арналған төлсипат мәндерінің осы тіркесімінің жарамдылығы үшін аяқталу күнін (соңғы күнді) жүктеңізЖоқ
IND_PRIMARY_DRIVERДрайвер осы машинаның негізгі драйвері болып табылатындығының көрсеткішіЖоқ (*)
САҚТАНДЫРУ КОМПАНИЯСЫОсы көлік құралына және осы жүргізушіге арналған сақтандыру компаниясының атауыЖоқ (*)
NR_OF_ACCIDENTSОсы көлік құралында жүргізушінің жазатайым оқиғалар саныЖоқ (*)
R_RISK_CATEGORY_CDЖүргізуші үшін қауіп категориясы. Бұл R_RISK_CATEGORY сілтемесіЖоқ (*)
S_RSRCАлғашқы жүктелген кезде осы спутниктегі ақпараттардың дереккөзіИә
LOAD_AUDIT_IDАудиторлық ақпараты бар кестеге идентификатор, мысалы жүктеу уақыты, жүктеме ұзақтығы, сызық саны және т.б.Жоқ

(*) кем дегенде бір атрибут міндетті болып табылады. (**) реттік нөмір міндетті түрде бір хабта немесе сілтемеде бірнеше жарамды жерсеріктердің бірегейлігін қамтамасыз ету үшін қажет болады.

Анықтамалық кестелер

Анықтамалық кестелер - мәліметтер қоймасы сау үлгісінің қалыпты бөлігі. Олар көп сілтеме жасайтын қарапайым анықтамалық деректердің артық сақталуын болдырмау үшін бар. Дэн Линстедт формальды түрде анықтамалық мәліметтерді келесідей анықтайды:

Кодтардағы сипаттамаларды шешуге немесе кілттерді дәйекті түрде аударуға қажет деп саналатын кез келген ақпарат. Осы өрістердің көпшілігі «сипаттамалық» сипатқа ие және сипаттау басқа маңызды ақпараттың нақты күйі. Осылайша, анықтамалық деректер бастапқы кестелерден бөлек бөлек сақталады.[19]

Анықтамалық кестелерге спутниктер сілтеме жасайды, бірақ ешқашан физикалық шетелдік кілттермен байланыстырылмайды. Анықтамалық кестелер үшін белгілі бір құрылым жоқ: қарапайым іздеу кестелерінен бастап деректердің кішігірім қоймаларына немесе тіпті жұлдыздарға дейін ең жақсы нәтижені қолданыңыз. Олар тарихи болуы мүмкін немесе тарихы жоқ, бірақ табиғи кілттерге жабысып, суррогат кілттерін жасамау ұсынылады.[20] Әдетте мәліметтер қоймаларында кез-келген басқа деректер қоймасы сияқты көптеген анықтамалық кестелер болады.

Анықтамалық мысал

Бұл көлік құралдарының жүргізушілеріне арналған қауіп-қатер санаттары бар анықтамалық кестенің мысалы. Оған кез-келген жерсеріктен мәліметтер қоймасында сілтеме жасауға болады. Әзірге біз S_DRIVER_INSURANCE жерсеріктен сілтеме жасаймыз. Анықтамалық кесте - R_RISK_CATEGORY.

Өріс атыСипаттамаМіндетті ме?
R_RISK_CATEGORY_CDТәуекел санатына арналған кодИә
RISK_CATEGORY_DESCТәуекел категориясының сипаттамасыЖоқ (*)

(*) кем дегенде бір атрибут міндетті болып табылады.

Жүктеу тәжірибелері

The ETL деректер қоймасының моделін жаңарту үшін өте қарапайым (қараңыз) Data Vault сериясы 5 - жүктеу практикасы ). Алдымен кез-келген жаңа бизнес кілттері үшін суррогатты идентификатор жасай отырып, барлық хабтарды жүктеу керек. Осыны жасағаннан кейін, сіз хабқа сұраныс жасасаңыз, суррогаттық куәліктің барлық іскери кілттерін шеше аласыз. Екінші қадам - ​​хабтар арасындағы байланысты шешу және кез-келген жаңа бірлестіктер үшін суррогатты идентификатор құру. Сонымен қатар, сіз хабтарға бекітілген барлық жерсеріктерді жасай аласыз, өйткені суррогат идентификаторының кілтін шеше аласыз. Барлық жаңа сілтемелерді олардың суррогаттық кілттерімен жасағаннан кейін, сіз спутниктерді барлық сілтемелерге қоса аласыз.

Сілтемелер арқылы ғана концентраторлар бір-біріне қосылмағандықтан, барлық хабтарды параллель жүктеуге болады. Сілтемелер бір-біріне тікелей бекітілмегендіктен, сіз барлық сілтемелерді параллель де жүктей аласыз. Спутниктерді тек хабтар мен сілтемелерге бекітуге болатындықтан, оларды параллель жүктеуге болады.

ETL өте қарапайым және жеңіл автоматикаға немесе темплазацияға мүмкіндік береді. Мәселелер басқа сілтемелерге қатысты сілтемелерде ғана пайда болады, өйткені сілтемедегі іскери кілттерді шешу тек басқа сілтемені тудырады, оны шешуге тура келеді. Бұл жағдайдың бірнеше хабтарға байланысы бар эквиваленттілігіне байланысты, мұндай жағдайларды қайта құру арқылы бұл қиындықты болдырмауға болады және бұл іс жүзінде ұсынылған тәжірибе.[11]

Деректер қоймасынан деректер ешқашан жойылмайды, егер сізде деректерді жүктеу кезінде техникалық қателік болмаса.

Деректерді сақтау және өлшемді модельдеу

Деректер қоймасының модельденген қабаты, әдетте, деректерді сақтау үшін қолданылады. Ол сұраныстың өнімділігі үшін оңтайландырылмаған және сияқты сұраныс құралдары арқылы сұрау оңай емес Cognos, OBIEE, SAP бизнес нысандары, Пентахо т.б.[дәйексөз қажет ] Бұл соңғы пайдаланушының есептеу құралдары олардың деректері өлшемді модельде болады деп күткендіктен немесе оны қалайтындықтан, түрлендіру әдетте қажет.

Осы мақсатта осы хабтардағы концентраторлар мен байланысты жерсеріктерді өлшемдер деп санауға болады, ал сілтемелер мен байланысқан спутниктерді өлшемді модельдегі факт-кестелер ретінде қарастыруға болады. Бұл көріністерді пайдаланып деректердің қойма моделінен өлшемді модельді тез прототиптеуге мүмкіндік береді.

Деректерді қоймалық модельден (тазартылған) өлшемді модельге көшіру салыстырмалы түрде қарапайым болғанымен, өлшемді модельдің факт-кестелерінің нормаланбаған сипатын ескере отырып, керісінше оңай емес екенін ескеріңіз. үшінші қалыпты форма мәліметтер қоймасы.

Деректерді сақтау әдістемесі

Деректерді сақтау әдістемесі SEI / CMMI 5 деңгейдегі ең жақсы тәжірибеге негізделген. Оған CMMI 5 деңгейінің бірнеше компоненттері кіреді және оларды алдыңғы қатарлы тәжірибелермен біріктіреді Алты сигма, TQM, және SDLC. Атап айтқанда, ол Скотт Амблердің құрастыру және орналастырудың икемді әдістемесіне бағытталған. Деректерді сақтауға арналған жобалар қысқа, ауқыммен бақыланатын босату циклына ие және әр 2 - 3 апта сайын өндірістік шығарылымнан тұруы керек.

Деректер қоймасының әдіснамасын қолданатын командалар CMMI 5 деңгейінде күтілетін қайталанатын, дәйекті және өлшенетін жобаларға бейімделуі керек, EDW деректерді сақтау қоймасы жүйесімен өтетін мәліметтер TQM (жалпы сапа менеджменті) өмірлік циклына сәйкес келе бастайды. көптен бері BI (іскери интеллект) жобаларында жоқ болып шықты.

Құралдар

2150 Datavault Builder

Верескейп

Вольспид

Әдебиеттер тізімі

Дәйексөздер

  1. ^ Сіздің деректер қоймаңызды Super Charge, 74 бет
  2. ^ Келесі ұрпақ EDW
  3. ^ Сіздің деректер қоймаңызды Super Charge, 21 бет
  4. ^ Сіздің деректер қоймаңызды Super Charge, 76 бет
  5. ^ Жаңа бизнес супермоделі, глоссарий, 75 бет
  6. ^ # Datavault 2.0-ге қысқаша кіріспе
  7. ^ Data Vault сериясы 1 - Data Vault шолуы
  8. ^ Data Vault сериясы 2 - Data Vault компоненттері
  9. ^ Data Vault 3 сериясы - соңғы күндер және негізгі қосылыстар
  10. ^ Data Vault Series 4 - кестелерді байланыстыру, 2.3-тармақ
  11. ^ а б Data Vault сериясы 5 - жүктеу практикасы
  12. ^ Думиндерге арналған мәліметтер қоймасы, 83 бет
  13. ^ #Datavault 2.0-ге қысқаша кіріспе
  14. ^ Data Vault 2.0 жарияланады
  15. ^ Сіздің деректер қоймаңызды супер зарядтаңыз, 5.20 абзац, 110 бет
  16. ^ Сіздің деректер қоймаңызды Super Charge, 61 бет, бизнес кілттері неге маңызды
  17. ^ а б Data Vault форумы, стандарттар бөлімі, 3.0 концентраторының ережелері
  18. ^ а б c Data Vault моделдеуінің техникалық сипаттамасы v1.0.9
  19. ^ Сіздің деректер қоймаңызды супер зарядтаңыз, 8.0 абзац, 146 бет
  20. ^ Сіздің деректер қоймаңызды супер зарядтаңыз, 8.0 абзац, 149 бет

Дереккөздер

  • Хултгрен, Ханс (қараша 2012). Data Vault көмегімен Agile Data Warehouse-ді модельдеу. Ханс Хултгрен. ISBN  978-0615723082.
  • Линстедт, Дэн (желтоқсан 2010). Сіздің деректер қоймаңызды супер зарядтаңыз. Дэн Линстедт. ISBN  978-0-9866757-1-3.
  • Томас С Хаммергрен; Алан Р.Симон (ақпан 2009). Думиндерге арналған мәліметтер қоймасы, 2-ші басылым. Джон Вили және ұлдары. ISBN  978-0-470-40747-9.
  • Рональд Дамхоф; Лидвайн ван Ас (25 тамыз, 2008). «Келесі ұрпақ EDW - шындықтың бірыңғай нұсқасы идеясынан бас тарту» (PDF). Деректер базасы журналы (МҚ / М). Array Publications B.V.
  • Линстедт, Дэн. «Data Vault Series 1 - Data Vault шолуы». Data Vault сериясы. Деректерді басқару жөніндегі ақпараттық бюллетень. Алынған 12 қыркүйек 2011.
  • Линстедт, Дэн. «Data Vault Series 2 - Data Vault компоненттері». Data Vault сериясы. Деректерді басқару жөніндегі ақпараттық бюллетень. Алынған 12 қыркүйек 2011.
  • Линстедт, Дэн. «Data Vault 3 сериясы - соңғы күндер және негізгі қосылыстар». Data Vault сериясы. Деректерді басқару жөніндегі ақпараттық бюллетень. Алынған 12 қыркүйек 2011.
  • Линстедт, Дэн. «Data Vault Series 4 - сілтеме кестелері». Data Vault сериясы. Деректерді басқару жөніндегі ақпараттық бюллетень. Алынған 12 қыркүйек 2011.
  • Линстедт, Дэн. «Data Vault Series 5 - жүктеу практикасы». Data Vault сериясы. Деректерді басқару жөніндегі ақпараттық бюллетень. Алынған 12 қыркүйек 2011.
  • Куненборг, Рональд. «Data Vault Rules v1.0.8 Cheat Sheet» (PDF). Деректерді сақтау ережелері. Grundsätzlich IT. Алынған 26 қыркүйек 2012. V1.0.8 ережелерін көрсететін парақ және v1.0.8 ережелері бойынша форумдардан қосымша түсініктеме.
  • Линстедт, Дэн. «V1.0.9 деректер қоймасын модельдеу сипаттамасы». Data Vault форумы. Дэн Линстедт. Алынған 26 қыркүйек 2012.
  • Линстедт, Дэн. «Data Vault жүктеу сипаттамасы v1.2». DanLinstedt.com. Дэн Линстедт. Алынған 2014-01-03.
  • Линстедт, Дэн. «#Datavault 2.0-ге қысқаша кіріспе». DanLinstedt.com. Дэн Линстедт. Алынған 2014-01-03.
  • Линстедт, Дэн. «Data Vault 2.0 жарияланды». DanLinstedt.com. Дэн Линстедт. Алынған 2014-01-03.
Голланд тіліндегі ақпарат көздері
  • Кетелаарс, М.В.А.М. (2005-11-25). «Datawarehouse-модельерлер Data Vault-пен кездесті». Деректер базасы журналы (МҚ / М). Array Publications B.V. (7): 36-40.
  • Верхаген, К .; Vrijkorte, B. (10.06.2008). «Relationeel және Data Vault». Деректер базасы журналы (МҚ / М). Array Publications B.V. (4): 6–9.

Сыртқы сілтемелер