Корреляциялық мәліметтер базасы - Correlation database

A корреляциялық мәліметтер базасы Бұл мәліметтер базасын басқару жүйесі (ДҚБЖ), бұл деректер модельдеріне тәуелді емес және жоспарланбаған тиімді басқаруға арналған, осы жағдай үшін аналитикалық жүйелік ортадағы сұраулар.

Қатарға бағытталғаннан айырмашылығы мәліметтер қорын реляциялық басқару жүйелері, жазбаларға негізделген сақтау тәсілін қолданатын немесе бағанға негізделген дерекқорлар бағанға негізделген сақтау әдісін қолданатын корреляциялық мәліметтер қоры мәнге негізделген сақтау архитектурасын қолданады, мұнда әрбір бірегей деректер мәні бір рет қана сақталады және автоматты түрде жасалатын индекстеу жүйесі барлық мәндер үшін мәтінмәнді қолдайды.[1]

Құрылым

Корреляциялық ДҚБЖ деректердің әрбір бірегей мәнін бір рет қана сақтайтындықтан, мәліметтер базасының физикалық мөлшері реляциялық немесе бағанға негізделген дерекқорларға қарағанда айтарлықтай аз, деректерді қысу техникасы. 30 ГБ-тан жоғары ДББ-нің корреляциясы бастапқы деректер жиынтығынан аз болуы мүмкін.[дәйексөз қажет ]

CDBMS пайдаланатын VBS моделі сақталатын және басқарылатын объектілердің үш негізгі физикалық жиынтығынан тұрады:

  • а мәліметтер сөздігі (метадеректер );
  • деректер жиынтығын индекстеу және байланыстыру (қосымша метадеректер); және
  • сақталған ақпаратты құрайтын нақты деректер мәндері.

VBS моделінде бастапқы мәліметтердегі әрбір ерекше мән бір рет қана сақталады; сондықтан деректер әрқашан қалыпқа келтірілген бірегей құндылықтар деңгейінде.[2] Бұл логикалық схемадағы мәліметтер жиынтығын қалыпқа келтіру қажеттілігін жояды.

Деректер мәндері мәліметтер типтеріне негізделген реттелген жиынтықтарда бірге сақталады: барлық жиынтықтар бір жиынтықта, символдар басқаларында, т.б. Бұл мәндерге қол жеткізетін деректермен жұмыс істеу процестерін оңтайландырады.

Деректер қорының типтік мәндерінен басқа кестелер арасындағы қатынастарды сақтауға арналған мәліметтер типі де бар. Бұл ұқсас функциялар шетелдік кілттер RDBMS құрылымдарында, бірақ CDBMS-пен байланыс сөздікпен белгілі және деректер арасында сақталады, кестелер арасында навигацияны толығымен автоматты етеді.

Мәліметтер сөздігінде типтік метадеректер және кестелер, бағандар мен мәндердің пайда болуы туралы қосымша статистикалық мәліметтер бар логикалық схема. Сонымен қатар, логикалық кестелер арасындағы байланыстар туралы ақпарат сақталады. Көрсеткіш пен байланыстырушы қоймаға мәліметтер қоймасындағы реттелген мәндерден жазбаның мазмұнын табуға қолданылатын барлық деректер кіреді.

Бірақ жоқ Жедел Жадтау Құрылғысы CDBMS-ге негізделген сақтау жүйесі, сияқты жедел жадты пайдалануға арналған операциялық жүйе қамтамасыз ете алады. Үлкен дерекқорлар үшін қосымша жедел жад өнімділігін жақсартады. Әдетте, 4 Гбайт жедел жад шамамен 100 миллион жазбаға дейін оңтайландырылған қол жетімділікті қамтамасыз етеді. 8 Гбайт жедел жады осыдан 10 есе үлкен мәліметтер базасына сәйкес келеді.[3] Деректер базасы өскен сайын тұтынылатын жедел жады азаятындықтан, 16 Гбайт жедел жад шамамен 20 миллиардқа дейінгі жазбалардан тұратын дерекқорларды қолдайды.

ДҚБЖ сақтау құрылымдарын салыстыру

Төменде көрсетілген жазбалар реляциялық, бағанға бағытталған және корреляциялық мәліметтер базасында қолданылатын сақтау құрылымдарындағы физикалық айырмашылықтарды көрсетеді.

Күдікті куәлікАты-жөніҚалаМемлекет
12222ABC CorpМиннеаполисMN
19434A1 MfgДулутMN
20523J&J IncӘулие ПавелMN

RDBMS-те сақтау

RDBMS-те қолданылатын жазбаларға негізделген құрылым элементтерді бір қатарға іргелес қатарда сақтайды. Ұқсас вариациялар кластерлік индекстеу жолдар ретін өзгерте алады, бірақ барлық жолдар, бағандар мен мәндер кестеде көрсетілгендей сақталады. Жоғарыдағы кесте келесідей сақталуы мүмкін:

      12222, ABC Corp, Миннеаполис, MN; 19434, A1 Mfg, Дулут, MN; 20523, J & J Inc, St. Пол, МН

Бағанға негізделген мәліметтер базасында сақтау

Бағанға негізделген құрылымда бір бағанның элементтері бір-біріне іргелес жерде сақталады. Бір баған ішіндегі дәйекті көшірмелер автоматты түрде жойылуы немесе тиімді түрде қысылуы мүмкін.

      12222,19434,20523; ABC Corp, A1 Mfg, J & J Inc; Миннеаполис, Дулут, Сент-Пол; MN, MN, MN

CDBMS-те сақтау

CDBMS-те қолданылатын VBS құрылымында әрбір ерекше мән бір рет сақталады және деректердің бастапқы жиынтығындағы пайда болу немесе орналасу санына қарамастан дерексіз (сандық) идентификатор беріледі. Содан кейін бастапқы деректер жиынтығы сол логикалық идентификаторларға сілтеме жасау арқылы жасалады. Корреляция индексі төмендегі қоймаға ұқсас болуы мүмкін. Жоғарыда келтірілген мәліметтерде бірнеше рет кездесетін «MN» мәні тек бір рет енгізілгенін ескеріңіз. Қайталанатын мәліметтер саны өскен сайын, бұл пайда көбейеді.

      1: 12222,2: 19434,3: 20523,4: ABC Corp, 5: A1 Mfg, 6: J&J Inc, 7: Миннеаполис, 8: Дулут, 9: Сент-Пол, 10: MN

Жоғарыдағы мысал кестеміздегі жазбалар келесі түрде көрсетілуі мүмкін:

      11:[1,4,7,10],12:[2,5,8,10],13:[3,6,9,10]

Бұл корреляциялық процесс формасы болып табылады мәліметтер базасын қалыпқа келтіру. RDBMS ішінде бағанға негізделген сақтаудың кейбір артықшылықтарына қол жеткізуге болатыны сияқты, мәліметтер базасын қалыпқа келтіру арқылы корреляциялық мәліметтер базасының кейбір артықшылықтарына қол жеткізуге болады. Дәстүрлі RDBMS-те бұл қалыпқа келтіру процесі кесте конфигурациясы, сақталған процедуралар және SQL операторлары түрінде жұмыс істеуді қажет етеді. Бұл қосымша конфигурациясыз толықтай қалыпқа келтірілген схеманы табиғи түрде білдірген кезде мәліметтер қоры корреляциялық мәліметтер қоры деп айтамыз. Нәтижесінде корреляциялық мәліметтер базасында осы толықтай қалыпқа келтірілген құрылымға бағытталған оңтайландырулар болуы мүмкін.

Бұл корреляция процесі мәтіндік іздеуге бағытталғанға ұқсас Төңкерілген индекс.

Артылықшылықтар мен кемшіліктер

Аналитикалық үшін мәліметтер қоймасы қосымшалар, CDBMS баламалы мәліметтер қорының құрылымдарынан бірнеше артықшылықтарға ие. Біріншіден, мәліметтер базасының қозғалтқышы өзі барлық деректерді индекстейтіндіктен және жүктеу кезінде жылдамдықта өзінің схемасын автоматты түрде жасайды, оны тез іске асыруға болады және жаңартуға оңай. Физикалық алдын-ала жобалаудың қажеті жоқ және дерекқорды ешқашан қайта құрудың қажеті жоқ. Екіншіден, CDBMS ассоциативті сұраулар сияқты күрделі сұраныстарды құруға және орындауға мүмкіндік береді («байланысты барлық нәрсені көрсету» х«) модельдеу қиын, мүмкін емес SQL. CDBMS-тің басты артықшылығы - бұл уақытша сұраныстарды - мәліметтер қоймасын жобалау кезеңінде күтілмеген сұраныстарды орындау үшін оңтайландырылған.[4]

CDBMS мәліметтер базасының баламаларына қарағанда екі кемшіліктерге ие. Әр түрлі қосымшаларда қолдануға болатын реляциялық мәліметтер базасынан айырмашылығы, корреляциялық мәліметтер қоры аналитикалық қосымшалар үшін арнайы жасалған және транзакцияны басқару мүмкіндіктерін бермейді; оны пайдалану мүмкін емес транзакциялық өңдеу. Екіншіден, ол жүктеу процесі кезінде барлық деректерді индекстейтін болғандықтан, CDBMS жүктемесінің физикалық жылдамдығы реляциялық немесе бағанға бағытталған құрылымдарға қарағанда баяу болады. Алайда, бұл логикалық немесе физикалық алдын-ала жобалау қажеттілігін болдырмайтындықтан, CDBMS-тің жалпы «пайдалану уақыты» әдетте альтернативті құрылымдарға ұқсас немесе біршама жылдамырақ.

Әдебиеттер тізімі

  1. ^ Рааб, Дэвид М.«Деректер қорының аналитикалық параметрлері». Ақпаратты басқару журналы 1 шілде 2008 ж.
  2. ^ Раден, Нил.«Деректер базасы ТІРІ». Интеллектуалды кәсіпорын 18 сәуір 2008 ж.
  3. ^ Пауэлл, Джеймс Э.«Illuminate корреляциясының мәліметтер базасы жеделдетеді, BI сұраныстарын кеңейтеді». Enterprise Systems журналы 9 сәуір 2008 ж.
  4. ^ Свойер, Стивен.«Тереңдігі: Ad-Horg сұранысының өнімділіктің жақсылыққа деген айырмашылығын жабу». Enterprise Systems журналы 9 шілде 2008 ж.