Деректерді бейнелеу - Data mapping

Жылы есептеу және деректерді басқару, деректерді бейнелеу құру процесі болып табылады деректер элементі кескіндер екі нақты арасында деректер модельдері. Деректерді бейнелеу әртүрлі қадамдар үшін алғашқы қадам ретінде қолданылады деректерді біріктіру міндеттер, оның ішінде:[1]

  • Мәліметтерді трансформациялау немесе деректер медиациясы деректер көзі мен тағайындалған орын арасында
  • Бөлігі ретінде деректер байланыстарын анықтау деректер тегі талдау
  • Деректерді бүркемелеу бөлігі ретінде басқа пайдаланушы идентификаторында жасырылған әлеуметтік қауіпсіздік нөмірінің соңғы төрт саны сияқты жасырын құпия деректерді табу немесе идентификациялау жоба
  • Шоғырландыру бірнеше дерекқорларды бір дерекқорға біріктіру және жою үшін деректердің артық бағандарын анықтау

Мысалы, сатып алулар мен шот-фактураларды басқа компаниялармен жеткізгісі келетін және қабылдағысы келетін компания деректер картасын компанияның деректерінен стандартталғанға дейін карталар жасау үшін қолдануы мүмкін. ANSI ASC X12 сатып алу тапсырыстары мен шот-фактуралар сияқты элементтерге арналған хабарламалар.

Стандарттар

X12 стандарттары жалпы болып табылады Электрондық мәліметтер алмасу (EDI) мүмкіндік беретін стандарттар компания айырбастау деректер саласына қарамастан кез-келген басқа компаниямен. Стандарттарды X12 (ASC X12) аккредиттелген стандарттар комитеті қолдайды Американдық ұлттық стандарттар институты (ANSI) EDI стандарттарын белгілеу үшін аккредиттелген. X12 стандарттары жиі аталады ANSI ASC X12 стандарттар.

Болашақта негізделген құралдар семантикалық желі сияқты тілдер Ресурстың сипаттамасы (RDF), Веб-онтология тілі (OWL) және стандартталған метадеректер тізілімі деректерді бейнелеуді автоматты процесске айналдырады. Егер әрбір қосымша орындалса, бұл процесс жеделдетіледі метамәліметтерді жариялау. Толық автоматтандырылған деректерді картографиялау өте қиын мәселе болып табылады (қараңыз) мағыналық аударма ).

Қолмен кодталған, графикалық нұсқаулық

Мәліметтерді салыстыруды процедуралық кодты қолдану арқылы әр түрлі тәсілдермен жасауға болады XSLT түрлендіреді немесе автоматты түрде орындалатын түрлендіру бағдарламаларын жасайтын графикалық бейнелеу құралдарын қолданады. Бұл қолданушыға мәліметтер жиынтығындағы өрістерден екіншісіндегі өрістерге сызықтар «салуға» мүмкіндік беретін графикалық құралдар. Деректерді бейнелеудің кейбір графикалық құралдары пайдаланушыларға дерек көзі мен баратын жерді «автоматты түрде қосуға» мүмкіндік береді. Бұл функция көзі мен тағайындалған орнына байланысты деректер элементінің атауы бірдей болу. Трансформациялық бағдарламалар автоматты түрде SQL, XSLT, Java бағдарламалау тілі, немесе C ++. Мұндай графикалық құралдар көбіне кездеседі ETL (шығарып алу, түрлендіру және жүктеу) құралдары мәліметтер қозғалысын қолдау үшін мәліметтер карталарын енгізудің негізгі құралы ретінде. Мысалдарға SAP BODS және Informatica PowerCenter кіреді.

Деректерге негізделген картаға түсіру

Бұл деректерді бейнелеудің ең жаңа тәсілі және екі деректер жиынтығының арасындағы күрделі кескіндерді автоматты түрде табу үшін эвристика мен статистиканы қолдана отырып, екі дерек көзіндегі деректердің нақты мәндерін бір уақытта бағалауды қамтиды. Бұл тәсіл екі деректер жиынтығы арасындағы түрлендірулерді табуға, ішкі тізбектерді, тізбектерді, арифметикалық, кейстер тұжырымдары, сондай-ақ түрлендірудің басқа логикасы. Бұл тәсіл табылған түрлендіру логикасына сәйкес келмейтін деректердің ерекшеліктерін анықтайды.

Семантикалық картаға түсіру

Семантикалық картаға түсіру а. қоспағанда, деректер карталарын автоматты түрде қосу мүмкіндігіне ұқсас метадеректер тізілімі деректер элементтерінің синонимдерін іздеу үшін кеңес алуға болады. Мысалы, егер бастапқы жүйе тізімде болса Аты бірақ тағайындалған тізім PersonGivenName, егер деректер элементтері тізімге енгізілсе, кескіндер жасалады синонимдер метамәліметтер тізілімінде. Семантикалық карта деректердің бағандары арасындағы нақты сәйкестікті ғана анықтай алады және ешқандай өзгеру логикасын немесе бағандар арасындағы ерекшеліктерді анықтамайды.

Деректер тегі - бұл әрбір деректердің өмірлік циклінің, оны талдау жүйесінде қабылдауға, өңдеуге және шығаруға байланысты. Бұл аналитикалық құбырға көрінуді қамтамасыз етеді және қателіктерді олардың көздерінен іздеуді жеңілдетеді. Ол сондай-ақ нақты ақауларды түзетуге немесе жоғалған шығынды қалпына келтіруге арналған мәліметтер ағынының белгілі бір бөліктерін немесе кірістерін қайта ойнатуға мүмкіндік береді. Шын мәнінде, деректер базасы жүйелері дәлелдеуге және түзетуді шешуге арналған қиындықтарды шешу үшін деректерді тексеру деп аталатын осындай ақпаратты қолданды.[2]

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ Шахбаз, Q. (2015). Деректер қоймасын жобалау үшін деректерді бейнелеу. Elsevier. б. 180. ISBN  9780128053355. Алынған 29 мамыр 2018.
  2. ^ Де, Сумярупа. (2012). Ньют: DISC жүйелерінде линейкалар негізінде қайта ойнатуға және түзетуге арналған архитектура. Сан-Диего UC: b7355202. Алынған: https://escholarship.org/uc/item/3170p7zn

Сыртқы сілтемелер