Алгебралық мәліметтер типі - Algebraic data type

Жылы компьютерлік бағдарламалау, әсіресе функционалды бағдарламалау және тип теориясы, an мәліметтердің алгебралық түрі түрі болып табылады құрама түрі, яғни басқа типтерді біріктіру арқылы қалыптасқан тип.

Алгебралық типтердің екі жалпы сыныбы өнім түрлері (яғни, кортеждер және жазбалар ) және қосынды түрлері (яғни, тегтелген немесе одақтарды бөлу, қосымша өнім түрлері немесе вариант түрлері).[1]

The құндылықтар өнім типінде әдетте бірнеше мәндер болады, олар деп аталады өрістер. Бұл типтің барлық мәндері өріс типтерінің бірдей тіркесіміне ие. Өнім түрінің барлық мүмкін мәндерінің жиынтығы теориялық өнім болып табылады, яғни Декарттық өнім, оның өріс типтерінің барлық мүмкін мәндерінің жиынтығы.

Қосынды түрінің мәндері, әдетте, бірнеше кластарға топтастырылады нұсқалары. Нұсқа түрінің мәні, әдетте, а деп аталатын квази-функционалды құрылыммен жасалады конструктор. Әрбір вариантта көрсетілген типтермен аргументтердің белгіленген санын қабылдайтын өзінің конструкторы болады. Қосынды түрінің барлық мүмкін мәндерінің жиыны жиынтық-теориялық қосынды болып табылады, яғни бірлескен одақ, оның нұсқаларының барлық мүмкін мәндерінің жиынтығы. Санамаланған түрлері қосынды типтерінің ерекше жағдайы, онда конструкторлар ешқандай дәлел келтірмейді, өйткені әрбір конструктор үшін дәл бір мән анықталады.

Алгебралық типтердің мәні талданады үлгілерді сәйкестендіру, ол мәнді конструкторы немесе өріс атаулары бойынша анықтайды және құрамындағы деректерді шығарады.

Мәліметтердің алгебралық типтері енгізілді Үміт, кішкентай функционалды бағдарламалау тілі 1970 жылдары дамыған Эдинбург университеті.[2]

Мысалдар

Мәліметтердің алгебралық типіне ең көп таралған мысалдардың бірі - жеке байланысқан тізім. Тізім түрі - бұл екі варианты бар қосынды түрі, Жоқ бос тізім үшін және Минус х xs жаңа элементтің тіркесімі үшін х тізімімен xs жаңа тізімді жасау. Мұнда жеке байланыстырылған тізімнің қалай жарияланатыны туралы мысал келтірілген Хаскелл:

деректер Тізім а = Жоқ | Минус а (Тізім а)

Минус деген аббревиатура болып табылады минуструкт. Көптеген тілдерде осылайша анықталған тізімдерге арналған арнайы синтаксис бар. Мысалы, Хаскелл және ML пайдалану [] үшін Жоқ, : немесе :: үшін Минуссәйкесінше және бүкіл тізімдерге арналған тік жақшалар. Сонымен Минус 1 (Минус 2 (Минус 3 Нил)) әдетте ретінде жазылады 1:2:3:[] немесе [1,2,3] Хаскеллде немесе сол сияқты 1::2::3::[] немесе [1;2;3] ML-де.

Біршама күрделі мысал үшін екілік ағаштар келесі түрде Хаскеллде жүзеге асырылуы мүмкін:

деректер Ағаш = Бос          | Жапырақ Int          | Түйін Ағаш Ағаш

Мұнда, Бос бос ағашты білдіреді, Жапырақ деректер бөлігін қамтиды және Түйін деректерді филиалдарға жүйелейді.

Мәліметтердің алгебралық түрлерін қолдайтын көптеген тілдерде анықтауға болады параметрлік түрлері. Мысалдар осы мақалада кейінірек келтірілген.

Функцияға біршама ұқсас деректер конструкторы тиісті типтегі аргументтерге қолданылады, тип конструкторы жататын деректер типінің данасын береді. Мысалы, мәліметтер конструкторы Жапырақ логикалық тұрғыдан функция болып табылады Int -> ағаш, бұл аргумент ретінде бүтін санды беру дегенді білдіреді Жапырақ типтің мәнін шығарады Ағаш. Қалай Түйін типтің екі аргументін алады Ағаш өзі, деректер типі рекурсивті.

Мәліметтердің алгебралық типтеріндегі операцияларды қолдану арқылы анықтауға болады үлгілерді сәйкестендіру дәлелдерді алу үшін. Мысалы, а тереңдігін табу функциясын қарастырайық Ағаш, Хаскеллде келтірілген:

 тереңдік :: Ағаш -> Int тереңдік Бос = 0 тереңдік (Жапырақ n) = 1 тереңдік (Түйін л р) = 1 + макс (тереңдік л) (тереңдік р)

Осылайша, а Ағаш берілген тереңдік кез келгенін пайдаланып құрастыруға болады Бос, Жапырақ, немесе Түйін және барлық жағдайларды қарау үшін олардың кез-келгеніне сәйкес келуі керек. Жағдайда Түйін, үлгі кіші ағаштарды шығарады л және р әрі қарай өңдеу үшін.

Мәліметтердің алгебралық типтері іске асыруға өте қолайлы дерексіз синтаксис. Мысалы, мәліметтердің келесі алгебралық типі сандық өрнектерді білдіретін қарапайым тілді сипаттайды:

деректер Өрнек = Нөмір Int                | Қосу Өрнек Өрнек                | Минус Өрнек Өрнек                | Mult Өрнек Өрнек                | Бөлу Өрнек Өрнек

Мұндай деректер түрінің элементі сияқты формаға ие болады Mult (Қосу (4 саны) (Минус (0 саны) (1 саны))) (2 саны).

Бұл тіл үшін бағалау функциясын жазу қарапайым жаттығу; дегенмен, күрделі түрлендірулер де мүмкін болады. Мысалы, компилятордағы оңтайландыру парағы абстрактілі өрнекті кіріс ретінде қабылдап, оңтайландырылған форманы қайтаратын функция ретінде жазылуы мүмкін.

Түсіндіру

Болып жатқан нәрсе болуы мүмкін, ол болуы мүмкін заттардың бірнеше түрінің бірі. Әрқайсысы заттың түрі а деп аталатын идентификатормен байланысты конструктор, оны деректер түрінің бір түрі ретінде қарастыруға болады. Әрбір конструктор өзімен бірге әртүрлі типтегі мәліметтерді алып жүре алады. Конструктор деректерді (мысалы, жоғарыдағы мысалдағы «Бос») немесе бір мәліметтерді (мысалы, «Жапырақ» бір Int мәніне ие) немесе бірнеше деректерді (мысалы, «Түйінде» екі ағаш мәні бар) алып жүре алмады. ).

Осы ағаштың алгебралық типтегі мәнімен бірдеңе істеу керек бұзылған деп аталатын процесті қолдану үлгілерді сәйкестендіру. Ол қамтиды сәйкестендіру тізбегі бар деректер өрнектер. Жоғарыда келтірілген «тереңдік» функциясы оның дәлелін үш өрнекпен сәйкестендіреді. Функция шақырылған кезде, оның аргументіне сәйкес келетін бірінші үлгіні табады, өрнекте кездесетін кез-келген айнымалы байланыстарды орындайды және өрнекке сәйкес өрнекті бағалайды.

Жоғарыда келтірілген әр үлгіде осы типтің кейбір мүмкін мәндерінің құрылымына ұқсас формасы бар. Бірінші өрнек конструктордың мәндеріне сәйкес келеді Бос. Екінші өрнек конструктордың мәндеріне сәйкес келеді Жапырақ. Өрнектер рекурсивті болып табылады, сондықтан сол конструктормен байланысты мәліметтер «n» өрнегімен сәйкес келеді. Бұл жағдайда кіші әріп идентификаторы кез-келген мәнге сәйкес келетін үлгіні білдіреді, содан кейін сол аттың айнымалысына байланысты болады - бұл жағдайда айнымалы “n”Деректер типінде сақталған бүтін мәнмен байланысты - бағалау үшін өрнекте қолдану үшін.

Бұл мысалдағы үлгілердегі рекурсия ұсақ-түйек болып табылады, бірақ ықтимал күрделі рекурсивті үлгі ұқсас болуы мүмкін Түйін (Түйін (Жапырақ 4) х) (Түйін ж (Түйін Бос з)). Мысалы, теңдестіру кезінде бірнеше қабаттардан тұратын рекурсивті өрнектер қолданылады қызыл-қара ағаштар Бұл түстерге бірнеше қабатты терең қарауды қажет ететін жағдайларды қамтиды.

Жоғарыда келтірілген мысал операциялық жағынан келесі псевдокодқа тең:

 қосқыш қосулы (деректер.конструктор)   іс Бос:     қайту 0   іс Жапырақ:     рұқсат етіңіз л = деректер.өріс1     қайту 1   іс Түйін:     рұқсат етіңіз л = деректер.өріс1     рұқсат етіңіз р = деректер.өріс2     қайту 1 + макс (тереңдік л) (тереңдік р)

Мұны үлгіні сәйкестендірумен салыстыру алгебралық мәліметтер типтері мен үлгілерді сәйкестендірудің кейбір артықшылықтарын көрсетеді. Бірінші артықшылығы қауіпсіздік түрі. Жоғарыдағы псевдокод қол жеткізбеу үшін бағдарламашының ыждағаттылығына сүйенеді өріс2 мысалы, конструктор жапырақ болған кезде. Сондай-ақ, түрі өріс1 жапырақ пен түйін үшін әр түрлі (жапырақ үшін ол Int; бұл түйін үшін Ағаш), сондықтан типтік жүйеге оған статикалық типті қауіпсіз түрде дәстүрлі түрде беруде қиындықтар туындауы мүмкін жазба мәліметтер құрылымы. Алайда, шаблондарды сәйкестендіруде әрбір шығарылған мәннің типі тиісті конструктор жариялаған типтерге сүйене отырып тексеріледі және қанша мән шығаруға болатыны конструктор негізінде белгілі, сондықтан ол бұл проблемаларға тап болмайды.

Екіншіден, шаблондарды сәйкестендіруде компилятор барлық жағдайлардың өңделуін статикалық түрде тексереді. Егер жағдайлардың бірі тереңдік Жоғарыда көрсетілген функция жоқ болса, компилятор ескертулер жіберіп, істің қаралмайтынын көрсетеді. Бұл тапсырма жоғарыдағы қарапайым өрнектер үшін оңай болып көрінуі мүмкін, бірақ көптеген күрделі рекурсивті заңдылықтармен қатар, бұл тапсырма қарапайым адам үшін (немесе егер ол ерікті түрде салынған, егер басқа құрылымдарды тексеруі керек болса, құрастырушы) қиынға соғады. Дәл сол сияқты, ешқашан сәйкес келмейтін үлгілер болуы мүмкін (яғни, олар алдыңғы үлгілермен қамтылған), сонымен бірге компилятор тексеріп, ескерту жасай алады, өйткені олар ойлаудың қателігін көрсетуі мүмкін.

Бұл үлгілерді шатастырмаңыз тұрақты өрнек жолдардың өрнектерін сәйкестендіруде қолданылатын өрнектер. Мақсаты ұқсас: мәліметтер бөлігінің белгілі бір шектеулерге сәйкестігін тексеру, егер солай болса, оның тиісті бөліктерін өңдеу үшін бөліп алу. Алайда, механизм мүлдем өзгеше. Мәліметтердің алгебралық типтеріндегі сәйкестіктің бұл түрі жолдардың таңбалар тізбегіне емес, құрылымның қасиеттеріне сәйкес келеді.

Теория

Мәліметтердің жалпы алгебралық типі мүмкін рекурсивті қосынды түрі туралы өнім түрлері. Әрбір конструктор өнім түрін басқалардан бөліп алу үшін белгілейді немесе егер бір ғана конструктор болса, мәліметтер типі өнім типі болып табылады. Әрі қарай, конструктордың параметр түрлері өнім түрінің факторлары болып табылады. Параметрсіз конструктор сәйкес келеді бос өнім. Егер деректер типі рекурсивті болса, онда өнімнің барлық сомасы а-ға оралады рекурсивті тип, және әрбір конструктор сонымен бірге деректер түрін рекурсивті типке айналдырады.

Мысалы, Haskell деректер типі:

 деректер Тізім а = Жоқ | Минус а (Тізім а)

ұсынылған тип теориясы сияқтыконструкторлармен және .

Haskell List типінің типі тип теориясында сәл өзгеше түрде ұсынылуы мүмкін, осылайша:. (Қалай екенін ескеріңіз және конструкциялар түпнұсқаға қатысты өзгертілген.) Бастапқы формация денесі рекурсивті тип болған типтік функцияны көрсетті. Қайта қаралған нұсқа типтер бойынша рекурсивті функцияны анықтайды. (Типтік айнымалы а-дан гөрі функцияны ұсыну үшін қолданылады базалық тип сияқты , бері грек сияқты f.) Функцияны енді қолдану керек оның аргумент түріне типті денеде.

Тізім мысалында осы екі тұжырымдама айтарлықтай ерекшеленбейді; бірақ екінші форма деп аталатынды білдіруге мүмкіндік береді кірістірілген деректер түрлері, яғни рекурсивті типтің түпнұсқадан параметрлік айырмашылығы барлар. (Кірістірілген деректер түрлері туралы көбірек ақпарат алу үшін, шығармаларын қараңыз) Ричард Берд, Ламберт Мертенс және Росс Патерсон.)

Жылы жиынтық теориясы қосынды түрінің баламасы - а бірлескен одақ, элементтері тегтерден тұратын (конструкторға балама) және тегке сәйкес типтегі объектілерден тұратын жұптар жиынтығы (конструктор аргументтеріне балама).

Мәліметтердің алгебралық типтерімен программалау

Көптеген бағдарламалау тілдері мәліметтердің алгебралық типтерін бірінші класс ұғымы ретінде біріктіреді, оларға:

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ Жазбалар мен нұсқалар - OCaml нұсқаулығы 1.4 Мұрағатталды 2020-04-28 Wayback Machine
  2. ^ Пол Худак; Джон Хьюз; Саймон Пейтон Джонс; Филипп Уэдлер. «Хаскелл тарихы: сыныппен жалқау болу». Бағдарламалау тілдерінің тарихы бойынша үшінші ACM SIGPLAN конференциясының материалдары. Презентацияларға Rod Burstall, Dave MacQueen және Don Sannella on Hope, алгебралық деректер түрлерін енгізген тіл кірді
  3. ^ Индуктивті құрылымдардың есебі және негізгі стандартты кітапханалар: Деректер типтері және Логика.
  4. ^ «CppCon 2016: Бен Дин» түрлерін тиімді пайдалану"" - www.youtube.com арқылы.
  5. ^ «Enum Instance». Haxe - кросс-платформалар құралы.
  6. ^ «JEP 360: жабық сыныптар (алдын ала қарау)». OpenJDK.
  7. ^ «Жабық сыныптар - бағдарламалау тілі Котлин». Котлин.
  8. ^ «Себеп · Себеп сізге JavaScript және OCaml экожүйелерін пайдалану кезінде қарапайым, жылдам және сапалы типтегі қауіпсіз код жазуға мүмкіндік береді». reasonml.github.io.

Бұл мақала алынған материалға негізделген мәліметтердің алгебралық түрі кезінде Есептеу техникасының ақысыз онлайн сөздігі 2008 жылдың 1 қарашасына дейін және «қайта қарау» шарттарына сәйкес енгізілген GFDL, 1.3 немесе одан кейінгі нұсқасы.