Ламбда сәулеті - Lambda architecture

Жалпы лямбда сәулетінің өңдеу және қызмет ету қабаттары арқылы мәліметтер ағымы

Ламбда сәулеті Бұл деректерді өңдеу екі архитектураны пайдалану арқылы үлкен көлемдегі деректерді өңдеуге арналған сәулет партия және ағынды өңдеу әдістер. Сәулет өнеріне бұл тәсіл тепе-теңдікті сақтауға тырысады кешігу, өткізу қабілеті, және ақаулыққа төзімділік пакеттік өңдеуді пайдалану арқылы пакеттік деректердің жан-жақты және нақты көрінісін қамтамасыз ету үшін, сонымен бірге желідегі деректердің көрінісін қамтамасыз ету үшін бір уақытта нақты уақыттағы ағындық өңдеуді қолдану. Екі көріністің нәтижелерін презентация алдында біріктіруге болады. Лямбда архитектурасының өсуі өсумен байланысты үлкен деректер, нақты уақыттағы аналитика және кідірісті азайтуға арналған драйв карта-кішірейту.[1]

Lambda архитектурасы жазба жүйесі ретінде қызмет ететін, тек қана қосымша, өзгермейтін деректер көзі бар деректер моделіне байланысты.[2]:32 Ол бар оқиғаларға жазудың орнына, бар оқиғаларға қосылатын уақыт белгілері бар оқиғаларды қабылдауға және өңдеуге арналған. Күй деректердің уақыт бойынша табиғи реттелуінен анықталады.

Шолу

Lambda архитектурасы үш қабаттан тұратын жүйені сипаттайды: пакеттік өңдеу, жылдамдық (немесе нақты уақыт режимінде) өңдеу және сұраныстарға жауап беруге арналған қызмет қабаты.[3]:13 Өңдеу қабаттары бүкіл деректер жиынтығының өзгермейтін негізгі көшірмесінен алады. Бұл парадигманы алғаш рет Натан Марц блогта «CAP теоремасын қалай жеңу керек» деп жазды, онда ол бастапқыда «партия / нақты уақыт сәулеті» деп атады.[4]

Бума қабаты

Бума қабаты өте үлкен көлемдегі деректерді өңдей алатын үлестірілген өңдеу жүйесін қолданып нәтижелерді алдын-ала есептейді. Бума қабаты өңдеуге мүмкіндігі бар тамаша дәлдікке бағытталған барлық көріністер құру кезінде қол жетімді деректер. Бұл дегеніміз, ол барлық деректер жиынтығы негізінде қайта есептеу, содан кейін бар көріністерді жаңарту арқылы кез-келген қателерді түзете алады. Шығару әдетте тек оқуға арналған мәліметтер қорында сақталады, жаңартулар бар алдын ала есептелген көріністерді толығымен ауыстырады.[3]:18

Apache Hadoop - бұл өнімділігі жоғары архитектураның көпшілігінде қолданылатын жетекші пакеттік өңдеу жүйесі.[5] Ұқсас параллельді, серпімді, реляциялық жаңа мәліметтер қоры Снежинка Сондай-ақ, бұл рөлде Redshift, Synapse және Big Query қолданылады.

Жылдамдық қабаты

Ламбда сәулетінің өңдеу және қызмет ету қабаттары арқылы мәліметтер ағынын көрсететін диаграмма. Мысал аталған компоненттер көрсетілген.

Жылдамдық деңгейі деректер ағындарын нақты уақыт режимінде және түзетулер мен толықтық талаптарынсыз өңдейді. Бұл қабат өнімділікті құрбан етеді, өйткені ол соңғы уақыттағы деректерге нақты уақыт режимінде қарау арқылы кешіктіруді азайтуға бағытталған. Шын мәнінде, жылдамдық деңгейі соңғы мәліметтерге негізделген көріністерді ұсынуда пакеттік қабаттың артта қалуынан туындаған «саңылауды» толтыруға жауап береді. Бұл қабаттың көріністері түпнұсқалық қабат шығарған көзқарастар сияқты дәл немесе толық болмауы мүмкін, бірақ олар мәліметтер алынғаннан кейін дереу қол жетімді болады және сол мәліметтерге пакеттік деңгей көріністері қол жетімді болған кезде оларды ауыстыруға болады.[3]:203

Әдетте осы қабатта қолданылатын ағынды өңдеу технологиялары жатады Apache дауылы, SQLstream, Apache Spark, Azure Stream Analytics және Azure Cosmos DB. Шығару әдетте жылдам NoSQL мәліметтер базасында сақталады.[6][7]

Қызмет ету қабаты

Druid деректер қоймасы бар лямбда архитектурасын көрсететін диаграмма.

Бумалық және жылдамдықты қабаттардан шыққан өнім қызмет етуші қабатта сақталады, олар алдын-ала есептелген көріністерді қайтару немесе өңделген мәліметтерден көріністер құру арқылы уақытша сұраныстарға жауап береді.

Сервистік қабатта қолданылатын технологиялардың мысалдары жатады Друид, бұл екі қабаттан шығуды өңдеу үшін бір кластерді ұсынады.[8] Қызмет көрсететін қабатта қолданылатын арнайы дүкендерге кіреді Apache Cassandra, Apache HBase, Azure Cosmos DB, MongoDB, VoltDB немесе Эластикалық іздеу жылдамдықты қабат үшін және Elephant DB, Apache Impala, SAP HANA немесе Apache Hive пакеттік қабатты шығару үшін.[2]:45[6]

Оңтайландыру

Деректер жиынтығын оңтайландыру және сұраныстың тиімділігін арттыру үшін шикі деректерге жинақтау мен жинақтаудың әртүрлі әдістері енгізілген,[8]:23 есептеу шығындарын одан әрі төмендету үшін бағалау әдістері қолданылады.[9] Ақаулыққа төзімділік үшін қымбат толық есептеу қажет болғанымен, тиімділікті жоғарылату үшін есептеудің алгоритмдерін таңдамалы түрде қосуға болады, мысалы, әдістер ішінара есептеу және ресурстарды пайдалануды оңтайландыру күту уақытын төмендетуге тиімді көмектеседі.[3]:93,287,293

Ламбда сәулеті қолданыста

Бағдарламалық жарнамалық кеңістіктегі компанияларға аналитика ұсынатын Metamarkets лямбда архитектурасының нұсқасын қолданады Друид ағынды және пакеттік өңделген деректерді сақтауға және қызмет етуге арналған.[8]:42

Жарнамалық мәліметтер қоймасында талдау жүргізу үшін, Yahoo қолдана отырып, ұқсас тәсілді қабылдады Apache дауылы, Apache Hadoop, және Друид.[10]:9,16

The Netflix Suro жобасында мәліметтер үшін бөлек өңдеу жолдары бар, бірақ лямбда архитектурасын қатаң сақтамайды, өйткені жолдар әр түрлі мақсаттарға қызмет етуі және көріністердің бірдей түрін қамтамасыз етпеуі мүмкін.[11] Дегенмен, жалпы идея нақты уақыт режимінде таңдалған оқиғалар туралы деректерді өте аз кешігу кезінде сұрауларға қол жетімді ету болып табылады, ал бүкіл деректер жиынтығы пакеттік құбыр арқылы өңделеді. Соңғысы кешігу сезімталдығы төмен және өңдеудің картадан кішірейтілген түрін қажет ететін қосымшаларға арналған.

Сын

Ламбда архитектурасының сыны оның күрделілігіне және оның шектеулі әсеріне бағытталған. Бума мен ағынды жақтардың әрқайсысы әр түрлі кодтық базаны қажет етеді, оларды сақтау және синхрондау қажет, осылайша өңделген мәліметтер екі жолдан бірдей нәтиже береді. Код негіздерін бір негізге салуға тырысу пакеттегі және нақты уақыттағы экожүйелердегі көптеген мамандандырылған құралдарды қол жетімсіз етіп қояды.[12]

Таза ағындық тәсілді қолданудың артықшылықтары туралы техникалық талқылауда, мысалы, икемді ағындық құрылымды пайдалану туралы айтылды Apache Samza кешіктірусіз пакеттік өңдеумен бірдей артықшылықтар бере алады.[13] Мұндай ағындық негіз деректердің ерікті үлкен терезелерін жинауға және өңдеуге, бұғаттауға және күйді басқаруға мүмкіндік береді.

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ Шустер, Вернер. «Натан Марц дауыл туралы, Ламбда архитектурасындағы өзгермейтіндік, Клоуре». www.infoq.com. Натан Марцпен сұхбат, 6 сәуір, 2014 ж
  2. ^ а б Бийненс, Натан. «Hadoop және Storm қолданатын нақты уақыттағы архитектура». 11 желтоқсан 2013.
  3. ^ а б c г. Марц, Натан; Уоррен, Джеймс. Үлкен деректер: нақты уақыт режиміндегі масштабталатын жүйелер принциптері мен озық тәжірибелері. Manning Publications, 2013 ж.
  4. ^ Марц, Натан. «CAP теоремасын қалай жеңуге болады». 13 қазан 2011 ж.
  5. ^ Кар, Сародж. «Hadoop секторы 2013-2020 жылдарға арналған жылдық өсімді 58% құрайды» Мұрағатталды 2014-08-26 сағ Бүгін мұрағат, 28 мамыр 2014 ж. Cloud Times.
  6. ^ а б Кинли, Джеймс. «Lambda архитектурасы: нақты уақыттағы Big Data жүйелерін архитектуралау принциптері», алынған 26 тамыз 2014 ж.
  7. ^ Феррера Бертран, Пере. «Lambda Architecture: ең заманауи». 17 қаңтар 2014 жыл, Datasalt.
  8. ^ а б c Ян, Фангжин және Мерлино, Джиан. «Ашық бастапқы технологиялармен нақты уақыттағы талдау». 30 шілде 2014 ж.
  9. ^ Рэй, Нельсон. «Таралуды жақындату өнері: масштабтағы гистограмма және квантил». 12 қыркүйек 2013 жыл. Метамаркет.
  10. ^ Рао, Супретх; Гупта, Сунил. «Адам уақытындағы интерактивті талдау». 17 маусым 2014 ж
  11. ^ Бэ, Джэ Хён; Юань, Дэнни; Тонсе, Судхир. «Суроны жариялау: Netflix-тің деректер құбырының магистралі», Netflix, 9 желтоқсан 2013 ж
  12. ^ Крепс, Джей. «Ламбда сәулетіне күмән келтіру». radar.oreilly.com. Орелли. Алынған 15 тамыз 2014.
  13. ^ Хакер жаңалықтары шығарылды 20 тамыз 2014

Сыртқы сілтемелер