Пирсон хэштеу - Pearson hashing

Пирсон хэштеу Бұл хэш функциясы 8 биттік процессорларда жылдам орындалуға арналған тіркеушілер. Кез-келген байт санынан тұратын кірісті ескере отырып, ол кіріс ретінде әр байтқа қатты тәуелді бір байт шығарады. Оны жүзеге асыру үшін тек бірнеше нұсқаулар, сонымен қатар 256 байт қажет іздеу кестесі құрамында а ауыстыру 0-ден 255-ке дейінгі мәндер.[1]

Бұл хэш-функция а CBC-MAC 8-битті қолданады ауыстыру шифры арқылы жүзеге асырылады ауыстыру кестесі. 8 бит шифр елеусіз криптографиялық қауіпсіздікке ие, сондықтан Pearson хэш-функциясы жоқ криптографиялық тұрғыдан мықты, бірақ бұл іске асыру үшін пайдалы хэш кестелер немесе а деректердің тұтастығын тексеру коды, ол қандай мақсаттар үшін келесі артықшылықтарды ұсынады:

  • Бұл өте қарапайым.
  • Ол ресурстармен шектелген процессорларда тез орындалады.
  • Ол үшін қарапайым кіріс класы жоқ қақтығыстар (бірдей нәтижелер) әсіресе ықтимал.
  • Кірістердің кішігірім, артықшылықты жиынтығы берілген (мысалы, сақталған сөздер үшін құрастырушы ), ауыстыру кестесін сол кірістер атау деп аталатын белгілі хэш мәндерін беретін етіп реттеуге болады. тамаша хэш функциясы.
  • Бір символмен ерекшеленетін екі енгізу жолы ешқашан соқтығыспайды.[2] Мысалы, ABC және AEC жолдарында алгоритмді қолдану ешқашан бірдей мәнге әкелмейді.

Басқа хэштеу алгоритмдерімен салыстырғанда оның кемшіліктерінің бірі 8 биттік процессорлар бұл кішігірім үшін үлкен болуы мүмкін 256 байтты іздеу кестесі микроконтроллер жүздеген байт ретіндегі бағдарламалық жадының өлшемімен. Бұл үшін уақытша шешім бағдарлама жадында сақталған кестенің орнына қарапайым ауыстыру функциясын қолдану болып табылады. Алайда, тым қарапайым функцияны қолдану T [i] = 255-i, хэш функциясы ретінде ыңғайлылықты ішінара жеңеді анаграммалар бірдей хэш мәні болады; тым күрделі функцияны қолдану жылдамдыққа кері әсер етеді. Кестеден гөрі функцияны қолдану блок өлшемін кеңейтуге мүмкіндік береді. Мұндай функциялар әрине болуы керек биективті, олардың кестелік нұсқалары сияқты.

Алгоритмді келесідей сипаттауға болады псевдокод, бұл хабарламаның хэшін есептейдіC ауыстыру кестесін қолдануТ:

алгоритм персонды хэштеу болып табылады    h: = 0 әрқайсысы үшін в жылы C цикл        h: = T [h xor в] соңғы цикл    қайту сағ

Хэш айнымалысы (сағ) басқаша инициализациялануы мүмкін, мысалы. деректер ұзындығына дейін (C) 256 модулі; бұл нақты таңдау төмендегі Python енгізу мысалында қолданылады.

Іске асырудың мысалы

Python, 8 биттік шығу

'Кесте' параметрі [0..255] аралығының жалған кездейсоқ араластырылған тізімін қажет етеді. Бұл оңай орнатылған питонның көмегімен жасалуы мүмкін ауқымы функциясы және пайдалану кездейсоқ оны өзгерту үшін:

 1 бастап кездейсоқ импорт араластыру 2  3 мысал кестесі = тізім(ауқымы(0, 256)) 4 араластыру(мысал кестесі) 5  6 деф хэш8(хабар: str, кесте) -> int: 7     «» «Пирсон хэштеу.» «» 8     хэш = лен(хабар) % 256 9     үшін мен жылы хабар:10         хэш = кесте[хэш ^ бұйрық(мен)]11     қайту хэш

C, 64 бит

 1 # қосу <stdint.h> 2 статикалық const қол қойылмаған char Т[256] = { 3     // TODO: 0-255 кез-келген (кездейсоқ) ретпен араластырылған қосу 4 }; 5  6 uint64_t Пирсон 64(const қол қойылмаған char *х, өлшем_т лен) { 7   өлшем_т мен; 8   өлшем_т j; 9   қол қойылмаған char сағ;10   uint64_t ретваль;11 12   үшін (j = 0; j < өлшемі(ретваль); ++j) {13     // Бірінші байтты өзгерту14     сағ = Т[(х[0] + j) % 256];15     үшін (мен = 1; мен < лен; ++мен) {16       сағ = Т[сағ ^ х[мен]];17     }18     ретваль = ((ретваль << 8) | сағ);19   }20 21   қайту ретваль;22 }

Жоғарыда қолданылған схема - алгоритмнің қарапайым жүзеге асырылуы, оның ұзындығы 8 биттен асатын қарапайым кеңейту. Бұл кеңейту сыртқы циклден тұрады (яғни айнымалыны қамтитын барлық оператор жолдары) j).

Берілген жол немесе мәліметтер бөлігі үшін Пирсонның бастапқы алгоритмі 8-биттік байт немесе бүтін санды ғана құрайды, 0-255. Алайда, алгоритм кез келген ұзындықтағы хэшті жасауды өте оңай етеді. Пирсон атап өткендей, жолдың кез-келген разрядының өзгеруі оның алгоритмінің мүлдем басқа хэш құруына әкеледі (0–255). Жоғарыдағы кодта ішкі цикл аяқталғаннан кейін жолдың бірінші байты тиімді түрде бір жолмен көбейтіледі (жолдың өзін өзгертпестен).

Деректердің бірінші байтына қарапайым өзгеріс енгізілген сайын, әр түрлі Пирсон хэші, сағ, жасалады. C функциясы 8 биттік Пирсон хэштерін біріктіру арқылы 16 алтылық таңбаны құрайды (жиналған ретваль). Бұл функция 0-ден 255-ке дейін мәннің орнына 0-ден 18,446,744,073,709,551,615 (= 2) мәнін шығарады64 - 1).

Бұл Пирсонның алгоритмін 8 биттік хэш мәндерінің тізбегін біріктіру арқылы кез-келген қажетті ұзындықтағы хэштерді құруға болатындығын көрсетеді, олардың әрқайсысы хэш функциясы есептелген сайын жолды аздап өзгерту арқылы есептеледі. Осылайша 32 биттік немесе 128 биттік хэштер жасау үшін дәл осындай негізгі логиканы жасауға болады.

C #, 8 бит

 1 қоғамдық сынып PearsonHashing 2 { 3     қоғамдық байт Хэш(жіп енгізу) 4     { 5         const байт[] Т = { / * 0-255-ке рұқсат ету * / }; 6          7         байт toRet = 0; 8         байт[] байт = Кодтау.UTF8.GetBytes(енгізу); 9 10         әрқайсысы үшін (var б жылы байт)11         {12             toRet = Т[(байт)(toRet ^ б)];13         }14 15         қайту toRet;16     }17 }

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ Пирсон, Питер К. (маусым 1990), «Өзгермелі ұзындықтағы жолдарды жылдам бұзу» (PDF), ACM байланысы, 33 (6): 677, дои:10.1145/78973.78978, мұрағатталған түпнұсқа (PDF) 2012-07-04, алынды 2013-07-13
  2. ^ Лемир, Даниэль (2012), «Ұзындығы ұзын жолдар бойынша қайталанатын хэштің әмбебаптығы», Дискретті қолданбалы математика, 160 (4–5): 604–617, arXiv:1008.1715, дои:10.1016 / j.dam.2011.11.009