Эталон (есептеу) - Benchmark (computing)

Жылы есептеу, а эталон а жүгіру әрекеті компьютерлік бағдарлама, туыстарды бағалау мақсатында бағдарламалар жиынтығы немесе басқа операциялар өнімділік әдетте, оған қарсы бірқатар стандартты сынақтар мен сынақтарды өткізу арқылы.[1]Термин эталон сонымен қатар, әдемілеп жасалған эталондық бағдарламалардың мақсаттары үшін қолданылады.

Бенчмаркинг, әдетте, компьютерлік жабдықтың жұмыс сипаттамаларын бағалаумен байланысты, мысалы, а Орталық Есептеуіш Бөлім, бірақ техниканың бағдарламалық жасақтамаға қатысты жағдайлары бар. Бағдарламалық жасақтама критерийлері, мысалы, орындалады құрастырушылар немесе мәліметтер базасын басқару жүйелері (ДҚБЖ).

Эталондар әр түрлі ішкі жүйелердің өнімділігін әр түрлі чип / жүйелік архитектура бойынша салыстыру әдісін ұсынады.

Сынақ бөлмелері - бағалауға арналған жүйенің түрі дұрыстық бағдарламалық қамтамасыздандыру

Мақсаты

Қалай компьютерлік архитектура жетілдірілген, әр түрлі компьютерлік жүйелердің сипаттамаларына қарап олардың өнімділігін салыстыру қиынға соқты. Сондықтан әртүрлі архитектураларды салыстыруға мүмкіндік беретін тесттер жасалды. Мысалға, Pentium 4 процессорлар әдетте қарағанда жоғары жиілікте жұмыс істейді Athlon XP немесе PowerPC есептеу қуаттылығына ауыспайтын процессорлар; сағат жиілігі баяу процессор неғұрлым жоғары жиілікте жұмыс істейтін процессорға қарағанда жақсы немесе жақсы жұмыс істей алады. Қараңыз BogoMips және мегагерц мифі.

Эталондар компоненттің немесе жүйенің белгілі бір жұмыс жүктемесін имитациялауға арналған. Синтетикалық эталондар мұны компонентке жүктеме жүктейтін арнайы құрылған бағдарламалар арқылы жүзеге асырады. Қолданбалы эталондар жүйеде шынайы бағдарламаларды орындайды. Әдетте қолданбалы эталондар берілген жүйедегі нақты жұмыс тиімділігін едәуір жақсартады, ал синтетикалық эталондар жеке компоненттерді сынау үшін пайдалы, мысалы қатқыл диск немесе желілік құрылғы.

Эталондар әсіресе маңызды Процессордың дизайны, процессор сәулетшілеріне өлшеу және өзара сауда жасау мүмкіндігін беру микроархитектуралық шешімдер. Мысалы, егер эталон кілт шығарса алгоритмдер қосымшаның құрамына осы қосымшаның өнімділікке қатысты аспектілері енеді. Бұл әлдеқайда ұсақ үзінді циклді дәлме-дәл тренажерде іске қосу өнімділікті жақсарту туралы кеңестер бере алады.

2000 жылға дейін компьютерлік және микропроцессорлық сәулетшілер қолданған SPEC мұны істеу үшін, SPEC-тің Unix-ке негізделген эталондары өте ұзақ болғанымен, бүлінбеуге болмайды.

Компьютер өндірушілері жүйелерді нақты қолданыста қайталанбайтын эталондық тестілерде шындыққа сәйкес келмейтін жоғары өнімділікке теңшейтіні белгілі. Мысалы, 1980 ж. Кейбір компиляторлар белгілі өзгермелі нүктелік эталонда қолданылатын белгілі бір математикалық операцияны анықтай алады және операцияны тезірек математикалық эквивалентті операциямен ауыстырады. Алайда, мұндай түрлендіру 1990 жылдардың ортасына дейін эталоннан тыс сирек пайдалы болды RISC және VLIW архитектуралары маңыздылығын атап өтті құрастырушы бұл өнімділікке байланысты технология. Салыстырмалы белгілерді қазір үнемі қолданады құрастырушы компаниялар өздерінің эталондық бағаларын ғана емес, сонымен қатар қосымшаның нақты өнімділігін жақсарту.

Көптеген орындау блоктары бар процессорлар - мысалы суперскалар CPU, а VLIW CPU немесе a қайта конфигурацияланатын есептеу Орталық процессор - жылдамдығы транзисторлардан құрастырылған кезде бір немесе екі орындау блогы бар дәйекті процессорға қарағанда баяу жылдамдыққа ие. Соған қарамастан, көптеген орындау блоктары бар процессорлар нақты және эталондық тапсырмаларды көбінесе жоғары жылдамдықты CPU-ға қарағанда аз уақытта орындайды.

Қол жетімді эталондардың көптігін ескере отырып, өндіруші, әдетте, оның жүйесі басқа жүйеден асып түсетінін көрсететін кем дегенде бір эталон таба алады; басқа жүйелер басқа эталонмен ерекшеленетінін көрсетуге болады.

Әдетте өндірушілер өздерінің өнімдерін жақсы жағынан көрсететін эталондар (немесе эталондардың аспектілері) туралы есеп береді. Олар сондай-ақ эталондардың маңыздылығын дұрыс көрсетпейтіні белгілі, қайтадан өз өнімдерін барынша жақсы жағынан көрсету үшін. Бірлесіп, бұл тәжірибелер деп аталады маркетинг.

Міндетті түрде эталондар нақты қосымшалардың орнын қолданба қол жетімді болмаған кезде немесе белгілі бір процессорға немесе компьютерлік жүйеге ауыстыру өте қиын немесе қымбатқа түскен жағдайда ғана алмастыруы керек. Егер өнімділік өте маңызды болса, мақсатты ортаның қолданбалы жиынтығы маңызды болып табылады.

Қиындықтар

Бенчмаркинг оңай емес және болжамды, пайдалы қорытындыға келу үшін бірнеше қайталану кезеңдерін қамтиды. Салыстырмалы деректерді интерпретациялау да өте қиын. Жалпы қиындықтардың ішінара тізімі:

  • Сатушылар өз өнімдерін салалық стандарттарға сәйкес келтіруге бейім. Norton SysInfo (SI) -ны баптау әсіресе оңай, өйткені ол бірнеше операциялардың жылдамдығына негізделеді. Мұндай нәтижелерді түсіндіру кезінде өте сақ болыңыз.
  • Кейбір сатушыларға эталондық бағаны «алдады» - әлдеқайда жоғары эталондық сандарды беретін, бірақ нақты жұмыс жүктемесінде жағдайды нашарлататын нәрселер жасады деп айыпталды.[2]
  • Көптеген эталондар толығымен жылдамдыққа бағытталған есептеу өнімділігі компьютерлік жүйенің басқа маңызды ерекшеліктерін ескермеу, мысалы:
    • Шикі өнімділіктен басқа қызмет көрсету сапалары. Қызметтің өлшенбеген сапаларына мысал ретінде қауіпсіздік, қол жетімділік, сенімділік, орындалудың тұтастығы, қызметке жарамдылығы, масштабталуы (әсіресе жылдамдықты және сөзсіз түрде қосу немесе қайта бөлу мүмкіндігі) және т.б. кіреді. Қызмет көрсетудің осы сапаларының арасында және арасында жиі нақты келісімдер болады, және барлығы бизнес-есептеуде маңызды. Транзакцияны өңдеу бойынша кеңес Эталондық сипаттамалар спецификациялау арқылы осы мәселелерді ішінара шешеді Қышқыл меншік тестілері, мәліметтер қорының масштабталу ережелері және қызмет деңгейіне қойылатын талаптар.
    • Жалпы, эталондар өлшенбейді Меншіктің жалпы құны. Транзакцияларды өңдеу бойынша кеңестің эталондық сипаттамалары бұл алаңдаушылықты ішінара шешеді, баға / өнімділік көрсеткіштері шикізат көрсеткіштеріне қосымша есеп беру керек, жеңілдетілген тәсілмен ТШО формула. Алайда, шығындар тек жартылай ғана болады, ал сатушылар жасанды түрде төмен бағамен өте ерекше «эталондық арнайы» конфигурацияны жобалап, эталонға арнайы (және тек) баға қоятыны белгілі болды. Тіпті эталондық пакеттен ауытқудың өзі нақты әлемдік тәжірибеде әлдеқайда жоғары бағаға әкеледі.
    • Объектілердің ауыртпалығы (кеңістік, қуат және салқындату). Қуатты көбірек пайдаланған кезде, портативті жүйеде батареяның қызмет ету мерзімі қысқа болады және жиі қайта зарядтауды қажет етеді. Қуатты және / немесе кеңістікті көбірек тұтынатын сервер салқындату шектеулерін қоса, қолданыстағы деректер орталығының ресурстық шектеулеріне сәйкес келмеуі мүмкін. Жартылай өткізгіштердің көпшілігі жылдам ауысу үшін көп қуатты қажет ететіндіктен нақты айырмашылықтар бар. Сондай-ақ қараңыз бір ваттға өнімділігі.
    • Жад айтарлықтай шығындар болатын кейбір ендірілген жүйелерде жақсы болады код тығыздығы шығындарды айтарлықтай төмендетуі мүмкін.
  • Сатушылардың эталондық бағалары даму, тестілеу және апатты қалпына келтіру есептеу қабілеті. Сатушылар өздерінің бастапқы сатып алу бағаларын мүмкіндігінше төмен етіп көрсету үшін өндірістік қуаттылыққа қажет болуы мүмкін нәрсе туралы есеп беруді ғана ұнатады.
  • Эталондар кең таралған серверлерге, әсіресе желілік топологияларға аса сезімталдығы бар серверлерге бейімделуде қиындықтарға тап болды. Пайда болуы торлы есептеу, атап айтқанда, эталондық бақылауды қиындатады, өйткені кейбір жүктемелер «торға қолайлы», ал басқалары ондай емес.
  • Пайдаланушылар эталондар ұсынғаннан гөрі өнімділікті әр түрлі қабылдауы мүмкін. Атап айтқанда, пайдаланушылар болжамды - әрқашан кездесетін немесе асып түсетін серверлерді бағалайды қызмет деңгейіндегі келісімдер. Эталондар ең нашар жауап қайтару уақытына емес, орташа ұпайларға (IT перспективасы) баса назар аударады (нақты уақыттағы есептеу перспектива), немесе төмен стандартты ауытқулар (пайдаланушының перспективасы).
  • Көптеген серверлік архитектуралар пайдалану деңгейінің жоғары деңгейінде (шамамен 100%) күрт нашарлайды - «жартастан құлайды» - және эталондар осы факторды ескеруі керек (бірақ көбінесе ескермейді). Сатушылар, атап айтқанда, серверлік бағдарларды шамамен 80% пайдалану кезінде жариялауға бейім, бұл шындыққа жанаспайтын жағдай - және сұраныс осы деңгейден асып кеткен кезде жалпы жүйеде не болатынын құжаттамайды.
  • Көптеген эталондар басқа қосымшаларды алып тастауға бір бағдарламаға, тіпті бір деңгей деңгейіне бағытталған. Қазіргі уақытта көптеген деректер орталықтары іске асырылуда виртуалдандыру әр түрлі себептерге байланысты кеңейтілген және салыстырмалы серверлерде бір уақытта бірнеше қосымшалар мен қосымшалар деңгейлері жұмыс істейтін шындыққа сәйкес келеді.
  • Компьютерлік өнімділікті өлшеуге көмектесетін жоғары сапалы көрсеткіштер аз (бар болса), әсіресе жоғары көлемді параллельді партия және желілік есептеуіштер аз. Бумалық есептеу ұзақ мерзімді тапсырмаларды мерзімінен бұрын дұрыс орындаудың болжамдылығына әлдеқайда көп көңіл бөлуге бейім, мысалы, айдың соңы немесе қаржы жылының соңы. Көптеген маңызды негізгі бизнес-процестер пакеттік-бағдарланған, мүмкін есеп айырысу сияқты болады.
  • Эталондық бақылау институттары көбінесе негізгі ғылыми әдісті ескермейді немесе қолданбайды. Бұған мыналар кіреді, бірақ олармен шектелмейді: іріктеудің кішігірім мөлшері, айнымалы бақылаудың болмауы және нәтижелердің шектеулі қайталануы.[3]

Эталондық принциптер

Эталондар үшін жеті маңызды сипаттама бар.[4] Бұл негізгі қасиеттер:

  1. Өзектілігі: Эталондар салыстырмалы өмірлік ерекшеліктерді өлшеуі керек.
  2. Репрезентативтілік: эталондық көрсеткіштер салалар мен ғылыми ортада кеңінен қабылдануы керек.
  3. Меншікті капитал: барлық жүйелерді әділетті түрде салыстыру керек.
  4. Қайталау мүмкіндігі: Эталон нәтижелерін тексеруге болады.
  5. Экономикалық тиімділік: Эталондық тестілер үнемді.
  6. Масштабтылығы: эталондық тестілер ресурстардың төменнен жоғарыға дейінгі ауқымына ие жүйелер бойынша жұмыс істеуі керек.
  7. Мөлдірлік: Эталондық көрсеткіштерді түсіну оңай болуы керек.

Эталондық типтер

  1. Нақты бағдарлама
    • мәтінді өңдеуге арналған бағдарламалық жасақтама
    • АЖЖ-нің бағдарламалық жасақтамасы
    • қолданушының бағдарламалық жасақтамасы (мысалы: MIS)
  2. Компоненттік эталон / Microbenchmark
    • негізгі режим салыстырмалы түрде кішігірім және арнайы код бөлігінен тұрады.
    • компьютердің негізгі компоненттерінің өнімділігін өлшеу[5]
    • регистрлер саны, кэш өлшемі, жадтың күту уақыты және т.с.с. компьютердің аппараттық параметрлерін автоматты түрде анықтау үшін пайдаланылуы мүмкін.
  3. Ядро
    • негізгі кодтардан тұрады
    • әдетте нақты бағдарламадан алынған
    • танымал ядро: Livermore циклі
    • linpack эталоны (FORTRAN тілінде жазылған негізгі сызықтық алгебраның ішкі бағдарламасы бар)
    • нәтижелер Mflop / s ұсынылған.
  4. Синтетикалық эталон
    • Синтетикалық эталонды бағдарламалау процедурасы:
      • көптеген қолданбалы бағдарламалардан операциялардың барлық түрлерінің статистикасын алу
      • әр операцияның үлесін алыңыз
      • жоғарыдағы пропорцияға негізделген бағдарлама жазу
    • Синтетикалық эталон түрлері:
    • Бұл жалпы мақсаттағы алғашқы компьютерлік стандарттық эталондар болды. Олар заманауи құбырлы компьютерлерде міндетті түрде жоғары ұпай жинай бермейді.
  5. I / O эталондары
  6. Мәліметтер базасының эталондары
    • мәліметтер базасын басқару жүйелерінің өткізу қабілеттілігі мен жауап беру уақытын өлшеу (ДҚБЖ)
  7. Параллельді эталондар
    • бірнеше ядролы және / немесе процессорлы машиналарда немесе бірнеше машинадан тұратын жүйелерде қолданылады

Жалпы критерийлер

Салалық стандарт (тексерілетін және тексерілетін)

Ашық бастапқы критерийлер

  • AIM Multiuser Benchmark - кез-келген UNIX типті ОЖ-де компьютердің белгілі бір функциясын имитациялайтын «жүктеме қоспасын» құру үшін араласуға болатын тестілер тізімінен тұрады.
  • Бони ++ - файлдық жүйе және қатты дискінің эталоны
  • BRL-CAD - көпжіптелген сәулелерді қадағалауға негізделген кросс-платформалық сәулет-агностикалық эталондық жинақ; VAX-11/780 қарсы базелинді; және 1984 жылдан бастап процессордың салыстырмалы өнімділігін, компилятор айырмашылықтарын, оңтайландыру деңгейлерін, келісімділігін, архитектуралық айырмашылықтарын және операциялық жүйенің айырмашылықтарын бағалау үшін қолданылады.
  • Ұжымдық білім - пайдаланушының жүктемесін оңтайландыру мен краудсорсингке арналған теңшелетін, платформалық құрылым (мысалы) терең оқыту ) еріктілер ұсынған жабдықтар арқылы
  • Сауда маркасы - ендірілген есептеу эталоны
  • Деректерді сақтау эталоны - LDBC әлеуметтік желісінің эталонының RDF жалғасы, Hobbit жобасынан[12]
  • DEISA Benchmark Suite - ғылыми HPC қосымшаларының эталоны
  • Dhrystone - көбінесе DMIPS-те баяндалатын бүтін арифметикалық көрсеткіш (Dhrystone секундына миллион нұсқаулық)
  • DiskSpdПәрмен жолы әр түрлі сұраныстар тудыратын сақтау бенчмаркинг құралы компьютерлік файлдар, бөлімдер немесе сақтау құрылғылары
  • Embench ™ - терең енгізілген жүйелерді салыстыруға арналған портативті, қайнар көзі критерийлері; олар ОЖ-нің жоқтығын, C кітапханасының минималды қолдауының және, атап айтқанда, шығыс ағынының жоқтығын болжайды. Embench - бұл жоба Ақысыз және ашық көзді кремний қоры.
  • Бетті қарап шығу эталоны - Hobbit жобасынан ақылды пайдаланушы орындайтын қайталанатын ауысулар арқылы байланыстырылған деректерді қарауды қолдайтын эталондық жүйелер[13]
  • Фурстондар - бүтін эталон
  • НҰСҚАУ - жалпы процессор мен жадтың өнімділігін өлшеуге арналған
  • Иометр - бір және кластерлі жүйелер үшін енгізу-шығару ішкі жүйесін өлшеу және сипаттау құралы.
  • IOzone - файлдық жүйенің эталоны
  • Кубестон - салыстыру операторы Кубернет және OpenShift
  • LINPACK критерийлері - өлшеу үшін дәстүрлі түрде қолданылады FLOPS
  • Ливермор ілмектері
  • ҰҒА параллель критерийлері
  • NBench - бүтін арифметикалық көрсеткіштерді, жад операцияларын және өзгермелі нүктелік арифметиканы өлшейтін синтетикалық эталондық жинақ
  • PAL - физикалық қозғалтқыштардың эталоны
  • PerfKitBenchmarker - бұлтты ұсыныстарды өлшеуге және салыстыруға арналған эталондар жиынтығы.
  • Phoronix Test Suite - Linux, OpenSolaris, FreeBSD, OSX және Windows жүйелеріне арналған қайнар көзі платформалық салыстыру жиынтығы. Оған осы параққа орындалуды жеңілдетуге арналған бірқатар басқа эталондар кіреді.
  • POV-Ray - 3D көрсету
  • Tak (функция) - рекурсияның өнімділігін тексеру үшін қолданылатын қарапайым эталон
  • TATP эталоны - Телекоммуникациялық қосымшалардың транзакцияларын өңдеу эталоны
  • TPoX - XML ​​дерекқорларына арналған XML транзакцияларды өңдеу эталоны
  • VUP (VAX өнімділік бірлігі) - VAX деп те аталады MIPS
  • Whetstone - жылдамдығы секундына миллиондаған Whetstone нұсқауларында баяндалатын өзгермелі-арифметикалық өнімділік (MWIPS)

Microsoft Windows критерийлері

Басқалар

  • AnTuTu - әдетте телефондарда және ARM негізіндегі құрылғыларда қолданылады.
  • Berlin SPARQL эталоны (BSBM) - архитектура бойынша SPARQL протоколы арқылы SPARQL соңғы нүктелерін көрсететін сақтау жүйелерінің жұмысын салыстыруға арналған эталондар жиынтығын анықтайды[14]
  • Geekbench - Windows, Linux, macOS, iOS және Android үшін кросс-платформалық эталон.
  • iCOMP - Intel жариялаған Intel-дің салыстырмалы микропроцессорлық өнімділігі
  • Хорнерстоун
  • Лехай университетінің эталоны (LUBM) - бірыңғай нақты онтологияға негізделген үлкен деректер жиынтығы бойынша кеңейтілген сұраулар арқылы Semantic Web репозитарийлерін бағалауды жеңілдетеді[15]
  • Өнімділік рейтингі - AMD және Cyrix қолданылатын бәсекелес өнімдермен салыстырмалы өнімділікті көрсету үшін қолданылатын модельдеу схемасы.
  • SunSpider - браузердің жылдамдығын тексеру
  • VMmark - виртуалдандырудың эталондық жиынтығы.[16]
  • RenderStats - 3D рендерингтік мәліметтер базасы.[17]

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ Флеминг, Филипп Дж.; Уоллес, Джон Дж. (1986-03-01). «Статистикамен қалай өтірік айтпауға болады: эталондық нәтижелерді қорытындылаудың дұрыс әдісі». ACM байланысы. 29 (3): 218–221. дои:10.1145/5666.5673. ISSN  0001-0782. S2CID  1047380. Алынған 2017-06-09.
  2. ^ Кразит, Том (2003). «NVidia-ның эталондық тактикасы қайта бағаланды». IDG жаңалықтары. Архивтелген түпнұсқа 2011-06-06. Алынған 2009-08-08.
  3. ^ Кастор, Кевин (2006). «Аппараттық құралдарды тестілеу және эталондық бағалау әдістемесі». Архивтелген түпнұсқа 2008-02-05. Алынған 2008-02-24.
  4. ^ Дай, Вэй; Берлянт, Даниэль (12-14 желтоқсан, 2019). «Қазіргі заманғы терең білім берудің техникалық құралдары мен құрылымдарын салыстыру: сапалық көрсеткіштерге шолу» (PDF). 2019 IEEE танымдық машиналық интеллект бойынша бірінші халықаралық конференция (CogMI). Лос-Анджелес, Калифорния, АҚШ: IEEE. 148–155 бет. дои:10.1109 / CogMI48466.2019.00029.
  5. ^ Эхлиар, Андреас; Лю, Дейк. «Желілік процессорларды салыстыру» (PDF). Журналға сілтеме жасау қажет | журнал = (Көмектесіңдер)
  6. ^ LDBC. «LDBC Semantic Publishing эталоны». LDBC SPB. LDBC. Алынған 2018-07-02.
  7. ^ LDBC. «LDBC әлеуметтік желісінің эталоны». LDBC SNB. LDBC. Алынған 2018-07-02.
  8. ^ Транзакцияны өңдеу бойынша кеңес (ақпан 1998 ж.). «ТКК тарихы және шолуы». TPC. Транзакцияны өңдеу бойынша кеңес. Алынған 2018-07-02.
  9. ^ Транзакцияны өңдеу бойынша кеңес. «TPC-A». Транзакцияны өңдеу бойынша кеңес. Алынған 2018-07-02.
  10. ^ Транзакцияны өңдеу бойынша кеңес. «TPC-C». Транзакцияны өңдеу бойынша кеңес. Алынған 2018-07-02.
  11. ^ Транзакцияны өңдеу бойынша кеңес. «TPC-H». Транзакцияны өңдеу бойынша кеңес. Алынған 2018-07-02.
  12. ^ «Деректерді сақтау эталоны». 2017-07-28. Алынған 2018-07-02.
  13. ^ «Факетті шолу критерийі». 2017-07-27. Алынған 2018-07-02.
  14. ^ «Berlin SPARQL эталоны (BSBM)». Алынған 2018-07-02.
  15. ^ «SWAT жобалары - Лихай университетінің эталоны (LUBM)». Лехай университетінің эталоны (LUBM). Алынған 2018-07-02.
  16. ^ «VMmark ережелері 1.1.1» (PDF). VMware. 2008.[өлі сілтеме ]
  17. ^ «3D көрсетудің эталондық дерекқоры». Алынған 2019-09-29. Журналға сілтеме жасау қажет | журнал = (Көмектесіңдер)

Әрі қарай оқу