ANNOVAR - ANNOVAR

Annovar broad overview diagnosis application.svg

ANNOVAR (ANNOtate VARiation) - бұл бір нуклеотидтік нұсқаларды (SNV) түсіндіру және олардың басымдылығын анықтауға арналған биоинформатикалық бағдарламалық құрал, кірістіру, жою, және көшірме нөмірінің нұсқалары (CNV) берілген геном.[1] Ол адамның hg18, hg19, hg38 геномдарын және модельдік организмдердің геномдарын, мысалы: тышқан (Бұлшықет бұлшықеті ), зебрбиш (Данио рерио ), жеміс шыбыны (Дрозофила меланогастері ), жұмыр құрт (Caenorhabditis elegans ), ашытқы (Saccharomyces cerevisiae ) және басқалары.[2] Аннотацияларды гендер мен организмдердегі мутациялардың функционалдық салдарын анықтау, цитогенетикалық белдеулерін шығару, функционалдық маңыздылықтары туралы есеп беру және / немесе консервіленген аймақтарда нұсқаларын табу үшін пайдалануға болады.[2] ANNOVAR SNP әсерімен бірге (SnpEFF ) және Variant Effect Predict (VEP) - аннотацияның ең көп қолданылатын үш нұсқасы.

Фон

Өткізгіштің жоғары құны ДНҚ секвенциясы 2001 жылы шамамен 100 миллион доллар / адам геномынан 2017 жылы шамамен 1000 доллар / адам геномына дейін төмендеді.[3] Қол жетімділіктің артуына байланысты жоғары өткізу қабілеті бар ДНҚ секвенциясы зерттеулер мен клиникалық жағдайларда кеңінен қолданыла бастады.[4][5] ДНҚ-ның жоғары секвенциясын кеңінен қолданатын кейбір жалпы бағыттар: Экзоманың бүкіл тізбегі, Жалпы геномдық тізбек (WGS), және кең ассоциациялық зерттеулер (GWAS).[6][7]

ДНҚ-ның жоғары тізбектелуінен алынған көптеген деректерді жан-жақты басқаруға, талдауға және интерпретациялауға арналған құралдар саны артып келеді. Құралдар зиянды / зиянды болуы мүмкін сирек кездесетін және клиникалық маңызды нұсқаларды анықтауға жеткілікті сезімтал болса да, көптеген нұсқаларды (адамның геномында 3 миллионнан астам) талдауға жеткілікті тиімді және мықты болуы қажет.[8] ANNOVAR-ны доктор Кай Ванг 2010 жылы Пенсильвания университетінің Қолданбалы геномика орталығында жасаған.[1] Бұл PolyPhen, ClinVar және CADD сияқты бағдарламалардан генетикалық вариантты болжаудың зиянды баллдарын құрастыратын және берілген геномның SNV, кірістіру, жою және CNV-ге түсініктеме беретін вариант аннотациясының бір түрі. ANNOVAR - алғашқы тиімді, теңшелетін, кеңейтілетін және платформалық үйлесімді аннотация құралдарының бірі.

Үлкен биоинформатикалық жұмыс ағыны тұрғысынан ANNOVAR жақын арада сәйкес келеді, ДНҚ секвенциясы оқылғаннан кейін картаға, тураланған және нұсқалар арасында туристік файлдан (BAM) алдын-ала болжам жасалды, оны вариантты шақыру деп те атайды. Бұл процесс нәтиже береді VCF қатарға генетикалық нұсқаларын қамтитын кесте тәрізді құрылымдағы қойындымен бөлінген мәтіндік файл. Содан кейін бұл файлды ANNOVAR бағдарламалық жасақтамасына биоинформатика құбырынан анықталған нұсқалардың интерпретацияларын шығарып, нұсқаларды аннотациялау процесі үшін пайдалануға болады.

Генетикалық варианттардың функционалды аннотациясының түрлері

Гендерге негізделген аннотация

Бұл тәсіл енгізу варианттарының ақуыздың кодталуының өзгеруіне және мутациялар әсер ететін аминқышқылдарының болуын анықтайды.[9] Кіріс файлы экзондардан, интрондардан, интергенді аймақтардан, қосылғыш акцептор / донорлық орындардан және 5 ′ / 3 ′ аударылмаған аймақтардан тұруы мүмкін. Синонимдік емес мутациялар (SNP, индель немесе CNV) арасындағы байланысты және олардың белгілі гендерге функционалды әсерін зерттеу басты назарда.[10] Әсіресе, генге негізделген аннотация егер мутация экзоникалық аймақта болса және белгілі геннің қызметіне болжамды әсер етсе, аминқышқылдарының нақты өзгеруін көрсетеді. Бұл тәсіл бүкіл экзомалық жүйелілік деректерінен белгілі гендердегі нұсқаларды анықтау үшін пайдалы.

Аймақтық аннотация

Бұл тәсіл геннің айналасындағы геномдық элементтер негізінде нақты геномдық аймақтардағы зиянды нұсқаларды анықтайды.[11] Аймақтық аннотация ескерілетін кейбір санаттар:

1) белгілі консервіленген геномдық аймақтағы нұсқа ма?

Мутация кезінде пайда болады митоз және мейоз. Егер нақты нуклеотидтік тізбектер үшін селективті қысым болмаса, онда геномның барлық аймақтары мутацияға ұшыраған болар еді. Жоғары дәрежеде сақталған геномдық аймақтар организмнің тіршілігі және / немесе репродуктивті табысы үшін маңызды геномдық тізбекті көрсетеді. Осылайша, егер нұсқа жоғары сақталған аймақты бұзса, онда бұл вариант өте зиянды болуы мүмкін.[12]

2) болжамдағы нұсқа ма? транскрипция коэффициенті байланыстырушы сайт?

ДНҚ-ға транскрипция жасалады хабаршы РНҚ (mRNA) арқылы РНҚ-полимераза II. Бұл процесті модуляциялауға болады транскрипция факторлары RNApol II байланысын күшейтуі немесе тежеуі мүмкін. Егер нұсқа транскрипция факторының байланысатын жерін бұзатын болса, онда геннің транскрипциясы өзгеруі мүмкін, бұл геннің экспрессия деңгейінде және / немесе ақуыздың түзілуінде өзгеріс тудыруы мүмкін. Бұл өзгерістер фенотиптік вариацияларды тудыруы мүмкін.

3) болжамдағы нұсқа ма? miRNA мақсатты сайт?

МикроРНҚ (miRNA) - мРНҚ трансляциясын басу немесе тыныштандыру үшін мақсатты mRNA тізбегімен комплементарлы байланысатын РНҚ түрі. Егер нұсқа miRNA мақсатты орналасуын бұзса, miRNA сәйкес гендік транскриптке байланыстырушы жақындығын өзгерте алады, сөйтіп транскрипттің mRNA экспрессия деңгейін өзгертеді. Бұл фенотиптік вариацияны тудыруы мүмкін ақуыз өндірісінің деңгейіне әсер етуі мүмкін.

4) Нұсқа тұрақты РНҚ-ның екіншілік құрылымын үзуі мүмкін бе?

РНҚ РНҚ деңгейінде жұмыс істей алады кодталмаған РНҚ немесе төменгі ағыс процестері үшін ақуыздарға аударылады. РНҚ-ның екінші реттік құрылымдары сол РНҚ-ның дұрыс жартылай шығарылу кезеңі мен қызметін анықтауда өте маңызды. Қатаң реттелген екінші реттік құрылымы бар екі РНҚ түрі рибосомалық РНҚ (рРНҚ) және тасымалдау РНҚ (тРНҚ) мРНҚ-ны протеинге ауыстыруда маңызды болып табылады. Егер нұсқа РНҚ-ның екінші құрылымының тұрақтылығын бұзса, онда РНҚ-ның жартылай шығарылу кезеңі қысқаруы мүмкін, осылайша РНҚ-ның жасушадағы концентрациясы төмендейді.

Кодтамайтын аймақтар адам геномының 99% құрайды[13] және аймақтық аннотация сол аймақтардағы нұсқаларды анықтауда өте пайдалы. Бұл тәсілді WGS деректерінде қолдануға болады.

Сүзгіге негізделген аннотация

Бұл тәсіл нақты мәліметтер базасында құжатталған нұсқаларды анықтайды.[14] Нұсқаларын dbSNP-тен алуға болады, 1000 геном жобасы немесе пайдаланушы ұсынған тізім. Қосымша ақпаратты жоғарыда келтірілген мәліметтер базасының нұсқаларының жиілігінен немесе PolyPhen, CADD, ClinVar немесе басқалар жасаған болжамды зиянды баллдардан алуға болады.[1] Жалпыға қол жетімді мәліметтер қорында нұсқа сирек кездесетін болса, соғұрлым ол зиянды болуы мүмкін. Әр түрлі зиянды балл болжау құралдарының нәтижелерін зерттеуші біріктіріп, нұсқаға дәлірек қоңырау шалуы мүмкін.

Бұл тәсілдер адам геномындағы 4 миллионнан астам нұсқаны сүзу үшін бірін-бірі толықтырады. Баллдың жалпы, төмен зиянды нұсқалары алынып тасталды, бұл сирек кездесетін, жоғары зиянды, варианттар туа біткен ауруларға себеп болуы мүмкін.

Техникалық ақпарат

ANNOVAR - командалық жол құралы Перл бағдарламалау тілі және кез келгенінде іске қосылуы мүмкін операциялық жүйе Perl аудармашысы орнатылған.[1] Егер коммерциялық емес мақсаттарда қолданылса, ол тегін ретінде қол жетімді ашық көзі ANNOVAR веб-сайты арқылы жүктелетін пакет. ANNOVAR ең көп өңдей алады келесі буынның реттілігі а арқылы жүргізілген деректер вариантты қоңырау бағдарламалық жасақтама.

Бағдарламадағы негізгі сценарийлерге шолу
СценарийМақсатыСипаттамаКірісШығуТалаптар
annotate_variation.plнұсқа аннотациясы(1) генге негізделген, (2) аймақтық және / немесе (3) сүзгіге негізделген аннотация арқылы генетикалық нұсқаларды функционалды түрде түсіндіретін негізгі сценарий..жіберу.жіберуДеректер көздері аннотацияға жүктеледі, мысалы. hg38, UCSC, 1000 геном жобасы.
convert2annovar.plфайл түрлендіргішіФайлдардың әр түрлі форматтарын өзгертпелі ANNOVAR енгізу файлының форматына түрлендіреді.«ANNOVAR кіріс файлының форматына түрлендіру» бөлімін қараңыз..жіберу
table_annovar.plавтоматтандырылған нұсқа анноаторыАйнала орам annotate_variation.pl VCF пішімін ANNOVAR форматымен бірге ала алады, аннотация жасайды және Excel-мен үйлесімді файл шығарады. Жаңадан бастаушылар үшін өте қолайлы..avinput, CSV, TSV, VCFCSV, TSV, VCF, TXTДеректер көздері аннотацияға жүктеледі, мысалы. hg38, UCSC, 1000 геном жобасы.
variants_reduction.plнұсқа редукторыФункционалды маңызды нұсқалардың ішіне тарылу үшін кіріс нұсқаларының үлкен жиынтығында қадамдық қысқартуды орындайды. Сүзу процедураларына мыналар кіреді: Аурумен байланысты болуы мүмкін нұсқалардың ішкі жиынтықтарын анықтау үшін сүзгілеудің сатылы процедурасын қолданады.[2] Мұндай сүзу процедураларына мыналар жатады:[2]
  • синонимдік емес және сплайсингтік нұсқаларды анықтау
  • сегменттік қайталану аймақтарындағы нұсқаларды жою
  • сақталған геномдық аймақтарды анықтау
  • 1000 Genomes Project, ESP6500 және dbSNP нұсқаларын жою
.жіберу.жіберуГенге негізделген аннотация деректері және әр түрлі сүзгіге негізделген аннотация дерек көздері жүктеледі.

Файл форматтары

ANNOVAR бағдарламалық жасақтамасы мәтіндік енгізу файлдарын, соның ішінде қабылдайды VCF (вариантты қоңырау форматы), генетикалық локустарды сипаттайтын алтын стандарт.

Бағдарламаның негізгі аннотация сценарийі, annotate_variation.pl енгізудің арнайы форматы қажет, ANNOVAR енгізу форматы (.avinput). Берілген сценарийдің көмегімен аннотация үшін жалпы файл түрлерін ANNOVAR енгізу форматына ауыстыруға болады (төменде қараңыз). Бұл қарапайым мәтіндік файл, онда файлдағы әр жол вариантқа сәйкес келеді және әр жолдың ішінде негізгі геномдық координат өрістерін (хромосома, бастапқы позиция, соңғы позиция, сілтеме нуклеотидтері және бақыланатын нуклеотидтер) бейнелейтін қойындымен бөлінген бағандар болады. қосымша бағандар[2]

ANNOVAR файлының кірісі келесі негізгі өрістерден тұрады:

  • Хр
  • Бастау
  • Соңы
  • Сілтеме
  • Alt

Негізгі «қораптан тыс» пайдалану үшін:

ANNOVAR құралының танымал функциясы - пайдалану table_annovar.pl сценарий, бұл аннотацияға арналған деректер көздері жүктелгендігін ескере отырып, жұмыс процесін бір командалық жолдағы қоңырауға біріктіреді. Файлды түрлендіру VCF файлы функционалдық шақыру шеңберінде өңделеді, содан кейін аннотация және Excel-ге сәйкес келетін файлға шығарылады. Сценарий аннотация үшін бірқатар параметрлерді алады және VCF файлын аннотациямен шығарады кілттердің мәні ішіндегі АҚПАРАТ әр генетикалық нұсқаға арналған VCF файлының бағанасы, мысалы. «genomic_function = exonic».

ANNOVAR кіріс файлының форматына түрлендіру

Файлды ANNOVAR кіріс форматына түрлендіру берілген файл пішімін түрлендіру сценарийі арқылы мүмкін болады convert2annovar.pl. Бағдарлама ағынмен шығарылатын жалпы файл пішімдерін қабылдайды вариантты қоңырау құралдар. Кейінгі функционалды аннотация сценарийлері annotate_variation.pl ANNOVAR кіріс файлын қолданыңыз. Арқылы қабылданған файл пішімдері convert2annovar.pl мыналарды қамтиды:[2]

Белгілі бір нұсқаларға, транскрипцияларға немесе геномдық аймақтарға негізделген кіріс файлдарын жасау:

Аурулармен байланысты кандидаттардың локустарын зерттеу кезінде жоғарыда келтірілген нұсқаларды ANNOVAR-ға енгізу ретінде шақыратын файл пішімдерін пайдалану - бұл биоинформатика құбырынан шыққан генетикалық варианттардың функционалды аннотациясы үшін стандартты жұмыс процесі. ANNOVAR басқа сценарийлерде де қолданылуы мүмкін, мысалы тізімнің негізінде қызығушылықтың генетикалық нұсқаларының жиынтығына жауап алу. dbSNP идентификаторлар, сондай-ақ нақты геномдық немесе экзомикалық аймақтар ішіндегі нұсқалар.[2]

DbSNP идентификаторлары жағдайында convert2annovar.pl мәтін файлындағы идентификаторлар тізімін (мысалы, rs41534544, rs4308095, rs12345678) сценариймен жазыңыз анықтамалық геном параметр ретінде қызығушылық тудыратын болса, ANNOVAR ANNOVAR кіріс файлын геномдық координат өрістерімен бірге шығарады, содан кейін функционалды аннотация үшін қолдануға болады.[2]

Геномдық аймақтар жағдайында қызығушылықтың геномдық диапазонын ұсынуға болады (мысалы, chr1: 2000001-2000003) және қызығушылықтың анықтамалық геномымен бірге ANNOVAR осы ауқымды қамтитын барлық генетикалық локустардың ANNOVAR кіріс файлын жасайды. Сонымен қатар, сценарийде қызығушылықты енгізу немесе жоюдың белгілі бір мөлшері табылған барлық генетикалық локустар таңдалатын кірістіру және жою мөлшері де көрсетілуі мүмкін.[2]

Соңында, егер белгілі бір экзоникалық аймақтардағы нұсқаларды қарастыратын болсақ, онда пайдаланушылар экзондардағы барлық ықтимал нұсқалар үшін ANNOVAR кіріс файлдарын жасай алады (соның ішінде, біріктіру нұсқалары).convert2annovar.pl сценарийге РНҚ беріледі транскрипт стандартты HGVS (Human Genome Variation Society) номенклатурасына негізделген идентификатор (мысалы, NM_022162).[2]

Шығарылатын файл

Мүмкін шығыс файлдары - түсіндірмелі .avinput файлы, CSV, TSV, немесе VCF. Алынған аннотация стратегиясына байланысты (төмендегі суретті қараңыз), кіріс және шығыс файлдары әр түрлі болады. Бағдарламаға сәйкес параметрді беру арқылы белгілі бір кіріс файлы берілген шығыс файлдарының түрлерін конфигурациялауға болады.

Мысалы, үшін table_annovar.pl бағдарлама, егер кіріс файлы VCF болса, онда шығыс VCF файлы болады. Егер кіріс файлы ANNOVAR кіріс форматында болса, онда шығыс әдепкі бойынша TSV болады, егер CSV-ге шығару мүмкіндігі болса -қатысу параметр көрсетілген. Шығарылатын файл түрі ретінде CSV немесе TSV таңдау арқылы пайдаланушы аннотацияларды қарау үшін файлдарды аша алады Excel немесе басқа кестелік бағдарламалық жасақтама. Бұл қолданушылар арасында танымал функция.

Шығару файлында бастапқы анализден алынған барлық мәліметтер қажет аннотацияға арналған қосымша бағандардан тұрады. Мысалы, (1) геномдық функция және (2) кодтау нұсқасының функционалды рөлі сияқты сипаттамалары бар нұсқаларға түсініктеме берген кезде, шығыс файлында кіріс файлы барлық бағандар болады, одан кейін «genomic_function» қосымша бағандары болады (мысалы, мәндермен) «exonic» немесе «intronic») және «coding_variant_function» (мысалы, «синонимді SNV» немесе «синонимдік емес SNV» мәндерімен).

ANNOVAR бағдарламасының негізгі жұмыс процестері

Жүйенің тиімділігі

Қазіргі заманғы жұмыс үстелі компьютерінде (3GHz Intel Xeon процессоры, 8 Гбайт жады) эталондық көрсеткіш, 4,7 миллион нұсқаға арналған, ANNOVAR гендерге негізделген функционалды аннотация жасау үшін ~ 4 минут немесе сатылы «нұсқаларды азайту» үшін ~ 15 минут уақытты қажет етеді. Тәулігіне жүздеген адам геномында вариант аннотациясы мен вариантты басымдылықты жүзеге асыруға ыңғайлы дейді.[2]

ANNOVAR жылдамдығын - жіп мүмкіндік беретін аргумент көп бұрандалы енгізу файлдары параллель өңделуі үшін.

Деректер қорлары

ANNOVAR-ны нұсқалардың функционалды аннотациясы үшін пайдалану үшін аннотациялық мәліметтер жиынтығын жүктеп алуға болады annotate_variation.pl оларды жергілікті дискіге сақтайтын сценарий.[1] Аннотацияның үш негізгі түрі үшін әртүрлі аннотация дерек көздері қолданылады (генге негізделген, аймақтық және сүзгіге негізделген).

Әрбір аннотация түріне арналған деректер көздерінің кейбіреулері:

Гендерге негізделген аннотация

[9]

Аймақтық аннотация

  • ҚОЙЫҢЫЗ
  • GFF3 (Generic Feature Format 3 нұсқасы) сәйкес келетін тапсырыс бойынша жасалған мәліметтер базасы

[11]

Сүзгіге негізделген аннотация

1000 геном жобасыLRTClinVar
dbSNPMutationTasterCADD
avSNPGERP ++ДАНН
dbNSFPExACCOSMIC
SIFTESP (Exome Sequencing Project)ICGC
PolyPhen 2gnomAD аллель жиілігіNCI60
ФилоПТолық Genomics аллель жиілігі

Сүзгіге негізделген аннотацияға арналған деректер көздерінің көптігін ескере отырып, деректер жиынтығының ішкі жиынтықтарын бірнеше ең көп қолданылатын жағдайларда қолдануға болатын мысалдар келтірілген.[14]

  1. Варианттардың жиілігі үшін бүкіл экзома деректер:[14]
    1. ExAC: барлық этникалық топтарға арналған аллельді жиіліктермен
    2. NHLBI-ESP: 6500 кірістен үш топтастыруды қолданыңыз
    3. gnomAD аллель жиілігі: бірнеше популяцияға арналған аллель жиіліктерімен
  2. Аурудың ерекше нұсқалары үшін:[14]
    1. ClinVar: әр нұсқа үшін әр ClinVar өрісі үшін жеке бағандары бар
    2. COSMIC: қатерлі ісіктерден болатын соматикалық мутациялар және қатерлі ісіктің әр типінде пайда болу жиілігі
    3. ICGC: Халықаралық қатерлі ісік геномы консорциумының мутациясы
    4. NCI-60: адамның ісік жасушалары панелінің экзомасы, аллель жиілігі туралы мәліметтер

[14]

Мысал қолдану

Сирек кездесетін аурудың мутациясын анықтауға арналған ANNOVAR қосымшасына кең шолу

Сирек кездесетін генетикалық аурудағы мутацияны анықтау үшін генетикалық нұсқаларға басымдық беру үшін ANNOVAR қолдану

ANNOVAR - сирек кездесетін генетикалық аурулардың кандидатты және себепті мутациясы мен генін анықтауға арналған жалпы аннотация құралдарының бірі.

Генге негізделген және фильтрге негізделген аннотацияның, содан кейін нұсқалардың аннотациялық мәндеріне негізделген вариантты төмендетудің тіркесімін қолдану арқылы Миллер синдромы деп аталатын сирек кездесетін рецессивті менделия ауруындағы себептік генді анықтауға болады.[1]

Бұл ~ 4,2 миллион бір нуклеотидтік нұсқалардан тұратын геномдық деректер жиынтығын синтездеуді қажет етеді (SNV)) және ~ 0,5 миллион енгізу және жою (индельдер ).[1]. Екі белгілі себептік мутация Миллер синдромы (G152R және G202A DHODH ген) де енгізілген[1]

ANNOVAR көмегімен аурудың себеп-салдарлық нұсқаларын анықтау қадамдары:[1]

  1. SNV және. Тіркесімінің экзоникалық / сплайсингтік нұсқаларын анықтайтын гендік аннотация индельдер (~ 4,7 млн ​​нұсқа), мұнда барлығы 24617 экзоникалық нұсқа анықталған.[1]
  2. Миллер синдромы сирек кездесетін менделік ауру болғандықтан, ақуыздың экзоникалық өзгеретін нұсқалары тек қызығушылық тудырады, бұл 11166 құрайды.[1] Осыдан жоғары сақталған геномдық аймақтарға жататын 4860 нұсқа анықталды[1]
  3. Сияқты жалпыға қол жетімді мәліметтер қоры ретінде dbSNP және 1000 геном жобасы мұрағатта жиі кездесетін нұсқалар, оларда сирек кездесетін Миллер синдромының себеп-салдарлық нұсқалары болуы ықтималдығы аз.[1] Демек, осы деректер көздерінде кездесетін нұсқалар сүзгіден өткізіліп, 413 нұсқа қалады.
  4. Содан кейін гендер көптеген гендер бір генде бар-жоғы үшін бағаланады қосылыс гетерозиготалар және 23 ген қалды.[1]
  5. Ақырында, «таратылатын» гендер жойылады, олардың жиілігі жоғары сезімсіз мутациялар (пәндердің 1% -дан астамында 1000 геном жобасы ) сезімтал реттілік және қысқа оқылатын ретке келтіру платформасындағы туралау қателіктері.[1] Бұл гендер сирек кездесетін себептер болып саналмайды Менделия ауруы. Нәтижесінде үш ген сүзіледі, ал себепті генді қосқанда 20 кандидат қалады DHODH[1]

ANNOVAR шектеулері

ANNOVAR-дің екі шектеуі кең таралған ауруларды анықтауға және құрылымдық вариантты аннотацияға қатысты. Бұл проблемалар қазіргі кездегі барлық аннотация құралдарында бар.

Қант диабеті және Альцгеймер сияқты ең көп таралған аурулар геном бойынша популяцияда кездесетін бірнеше нұсқаларға ие.[15][16] Бұл варианттарда жекелеген зиянды баллдар көп болады және көптеген нұсқалардың жинақталуына қарамастан ауру тудырады деп күтілуде. Алайда ANNOVAR-да сирек кездесетін және жоғары болжамды зиянды нұсқалардың кішігірім тізімін беретін әдепкі «вариантты қысқарту» схемалары бар.[17] Бұл әдепкі параметрлер оңтайландырылуы мүмкін, сондықтан шығыс деректері болжамды зиянды ұпайлардың төмендеуімен қосымша нұсқаларды көрсетеді.[2] ANNOVAR ең алдымен сирек кездесетін аурулардың варианттарын анықтау үшін қолданылады, мұнда себепті мутация сирек кездеседі және өте зиянды болады.

Үлкенірек құрылымдық нұсқалар (SV) хромосомалық инверсия, транслокация және күрделі SV сияқты гемофилия А және Альцгеймер сияқты ауруларды тудыратыны дәлелденді.[18][19] Алайда, SV-ді аннотациялау қиынға соғады, өйткені үлкен мутацияланған геномдық аймақтарға нақты зиянды ұпайларды қою қиын. Қазіргі уақытта ANNOVAR тек жойылған немесе қайталанатын гендерде немесе <50bp / мин индекстерінде түсініктеме бере алады. ANNOVAR күрделі SV және транслокация жасай алмайды[17]

Баламалы аннотация құралдары

SNP аннотация құралдарының ANNOVAR-ға ұқсас тағы екі түрі бар: SNP эффектісі (SnpEFF ) және Variant Effect Predict (VEP). ANNOVAR, SnpEFF және VEP арасындағы көптеген мүмкіндіктер бірдей, енгізу және шығару файлының форматы, реттеуші аймақ аннотациясы және вариант аннотациясын білу. Алайда, негізгі айырмашылықтар: ANNOVAR функциялардың болжамын жоғалтуына түсініктеме бере алмайды, ал SnpEFF де, VEP де мүмкін. Сондай-ақ, ANNOVAR түсініктеме бере алмайды микроРНҚ құрылымдық байланыстыру орындары, ал VEP мүмкін.[20] МикроРНҚ байланыстыратын орналасу болжамдары ашуда ақпараттық болуы мүмкін транскрипциялық мутацияның патогенездегі рөлі.[21] Функцияны жоғалту мутациялар - бұл гендік өнімнің жалпы дисфункциясына әкелетін геномдағы өзгерістер. Осылайша, бұл болжамдар ауруды диагностикалауға, әсіресе сирек кездесетін моногендік ауруларға қатысты өте ақпараттылық болуы мүмкін.[дәйексөз қажет ]

Үш вариантты аннотация құралын салыстыру
СыныпЕрекшелікVEPАнноварSnpEff
ЖалпыҚол жетімділікТегінТегін (тек академиялық мақсатта)Тегін
КірісVCFИәИәИә
Тізбектің нұсқаларыИәИәИә
Құрылымдық нұсқаларыИәИәИә
ШығуVCFИәИәИә
Транскрипт жиынтығыАнсамбльИәИәИә
RefSeqИәИәИә
Пайдаланушы жасаған мәліметтер базасыИәИәИә
ИнтерфейстерЖергілікті пакетИәИәИә
Жедел болжау веб-интерфейсіИәЖоқЖоқ
Салдардың түрлеріБолжамдарды біріктіруИә (плагиндер арқылы)Иә (сыртқы деректер арқылы)Иә (тәжірибелік)
Функцияны болжаудың жоғалуыИә (плагиндер арқылы)ЖоқИә
КодтамауРеттеу ерекшеліктеріИәИәИә
Бірнеше ұяшық сызықтарын қолдауИәЖоқИә
miRNA құрылымының орналасуыИә (плагиндер арқылы)ЖоқЖоқ
Белгілі нұсқаларБелгілі нұсқалар туралы есеп беруИәИәИә
Жиілік бойынша сүзгіден өткізіңізИәИәИә
Клиникалық маңызыИәИәИә
Басқа сүзгілерАлдын ала орнатылған сүзгілерИәИәИә

* McLaren және басқалардан алынған кесте. (2016).

Әдебиеттер тізімі

  1. ^ а б в г. e f ж сағ мен j к л м n o б Хаконарсон, Хакон; Ли, Миняо; Ванг, Кай (2010-09-01). «ANNOVAR: генетикалық варианттардың функционалды аннотациясы, өнімділігі жоғары реттіліктің деректері». Нуклеин қышқылдарын зерттеу. 38 (16): e164. дои:10.1093 / nar / gkq603. ISSN  0305-1048. PMC  2938201. PMID  20601685.
  2. ^ а б в г. e f ж сағ мен j к л «ANNOVAR веб-сайты». www.openbioinformatics.org. Алынған 2019-02-28.
  3. ^ «ДНҚ-ны реттеуге кететін шығындар: мәліметтер». Ұлттық геномды зерттеу институты (NHGRI). Алынған 2019-04-04.
  4. ^ Эмерсон, Райан О .; Шервуд, Анна М .; Ридер, Марк Дж.; Гентхоер, Джейми; Уильямсон, Дэвид В .; Карлсон, Кристофер С .; Дрешер, Чарльз В. Тевари, Мунеш; Билас, Джейсон Х. (желтоқсан 2013). «Т-жасушалық рецепторлардың жоғары өткізгіштік тізбегі аналық без қатерлі ісігіндегі инфильтратты лимфоциттердің біртекті репертуарын анықтайды». Патология журналы. 231 (4): 433–440. дои:10.1002 / жол.460. ISSN  0022-3417. PMC  5012191. PMID  24027095.
  5. ^ Блейни, Джейн К .; Паркс, Айлин; Чжэн, Хуиру; Таггарт, Лаура; Браун, Фиона; Хаберланд, Валерия; Lightbody, Gaye (2018). «Дербестендірілген медицинада жоғары өткізу қабілеттілігін қолдану: шолу мен клиникалық қолданудағы болашақ прогрестің тосқауылдары мен жеңілдетушілері». Биоинформатика бойынша брифингтер. дои:10.1093 / bib / bby051. PMID  30084865.
  6. ^ Анықтама, генетика үйі. «Экзоманың тұтас тізбегі және геномның тұтас тізбегі деген не?». Генетика туралы анықтама. Алынған 2019-04-04.
  7. ^ Анықтама, генетика үйі. «Жалпы геномды ассоциацияны зерттеу дегеніміз не?». Генетика туралы анықтама. Алынған 2019-04-04.
  8. ^ 1000 геном жобасының консорциумы (2015 ж. Қазан). «Адамның генетикалық вариациясының ғаламдық анықтамасы». Табиғат. 526 (7571): 68–74. Бибкод:2015 ж. 526 ... 68Т. дои:10.1038 / табиғат 15393. ISSN  1476-4687. PMC  4750478. PMID  26432245.
  9. ^ а б «Гендерге негізделген аннотация - ANNOVAR құжаттамасы». annovar.openbioinformatics.org. Алынған 2019-02-28.
  10. ^ Янг, Хуй; Ванг, Кай (қазан 2015). «ANNOVAR және wANNOVAR-мен геномдық нұсқаға аннотация және басымдық беру». Табиғат хаттамалары. 10 (10): 1556–1566. дои:10.1038 / nprot.2015.105 ж. ISSN  1754-2189. PMC  4718734. PMID  26379229.
  11. ^ а б «Аймақтық аннотация - ANNOVAR құжаттамасы». annovar.openbioinformatics.org. Алынған 2019-02-28.
  12. ^ Иордания, I. Король; Рогозин, Игорь Б .; Қасқыр, Юрий I .; Коонин, Евгений В. (маусым 2002). «Бактериядағы маңызды емес гендерден гөрі маңызды гендер эволюциялық сақталады». Геномды зерттеу. 12 (6): 962–968. дои:10.1101 / гр.87702. ISSN  1088-9051. PMC  1383730. PMID  12045149.
  13. ^ Анықтама, генетика үйі. «Кодталмаған ДНҚ дегеніміз не?». Генетика туралы анықтама. Алынған 2019-03-01.
  14. ^ а б в г. e «Сүзгіге негізделген аннотация - ANNOVAR құжаттамасы». annovar.openbioinformatics.org. Алынған 2019-02-28.
  15. ^ Ву, Йиминг; Джинг, Руню; Донг, Юнчэн; Куанг, Цифан; Ли, Ян; Хуанг, Цзянь; Ган, Вэй; Сюэ, Юэ; Ли, Йиджоу (2017-03-06). «Алпыс бес типті-2 диабет қаупі бар SNP-дің функционалды аннотациясы және оны қауіпті болжауда қолдану». Ғылыми баяндамалар. 7: 43709. Бибкод:2017 Натрия ... 743709W. дои:10.1038 / srep43709. ISSN  2045-2322. PMC  5337961. PMID  28262806.
  16. ^ Эмахазион, Т .; Фейк, Л .; Джобс, М .; Сойер, С.Л .; Фредман, Д .; Сент-Клэр, Д .; Ханзада, Дж. А .; Брукс, Дж. (Шілде 2001). «Альцгеймер ауруы бойынша SNP қауымдастығының зерттеулері ауруды кешенді талдау проблемаларын көрсетеді». Генетика тенденциялары. 17 (7): 407–413. дои:10.1016 / S0168-9525 (01) 02342-3. ISSN  0168-9525. PMID  11418222.
  17. ^ а б Янг, Хуй; Ванг, Кай (қазан 2015). «ANNOVAR және wANNOVAR-мен геномдық нұсқаға аннотация және басымдық беру». Табиғат хаттамалары. 10 (10): 1556–1566. дои:10.1038 / nprot.2015.105 ж. ISSN  1754-2189. PMC  4718734. PMID  26379229.
  18. ^ Лакич, Делия; Казазян, Хейг Х .; Антонаракис, Стилианос Е .; Гитчьер, Джейн (қараша 1993). «VIII фактор генін бұзатын инверсиялар ауыр гемофилияның А себебі болып табылады». Табиғат генетикасы. 5 (3): 236–241. дои:10.1038 / ng1193-236. ISSN  1061-4036. PMID  8275087.
  19. ^ Лупски, Джеймс Р. (маусым 2015). «Адам геномының құрылымдық өзгерісі мутагенезі: ауру мен эволюцияға әсері». Экологиялық және молекулалық мутагенез. 56 (5): 419–436. дои:10.1002 / эм.21943. ISSN  0893-6692. PMC  4609214. PMID  25892534.
  20. ^ Макларен, Уильям; Гил, Лоран; Хант, Сара Е .; Риат, Харприт Сингх; Ричи, Грэм Р. С .; Торман, Анья; Фликек, Пауыл; Каннингэм, Фиона (2016-06-06). «Ансамбльдің вариантты эффектін болжаушы». Геном биологиясы. 17 (1): 122. дои:10.1186 / s13059-016-0974-4. ISSN  1474-760X. PMC  4893825. PMID  27268795.
  21. ^ Цзян Q, Ван Y, Хао Y, Хуан Л, Тенг M, Чжан X, Ли М, Ван Г, Лю Ю (қаңтар 2009). «miR2Disease: адам ауруы кезінде микроРНҚ-ны реттеуге арналған қолмен жасалған мәліметтер базасы». Нуклеин қышқылдарын зерттеу. 37. 37 (Деректер базасы мәселесі): D98–104. дои:10.1093 / nar / gkn714. PMC  2686559. PMID  18927107.