Сілтеме шірік - Link rot

Сілтеме шірік (деп те аталады өліммен байланыстыру, сілтемені бұзу, немесе сілтілік шірік) құбылысы болып табылады сілтемелер уақыт өте келе олардың бастапқы мақсатты нұсқауын тоқтату файл, веб парақ, немесе сервер ресурстардың көшірілуіне немесе біржола қол жетімсіз болуына байланысты. Енді мақсатты көрсетпейтін сілтеме, көбінесе а деп аталады сынған немесе өлі сілтеме, нақты формасы болып табылады ілулі көрсеткіш.

Сілтемелердің шіріп кету жылдамдығы Интернеттің ақпаратты сақтау қабілетіне маңыздылығына байланысты зерттеу мен зерттеудің тақырыбы болып табылады. Бұл жылдамдықтың бағалары зерттеулер арасында күрт өзгереді.

Таралуы

Бірқатар зерттеулер сілтеме шірігінің таралуын зерттеді Дүниежүзілік өрмек, қолданатын академиялық әдебиеттерде URL мекенжайлары ішіндегі веб-мазмұнға сілтеме жасау сандық кітапханалар.[1][2]

2003 жылғы зерттеу Интернетте әр апта сайын 200-ден бір сілтеме,[3] ұсыну Жартылай ыдырау мерзімі 138 аптаның ішінде Бұл мөлшерлеме негізінен 2016–2017 жылдардағы сілтемелерді зерттеу арқылы расталды Yahoo! Анықтамалық (21 жыл дамығаннан кейін 2014 жылы жаңартуды тоқтатқан), бұл анықтамалықтың сілтемелерінің жартылай шығарылу кезеңін екі жыл деп тапты.[4]

2004 жылғы зерттеу көрсеткендей, веб-сілтемелердің ішкі жиынтықтары (мысалы, белгілі бір файл түрлеріне бағытталған немесе академиялық мекеме орналастыратын) жартылай шығарылу кезеңінен әр түрлі болуы мүмкін.[5] Жариялауға таңдалған URL мекенжайлары орташа URL-ге қарағанда ұзақ өмір сүретін көрінеді. Веблоктың 2015 жылғы зерттеуі үш негізгі ашық баспагерлердің толық мәтінді корпорацияларындағы сілтемелерден 180 000-нан астам сілтемелерді талдады және жартылай шығарылу кезеңін 14 жылға жуықтады,[6] жартысын құрайтынын анықтаған 2005 жылғы зерттеуді негізінен растайды URL мекенжайлары келтірілген D-Lib журналы мақалалар жарияланғаннан кейін 10 жылдан кейін белсенді болды.[7] Басқа зерттеулер академиялық әдебиеттерде сілтеме шіріуінің жоғары қарқынын анықтады, бірақ әдетте жартылай шығарылу кезеңі төрт жыл немесе одан да жоғары.[8][9] 2013 оқу BMC Биоинформатика Thomson Reuters's конспектілеріндегі 15000-ға жуық сілтемелерді талдады Web of Science сілтеме индексі және веб-парақтардың орташа өмір сүру ұзақтығы 9,3 жыл екенін анықтады және 62% -ы ғана мұрағатталды.[10]

2002 жылы жүргізілген зерттеуде сандық кітапханалардағы байланыстың шіруі Интернеттегіден гөрі баяу болып, объектілердің шамамен 3% -ы бір жылдан кейін қол жетімді болмайтынын анықтады.[11] (шамамен 23 жылдық жартылай шығарылу кезеңіне тең).

Себептері

Сілтеменің шіруі бірнеше рет пайда болуы мүмкін. Мақсатты веб-парақ жойылуы мүмкін. Мақсатты бетті орналастыратын сервер сәтсіздікке ұшырауы, қызметтен алынып тасталуы немесе жаңасына ауысуы мүмкін домен атауы. Домендік атауды тіркеу тоқтатылуы немесе басқа жаққа берілуі мүмкін. Кейбір себептер сілтеменің қатені қайтару кезінде мақсатты таба алмауына әкеледі HTTP 404. Басқа себептер сілтеме авторының көздегенінен басқа мақсатты мазмұнға сілтеме тудырады.

Сілтемелердің бұзылуының басқа себептеріне мыналар жатады:

  • URL мекенжайларының өзгеруіне әкелетін веб-сайттарды қайта құрылымдау domain.net/pine_tree көшірілуі мүмкін domain.net/tree/pine)
  • бұрын тегін мазмұнды артқа көшіру а төлем тақтасы
  • сияқты кодқа әкелетін сервер архитектурасындағы өзгеріс PHP басқаша жұмыс істейді
  • дизайны бойынша өзгеретін іздеу нәтижелері сияқты динамикалық бет мазмұны
  • сілтеме ішінде пайдаланушыға арналған ақпараттың болуы (мысалы, кіру аты)
  • қасақана бұғаттау мазмұн сүзгілері немесе брандмауэрлер
  • жою gTLD[12]

Алдын алу және анықтау

Сілтемелердің шіріп кетуіне жол бермеу стратегиялары мазмұнды оның сақталу ықтималдығы жоғарырақ орналастыруға, бұзылу ықтималдығы аз сілтемелерді құруға, бар сілтемелерді сақтауға шаралар қабылдауға немесе мақсаттары басқа жерге ауыстырылған немесе жойылған сілтемелерді жөндеуге бағытталуы мүмкін.

Уақыт өзгермейтін URL мекенжайларын құру сілтемелердің шірімеуінің алдын-алудың негізгі әдісі болып табылады. Профилактикалық жоспарлауды басқарды Тим Бернерс-Ли және басқа веб-ізашарлар.[13]

Сілтемелердің авторлығына қатысты стратегияларға мыналар жатады:

Қолданыстағы сілтемелерді қорғауға қатысты стратегияларға мыналар кіреді:

  • қолдану қайта бағыттау сияқты механизмдер HTTP 301 браузерлер мен тексеріп шығушыларды қоныс аударылған мазмұнға автоматты түрде жіберу үшін
  • қолдану мазмұнды басқару жүйелері сол сайттағы мазмұн ауыстырылған кезде сілтемелерді автоматты түрде жаңарта алатын немесе сілтемелерді канондық URL мекенжайларымен автоматты түрде алмастыратын[20]
  • іздеу ресурстарын біріктіру HTTP 404 беттер[21]

Сынған сілтемелерді анықтау қолмен немесе автоматты түрде жасалуы мүмкін. Автоматтандырылған әдістерге жатады плагиндер үшін мазмұнды басқару жүйелері сияқты сынған сілтемелер сияқты дербес Ксенудың сілтеме ақиқаты. Автоматты тексеру а қайтаратын сілтемелерді анықтамауы мүмкін 404 немесе қайтаратын сілтемелер 200 жарайды жауап, бірақ өзгерген мазмұнды көрсетіңіз.[22]

Сондай-ақ қараңыз

Әрі қарай оқу

  • Марквелл, Джон; Брукс, Дэвид В. (2002). «Сынған сілтемелер: білім берудің уақытша сипаты WWW гипер сілтемелері». Science Science and Technology журналы. 11 (2): 105–108. дои:10.1023 / A: 1014627511641.
  • Гомес, Даниел; Силва, Марио Дж. (2006). «Интернеттегі ақпараттық тұрақтылықты модельдеу» (PDF). Веб-инженерия бойынша 6-шы халықаралық конференция материалдары. ICWE'06. Архивтелген түпнұсқа (PDF) 2011-07-16. Алынған 14 қыркүйек 2010.
  • Деллавалле, Роберт П .; Хестер, Эрик Дж.; Хайлиг, Лорен Ф .; Дрейк, Аманда Л. Кунцман, Джефф В .; Грейбер, Марла; Шиллинг, Лиза М. (2003). «Бару, бару, кету: жоғалған интернет сілтемелері». Ғылым. 302 (5646): 787–788. дои:10.1126 / ғылым.1088234. PMID  14593153.
  • Келер, Уоллес (1999). «Веб-парақ пен веб-сайттың тұрақтылығы мен тұрақтылығын талдау». Американдық ақпараттық ғылымдар қоғамының журналы. 50 (2): 162–180. дои:10.1002 / (SICI) 1097-4571 (1999) 50: 2 <162 :: AID-ASI7> 3.0.CO; 2-B.
  • Sellitto, Carmine (2005). «Интернетке тұрақты сілтемелердің әсері: 123 ғылыми конференция жарияланымдарын зерттеу» (PDF). Американдық ақпараттық ғылымдар және технологиялар қоғамының журналы. 56 (7): 695–703. CiteSeerX  10.1.1.473.2732. дои:10.1002 / ази.20159.

Ескертпелер мен сілтемелер

Ескертулер
  1. ^ Сақтау жүйелері сервистік үзілістерге ұшырауы мүмкін, сондықтан сақталған URL мекенжайлары үзік-үзік қол жетімді болмауы мүмкін.[15]
Әдебиеттер тізімі
  1. ^ Хабибзаде, П. (2013). «Жалпы медициналық журналдарда жарияланған мақалалардағы веб-сайттарға сілтемелердің ыдырауы: Мейнстрим және кіші журналдар». Қолданбалы клиникалық информатика. 4 (4): 455–464. дои:10.4338 / aci-2013-07-ra-0055. PMC  3885908. PMID  24454575.
  2. ^ «Hiberlink». Hiberlink.org. Мұрағатталды түпнұсқадан 2015 жылғы 29 қаңтарда. Алынған 15 қаңтар 2015.
  3. ^ Фетлерли, Деннис; Манассе, Марк; Найорк, Марк; Винер, Джанет (2003). «Веб-беттер эволюциясын кең ауқымды зерттеу». Дүниежүзілік желідегі 12-ші халықаралық конференция материалдары. Алынған 14 қыркүйек 2010.
  4. ^ ван дер Граф, Ганс. «Сілтеменің жартылай шығарылу кезеңі - екі жыл». ZOMDir блогы. Мұрағатталды 2017-10-17 аралығында түпнұсқадан. Алынған 2019-01-31.
  5. ^ Кёлер, Уоллес (2004). «Веб-парақтарды бойлық зерттеу жалғасты: құжаттың табандылығын қарастыру». Ақпараттық зерттеулер. 9 (2). Мұрағатталды түпнұсқасынан 2017-09-11. Алынған 2019-01-31.
  6. ^ «Барлық уақытта веб-блок туралы есеп». Тамыз 2015. мұрағатталған түпнұсқа 2016 жылғы 4 наурызда. Алынған 12 қаңтар 2016.
  7. ^ а б МакКоун, Фрэнк; Чан, Шеффан; Нельсон, Майкл Л .; Боллен, Йохан (2005). «D-Lib журналындағы веб-сілтемелердің қол жетімділігі және тұрақтылығы» (PDF). 5-ші веб-архивтеу және цифрлық сақтау бойынша халықаралық семинардың материалдары (IWAW'05). Архивтелген түпнұсқа (PDF) 2012-07-17. Алынған 2005-10-12.
  8. ^ Шпинеллис, Диомидис (2003). «Веб-сілтемелердің ыдырауы және сәтсіздіктері». ACM байланысы. 46 (1): 71–77. CiteSeerX  10.1.1.12.9599. дои:10.1145/602421.602422.
  9. ^ Лоуренс, Стив; Пеннок, Дэвид М .; Флейк, Гари Уильям; Кровец, Роберт; Коцзи, Франс М .; Гловер, Эрик; Нильсен, Финн Аруп; Крюгер, Андрис; Джайлс, C. Ли (2001). «Ғылыми зерттеулердегі веб-сілтемелердің табандылығы». Компьютер. 34 (2): 26–31. CiteSeerX  10.1.1.97.9695. дои:10.1109/2.901164.
  10. ^ Хеннесси, Джейсон; Xijin Ge, Steven (2013). «Сілтемелердің ыдырауын және оларды азайту әдістерінің тиімділігін кросс-тәртіптік зерттеу». BMC Биоинформатика. 14: S5. дои:10.1186 / 1471-2105-14-S14-S5. PMC  3851533. PMID  24266891.
  11. ^ Нельсон, Майкл Л .; Аллен, Б.Данетт (2002). «Сандық кітапханалардағы табандылық және қол жетімділік». D-Lib журналы. 8 (1). дои:10.1045 / 2002 ж. Қаңтар-нельсон.
  12. ^ «TLD өлімі». blog.benjojo.co.uk. Мұрағатталды түпнұсқасынан 2018-07-26. Алынған 2018-07-27.
  13. ^ Бернерс-Ли, Тим (1998). «Керемет URI өзгермейді». Мұрағатталды түпнұсқасынан 2000-03-02 ж. Алынған 2019-01-31.
  14. ^ а б Килл, Лейтон Уолтер (8 қараша 2014). «Интернеттің өсіп келе жатқан проблемасы» «Rot Rot» және бұқаралық ақпарат құралдары мен интернет-баспагерлерге арналған үздік тәжірибелер ». Журналистің ресурсы, Гарвард Кеннеди мектебі. Мұрағатталды түпнұсқадан 2015 жылғы 12 қаңтарда. Алынған 16 қаңтар 2015.
  15. ^ Хабибзаде, Пархам (2015-07-30). «Қазіргі архивтеу жүйелері жеткілікті сенімді ме?». Халықаралық урогинекология журналы. 26 (10): 1553. дои:10.1007 / s00192-015-2805-7. ISSN  0937-3462. PMID  26224384.
  16. ^ «Интернет-архив: ақысыз кітаптар, фильмдер, музыка және Wayback машиналарының сандық кітапханасы». 2001-03-10. Мұрағатталды түпнұсқадан 1997 жылғы 26 қаңтарда. Алынған 7 қазан 2013.
  17. ^ Эйзенбах, Гюнтер; Трудель, Матье (2005). «Бару, бару, әлі де бар: сілтеме жасалған веб-парақтарды тұрақты мұрағаттау үшін WebCite қызметін пайдалану». Медициналық Интернетті зерттеу журналы. 7 (5): e60. дои:10.2196 / jmir.7.5.e60. PMC  1550686. PMID  16403724.
  18. ^ Зиттрейн, Джонатан; Альберт, Кендра; Лессиг, Лоуренс (12 маусым 2014 ж.). «Перма: заңды сілтемелердегі сілтеме мен анықтамалық шірік мәселесін шешу және шешу» (PDF). Құқықтық ақпаратты басқару. 14 (2): 88–99. дои:10.1017 / S1472669614000255.
  19. ^ «Гарвард Университетінің Беркман Орталығы Интернетті қолдауға көмектесетін блогерлер мен веб-сайт иелеріне арналған» Өзара көмек «құралы - Эмберді шығарды | Беркман орталығы». кибер.құқық.гарвард.еду. Мұрағатталды түпнұсқасынан 2016-02-02. Алынған 2016-01-28.
  20. ^ Рон-Дженсен, Джеспер (2007-10-05). «Бағдарламалық жасақтама пайдаланушының қателіктерін және Linkrotты жояды». Justaddwater.dk. Мұрағатталды түпнұсқадан 2007 жылғы 11 қазанда. Алынған 5 қазан 2007.
  21. ^ Мюллер, Джон (2007-12-14). «Google құралдар тақтасындағы соңғы мүмкіндіктер». Google Webmaster орталық блогы. Мұрағатталды түпнұсқадан 2008 жылғы 13 қыркүйекте. Алынған 9 шілде 2008.
  22. ^ Бар-Йосеф, Зив; Бродер, Андрей З .; Кумар, Рави; Томкинс, Эндрю (2004). «Sic transit gloria telae: Интернеттің ыдырауын түсінуге қарай». WWW '04 - бүкіләлемдік желідегі 13-ші халықаралық конференция материалдары. 328–337 бб. CiteSeerX  10.1.1.1.9406. дои:10.1145/988672.988716. ISBN  978-1581138443.

Сыртқы сілтемелер