Knowledge Base Wiki

Search for LIMS content across all our Wiki Knowledge Bases.

Type a search term to find related articles by LIMS subject matter experts gathered from the most trusted and dynamic collaboration tools in the laboratory informatics industry.

Wayback Machine
Выява лагатыпа
Стартавая старонка партала
Стартавая старонка партала
URL web.archive.org/
Тып сайта [d]
Мова(-ы) англійская
Мова праграмавання Java, Python
Уладальнік Архіў Інтэрнэту
Пачатак працы 24 кастрычніка 2001
Рэйтынг Alexa 173[1]
Лагатып Вікісховішча Медыяфайлы на Вікісховішчы

Wayback Machine (з англ. — «Машына часу») — бясплатны анлайн-архіў некамерцыйнай бібліятэкі «Архіў Інтэрнэту». З дапамогай пошукавых робатаў «Wayback Machine» архівуе і робіць агульнадаступнай большую частку «адкрытага» інтэрнэту[2].

Сэрвіс быў запушчаны ў 1996 годзе, аднак стаў даступны для грамадскасці толькі ў 2001 годзе.

За першыя 20 гадоў існавання Wayback Machine каталагізаваў і захаваў калекцыю з больш як 286 млрд вэб-старонак. Архіўныя здымкі адлюстроўваюцца ў фармаце HTML, JavaScript і CSS[3]. Дзякуючы захаваным у Wayback Machine дакументам карыстальнікі могуць адсочваць змены, якія адбываюцца на сайтах, і параўноўваць розныя версіі правак[4]. Станам на студзень 2023 года Wayback Machine дае доступ да больш як 767 мільярдаў захаваных вэб-старонак[5].

Стварэнне

Серверы «Архіва Інтэрнэту», 2008 год
Брустэр Кейл у 2009 годзе

У 1989 годзе англійскі навуковец Цім Бернерс-Лі стварыў сусветнае павуцінне — сістэму, якая дазваляе перадаваць даныя праз падключаныя да інтэрнэту камп’ютары. Аднак з распаўсюджваннем сусветнага павуціння былі выяўлены дзве асноўныя праблемы. Першая складалася ў недахопе месца для захоўвання ўсіх даных, праз што многія дакументы і вэб-старонкі выдаляліся. Іншая праблема складалася ў тым, што пасля рэдагавання вэб-старонкі (напрыклад, з юрыдычных прычын) карыстальнікі не маглі паглядзець яе першапачатковую версію. Вырашыць гэтыя недахопы імкнулася амерыканская лічбавая бібліятэка «Архіў Інтэрнэту» — некамерцыйная арганізацыя, створаная праграмістамі Брустэрам Кейлам і Брусам Галіятам[en] у 1996 годзе. Пры супрацоўніцтве з Alexa Internet (даччынай кампаніяй Amazon, якая займаецца вэб-індэксаваннем). «Архіў» ініцыяваў стварэнне і захоўванне копій існых сайтаў для развіцця «ўніверсальнага доступу да ведаў». Арганізацыя давала бясплатны публічны доступ да алічбаваных матэрыялаў, такіх як вэб-старонкі, кнігі, аўдыёзапісы, уключаючы жывыя канцэрты, відэа, выявы і праграмнае забеспячэнне. На 2021 год штаб-кватэра «Архіва Інтэрнэту» знаходзіцца ў Сан-Францыска, у будынку былой хрысціянскай царквы, размешчанай у раёне Рычманд. Журналіст мясцовай радыёстанцыі Kawl[en] у 2019 годзе параўноўваў офіс «Архіва» з рымскім храмам[6][7][8]. Арганізацыя ставіць сабе за мэту выратаваць інтэрнэт ад знікнення[9].

«Wayback Machine» стаў самым вядомым праектам «Архіва». Анлайн-сэрвіс быў названы ў гонар машыны часу з мультсерыяла 1960-х гадоў «Шоу Рокі і Булвінкля». Ён дае доступ да лічбавай калекцыі з больш як 550 млрд вэб-старонак[4][10][11]. Праект Wayback Machine быў задуманы як рашэнне праблемы памылкі 404, якая азначае, што сервер не можа знайсці даныя па запытаным адрасе. Гэта звязана з так званым выміраннем спасылак — нарастаючай недаступнасцю некалі апублікаваных даных. Так, у 1997 годзе сярэдняя працягласць жыцця вэб-старонкі складала 44 дня. У 2003 годзе гэты паказчык склаў 100 дзён.

Праведзены ў 2008 годзе аналіз спасылак на 2700 лічбавых рэсурсах, большасць з якіх не мае друкаваных аналагаў, паказаў, што каля 8 працэнтаў спасылак пераставалі працаваць праз год. Да 2011 года, то бок праз тры гады, 30 працэнтаў спасылак у калекцыі былі непрацуючымі[12]. Дзякуючы інтэграцыі з Alexa, карыстальнік, які сутыкнуўся з паведамленнем пра памылку, мог атрымаць доступ да заархіваванай версіі старонкі праз укаранёную ў браўзер панэль інструментаў. Калі копія недаступнай старонкі прысутнічала ў базе даных Wayback Machine, то загаралася спецыяльная кнопка. Пры гэтым карыстальнікі маглі даць браўзеру дазвол на прагляд і рэгістрацыю актыўнасці — у такім разе ўсе сайты, што карыстальнік наведаў, архіваваліся на партале[13].

Wayback Machine быў запушчаны ў маі 1996 года, аднак стаў даступным для грамадскасці толькі ў 2001 г. — да гэтага ўся запісаная на лічбавых магнітных стужках інфармацыя была адкрыта толькі для абмежаванай колькасці навукоўцаў і даследчыкаў[14]. Да моманту «адкрыцця» архіў утрымліваў звыш 10 млрд заархіваваных старонак[4]. Да снежня 2014 года кіраўніцтва Wayback Machine паведаміла, што захавала 435 млрд вэб-старонак па ўсім свеце[2]. З тэхнічнага пункта гледжання праграмнае забеспячэнне Wayback Machine не з’яўляецца архівам, а хутчэй агульнадаступным інтэрфейсам да абмежаванага падмноства ўсіх сховішчаў[15]. Так, Wayback Machine нельга лічыць пошукавай сістэмай калекцыі арганізацыі, бо яна не ажыццяўляе пошук па базе даных іншай буйной віртуальнай бібліятэкі — Open Library, якая дазваляе карыстальнікам бясплатна атрымліваць доступ да лічбавых копій кніг, якія загружаюцца і архівуюцца ў рамках праекта[16][17].

Характарыстыка

З запускам «Wayback Machine» «Архіў Інтэрнэту» стаў адным з самых папулярных і вядомых анлайн-парталаў і галоўным сэрвісам вэб-архівавання[4][9].

У 1999 годзе «Архіў» пачаў пашыраць калекцыю за межы архіўнага вэб-кантэнту, каб забяспечыць доступ як да алічбаваных, так і першапачаткова лічбавых рэсурсаў, у тым ліку кніг, аўдыя, фільмаў, відарысаў, дакументаў, праграмнага забеспячэння і відэагульняў[7]. Некаторыя сканіраванні выконваюцца пошукавымі робатамі самога архіва, а іншыя — партнёрскімі арганізацыямі. Асобныя базы даных могуць набывацца за кошт ахвяраванняў карыстальнікаў і мэтавых набыццяў[17]. Самі стваральнікі арганізацыі параўноўвалі сваю калекцыю з Александрыйскай бібліятэкай[7].

На 2021 год Wayback Machine змяшчаў звыш 424 млрд вэб-старонак[15] — больш, чым дакументаў у Бібліятэцы Кангрэса[18][7][17].

Зноскі

  1. Overview (англ.). alexa.com. Архівавана з першакрыніцы 18 мая 2020. Праверана 8 снежня 2021.
  2. а б Arora 2015.
  3. Lerner 2017, pp. 1741–1755.
  4. а б в г Michael Bryant. What is the Wayback Machine and Why is it Useful? (англ.). Groovy Post (22 красавіка 2021). Архівавана з першакрыніцы 18 мая 2021. Праверана 29 мая 2021.
  5. Wayback Machine (англ.). Wayback Machine. Праверана 7 чэрвеня 2021.
  6. Dominic Cummings: how the internet knows when you’ve updated your blog (англ.). The Conversation (28 мая 2020). Архівавана з першакрыніцы 25 ліпеня 2021. Праверана 3 чэрвеня 2021.
  7. а б в г Odgen 2017.
  8. In An Old Church, The Internet Archive Stores Our Digital History (англ.). Kalw. San Francisco local public radio (11 верасня 2019). Архівавана з першакрыніцы 6 мая 2021. Праверана 3 чэрвеня 2021.
  9. а б Price 2011.
  10. Jack Schofield. The Time Machine (англ.). The Guardian (19 лістапада 2007). Архівавана з першакрыніцы 19 красавіка 2021. Праверана 1 чэрвеня 2021.
  11. Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress (англ.). WPMudev (25 мая 2017). Архівавана з першакрыніцы 13 красавіка 2021. Праверана 29 мая 2021.
  12. Adrienne LaFrance. Raiders of the Lost Web (англ.). The Atlantic (14 кастрычніка 2015). Архівавана з першакрыніцы 7 мая 2017. Праверана 7 чэрвеня 2021.
  13. Rogers 2017, pp. 160–172.
  14. Hartelius 2020, p. 378.
  15. а б Bowyer 2021, pp. 43–57.
  16. Aja Romano. A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard (англ.). Vox (23 студзеня 2020). Архівавана з першакрыніцы 18 жніўня 2021. Праверана 29 мая 2021.
  17. а б в Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web (англ.). Forbes (18 студзеня 2016). Архівавана з першакрыніцы 15 жніўня 2021. Праверана 5 чэрвеня 2021.
  18. O'Connor 2008, p. 64.

Літаратура

  • Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics.(англ.) // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — DOI:10.37016/mr-2020-41
  • Anat Ben-David, Adam Amram The Internet Archive and the socio-technical construction of historical facts(англ.) // Internet Histories. — 2018. — DOI:10.1080/24701475.2018.1455412
  • Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource(англ.). — 2015. — В. 8. — Т. 67. — С. 1904—1915. — DOI:10.1002/asi.23503
  • Bowyer S. The Wayback Machine: notes on a re-enchantment(англ.) // Archival Science. — 2021. — Т. 21. — С. 43—57.
  • Deborah R. Eltgroth Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence(англ.) // Fordham L. Rev.. — 2009. — В. 181. — Т. 78.
  • Greg R. Notess The Wayback Machine: The Web's Archive(англ.) // Online. — 2002. — В. 2. — Т. 26.
  • Hartelius J. The anxious flaneur: Digital archiving and the Wayback Machine(англ.) // Quarterly Journal of Speech. — 2020. — В. 4. — Т. 106. — С. 377—398.
  • James L. Quarles III and Richard A. Crudo [Way]Back to the Future: Using the Wayback Machine in Patent Litigation(англ.) // Landslide. — 2014. — В. 3. — Т. 6.
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present(англ.) // Association for Computing Machinery. — 2017. — DOI:10.1145/3133956.3134042
  • Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance(англ.) // Journal of the association for information science and technology. — 2018. — В. 10. — Т. 69. — С. 1223—1233.
  • Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives(англ.) // International Journal of Humanities and Arts Computing. — 2016.
  • Murphy J., Hashim N., O’Connor P. Take Me Back: Validating the Wayback Machine(англ.) // Journal of Computer-Mediated Communication. — 2008. — В. 13. — С. 60—75.
  • Odgen J., Halford S., Carr L. Observing Web Archives(англ.) // WebSci. — 2017. — С. 299—308.
  • Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org)(англ.) // Medical Hypothesis. — 2009. — С. 875.
  • Price Internet Archiving — The Wayback machine(англ.) // MLA Commons. — 2011.
  • Phyllis Holman Weisbard Oldies but Goodies: Archiving WebBased Information(англ.) // Feminist Collections. — 2011. — В. 2. — Т. 32.
  • Rogers R. Doing Web history with the Internet Archive: screencast documentaries(англ.) // Internet Histories. — 2017. — В. 1—2. — Т. 1. — С. 160—172. — DOI:10.1080/24701475.2017.1307542