واي باك مشين
المزيد من الإجراءات
واي باك مشين أو وَيْبَاك مَشِين (بالإنجليزية: Wayback Machine) (معناها: آلة الماضي البعيد) هو أرشيف رقمي متجدد للمحتوى الموجود على شبكة الإنترنت بالإضافة إلى معلومات أخرى موجودة على الشبكة، أسسته منظمة أرشيف الإنترنت في 10 أيار/مايو 1996، وأطلقته للجمهور في عام 2001، وهي منظمة غير ربحية، مقرها سان فرنسسكو، كاليفورنيا، الولايات المتحدة.
طورها كل من بروستر لورتون كيل و بروس غيليات لتحقيق هدفهما المُعلن والمتمثل «بالوصول العالمي للمعرفة»، من خلال إتاحة العودة في الوقت لرؤية نسخ مؤرشفة من صفحات الشبكة العنكبوتية وتغييراتها عبر الزمن.[1]
حفظت واي باك مشين أكثر من 38.2 مليار صفحة ويب في نهاية عام 2009. وأُرشف ما يزيد عن 860 مليار صفحة ويب (أكثر من 99 بيتا بايت بيانات) بحلول 3 كانون الثاني/يناير 2024.[2][3]
واي باك مشين - خلفية تاريخية
بدأت واي باك مشين في أرشفة صفحات الويب المخزنة في عام 1996. وتعود أولى وأقدم الصفحات المؤرشفة المعروفة إلى 10 مايو 1996 في الساعة 2:08 مساءً (التوقيت العالمي المنسق).[4]
أطلق مؤسسا أرشيف الإنترنت، بروستر لورتون كيل وبروس غيليات، موقع واي باك مشين في سان فرانسيسكو، كاليفورنيا، في أكتوبر 2001، وذلك أساسًا لحل مشكلة اختفاء محتوى الويب عند تغييره أو عند إغلاق موقع الويب.[5][6][7][8]
تُمكِّن هذه الخدمة والتي يطلق عليها الأرشيف "فهرسة ثلاثية الأبعاد" تمكن المستخدمين من الاطلاع على إصدارات مؤرشفة من صفحات الويب عبر الزمن.[9] أسس بروستر كيل وبروس غيليات هذه الخدمة بهدف أرشفة الإنترنت بالكامل وتوفير "وصول عالمي إلى كل المعرفة".[10]
يشير اسم (بالإنجليزية: Wayback Machine) إلى جهاز خيالي استخدم للسفر عبر الزمن في مسلسل الرسوم المتحركة مغامرات روكي وبولوينكل والأصدقاء (بالإنجليزية: "The Adventures of Rocky and Bullwinkle and Friends") في فترة الستينيات.[11][12][13]
في مقطع من هذه الرسوم المتحركة المعنون "تاريخ بيبوبي غير المحتمل"، استخدمت شخصيتان هما السيد بيبوبي وشيرمان "آلة واي باك" لمشاهدة والمشاركة في أحداث تاريخية مشهورة.
خُزنت المعلومات على شريط رقمي من عام 1996 وحتى 2001، وسمح بروستر كيل للباحثين والعلماء أحيانًا بالوصول إلى قاعدة البيانات "البطيئة".[14]
كُشف عن ارشيف الإنترنت بحلول عامه الخامس سنة 2001 وتوفر للجمهور في حفل أقيم في جامعة كاليفورنيا، بركلي.[15] واحتوى واي باك مشين عند إطلاقه بالفعل على أكثر من 10 مليارات صفحة مؤرشفة.[16] خُزنت هذه البيانات على مجموعة كبيرة من عقد Linux الخاصة بـ مؤسسة أرشيف الإنترنت.[10]
تقوم هذه الأجهزة بإعادة زيارة وأرشفة الإصدارات الجديدة من مواقع الويب من وقت لآخر (انظر التفاصيل التقنية أدناه).[17] كما يمكن أيضًا التقاط نسخ للمواقع يدويًا عن طريق إدخال عنوان URL للموقع في مربع البحث، بشرط أن يسمح الموقع لـ واي باك مشين بـ "الزحف" إليه لحفظ البيانات.[18]
بدأت واي باك مشين في 30 تشرين الأول/أكتوبر 2020 بالتحقق من صحة المحتوى.[19] وعطلت أسماء نطاقات خوادم الإعلانات عن الأرشفة اعتبارًا من كانون الثاني/يناير 2022.[20]
معلومات تقنية - واي باك مشين
تستخدم واي باك مشين برمجيات خاصة تقوم بالزحف (بالإنجليزية: Crawling) للإنترنت بهدف تحميل كافة المعلومات والبيانات المتاحة للجمهور على صفحات الويب، بالإضافة إلى شبكة غوفر، ونظام إعلانات Usenet (Netnews)، والبرمجيات المتاحة للتحميل.[21] تجدر الإشارة إلى أن المعلومات التي تجمعها هذه البرمجيات لا تشمل كامل المعلومات المتاحة على الإنترنت، حيث أن جزءاً كبيراً من هذه البيانات قد يكون محجوبا من قبل الناشر أو مخزّن في قواعد بيانات لايمكن الوصول إليها.
قامت منظمة أرشيف الإنترنت (Internet Archive) بتطوير موقع Archive-It.org عام 2005 للتغلب على التناقضات في المواقع الإلكترونية المخزنة جزئياً. يهدف هذا الموقع إلى توفير منصة للمؤسسات ومنشئي المحتوى للسماح لهم بحفظ مجموعات من المحتوى الرقمي وبناء أرشيفات رقمية مستقلة اختياريا.[22]
تُساهم مصادر متنوعة في عمليات الزحف، بعضها مستورد من جهات خارجية وبعضها الآخر أنشئ داخليًا بواسطة الأرشيف نفسه.[17] على سبيل المثال، تُساهم مؤسسة ألفريد ب. سلون وهي منظمة خيرية أمريكية غير ربحية و أليكسا إنترنت في عمليات الزحف، كما تقوم مؤسسة ارشيف الإنترنت بتشغيل عمليات الزحف نيابة عن إدارة الأرشيف والوثائق الوطنية ومؤسسة ذاكرة الإنترنت، بالإضافة إلى نسخ مطابقة من خدمة الزحف المشترك (بالإنجليزية: Common Crawl).[17] عملت "عمليات الزحف على شبكة الويب العالمية" منذ عام 2010 وأرشفت جل الشبكة العالمية.[17][23]
خُزنت الوثائق والموارد باستخدام عناوين URL المختومة بالتوقيت مثل 20240920160835. رُبطت الموارد الفردية للصفحات، مثل الصور والأنماط والبرمجيات، وكذلك الروابط الخارجية، باستخدام توقيت الصفحة المعروضة حاليًا، وبالتالي يعاد توجيهها تلقائيًا إلى لقطاتها الفردانية الأقرب زمنيًا.[24]
يختلف تكرار التقاط اللقطات لكل موقع ويب.[17] و تضمن مواقع الويب في "عمليات الزحف على شبكة الويب العالمية" في "قائمة الزحف"، مع أرشفة الموقع مرة واحدة لكل عملية زحف.[17] قد يستغرق الزحف شهورًا أو حتى سنوات حتى يكتمل وذلك حسب الحجم.[17] على سبيل المثال، بدأت "عملية الزحف الشاملة رقم 13" في 9 كانون الثاني/يناير 2015، واكتملت في 11 تموز/يوليو 2016.[25] ومع ذلك، قد تكون هناك عمليات زحف متعددة جارية في أي وقت، وقد يضمن موقع واحد في أكثر من قائمة زحف، ولذلك فإن عدد مرات زحف الموقع يختلف اختلافا كبيرا.[17]
أصبح عدد طلبات الأرشفة والاسترجاع المسموح بها للمستخدمين يقتصر على 15 طلبًا في الدقيقة بدءًا من تشرين الأول/أكتوبر 2019.[26]
السعة التخزينية والنمو
نمت سعة تخزين واي باك مشين مع تطور التقنية على مر السنين. وبعد عامين فقط من نشره للجمهور وتحديدا في عام 2003 نمت واي باك مشين بمعدل 12 تيرابايت شهريًا. خُزنت هذه البيانات على أنظمة PetaBox صممها موظغو مؤسسة أرشيف الإنترنت خصيصًا. وصلت أول منظومة تخزين بيانات إلى طاقتها الاستيعابية القصوى والتي بلغت آنذاك 100 تيرا بايت في حزيران/يونيو 2004، الأمر الذي بدا جليًا في أنهم أصبحوا بحاجة إلى مساحة تخزين أكبر بكثير من ذلك.[27][28]
حولت مؤسسة أرشيف الإنترنت البنية التخزينية المخصصة إلى منظومة صن أوبن ستوريدج (بالإنجليزية: Sun Open Storage) في عام 2009، و استضيف مركز البيانات الجديد في مركز بيانات صن مودولار (بالإنجليزية: Sun Modular Datacenter) في حرم شركة صن ميكروسيستمز (بالإنجليزية: Sun Microsystems) في كاليفورنيا.[29] احتوت بيانات واي باك مشين على حوالي ثلاثة بيتابايت من البيانات اعتبارًا من عام 2009 وكان ينمو بمعدل 100 تيرابايت شهريًا.[30]
طُرح إصدار جديد ومحسّن من واي باك مشين للاختبار العام في عام 2011، بواجهة مستخدم محدثة ومؤشر محدّث للمحتوى المؤرشف، حيث تظهر اللقطات في تخطيط تقويمي مع دوائر يمثل عرضها عدد مرات الزحف يوميًا، ولكن بدون تمييز للمكررات باستخدام النجمة أو صفحة بحث متقدمة.[31][32] وأضيف شريط أدوات علوي لتسهيل التنقل بين اللقطات، ويوضح مخطط شريطي تردد اللقطات كل شهر على مر السنين.[33] أضيفت ميزات مثل "التغييرات" و"الملخص" وخريطة الموقع الرسومية لاحقًا.
قيل في منتدى واي باك مشين في مارس من ذلك العام أن "إصدار بيتا الجديد يحتوي على مؤشر أكثر اكتمالاً وتحديثًا لجميع المواد المستخرجة حتى عام 2010، وسيُحدث بانتظام. ويحتوي الفهرس الكلاسيكي الذي يشغل واي باك مشين فقط على القليل من المواد التي ترجع إلى ما بعد عام 2008، ولا توجد خطط لتطبيق المزيد من التحديثات على هذا الفهرس، حيث سيتم التخلص منه تدريجيًا هذا العام".[34] وفي عام 2011، قامت مؤسسة أرشيف الإنترنت بتثبيت الزوج السادس من وحدات تخزين PetaBox مما زاد من سعة تخزين واي باك مشين بمقدار 700 تيرابايت.[35]
أعلنت الشركة عن إنجاز تاريخي بلغ 240 مليار عنوان ويب في كانون الثاني/يناير 2013.[36]
وفي تشرين الأول/أكتوبر 2013، قدمت الشركة ميزة "حفظ صفحة"[37][38] التي تسمح لأي مستخدم للإنترنت بأرشفة محتويات عنوان URL، وتوليد رابط دائم بسرعة على عكس ميزة liveweb السابقة.
في كانون الأول/ديسمبر 2014، احتوت واي باك مشين على 435 مليار صفحة ويب - ما يقرب من تسعة بيتابايت من البيانات، وكانت تنمو بمعدل حوالي 20 تيرابايت أسبوعيًا.[16][39][40]
وفي حزيران/يوليو 2016، قيل أن واي باك مشين احتوت على حوالي 15 بيتابايت من البيانات.[41]
وفي أيلول/سبتمبر 2018، احتوت واي باك مشين على أكثر من 25 بيتابايت من البيانات.[42][43]
اعتبارًا من كانون الأول/ديسمبر 2020، احتوت واي باك مشين على أكثر من 70 بيتابايت من البيانات.[44]
ويُدّعى أن أرشيف الإنترنت، اعتبارًا من كانون الثاني/يناير 2024، قد خزن أكثر من 99 بيتابايت من البيانات حتى الآن.[2][3]
واي باك مشين حسب السنة | الصفحات المؤرشفة |
---|---|
2004 | 30٬000٬000٬000(0-100B : Light blue)
|
2005 | 40٬000٬000٬000
|
2008 | 85٬000٬000٬000
|
2012 | 150٬000٬000٬000(100B-450B : Yellow)
|
2013 | 373٬000٬000٬000
|
2014 | 400٬000٬000٬000
|
2015 | 452٬000٬000٬000(450B-600B : Orange)
|
2016 | 459٬000٬000٬000
|
2017 | 279٬000٬000٬000
|
2018 | 310٬000٬000٬000
|
2019 | 345٬000٬000٬000
|
2020 | 405٬000٬000٬000
|
2021 | 514٬000٬000٬000
|
2022 | 640٬000٬000٬000(600B- : Red)
|
2024 | 866٬000٬000٬000
|
المراجع
- ↑ Kahle، Brewster (23 نوفمبر 2005). "Universal Access to all Knowledge". Internet Archive. مؤرشف من الأصل في 2022-08-14. اطلع عليه بتاريخ 2022-06-05.
- ↑ 2٫0 2٫1 "Internet Archive: Wayback Machine". web.archive.org. مؤرشف من الأصل في 2023-03-13. The current number of archived pages can be seen at the archive's home page.
- ↑ 3٫0 3٫1 Kahle، Brewster. "A Message from Internet Archive Founder, Brewster Kahle". Internet Archive. اطلع عليه بتاريخ 2024-01-10.
- ↑ PepsiCo, Inc. (10 مايو 1996). "PepsiCo Home Page". Internet Archive/Wayback Machine. مؤرشف من الأصل في 1996-05-10. اطلع عليه بتاريخ 2022-10-08.
- ↑ "Wayback Machine General Information". Internet Archive. مؤرشف من الأصل في 2019-12-05. اطلع عليه بتاريخ 2021-03-02.
- ↑ "WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. مؤرشف من الأصل في 2020-05-14. اطلع عليه بتاريخ 2016-03-13.
- ↑ "InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. مؤرشف من الأصل في 2020-05-12. اطلع عليه بتاريخ 2016-03-13.
- ↑ Notess، Greg R. (مارس–أبريل 2002). "The Wayback Machine: The Web's Archive". Online. ج. 26: 59–61. INIST:13517724.
- ↑ "The Wayback Machine"، Frequently Asked Questions، مؤرشف من الأصل في 2018-09-18، اطلع عليه بتاريخ 2018-09-18
- ↑ 10٫0 10٫1 "20,000 Hard Drives on a Mission". Internet Archive Blogs. 25 أكتوبر 2016. مؤرشف من الأصل في 2018-10-20. اطلع عليه بتاريخ 2018-10-15.
- ↑ Green، Heather (28 فبراير 2002). "A Library as Big as the World". BusinessWeek. مؤرشف من الأصل في 2011-12-20.
- ↑ Tong، Judy (8 سبتمبر 2002). "Responsible Party – Brewster Kahle; A Library Of the Web, On the Web". The New York Times. مؤرشف من الأصل في 2011-02-20. اطلع عليه بتاريخ 2011-08-15.
- ↑ Keith Scott (2000). The Moose that Roared: The Story of Jay Ward, Bill Scott, a Flying Squirrel, and a Talking Moose. St. Martin's Press. (ردمك 0-312-19922-8)
- ↑ Cook، John (1 نوفمبر 2001). "Web site takes you way back in Internet history". Seattle Post-Intelligencer. مؤرشف من الأصل في 2014-08-12. اطلع عليه بتاريخ 2011-08-15.
- ↑ Mayfield، Kendra (28 أكتوبر 2001). "Wayback Goes Way Back on Web". Wired. مؤرشف من الأصل في 2017-10-16. اطلع عليه بتاريخ 2017-10-16.
- ↑ 16٫0 16٫1 Arora، Sanjay K.؛ Li، Yin؛ Youtie، Jan؛ Shapira، Philip (5 مايو 2015). "Using the wayback machine to mine websites in the social sciences: A methodological resource". Journal of the Association for Information Science and Technology. ج. 67 ع. 8: 1904–1915. DOI:10.1002/asi.23503. ISSN:2330-1635.
- ↑ 17٫0 17٫1 17٫2 17٫3 17٫4 17٫5 17٫6 17٫7 Leetaru، Kalev (28 يناير 2016). "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web". Forbes. مؤرشف من الأصل في 2017-10-16. اطلع عليه بتاريخ 2017-10-16.
- ↑ "Internet Archive: Wayback Machine". Internet Archive. مؤرشف من الأصل في 2014-01-03. اطلع عليه بتاريخ 2018-10-15.
- ↑ Graham، Mark (30 أكتوبر 2020). "Fact Checks and Context for Wayback Machine Pages". Internet Archive Blogs. اطلع عليه بتاريخ 2021-01-17.
- ↑ Attempts to 'save page now' domains such as tpc.googlesyndication.com or s0.2mdn.net or atdmt.com or adbrite.com result in "This URL is in our block list and cannot be captured."
- ↑ Kahle، Brewster. "Archiving the Internet". Scientific American – March 1997 Issue. مؤرشف من الأصل في 2012-04-03. اطلع عليه بتاريخ 2011-08-19.
- ↑ Kaplan، Jeff (27 أكتوبر 2014). "Archive-It: Crawling the Web Together". Internet Archive Blogs. مؤرشف من الأصل في 2017-10-12. اطلع عليه بتاريخ 2017-10-16.
- ↑ "Worldwide Web Crawls". Internet Archive. مؤرشف من الأصل في 2017-10-19. اطلع عليه بتاريخ 2017-10-16.
- ↑ "Using The Wayback Machine". Internet Archive. اطلع عليه بتاريخ 2022-04-03.
- ↑ "Wide Crawl Number 13". Internet Archive. مؤرشف من الأصل في 2017-10-19. اطلع عليه بتاريخ 2017-10-16.
- ↑ "Too Many Requests". Internet Archive. 10 نوفمبر 2019. اطلع عليه بتاريخ 2021-11-27.
- ↑ "Petabox". Internet Archive. اطلع عليه بتاريخ 2018-10-25.
- ↑ Kanellos، Michael (29 يوليو 2005). "Big storage on the cheap". CNET News. مؤرشف من الأصل في 2007-04-03. اطلع عليه بتاريخ 2007-07-29.
- ↑ "Internet Archive and Sun Microsystems Create Living History of the Internet". Sun Microsystems. 25 مارس 2009. مؤرشف من الأصل في 2009-03-26. اطلع عليه بتاريخ 2009-03-27.
- ↑ Mearian، Lucas (19 مارس 2009). "Internet Archive to unveil massive Wayback Machine data center". Computerworld. مؤرشف من الأصل في 2009-03-23. اطلع عليه بتاريخ 2009-03-22.
- ↑ gojomo (24 يناير 2011). "Updated Wayback Machine in Beta Testing". مؤرشف من الأصل في 2011-08-23. اطلع عليه بتاريخ 2011-08-19.
- ↑ "Advanced Search". Wayback Machine. مؤرشف من الأصل في 2010-01-31. اطلع عليه بتاريخ 2022-04-03.
- ↑ "What's the difference between the classic Wayback Machine and the new Beta version?". مؤرشف من الأصل في 2010-12-25. اطلع عليه بتاريخ 2021-11-17.
- ↑ "Beta Wayback Machine, in forum". مؤرشف من الأصل في 2014-04-17. اطلع عليه بتاريخ 2014-04-16.
- ↑ "Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used". Internet Archive. مؤرشف من الأصل في 2016-10-24. اطلع عليه بتاريخ 2018-10-25.
- ↑ "Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs". 9 يناير 2013. مؤرشف من الأصل في 2014-04-14. اطلع عليه بتاريخ 2014-04-16.
- ↑ Rossi، Alexis (25 أكتوبر 2013). "Fixing Broken Links on the Internet". Internet Archive. San Francisco, CA, US: Collections Team, the Internet Archive. مؤرشف من الأصل في 2014-11-07. اطلع عليه بتاريخ 2015-03-25.
We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.
- ↑ Baron، Alexander (23 أكتوبر 2013). "The new Internet Archive Wayback Machine now online". Digital Journal. مؤرشف من الأصل في 2020-11-19. اطلع عليه بتاريخ 2020-11-19.
- ↑ "Internet Archive Frequently Asked Questions". مؤرشف من الأصل في 2009-10-21. اطلع عليه بتاريخ 2015-01-17.
- ↑ "Internet Archive Frequently Asked Questions". 18 ديسمبر 2014. مؤرشف من الأصل في 2014-12-18. اطلع عليه بتاريخ 2018-12-13.
- ↑ "Can the manipulation of big data change the way the world thinks?". The National. مؤرشف من الأصل في 2017-01-12. اطلع عليه بتاريخ 2017-05-14.
- ↑ Crockett، Zachary (28 سبتمبر 2018). "Inside Wayback Machine, the internet's time capsule". The Hustle. مؤرشف من الأصل في 2018-10-02. اطلع عليه بتاريخ 2018-10-26.
- ↑ Heffernan، Virginia (18 سبتمبر 2018). "Things Break and Decay on the Internet—That's a Good Thing". WIRED. مؤرشف من الأصل في 2018-09-25. اطلع عليه بتاريخ 2018-10-26.
- ↑ "Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine". adafruit. مؤرشف من الأصل في 2020-12-02. اطلع عليه بتاريخ 2020-12-02.
- ↑ michelle (9 مايو 2014). "Wayback Machine Hits 400,000,000,000!". Internet Archive. مؤرشف من الأصل في 2014-08-26. اطلع عليه بتاريخ 2015-03-25.
- ↑ "Internet Archive". Internet Archive. مؤرشف من الأصل في 2020-12-31. اطلع عليه بتاريخ 2021-03-08.