تبديل القائمة
تبديل القائمة الشخصية
غير مسجل للدخول
سيكون عنوان الآيبي الخاص بك مرئيًا للعامة إذا قمت بإجراء أي تعديلات.

واي باك مشين

واي باك مشين أرشيف ضخم يضم مئات المليارات من صفحات الويب. تأسست عام 1996 وتسمح لك برؤية كيف تغير الإنترنت عبر الزمن.
واي باك مشين - مشهد تخيلي مولد باستخدام الذكاء الصنعي.
واي باك مشين - مشهد تخيلي مولد باستخدام الذكاء الصنعي.

واي باك مشين أو وَيْبَاك مَشِين (بالإنجليزية: Wayback Machine)‏ (معناها: آلة الماضي البعيد) هو أرشيف رقمي متجدد للمحتوى الموجود على شبكة الإنترنت بالإضافة إلى معلومات أخرى موجودة على الشبكة، أسسته منظمة أرشيف الإنترنت في 10 أيار/مايو 1996، وأطلقته للجمهور في عام 2001، وهي منظمة غير ربحية، مقرها سان فرنسسكو، كاليفورنيا، الولايات المتحدة.

طورها كل من بروستر لورتون كيل و بروس غيليات لتحقيق هدفهما المُعلن والمتمثل «بالوصول العالمي للمعرفة»، من خلال إتاحة العودة في الوقت لرؤية نسخ مؤرشفة من صفحات الشبكة العنكبوتية وتغييراتها عبر الزمن.[1]

حفظت واي باك مشين أكثر من 38.2 مليار صفحة ويب في نهاية عام 2009. وأُرشف ما يزيد عن 860 مليار صفحة ويب (أكثر من 99 بيتا بايت بيانات) بحلول 3 كانون الثاني/يناير 2024.[2][3]

واي باك مشين - خلفية تاريخية

بدأت واي باك مشين في أرشفة صفحات الويب المخزنة في عام 1996. وتعود أولى وأقدم الصفحات المؤرشفة المعروفة إلى 10 مايو 1996 في الساعة 2:08 مساءً (التوقيت العالمي المنسق).[4]

أطلق مؤسسا أرشيف الإنترنت، بروستر لورتون كيل وبروس غيليات، موقع واي باك مشين في سان فرانسيسكو، كاليفورنيا، في أكتوبر 2001، وذلك أساسًا لحل مشكلة اختفاء محتوى الويب عند تغييره أو عند إغلاق موقع الويب.[5][6][7][8]

تُمكِّن هذه الخدمة والتي يطلق عليها الأرشيف "فهرسة ثلاثية الأبعاد" تمكن المستخدمين من الاطلاع على إصدارات مؤرشفة من صفحات الويب عبر الزمن.[9] أسس بروستر كيل وبروس غيليات هذه الخدمة بهدف أرشفة الإنترنت بالكامل وتوفير "وصول عالمي إلى كل المعرفة".[10]

يشير اسم (بالإنجليزية: Wayback Machine)‏ إلى جهاز خيالي استخدم للسفر عبر الزمن في مسلسل الرسوم المتحركة مغامرات روكي وبولوينكل والأصدقاء (بالإنجليزية: "The Adventures of Rocky and Bullwinkle and Friends")‏ في فترة الستينيات.[11][12][13]

في مقطع من هذه الرسوم المتحركة المعنون "تاريخ بيبوبي غير المحتمل"، استخدمت شخصيتان هما السيد بيبوبي وشيرمان "آلة واي باك" لمشاهدة والمشاركة في أحداث تاريخية مشهورة.

خُزنت المعلومات على شريط رقمي من عام 1996 وحتى 2001، وسمح بروستر كيل للباحثين والعلماء أحيانًا بالوصول إلى قاعدة البيانات "البطيئة".[14]

كُشف عن ارشيف الإنترنت بحلول عامه الخامس سنة 2001 وتوفر للجمهور في حفل أقيم في جامعة كاليفورنيا، بركلي.[15] واحتوى واي باك مشين عند إطلاقه بالفعل على أكثر من 10 مليارات صفحة مؤرشفة.[16] خُزنت هذه البيانات على مجموعة كبيرة من عقد Linux الخاصة بـ مؤسسة أرشيف الإنترنت.[10]

تقوم هذه الأجهزة بإعادة زيارة وأرشفة الإصدارات الجديدة من مواقع الويب من وقت لآخر (انظر التفاصيل التقنية أدناه).[17] كما يمكن أيضًا التقاط نسخ للمواقع يدويًا عن طريق إدخال عنوان URL للموقع في مربع البحث، بشرط أن يسمح الموقع لـ واي باك مشين بـ "الزحف" إليه لحفظ البيانات.[18]


بدأت واي باك مشين في 30 تشرين الأول/أكتوبر 2020 بالتحقق من صحة المحتوى.[19] وعطلت أسماء نطاقات خوادم الإعلانات عن الأرشفة اعتبارًا من كانون الثاني/يناير 2022.[20]

معلومات تقنية - واي باك مشين

تستخدم واي باك مشين برمجيات خاصة تقوم بالزحف (بالإنجليزية: Crawling)‏ للإنترنت بهدف تحميل كافة المعلومات والبيانات المتاحة للجمهور على صفحات الويب، بالإضافة إلى شبكة غوفر، ونظام إعلانات Usenet (Netnews)، والبرمجيات المتاحة للتحميل.[21] تجدر الإشارة إلى أن المعلومات التي تجمعها هذه البرمجيات لا تشمل كامل المعلومات المتاحة على الإنترنت، حيث أن جزءاً كبيراً من هذه البيانات قد يكون محجوبا من قبل الناشر أو مخزّن في قواعد بيانات لايمكن الوصول إليها.

قامت منظمة أرشيف الإنترنت (Internet Archive) بتطوير موقع Archive-It.org عام 2005 للتغلب على التناقضات في المواقع الإلكترونية المخزنة جزئياً. يهدف هذا الموقع إلى توفير منصة للمؤسسات ومنشئي المحتوى للسماح لهم بحفظ مجموعات من المحتوى الرقمي وبناء أرشيفات رقمية مستقلة اختياريا.[22]

تُساهم مصادر متنوعة في عمليات الزحف، بعضها مستورد من جهات خارجية وبعضها الآخر أنشئ داخليًا بواسطة الأرشيف نفسه.[17] على سبيل المثال، تُساهم مؤسسة ألفريد ب. سلون وهي منظمة خيرية أمريكية غير ربحية و أليكسا إنترنت في عمليات الزحف، كما تقوم مؤسسة ارشيف الإنترنت بتشغيل عمليات الزحف نيابة عن إدارة الأرشيف والوثائق الوطنية ومؤسسة ذاكرة الإنترنت، بالإضافة إلى نسخ مطابقة من خدمة الزحف المشترك (بالإنجليزية: Common Crawl)‏.[17] عملت "عمليات الزحف على شبكة الويب العالمية" منذ عام 2010 وأرشفت جل الشبكة العالمية.[17][23]

خُزنت الوثائق والموارد باستخدام عناوين URL المختومة بالتوقيت مثل 20240920160835. رُبطت الموارد الفردية للصفحات، مثل الصور والأنماط والبرمجيات، وكذلك الروابط الخارجية، باستخدام توقيت الصفحة المعروضة حاليًا، وبالتالي يعاد توجيهها تلقائيًا إلى لقطاتها الفردانية الأقرب زمنيًا.[24]

يختلف تكرار التقاط اللقطات لكل موقع ويب.[17] و تضمن مواقع الويب في "عمليات الزحف على شبكة الويب العالمية" في "قائمة الزحف"، مع أرشفة الموقع مرة واحدة لكل عملية زحف.[17] قد يستغرق الزحف شهورًا أو حتى سنوات حتى يكتمل وذلك حسب الحجم.[17] على سبيل المثال، بدأت "عملية الزحف الشاملة رقم 13" في 9 كانون الثاني/يناير 2015، واكتملت في 11 تموز/يوليو 2016.[25] ومع ذلك، قد تكون هناك عمليات زحف متعددة جارية في أي وقت، وقد يضمن موقع واحد في أكثر من قائمة زحف، ولذلك فإن عدد مرات زحف الموقع يختلف اختلافا كبيرا.[17]

أصبح عدد طلبات الأرشفة والاسترجاع المسموح بها للمستخدمين يقتصر على 15 طلبًا في الدقيقة بدءًا من تشرين الأول/أكتوبر 2019.[26]

السعة التخزينية والنمو

نمت سعة تخزين واي باك مشين مع تطور التقنية على مر السنين. وبعد عامين فقط من نشره للجمهور وتحديدا في عام 2003 نمت واي باك مشين بمعدل 12 تيرابايت شهريًا. خُزنت هذه البيانات على أنظمة PetaBox صممها موظغو مؤسسة أرشيف الإنترنت خصيصًا. وصلت أول منظومة تخزين بيانات إلى طاقتها الاستيعابية القصوى والتي بلغت آنذاك 100 تيرا بايت في حزيران/يونيو 2004، الأمر الذي بدا جليًا في أنهم أصبحوا بحاجة إلى مساحة تخزين أكبر بكثير من ذلك.[27][28]

المراجع

  1. Kahle، Brewster (23 نوفمبر 2005). "Universal Access to all Knowledge". Internet Archive. مؤرشف من الأصل في 2022-08-14. اطلع عليه بتاريخ 2022-06-05.
  2. "Internet Archive: Wayback Machine". web.archive.org. مؤرشف من الأصل في 2023-03-13. The current number of archived pages can be seen at the archive's home page.
  3. Kahle، Brewster. "A Message from Internet Archive Founder, Brewster Kahle". Internet Archive. اطلع عليه بتاريخ 2024-01-10.
  4. PepsiCo, Inc. (10 مايو 1996). "PepsiCo Home Page". Internet Archive/Wayback Machine. مؤرشف من الأصل في 1996-05-10. اطلع عليه بتاريخ 2022-10-08.
  5. "Wayback Machine General Information". Internet Archive. مؤرشف من الأصل في 2019-12-05. اطلع عليه بتاريخ 2021-03-02.
  6. "WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. مؤرشف من الأصل في 2020-05-14. اطلع عليه بتاريخ 2016-03-13.
  7. "InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. مؤرشف من الأصل في 2020-05-12. اطلع عليه بتاريخ 2016-03-13.
  8. Notess، Greg R. (مارس–أبريل 2002). "The Wayback Machine: The Web's Archive". Online. ج. 26: 59–61. INIST:13517724.
  9. "The Wayback Machine"، Frequently Asked Questions، مؤرشف من الأصل في 2018-09-18، اطلع عليه بتاريخ 2018-09-18
  10. 10٫0 10٫1 "20,000 Hard Drives on a Mission". Internet Archive Blogs. 25 أكتوبر 2016. مؤرشف من الأصل في 2018-10-20. اطلع عليه بتاريخ 2018-10-15.
  11. Green، Heather (28 فبراير 2002). "A Library as Big as the World". BusinessWeek. مؤرشف من الأصل في 2011-12-20.
  12. Tong، Judy (8 سبتمبر 2002). "Responsible Party – Brewster Kahle; A Library Of the Web, On the Web". The New York Times. مؤرشف من الأصل في 2011-02-20. اطلع عليه بتاريخ 2011-08-15.
  13. Keith Scott (2000). The Moose that Roared: The Story of Jay Ward, Bill Scott, a Flying Squirrel, and a Talking Moose. St. Martin's Press. (ردمك 0-312-19922-8)
  14. Cook، John (1 نوفمبر 2001). "Web site takes you way back in Internet history". Seattle Post-Intelligencer. مؤرشف من الأصل في 2014-08-12. اطلع عليه بتاريخ 2011-08-15.
  15. Mayfield، Kendra (28 أكتوبر 2001). "Wayback Goes Way Back on Web". Wired. مؤرشف من الأصل في 2017-10-16. اطلع عليه بتاريخ 2017-10-16.
  16. خطأ استشهاد: وسم <ref> غير صحيح؛ لا نص تم توفيره للمراجع المسماة Arora (2015)
  17. 17٫0 17٫1 17٫2 17٫3 17٫4 17٫5 17٫6 17٫7 Leetaru، Kalev (28 يناير 2016). "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web". Forbes. مؤرشف من الأصل في 2017-10-16. اطلع عليه بتاريخ 2017-10-16.
  18. "Internet Archive: Wayback Machine". Internet Archive. مؤرشف من الأصل في 2014-01-03. اطلع عليه بتاريخ 2018-10-15.
  19. Graham، Mark (30 أكتوبر 2020). "Fact Checks and Context for Wayback Machine Pages". Internet Archive Blogs. اطلع عليه بتاريخ 2021-01-17.
  20. Attempts to 'save page now' domains such as tpc.googlesyndication.com or s0.2mdn.net or atdmt.com or adbrite.com result in "This URL is in our block list and cannot be captured."
  21. Kahle، Brewster. "Archiving the Internet". Scientific American – March 1997 Issue. مؤرشف من الأصل في 2012-04-03. اطلع عليه بتاريخ 2011-08-19.
  22. Kaplan، Jeff (27 أكتوبر 2014). "Archive-It: Crawling the Web Together". Internet Archive Blogs. مؤرشف من الأصل في 2017-10-12. اطلع عليه بتاريخ 2017-10-16.
  23. "Worldwide Web Crawls". Internet Archive. مؤرشف من الأصل في 2017-10-19. اطلع عليه بتاريخ 2017-10-16.
  24. "Using The Wayback Machine". Internet Archive. اطلع عليه بتاريخ 2022-04-03.
  25. "Wide Crawl Number 13". Internet Archive. مؤرشف من الأصل في 2017-10-19. اطلع عليه بتاريخ 2017-10-16.
  26. "Too Many Requests". Internet Archive. 10 نوفمبر 2019. اطلع عليه بتاريخ 2021-11-27.
  27. "Petabox". Internet Archive. اطلع عليه بتاريخ 2018-10-25.
  28. Kanellos، Michael (29 يوليو 2005). "Big storage on the cheap". CNET News. مؤرشف من الأصل في 2007-04-03. اطلع عليه بتاريخ 2007-07-29.