تبديل القائمة
تبديل القائمة الشخصية
غير مسجل للدخول
سيكون عنوان الآيبي الخاص بك مرئيًا للعامة إذا قمت بإجراء أي تعديلات.

واي باك مشين

واي باك مشين أرشيف ضخم يضم مئات المليارات من صفحات الويب. تأسست عام 1996 وتسمح لك برؤية كيف تغير الإنترنت عبر الزمن.
واي باك مشين - مشهد تخيلي مولد باستخدام الذكاء الصنعي.
واي باك مشين - مشهد تخيلي مولد باستخدام الذكاء الصنعي.

واي باك مشين أو وَيْبَاك مَشِين (بالإنجليزية: Wayback Machine)‏ (معناها: آلة الماضي البعيد) هو أرشيف رقمي متجدد للمحتوى الموجود على شبكة الإنترنت بالإضافة إلى معلومات أخرى موجودة على الشبكة، أسسته منظمة أرشيف الإنترنت في 10 أيار/مايو 1996، وأطلقته للجمهور في عام 2001، وهي منظمة غير ربحية، مقرها سان فرنسسكو، كاليفورنيا، الولايات المتحدة.

طورها كل من بروستر لورتون كيل و بروس غيليات لتحقيق هدفهما المُعلن والمتمثل «بالوصول العالمي للمعرفة»، من خلال إتاحة العودة في الوقت لرؤية نسخ مؤرشفة من صفحات الشبكة العنكبوتية وتغييراتها عبر الزمن.[1]

حفظت واي باك مشين أكثر من 38.2 مليار صفحة ويب في نهاية عام 2009. وأُرشف ما يزيد عن 860 مليار صفحة ويب (أكثر من 99 بيتا بايت بيانات) بحلول 3 كانون الثاني/يناير 2024.[2][3]

واي باك مشين - خلفية تاريخية

بدأت واي باك مشين في أرشفة صفحات الويب المخزنة في عام 1996. وتعود أولى وأقدم الصفحات المؤرشفة المعروفة إلى 10 مايو 1996 في الساعة 2:08 مساءً (التوقيت العالمي المنسق).[4]

أطلق مؤسسا أرشيف الإنترنت، بروستر لورتون كيل وبروس غيليات، موقع واي باك مشين في سان فرانسيسكو، كاليفورنيا، في أكتوبر 2001، وذلك أساسًا لحل مشكلة اختفاء محتوى الويب عند تغييره أو عند إغلاق موقع الويب.[5][6][7][8]

تُمكِّن هذه الخدمة والتي يطلق عليها الأرشيف "فهرسة ثلاثية الأبعاد" تمكن المستخدمين من الاطلاع على إصدارات مؤرشفة من صفحات الويب عبر الزمن.[9] أسس بروستر كيل وبروس غيليات هذه الخدمة بهدف أرشفة الإنترنت بالكامل وتوفير "وصول عالمي إلى كل المعرفة".[10]

يشير اسم (بالإنجليزية: Wayback Machine)‏ إلى جهاز خيالي استخدم للسفر عبر الزمن في مسلسل الرسوم المتحركة مغامرات روكي وبولوينكل والأصدقاء (بالإنجليزية: "The Adventures of Rocky and Bullwinkle and Friends")‏ في فترة الستينيات.[11][12][13]

في مقطع من هذه الرسوم المتحركة المعنون "تاريخ بيبوبي غير المحتمل"، استخدمت شخصيتان هما السيد بيبوبي وشيرمان "آلة واي باك" لمشاهدة والمشاركة في أحداث تاريخية مشهورة.

خُزنت المعلومات على شريط رقمي من عام 1996 وحتى 2001، وسمح بروستر كيل للباحثين والعلماء أحيانًا بالوصول إلى قاعدة البيانات "البطيئة".[14]

كُشف عن ارشيف الإنترنت بحلول عامه الخامس سنة 2001 وتوفر للجمهور في حفل أقيم في جامعة كاليفورنيا، بركلي.[15] واحتوى واي باك مشين عند إطلاقه بالفعل على أكثر من 10 مليارات صفحة مؤرشفة.[16] خُزنت هذه البيانات على مجموعة كبيرة من عقد Linux الخاصة بـ مؤسسة أرشيف الإنترنت.[10]

تقوم هذه الأجهزة بإعادة زيارة وأرشفة الإصدارات الجديدة من مواقع الويب من وقت لآخر (انظر التفاصيل التقنية أدناه).[17] كما يمكن أيضًا التقاط نسخ للمواقع يدويًا عن طريق إدخال عنوان URL للموقع في مربع البحث، بشرط أن يسمح الموقع لـ واي باك مشين بـ "الزحف" إليه لحفظ البيانات.[18]


بدأت واي باك مشين في 30 تشرين الأول/أكتوبر 2020 بالتحقق من صحة المحتوى.[19] وعطلت أسماء نطاقات خوادم الإعلانات عن الأرشفة اعتبارًا من كانون الثاني/يناير 2022.[20]

معلومات تقنية - واي باك مشين

تستخدم واي باك مشين برمجيات خاصة تقوم بالزحف (بالإنجليزية: Crawling)‏ للإنترنت بهدف تحميل كافة المعلومات والبيانات المتاحة للجمهور على صفحات الويب، بالإضافة إلى شبكة غوفر، ونظام إعلانات Usenet (Netnews)، والبرمجيات المتاحة للتحميل.[21] تجدر الإشارة إلى أن المعلومات التي تجمعها هذه البرمجيات لا تشمل كامل المعلومات المتاحة على الإنترنت، حيث أن جزءاً كبيراً من هذه البيانات قد يكون محجوبا من قبل الناشر أو مخزّن في قواعد بيانات لايمكن الوصول إليها.

قامت منظمة أرشيف الإنترنت (Internet Archive) بتطوير موقع Archive-It.org عام 2005 للتغلب على التناقضات في المواقع الإلكترونية المخزنة جزئياً. يهدف هذا الموقع إلى توفير منصة للمؤسسات ومنشئي المحتوى للسماح لهم بحفظ مجموعات من المحتوى الرقمي وبناء أرشيفات رقمية مستقلة اختياريا.[22]

تُساهم مصادر متنوعة في عمليات الزحف، بعضها مستورد من جهات خارجية وبعضها الآخر أنشئ داخليًا بواسطة الأرشيف نفسه.[17] على سبيل المثال، تُساهم مؤسسة ألفريد ب. سلون وهي منظمة خيرية أمريكية غير ربحية و أليكسا إنترنت في عمليات الزحف، كما تقوم مؤسسة ارشيف الإنترنت بتشغيل عمليات الزحف نيابة عن إدارة الأرشيف والوثائق الوطنية ومؤسسة ذاكرة الإنترنت، بالإضافة إلى نسخ مطابقة من خدمة الزحف المشترك (بالإنجليزية: Common Crawl)‏.[17] عملت "عمليات الزحف على شبكة الويب العالمية" منذ عام 2010 وأرشفت جل الشبكة العالمية.[17][23]

خُزنت الوثائق والموارد باستخدام عناوين URL المختومة بالتوقيت مثل 20240920160835. رُبطت الموارد الفردية للصفحات، مثل الصور والأنماط والبرمجيات، وكذلك الروابط الخارجية، باستخدام توقيت الصفحة المعروضة حاليًا، وبالتالي يعاد توجيهها تلقائيًا إلى لقطاتها الفردانية الأقرب زمنيًا.[24]

يختلف تكرار التقاط اللقطات لكل موقع ويب.[17] و تضمن مواقع الويب في "عمليات الزحف على شبكة الويب العالمية" في "قائمة الزحف"، مع أرشفة الموقع مرة واحدة لكل عملية زحف.[17] قد يستغرق الزحف شهورًا أو حتى سنوات حتى يكتمل وذلك حسب الحجم.[17] على سبيل المثال، بدأت "عملية الزحف الشاملة رقم 13" في 9 كانون الثاني/يناير 2015، واكتملت في 11 تموز/يوليو 2016.[25] ومع ذلك، قد تكون هناك عمليات زحف متعددة جارية في أي وقت، وقد يضمن موقع واحد في أكثر من قائمة زحف، ولذلك فإن عدد مرات زحف الموقع يختلف اختلافا كبيرا.[17]

أصبح عدد طلبات الأرشفة والاسترجاع المسموح بها للمستخدمين يقتصر على 15 طلبًا في الدقيقة بدءًا من تشرين الأول/أكتوبر 2019.[26]

السعة التخزينية والنمو

نمت سعة تخزين واي باك مشين مع تطور التقنية على مر السنين. وبعد عامين فقط من نشره للجمهور وتحديدا في عام 2003 نمت واي باك مشين بمعدل 12 تيرابايت شهريًا. خُزنت هذه البيانات على أنظمة PetaBox صممها موظغو مؤسسة أرشيف الإنترنت خصيصًا. وصلت أول منظومة تخزين بيانات إلى طاقتها الاستيعابية القصوى والتي بلغت آنذاك 100 تيرا بايت في حزيران/يونيو 2004، الأمر الذي بدا جليًا في أنهم أصبحوا بحاجة إلى مساحة تخزين أكبر بكثير من ذلك.[27][28]

حولت مؤسسة أرشيف الإنترنت البنية التخزينية المخصصة إلى منظومة صن أوبن ستوريدج (بالإنجليزية: Sun Open Storage)‏ في عام 2009، و استضيف مركز البيانات الجديد في مركز بيانات صن مودولار (بالإنجليزية: Sun Modular Datacenter)‏ في حرم شركة صن ميكروسيستمز (بالإنجليزية: Sun Microsystems)‏ في كاليفورنيا.[29] احتوت بيانات واي باك مشين على حوالي ثلاثة بيتابايت من البيانات اعتبارًا من عام 2009 وكان ينمو بمعدل 100 تيرابايت شهريًا.[30]

طُرح إصدار جديد ومحسّن من واي باك مشين للاختبار العام في عام 2011، بواجهة مستخدم محدثة ومؤشر محدّث للمحتوى المؤرشف، حيث تظهر اللقطات في تخطيط تقويمي مع دوائر يمثل عرضها عدد مرات الزحف يوميًا، ولكن بدون تمييز للمكررات باستخدام النجمة أو صفحة بحث متقدمة.[31][32] وأضيف شريط أدوات علوي لتسهيل التنقل بين اللقطات، ويوضح مخطط شريطي تردد اللقطات كل شهر على مر السنين.[33] أضيفت ميزات مثل "التغييرات" و"الملخص" وخريطة الموقع الرسومية لاحقًا.

قيل في منتدى واي باك مشين في مارس من ذلك العام أن "إصدار بيتا الجديد يحتوي على مؤشر أكثر اكتمالاً وتحديثًا لجميع المواد المستخرجة حتى عام 2010، وسيُحدث بانتظام. ويحتوي الفهرس الكلاسيكي الذي يشغل واي باك مشين فقط على القليل من المواد التي ترجع إلى ما بعد عام 2008، ولا توجد خطط لتطبيق المزيد من التحديثات على هذا الفهرس، حيث سيتم التخلص منه تدريجيًا هذا العام".[34] وفي عام 2011، قامت مؤسسة أرشيف الإنترنت بتثبيت الزوج السادس من وحدات تخزين PetaBox مما زاد من سعة تخزين واي باك مشين بمقدار 700 تيرابايت.[35]

أعلنت الشركة عن إنجاز تاريخي بلغ 240 مليار عنوان ويب في كانون الثاني/يناير 2013.[36]

وفي تشرين الأول/أكتوبر 2013، قدمت الشركة ميزة "حفظ صفحة"[37][38] التي تسمح لأي مستخدم للإنترنت بأرشفة محتويات عنوان URL، وتوليد رابط دائم بسرعة على عكس ميزة liveweb السابقة.

في كانون الأول/ديسمبر 2014، احتوت واي باك مشين على 435 مليار صفحة ويب - ما يقرب من تسعة بيتابايت من البيانات، وكانت تنمو بمعدل حوالي 20 تيرابايت أسبوعيًا.[16][39][40]

وفي حزيران/يوليو 2016، قيل أن واي باك مشين احتوت على حوالي 15 بيتابايت من البيانات.[41]

وفي أيلول/سبتمبر 2018، احتوت واي باك مشين على أكثر من 25 بيتابايت من البيانات.[42][43]

اعتبارًا من كانون الأول/ديسمبر 2020، احتوت واي باك مشين على أكثر من 70 بيتابايت من البيانات.[44]

ويُدّعى أن أرشيف الإنترنت، اعتبارًا من كانون الثاني/يناير 2024، قد خزن أكثر من 99 بيتابايت من البيانات حتى الآن.[2][3]

نمو واي باك مشين[45][46]
واي باك مشين حسب السنة الصفحات المؤرشفة
2004
30٬000٬000٬000(0-100B : Light blue)
2005
40٬000٬000٬000
2008
85٬000٬000٬000
2012
150٬000٬000٬000(100B-450B : Yellow)
2013
373٬000٬000٬000
2014
400٬000٬000٬000
2015
452٬000٬000٬000(450B-600B : Orange)
2016
459٬000٬000٬000
2017
279٬000٬000٬000
2018
310٬000٬000٬000
2019
345٬000٬000٬000
2020
405٬000٬000٬000
2021
514٬000٬000٬000
2022
640٬000٬000٬000(600B- : Red)
2024
866٬000٬000٬000

واجهة برمجة تطبيقات واي باك مشين

تقدم خدمة واي باك مشين ثلاث واجهات برمجة تطبيقات عامة (APIs): حفظ الصفحة الآن (بالإنجليزية: SavePageNow)‏ والتوفر (بالإنجليزية: Availability)‏ وخادم CDX.[47] يمكن استخدام حفظ الصفحة الآن لأرشفة صفحات الويب. وواجهة برمجة التطبيقات (التوفر) لفحص حالة توفر الأرشيف لصفحة ويب ما،[48] للتحقق مما إذا كان هناك أرشيف لصفحة الويب أم لا. وتستخدم واجهة برمجة التطبيقات CDX للاستعلامات المعقدة وتصفية وتحليل البيانات الملتقطة.[49][50]

سياسة استبعاد المواقع

احترمت سياسة واي باك مشين معيار استبعاد الروبوتات (robots.txt) في تحديد ما إذا كان سيتم زحف موقع الويب - أو إذا كانت قد زُحف غليه بالفعل وما إذا كانت محفوظاته ستكون متاحة للجمهور. كان لدى مالكي مواقع الويب خيار إلغاء الاشتراك في واي باك مشين باستخدام robots.txt.

طبقت واي باك مشين قواعد robots.txt رجعيًا؛ وإذا قام موقع ما بحظر أرشيف الإنترنت، فإن أي صفحات مؤرشفة سابقًا من المجال ستزال من الأرشيف. بالإضافة إلى ذلك، صرحت مؤسسة أرشيف الإنترنت بأنه "في بعض الأحيان، يتصل بنا مالك موقع الويب مباشرة ويطلب منا التوقف عن الزحف إلى موقع ما أو أرشفته. نحن نلتزم بهذه الطلبات".[51] بالإضافة إلى ذلك، يقول موقع الويب: "إن مؤسسة أرشيف الإنترنت ليست مهتمة بالحفاظ على أو تقديم الوصول إلى مواقع الويب أو مستندات الإنترنت الأخرى للأشخاص الذين لا يريدون موادهم في المجموعة".[52][53]


ظهرت تقارير عن مواقع انتهت صلاحيتها وأصبحت مجالات مركونة تستخدم ملف robots.txt لاستبعاد نفسها من محركات البحث في 17 نيسان/أبريل 2017، مما أدى إلى استبعادها عن طريق الخطأ من واي باك مشين.[54] قامت مؤسسة أرشيف الإنترنت بتغيير السياسة الآن ليتطلب طلب استبعاد صريح لإزالته منواي باك مشين.[24]

سياسة أرشيف أوكلاند

سياسة الاستبعاد الرجعي لـ واي باك مشين مستندة جزئياً إلى توصيات لإدارة طلبات الإزالة والحفاظ على سلامة الأرشيف، التي نشرتها كلية إدارة المعلومات والأنظمة بجامعة كاليفورنيا، بيركلي في عام 2002، والتي تمنح مالك موقع الويب الحق في حظر الوصول إلى أرشيف الموقع.[55] وقد امتثلت واي باك مشين لهذه السياسة للمساعدة في تجنب تكاليف التقاضي المكلفة.[56]

بدأت سياسة الاستبعاد الرجعي لـ واي باك مشينفي التخفيف في عام 2017، عندما توقفت عن احترام روبوتات مواقع الويب الحكومية والعسكرية الأمريكية للزحف وعرض صفحات الويب. اعتبارًا من أبريل 2017، بدأت واي باك مشين في تجاهل ملف robots.txt تجاهلا أكبر، وانطبق ذلك على كل مواقع الويب.[57][58][59][60]

استخدامات واي باك مشين

درس الباحثون واي باك مشين منذ إطلاقها للجمهور في عام 2001، سواء من حيث الطرق التي تخزن بها وتجمع البيانات، وكذلك من حيث الصفحات الفعلية الواردة في أرشيفها.

كتب الباحثون حوالي 350 مقالًا حول واي باك مشين اعتبارًا من عام 2013، معظمها من مجالات تكنولوجيا المعلومات، وعلوم المكتبات، والعلوم الاجتماعية. استخدم باحثو العلوم الاجتماعية واي باك مشين لتحليل كيفية تأثير تطور مواقع الويب من منتصف التسعينيات حتى الوقت الحاضر على نمو الشركة.[16]

عند قيام واي باك مشين بأرشفة صفحة، فإنها عادةً ما تتضمن معظم الروابط التشعبية، مع الحفاظ على نشاط هذه الروابط في الوقت الذي يمكن بسهولة أن تُكسر بسبب عدم استقرار الإنترنت. درس باحثون في الهند فعالية وقدرة واي باك مشين على حفظ الروابط التشعبية في المنشورات الأكاديمية عبر الإنترنت ووجدوا أنها حفظت أكثر من نصفها بقليل.[61]

يوظف الصحفيون واي باك مشين للاطلاع على مواقع الويب المعطلة والتقارير الإخبارية المؤرخة، وكذلك تتبع التغييرات في محتوى المواقع. وقد استخدمت محتوياتها لمحاسبة السياسيين وكشف الأكاذيب في ساحات المعارك.[62]

على سبيل المثال، في عام 2014، كشفت صفحة وسائط اجتماعية مؤرشفة لإيجور جيركين، زعيم المتمردين الانفصاليين في أوكرانيا، تفاخره بإسقاط قواته لطائرة عسكرية يشتبه بأنها أوكرانية، وذلك قبل أن يُعرف أن الطائرة كانت في الواقع طائرة مدنية تابعة للخطوط الجوية الماليزية (رحلة الخطوط الجوية الماليزية 17)، وبعد ذلك قام بحذف المنشور واتهم جيش أوكرانيا بإسقاط هذه الطائرة.[62][63]

في عام 2017، انطلقت "مسيرة من أجل العِلم" (March for Science) من مناقشة على موقع Reddit تشير إلى أن شخصًا ما زار موقع Archive.org واكتشف أن جميع الإشارات إلى تغير المناخ قد حُذفت من موقع البيت الأبيض. وردًا على ذلك، علق أحد المستخدمين، "هناك حاجة لمسيرة علماء إلى واشنطن".[64][65][66]

يستخدم الموقع علاوة على ذلك استخداما مكثفا للتحقق، حيث يوفر الوصول إلى المراجع وإنشاء المحتوى من قبل محرري ويكيبيديا.[67] ويقوم أرشيف الإنترنت بأرشفة عناوين الارتباط الجديدة عند إضافتها إلى ويكيبيديا.[67]

المحدودية

كانت هناك فترة تأخير مدتها ستة أشهر بين وقت زحف موقع الويب ووقت توفره للعرض في واي باك مشين في عام 2014. وتبلغ فترة التأخير الحالية من 3 إلى 10 ساعات.[68][24] توفر واي باك مشين ميزات بحث محدودة فقط. وتسمح ميزة "البحث في الموقع" للمستخدمين بالعثور على موقع بناءً على الكلمات التي تصف الموقع، وليس الكلمات الموجودة على صفحات الويب نفسها.[69]

لا تشمل واي باك مشين كل صفحات الويب على الإطلاق، وذلك بسبب قيود زاحف الويب الخاص بها. لا يمكن لـ واي باك مشين أرشفة صفحات الويب التي تحتوي على ميزات تفاعلية مثل منصات Flash والنماذج المكتوبة بلغة JavaScript وتطبيقات الويب التفاعلية أرشفة كاملة، لأن هذه الوظائف تتطلب التفاعل مع موقع الويب المضيف. وهذا يعني أنه منذ حوالي 9 يوليو 2013، لم تتمكن واي باك مشين من عرض تعليقات يوتيوب عند حفظ صفحات مشاهدة الفيديو، حيث أنه وفقًا لفريق الأرشفة، لم يعد يتم "تحميل التعليقات داخل الصفحة نفسها".[70]

يواجه زاحف ويب واي باك مشين صعوبة في استخراج أي شيء غير مشفر بلغة HTML أو أحد متغيراتها، مما يمكن أن يؤدي غالبًا إلى وجود روابط تشعبية مكسورة وصور مفقودة. ولهذا السبب، لا يمكن لزاحف الويب أرشفة "الصفحات اليتيمة" التي لا تربط بواسطة صفحات أخرى.[69][71] يتبع زاحف واي باك مشين فقط عددًا محددًا من الروابط التشعبية بناءً على حد عمق محدد مسبقًا، لذلك لا يمكنه أرشفة كل رابط تشعبي على كل صفحة.[23]

في الأدلة القانونية

الدعاوى المدنية

شركة نيتبولا ضد شركة كرودينت للبرمجيات

في قضية شركة نيتبولا ضد شركة كرودينت للبرمجيات عام 2009، قدمت شركة كرودينت طلبًا لإجبار شركة نيتبولا على تعطيل ملف robots.txt على موقعها الإلكتروني الذي كان يتسبب في إزالة واي باك مشين للوصول إلى الإصدارات السابقة من الصفحات التي كانت قد أرشفتها من موقع نيتبولا، اعتقدت شركة كرودينت أن هذه الصفحات ستدعم قضيتها.[72]

اعترضت شركة نيتبولا على الطلب بحجة أن المدعى عليهم يطلبون تغيير موقع نيتبولا الإلكتروني وأن عليهم أن يستدعوا أرشيف الإنترنت للحصول على الصفحات مباشرة.[73] ومع ذلك، قدم موظف في أرشيف الإنترنت بيانًا تحت القسم يدعم طلب كرودينت ، مشيرًا إلى أنه لا يمكنه إنتاج صفحات الويب بأي وسيلة أخرى "دون عناء كبير ومكلف وتعطيل عملياتها".[72]

رفض قاضي المحكمة الجزئية هاوارد لويد في المنطقة الشمالية من كاليفورنيا، فرع سان خوسيه، حجج شركة نيتبولا وأمرها بتعطيل الحظر المؤقت لملف robots.txt للسماح لشركة كرودينت باسترداد الصفحات المؤرشفة التي كانت تسعى إليها.[72]

تلفزيون بولندا الولايات المتحدة، إنك. ضد شركة إيكوستار للساتلايت

في قضية تلفزيون بولندا الولايات المتحدة، إنك. ضد شركة إيكوستار للساتلايت، حاول أحد الخصوم استخدام أرشيف واي باك مشين كمصدر للبيانات المقبولة في المحكمة، ربما للمرة الأولى.

قبل إجراءات المحاكمة، أشارت إيكوستار إلى أنها تنوي تقديم لقطات من واي باك مشين كدليل على محتوى موقع تلفزيون بولندا السابق. قدمت محطة تلفزيون بولندا طلبًا لإبطال هذه اللقطات بدعوى أنها تعتبر من الشائعات ولم يُتأكد من مصدرها. ومع ذلك، رفض القاضي أرلاندر كيز ادعاء تلفزيون بولندا بشأن الشائعات ورفض طلبها لإقصاء هذا الدليل من المحاكمة.[74][75]

ومع ذلك، نقض قاضي المحكمة الجزئية رونالد غوزمان الذي يرأس المحاكمة قرار القاضي أرلاندر كيز، وقرر أن كلاً من إفادة موظف مؤسسة أرشيف الإنترنت وصفحات الويب الأساسية (أي موقع تلفزيون بولندا) غير مقبولين كدليل. استنتج القاضي غوزمان أن إفادة الموظف تحتوي على شائعات وبيانات داعمة غير قاطعة، وأن صفحات الويب المطبوعة ليست ذاتية التصديق.

قانون براءات الاختراع

مكتب الولايات المتحدة للبراءات والعلامات التجارية ومكتب البراءات الأوروبي سيقبلان النسخ الزمنية من أرشيف الإنترنت كدليل على وقت توفر صفحة ويب معينة للجمهور. حيث ستستخدم هذه التواريخ لتحديد ما إذا كانت صفحة ويب متاحة كفن سابق، على سبيل المثال عند فحص طلب براءة اختراع.[76]

حدود المنفعة

هناك قيود تقنية لأرشفة موقع الويب، ونتيجة لذلك، يمكن للأطراف المتنازعة في التقاضي أن يسيئ استخدام النتائج التي توفرها أرشيفات مواقع الويب.

يمكن أن تتفاقم هذه المشكلة بسبب ممارسة تقديم لقطات شاشة لصفحات الويب في الشكاوى أو الإجابات أو تقارير الخبراء عندما لا يكشف عن الروابط الأساسية وبالتالي، يمكن أن تحتوي على أخطاء.

على سبيل المثال، لا تقوم الأرشيفات مثل واي باك مشين بتعبئة النماذج وبالتالي، لا تتضمن محتويات قواعد البيانات التجارية غير النظيفة (RESTful) في أرشيفاتها.[77]

الوضع القانوني

يمكن اعتبار واي باك مشين في أوروبا على أنها تنتهك قوانين حقوق النشر. ومنشئ أو مبدع المحتوى فقط هو من يمكنه تحديد مكان نشر أو تكرار استخدام محتواه، لذلك يجب على الأرشيف حذف الصفحات من نظامه عند طلب المبدع.[78] يمكن العثور على سياسات الاستبعاد الخاصة بواي باك مشين في قسم الأسئلة الشائعة في الموقع.[79]

رُفعت بعض القضايا ضد مؤسسة أرشيف الإنترنت بسبب عملها في أرشفة واي باك مشين.

القضايا القانونية المتعلقة بالمحتوى المؤرشف

العلموية

في أواخر عام 2002، قام أرشيف الإنترنت بإزالة العديد من المواقع التي كانت تنتقد العِلمولوجيا من آلة واي باك مشين.[80] ذكرت رسالة خطأ أن هذا كان استجابةً لـ "طلب من مالك الموقع".[81] وضح في وقت لاحق أن محامين من الكنيسة العلموية كانوا قد طالبوا بالإزالة وأن مالكي الموقع لم يرغبوا في إزالة موادهم.[82]

محاموا الرعاية الصحية، المحدودة

في عام 2003، دافع هاردينج إيرلي فولمر وفرايلي عن عميل من نزاع حول العلامة التجارية باستخدام واي باك مشين. تمكن المحامون من إثبات عدم صحة الادعاءات التي قدمها المدعي، استنادًا إلى محتوى موقعه الإلكتروني من عدة سنوات سابقة. ثم قام المدعي، محاموا الرعاية الصحية، بتعديل شكواه ليشمل أرشيف الإنرتنت، متهمًا المنظمة بانتهاك حقوق النشر وكذلك انتهاكات DMCA وقانون الاحتيال والاعتداء على الكمبيوتر.

ادعى محاموا الرعاية الصحية أنه نظرًا لتثبيته ملف robots.txt على موقعه الإلكتروني، حتى بعد رفع الدعوى الأولية، كان على مؤسسة الأرشيف إزالة جميع النسخ السابقة لموقع المدعي من واي باك مشين، ومع ذلك، استمر ظهور بعض المواد بشكل عام على واي باك مشين.[83] انتهت الدعوى خارج المحكمة بعد أن قام واي باك مشين بإصلاح المشكلة.[84]

المراجع

  1. Kahle، Brewster (23 نوفمبر 2005). "Universal Access to all Knowledge". Internet Archive. مؤرشف من الأصل في 2022-08-14. اطلع عليه بتاريخ 2022-06-05.
  2. 2٫0 2٫1 "Internet Archive: Wayback Machine". web.archive.org. مؤرشف من الأصل في 2023-03-13. The current number of archived pages can be seen at the archive's home page.
  3. 3٫0 3٫1 Kahle، Brewster. "A Message from Internet Archive Founder, Brewster Kahle". Internet Archive. اطلع عليه بتاريخ 2024-01-10.
  4. PepsiCo, Inc. (10 مايو 1996). "PepsiCo Home Page". Internet Archive/Wayback Machine. مؤرشف من الأصل في 1996-05-10. اطلع عليه بتاريخ 2022-10-08.
  5. "Wayback Machine General Information". Internet Archive. مؤرشف من الأصل في 2019-12-05. اطلع عليه بتاريخ 2021-03-02.
  6. "WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. مؤرشف من الأصل في 2020-05-14. اطلع عليه بتاريخ 2016-03-13.
  7. "InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. مؤرشف من الأصل في 2020-05-12. اطلع عليه بتاريخ 2016-03-13.
  8. Notess، Greg R. (مارس–أبريل 2002). "The Wayback Machine: The Web's Archive". Online. ج. 26: 59–61. INIST:13517724.
  9. "The Wayback Machine"، Frequently Asked Questions، مؤرشف من الأصل في 2018-09-18، اطلع عليه بتاريخ 2018-09-18
  10. 10٫0 10٫1 "20,000 Hard Drives on a Mission". Internet Archive Blogs. 25 أكتوبر 2016. مؤرشف من الأصل في 2018-10-20. اطلع عليه بتاريخ 2018-10-15.
  11. Green، Heather (28 فبراير 2002). "A Library as Big as the World". BusinessWeek. مؤرشف من الأصل في 2011-12-20.
  12. Tong، Judy (8 سبتمبر 2002). "Responsible Party – Brewster Kahle; A Library Of the Web, On the Web". The New York Times. مؤرشف من الأصل في 2011-02-20. اطلع عليه بتاريخ 2011-08-15.
  13. Keith Scott (2000). The Moose that Roared: The Story of Jay Ward, Bill Scott, a Flying Squirrel, and a Talking Moose. St. Martin's Press. (ردمك 0-312-19922-8)
  14. Cook، John (1 نوفمبر 2001). "Web site takes you way back in Internet history". Seattle Post-Intelligencer. مؤرشف من الأصل في 2014-08-12. اطلع عليه بتاريخ 2011-08-15.
  15. Mayfield، Kendra (28 أكتوبر 2001). "Wayback Goes Way Back on Web". Wired. مؤرشف من الأصل في 2017-10-16. اطلع عليه بتاريخ 2017-10-16.
  16. 16٫0 16٫1 16٫2 Arora، Sanjay K.؛ Li، Yin؛ Youtie، Jan؛ Shapira، Philip (5 مايو 2015). "Using the wayback machine to mine websites in the social sciences: A methodological resource". Journal of the Association for Information Science and Technology. ج. 67 ع. 8: 1904–1915. DOI:10.1002/asi.23503. ISSN:2330-1635.
  17. 17٫0 17٫1 17٫2 17٫3 17٫4 17٫5 17٫6 17٫7 Leetaru، Kalev (28 يناير 2016). "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web". Forbes. مؤرشف من الأصل في 2017-10-16. اطلع عليه بتاريخ 2017-10-16.
  18. "Internet Archive: Wayback Machine". Internet Archive. مؤرشف من الأصل في 2014-01-03. اطلع عليه بتاريخ 2018-10-15.
  19. Graham، Mark (30 أكتوبر 2020). "Fact Checks and Context for Wayback Machine Pages". Internet Archive Blogs. اطلع عليه بتاريخ 2021-01-17.
  20. Attempts to 'save page now' domains such as tpc.googlesyndication.com or s0.2mdn.net or atdmt.com or adbrite.com result in "This URL is in our block list and cannot be captured."
  21. Kahle، Brewster. "Archiving the Internet". Scientific American – March 1997 Issue. مؤرشف من الأصل في 2012-04-03. اطلع عليه بتاريخ 2011-08-19.
  22. Kaplan، Jeff (27 أكتوبر 2014). "Archive-It: Crawling the Web Together". Internet Archive Blogs. مؤرشف من الأصل في 2017-10-12. اطلع عليه بتاريخ 2017-10-16.
  23. 23٫0 23٫1 "Worldwide Web Crawls". Internet Archive. مؤرشف من الأصل في 2017-10-19. اطلع عليه بتاريخ 2017-10-16.
  24. 24٫0 24٫1 24٫2 "Using The Wayback Machine". Internet Archive. اطلع عليه بتاريخ 2022-04-03.
  25. "Wide Crawl Number 13". Internet Archive. مؤرشف من الأصل في 2017-10-19. اطلع عليه بتاريخ 2017-10-16.
  26. "Too Many Requests". Internet Archive. 10 نوفمبر 2019. اطلع عليه بتاريخ 2021-11-27.
  27. "Petabox". Internet Archive. اطلع عليه بتاريخ 2018-10-25.
  28. Kanellos، Michael (29 يوليو 2005). "Big storage on the cheap". CNET News. مؤرشف من الأصل في 2007-04-03. اطلع عليه بتاريخ 2007-07-29.
  29. "Internet Archive and Sun Microsystems Create Living History of the Internet". Sun Microsystems. 25 مارس 2009. مؤرشف من الأصل في 2009-03-26. اطلع عليه بتاريخ 2009-03-27.
  30. Mearian، Lucas (19 مارس 2009). "Internet Archive to unveil massive Wayback Machine data center". Computerworld. مؤرشف من الأصل في 2009-03-23. اطلع عليه بتاريخ 2009-03-22.
  31. gojomo (24 يناير 2011). "Updated Wayback Machine in Beta Testing". مؤرشف من الأصل في 2011-08-23. اطلع عليه بتاريخ 2011-08-19.
  32. "Advanced Search". Wayback Machine. مؤرشف من الأصل في 2010-01-31. اطلع عليه بتاريخ 2022-04-03.
  33. "What's the difference between the classic Wayback Machine and the new Beta version?". مؤرشف من الأصل في 2010-12-25. اطلع عليه بتاريخ 2021-11-17.
  34. "Beta Wayback Machine, in forum". مؤرشف من الأصل في 2014-04-17. اطلع عليه بتاريخ 2014-04-16.
  35. "Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used". Internet Archive. مؤرشف من الأصل في 2016-10-24. اطلع عليه بتاريخ 2018-10-25.
  36. "Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs". 9 يناير 2013. مؤرشف من الأصل في 2014-04-14. اطلع عليه بتاريخ 2014-04-16.
  37. Rossi، Alexis (25 أكتوبر 2013). "Fixing Broken Links on the Internet". Internet Archive. San Francisco, CA, US: Collections Team, the Internet Archive. مؤرشف من الأصل في 2014-11-07. اطلع عليه بتاريخ 2015-03-25. We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.
  38. Baron، Alexander (23 أكتوبر 2013). "The new Internet Archive Wayback Machine now online". Digital Journal. مؤرشف من الأصل في 2020-11-19. اطلع عليه بتاريخ 2020-11-19.
  39. "Internet Archive Frequently Asked Questions". مؤرشف من الأصل في 2009-10-21. اطلع عليه بتاريخ 2015-01-17.
  40. "Internet Archive Frequently Asked Questions". 18 ديسمبر 2014. مؤرشف من الأصل في 2014-12-18. اطلع عليه بتاريخ 2018-12-13.
  41. "Can the manipulation of big data change the way the world thinks?". The National. مؤرشف من الأصل في 2017-01-12. اطلع عليه بتاريخ 2017-05-14.
  42. Crockett، Zachary (28 سبتمبر 2018). "Inside Wayback Machine, the internet's time capsule". The Hustle. مؤرشف من الأصل في 2018-10-02. اطلع عليه بتاريخ 2018-10-26.
  43. Heffernan، Virginia (18 سبتمبر 2018). "Things Break and Decay on the Internet—That's a Good Thing". WIRED. مؤرشف من الأصل في 2018-09-25. اطلع عليه بتاريخ 2018-10-26.
  44. "Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine". adafruit. مؤرشف من الأصل في 2020-12-02. اطلع عليه بتاريخ 2020-12-02.
  45. michelle (9 مايو 2014). "Wayback Machine Hits 400,000,000,000!". Internet Archive. مؤرشف من الأصل في 2014-08-26. اطلع عليه بتاريخ 2015-03-25.
  46. "Internet Archive". Internet Archive. مؤرشف من الأصل في 2020-12-31. اطلع عليه بتاريخ 2021-03-08.
  47. "Wayback Machine APIs | Internet Archive". Internet Archive.
  48. waybackpy على غيت هاب
  49. "Developers". Internet Archive Blogs. 22 أغسطس 2014. مؤرشف من الأصل في 2024-02-12.
  50. Gonzalez، John (13 ديسمبر 2018). "Documentation for Public APIs at the Internet Archive". Internet Archive Blogs. مؤرشف من الأصل في 2024-01-13.
  51. "FAQs – Some sites are not available because of Robots.txt or other exclusions. What does that mean?". Internet Archive Wayback Machine. مؤرشف من الأصل في 2011-04-15.
  52. "Frequently Asked Questions". Internet Archive. مؤرشف من الأصل في 2014-04-17.
  53. Cox، Joseph (22 مايو 2018). "The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers". Vice. مؤرشف من الأصل في 2018-05-22. اطلع عليه بتاريخ 2018-05-23.
  54. "Robots.txt meant for search engines don't work well for web archives". Internet Archive. 17 أبريل 2017. اطلع عليه بتاريخ 2019-06-29.
  55. "Recommendations for Managing Removal Requests And Preserving Archival Integrity". University of California. 14 ديسمبر 2002. مؤرشف من الأصل في 2017-09-18. اطلع عليه بتاريخ 2017-09-14.
  56. "Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy". Internet Archive. 7 يوليو 2014. مؤرشف من الأصل في 2017-10-10. اطلع عليه بتاريخ 2017-09-14.
  57. Graham، Mark (17 أبريل 2017). "Robots.txt meant for search engines don't work well for web archives". Internet Archive Blogs. مؤرشف من الأصل في 2017-04-17. اطلع عليه بتاريخ 2017-04-16.
  58. "Archivierung des Internets: Internet Archive ignoriert künftig robots.txt" (بDeutsch). heise online. 25 Apr 2017. Archived from the original on 2017-04-27. Retrieved 2017-05-14.
  59. "Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de" (بDeutsch). Archived from the original on 2017-06-19. Retrieved 2017-05-14.
  60. "Internet Archive will ignore robots.txt files to keep historical record accurate". Digital Trends. 24 أبريل 2017. مؤرشف من الأصل في 2017-05-16. اطلع عليه بتاريخ 2017-05-14.
  61. Sampath Kumar، B.T.؛ Prithviraj، K.R. (21 أكتوبر 2014). "Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs". Journal of Information Science. ج. 41 ع. 1: 71–81. DOI:10.1177/0165551514552752. ISSN:0165-5515. S2CID:28320982.
  62. 62٫0 62٫1 Nelson، Steven (17 أغسطس 2016). "Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed". U.S. News & World Report. مؤرشف من الأصل في 2017-01-06. اطلع عليه بتاريخ 2017-05-14.
  63. Lepore، Jill (26 يناير 2015). "What the Web Said Yesterday". The New Yorker. مؤرشف من الأصل في 2015-01-25. اطلع عليه بتاريخ 2017-05-14.
  64. Guarino، Ben (21 أبريل 2017). "The March for Science began with this person's 'throwaway line' on Reddit". Washington Post. مؤرشف من الأصل في 2017-04-23. اطلع عليه بتاريخ 2017-04-23.
  65. Kaplan، Sarah (25 يناير 2017). "Are scientists going to march on Washington?". The Washington Post. مؤرشف من الأصل في 2017-01-31. اطلع عليه بتاريخ 2017-01-31.
  66. Foley، Katherine Ellen (22 أبريل 2017). "The global March for Science started with a single Reddit thread". Quartz. مؤرشف من الأصل في 2017-04-24. اطلع عليه بتاريخ 2017-04-23.
  67. 67٫0 67٫1 Graham، Mark (1 أكتوبر 2018). "More than 9 million broken links on Wikipedia are now rescued". Internet Archive Blogs. مؤرشف من الأصل في 2023-04-08.
  68. "Internet Archive Frequently Asked Questions". Internet Archive. 2 أبريل 2014. مؤرشف من الأصل في 2014-04-02. اطلع عليه بتاريخ 2018-11-23.
  69. 69٫0 69٫1 Bates، Mary Ellen (2002). "The Wayback Machine". Online. ج. 26: 80.
  70. "YouTube – Archiveteam". archiveteam.org. مؤرشف من الأصل في 2020-08-05. اطلع عليه بتاريخ 2020-08-06.
  71. "Internet Archive Frequently Asked Questions". Internet Archive. مؤرشف من الأصل في 2013-04-20. اطلع عليه بتاريخ 2018-10-18.
  72. 72٫0 72٫1 72٫2 Lloyd، Howard (أكتوبر 2009). "Order to Disable Robots.txt" (PDF). مؤرشف من الأصل (PDF) في 2019-08-08. اطلع عليه بتاريخ 2009-10-15.
  73. Cortes، Antonio (أكتوبر 2009). "Motion Opposing Removal of Robots.txt". مؤرشف من الأصل في 2010-10-27. اطلع عليه بتاريخ 2009-10-15.
  74. Gelman، Lauren (17 نوفمبر 2004). "Internet Archive's Web Page Snapshots Held Admissible as Evidence". Packets. ج. 2 ع. 3. مؤرشف من الأصل في 2011-04-30. اطلع عليه بتاريخ 2007-01-04.
  75. Howell، Beryl A. (فبراير 2006). "Proving Web History: How to use the Internet Archive" (PDF). Journal of Internet Law: 3–9. مؤرشف من الأصل (PDF) في 2010-07-05. اطلع عليه بتاريخ 2008-08-06.
  76. Coggins، Wynn W. (Fall 2002). "Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?". USPTO. مؤرشف من الأصل في 2012-09-21. اطلع عليه بتاريخ 2012-08-15.
  77. "Debunking the Wayback Machine". مؤرشف من الأصل في 2010-06-29.
  78. Bahr, Martin (2002). "The Wayback Machine und Google Cache – eine Verletzung deutschen Urheberrechts?". JurPC (بDeutsch): 9. DOI:10.7328/jurpcb/20021719. Archived from the original on 2009-08-23.
  79. "Internet Archive FAQ". مؤرشف من الأصل في 2014-04-17. اطلع عليه بتاريخ 2014-04-16.
  80. Bowman، Lisa M (24 سبتمبر 2002). "Net archive silences Scientology critic". CNET News. مؤرشف من الأصل في 2012-05-15. اطلع عليه بتاريخ 2007-01-04.
  81. Jeff (23 سبتمبر 2002). "exclusions from the Wayback Machine" (Blog). Wayback Machine Forum. Internet Archive. مؤرشف من الأصل في 2007-02-11. اطلع عليه بتاريخ 2007-01-04. Author and Date indicate initiation of forum thread.
  82. Miller، Ernest. "Sherman, Set the Wayback Machine for Scientology". LawMeme. Yale Law School. مؤرشف من الأصل (Blog) في 2012-11-16. اطلع عليه بتاريخ 2007-01-04.
  83. Dye، Jessica (2005). "Website Sued for Controversial Trip into Internet Past". EContent. 28. ج. 11: 8–9.
  84. Bangeman، Eric (31 أغسطس 2006). "Internet Archive Settles Suit Over Wayback Machine". Ars Technica. مؤرشف من الأصل في 2007-11-05. اطلع عليه بتاريخ 2007-11-29.