सैन फ्रांसिस्को 22 नवंबर 2025। गोल्डन गेट ब्रिज के नीचे प्रेसिडियो नेशनल पार्क की शांत गलियों में एक सफेद इमारत खड़ी है। बाहर से यह जगह किसी पुराने क्रिश्चियन साइंटिस्ट चर्च जैसी दिखती है, जिसमें आठ गॉथिक कॉलम उसकी भव्यता को और बढ़ाते हैं। लेकिन अंदर कदम रखते ही साफ हो जाता है कि यह अब धार्मिक स्थल नहीं, बल्कि इंटरनेट का सबसे बड़ा संरक्षण केंद्र है। यही है इंटरनेट आर्काइव, वह नॉन-प्रॉफिट लाइब्रेरी जो लगभग तीन दशक से वेब के हर बदलाव को संभाल कर रख रही है।
आज भी जिस हॉल में कभी प्रार्थना गूंजती थी, वहां अब सर्वर की लगातार चलती आवाज़ें सुनाई देती हैं। यहीं मौजूद है दुनिया भर में लाखों लोगों द्वारा हर दिन इस्तेमाल की जाने वाली वेबैक मशीन—एक ऐसा टूल जो पुराने वेब पेजों को वैसे ही खोल देता है जैसा वे सालों पहले दिखते थे। पत्रकार, शोधकर्ता, फैक्ट-चेकर्स और इतिहासकार—सबके लिए यह अमूल्य संसाधन है।
और हाल ही में, वेबैक मशीन ने एक और ऐतिहासिक पड़ाव पार किया है—इसने अपना एक ट्रिलियनवां वेबपेज सेव किया है।
वेब को बचाने की जंग अब पहले से कठिन
इंटरनेट आज पहले जैसा नहीं रहा।
सरकारी वेबसाइटें बदली जा रही हैं, कई जगह जानकारी हटाई जा रही है। AI ने असली और कृत्रिम कंटेंट की सीमा को धुंधला कर दिया है। असंख्य पेज अब पेवॉल के पीछे लॉक हैं, और काफी जानकारी सीधे चैटबॉट्स के जवाबों में छिप जाती है—ऐसी जानकारी जो पारंपरिक वेबसाइटों पर कभी दिखती ही नहीं।
इन्हीं चुनौतियों के बीच इंटरनेट आर्काइव लगातार सारे डिजिटल इतिहास को बचाने की कोशिश में लगा है।
संस्थापक ब्रूस्टर काहले कहते हैं,
“हम यह सुनिश्चित करने की कोशिश करते हैं कि जो कुछ भी हुआ, उसका रिकॉर्ड रहे। ताकि लोग उससे सीख सकें और एक बेहतर भविष्य बना सकें।”
1996 से शुरू हुई यह डिजिटल लाइब्रेरी
काहले ने इंटरनेट आर्काइव 1996 में बनाया था। उस समय एक साल में सेव होने वाला पूरा वेब सिर्फ 2 टेराबाइट में फिट हो जाता था—आजकल यह सामान्य स्मार्टफोन की क्षमता है।
आज स्थिति बिल्कुल अलग है—आर्काइव हर दिन 150 टेराबाइट डेटा सेव कर रहा है। यानी रोज़ाना लाखों वेब पेज।
काहले बताते हैं कि यह चर्च जैसी इमारत सिर्फ सुंदर नहीं, बल्कि “स्थायित्व” का प्रतीक है—अलेक्ज़ेंड्रिया की प्रसिद्ध लाइब्रेरी की याद दिलाती हुई।
वेबैक मशीन सिर्फ स्क्रीनशॉट नहीं बचाती
वेबैक मशीन को अक्सर लोग पुराने पेजों की तस्वीरें समझ लेते हैं। लेकिन यह उससे कहीं ज़्यादा है। यह HTML, CSS, जावास्क्रिप्ट, इमेजेज़—यानी पेज की पूरी तकनीकी संरचना को सेव करता है। इसलिए जब असली वेबसाइट डाउन हो जाए, तब भी वेबैक मशीन पेज को वैसे ही चलाकर दिखा सकती है जैसा वह कभी था।
अब तो इंटरनेट आर्काइव AI द्वारा बनाए गए कंटेंट को भी स्टोर कर रहा है—जैसे ChatGPT के जवाब और Google के AI सारांश।
हर दिन आर्काइव की टीम सैकड़ों प्रॉम्प्ट और सवाल बनाकर चैटबॉट आउटपुट सेव करती है, ताकि भविष्य में पता चले कि लोगों को किस तरह की जानकारी दिखाई जाती थी।
राजनीतिक दबाव और वेब सेंसरशिप का रिकॉर्ड
आर्काइव की एक खास वजह यह भी है कि सरकारें और सिस्टम समय-समय पर ऑनलाइन डेटा में बड़े बदलाव करते हैं।
ट्रंप प्रशासन के दौरान हजारों सरकारी वेबपेज हटाए गए—हेल्थ पॉलिसी से लेकर सैन्य सेवाओं तक।
यह आर्काइव ही था जिसने 2004 से प्रशासनिक वेबसाइटों के बदलावों की कॉपी रखी और पत्रकारों का काम आसान किया।
काहले कहते हैं,
“लाइब्रेरी हमेशा निशाने पर रहती हैं। इसलिए हमें एक ऐसी संरचना चाहिए जो हर नज़रिए को लंबे समय तक सुरक्षित रख सके।”
वे लोग जो इंटरनेट का इतिहास बचा रहे हैं
इंटरनेट आर्काइव के 200 से ज़्यादा कर्मचारी—इंजीनियर, लाइब्रेरियन और आर्काइविस्ट—इसे संभालते हैं।
सैन फ्रांसिस्को के बाहर एक बड़े वेयरहाउस में अधिकतर सर्वर रखे गए हैं, जबकि कुछ सर्वर पुराने चर्च हॉल में प्रतीकात्मक रूप से लगाए गए हैं—ताकि लोग यह समझ सकें कि “ज्ञान की सामूहिक सुरक्षा” क्या होती है।
किताबें पेज-दर-पेज विशेष मशीनों से स्कैन की जाती हैं—और यह पूरा काम YouTube पर लाइवस्ट्रीम भी होता है।
बिल्डिंग में माइक्रोफिल्म से लेकर CD और पुराने टीवी फुटेज तक का ढेर है। इंटरनेट आर्काइव किताबें, संगीत, वीडियो गेम, टीवी शो—लगभग हर फॉर्मेट को बचाकर रख रहा है।
यहां कर्मचारियों की तीन फुट ऊंची मूर्तियों की एक "टेराकोटा आर्मी" भी बनी है—उन लोगों को सम्मान देने के लिए जो कम से कम तीन साल से इस काम का हिस्सा हैं।
भविष्य के लिए बना एक संसाधन
इंटरनेट आर्काइव किसी म्यूज़ियम की तरह कहानी सुनाने की कोशिश नहीं करता।
काहले साफ कहते हैं,
“हम सच तय करने नहीं आए हैं। हम सिर्फ़ वह सामग्री बचा रहे हैं जो आने वाले समय में लोगों के काम आएगी। यह एक संसाधन है, जहां हर व्यक्ति अपने विचार लेकर आ सकता है।”
सैन फ्रांसिस्को का यह पुराना चर्च अब इंटरनेट की सबसे बड़ी टाइम मशीन है—जहां हर पिक्सल, हर पेज और हर बदलाव को भविष्य के लिए सुरक्षित रखा जा रहा है।
और शायद यह वही जगह है जो याद दिलाती है कि डिजिटल दुनिया चाहें जितनी तेज़ बदले, इतिहास हमेशा बचाकर रखने लायक होता है।














