इंटरनेट: HTTP और HTML
मैं जैस्मीन हूँ और मैं XBOX वन इंजीनियरिंग टीम में एक प्रोग्राम मैनेजर
हूँ। हमारी सबसे बड़ी विशेषताओं में से एक है XBOX लाइव। यह एक ऑनलाइन सेवा है जो दुनिया भर के गेमर्स को
जोड़ती है, और हम ऐसा करने के लिए इंटरनेट पर भरोसा करते हैं। यह
कोई आसान काम नहीं है और पर्दे के पीछे बहुत सारी चीजें हो रही होती हैं। इंटरनेट लोगों के
इंटरैक्ट और कनेक्ट करने के तरीके को पूरी तरह बदल रहा है। लेकिन ये कैसे काम करता है? दुनिया
भर के कंप्यूटर वास्तव में एक दूसरे के साथ कैसे संवाद करते हैं? आइये वेब ब्राउजिंग पर नजर डालते हैं।
सबसे पहले, आप वेब ब्राउज़र खोलते हैं। यह वेब पेज तक पहुँचने के लिए आपके द्वारा उपयोग किया जाने वाला ऐप है। इसके बाद,
आप वेब पते या URL पर टाइप करते हैं, जिसका अर्थ है जिस साइट को आप खोलना चाहते हैं उसका यूनिफ़ॉर्म रिसोर्स लोकेटर,
उदाहरण के लिए tumblr.com। नमस्ते, मैं डेविड कार्प, टम्बलर का संस्थापक हूँ और हम आज यहां इस बारे में
बात करने के लिए हैं कि हमारे द्वारा हर रोज़ इस्तेमाल किये जाने वाले वेब ब्राउज़र कैसे काम करते हैं। तो आपको शायद
आश्चर्य हुआ हो कि वास्तव में क्या होता है जब आप अपने वेब ब्राउज़र में पता टाइप करते हैं और
फिर एंटर दबाते हैं। और यह वास्तव में उतना ही क्रेजी है जितना आप कल्पना कर सकते हैं। तो उस क्षण आपका कंप्यूटर
दूसरे कंप्यूटर से बात करना शुरू कर देता है, जिसे सर्वर कहा जाता है, जो आमतौर पर हजारों मील
दूर होता है। और मिलीसेकंड में आपका कंप्यूटर उस सर्वर से वेबसाइट के बारे में
पूछता है, और वह सर्वर आपके कंप्यूटर से HTTP नामक भाषा में वापस बात करना शुरू कर देता है। HTTP का अर्थ है हाइपर टेक्स्ट
ट्रांसफर प्रोटोकॉल। आप इसे एक भाषा समझ सकते हैं जो एक कंप्यूटर किसी दस्तावेज़ के
बारे में दूसरे कंप्यूटर से पूछने के लिए उपयोग करता है। और यह वास्तव में बहुत स्पष्ट है।
यदि आप इंटरनेट पर अपने कंप्यूटर और वेब सर्वर के बीच बातचीत को इंटरसेप्ट
करना चाहते थे, तो यह मुख्य रूप से "GET" अनुरोधों से बना है। वे वास्तव में बहुत
ही सरल शब्द GET और आपके द्वारा अनुरोध किए जा रहे दस्तावेज़ का नाम हैं। इसलिए यदि आप
टम्बलर में लॉग इन करने की कोशिश करते हैं और हमारे लॉगिन पेज को लोड करते हैं, तो आप टम्बलर के सर्वर को GET अनुरोध भेज रहे
हैं, जिसे कहते हैं GET / लॉगिन। और यह टम्बलर के सर्वर को बताता है कि आप टम्बलर लॉगिन पृष्ठ के
लिए सभी HTML कोड चाहते हैं। HTML का अर्थ है हाइपर टेक्स्ट मार्कअप लैंग्वेज और आप इसे
एक भाषा के रूप में देख सकते हैं, जिसे आप अपने वेब ब्राउज़र को यह बताने के लिए इस्तेमाल करते हैं कि पेज कैसा दिखाई देना चाहिए। यदि
आप विकिपीडिया जैसी किसी चीज़ के बारे में सोचते हैं, जो वास्तव में सिर्फ एक बड़ा सरल दस्तावेज़ है
और HTML वह भाषा है जिसका उपयोग आप उस शीर्षक को बड़ा और बोल्ड बनाने, फ़ॉन्ट को सही फ़ॉन्ट बनाने, कुछ टेक्स्ट
को कुछ अन्य पृष्ठों से जोड़ने, कुछ टेक्स्ट को बोल्ड करने, कुछ टेक्स्ट को इटैलिक बनाने, पृष्ठ के बीच में
एक तस्वीर लगाने, तस्वीर को दाईं ओर संरेखित करने, तस्वीर को
बाईं ओर संरेखित करने के लिए करते हैं। एक वेब पेज का टेक्स्ट सीधे HTML में शामिल है, लेकिन तस्वीरों या
वीडियो जैसे अन्य हिस्से स्वयं के URL के साथ अलग-अलग फाइलें हैं जिन्हें अनुरोध करने
की आवश्यकता होती है। ब्राउज़र इनमें से प्रत्येक के लिए अलग-अलग HTTP अनुरोध भेजता है और उन्हें
आते ही प्रदर्शित करता है। यदि किसी वेब पेज में बहुत सारी अलग-अलग तस्वीरें हैं, तो उनमें से प्रत्येक एक अलग HTTP अनुरोध
का कारण बनती है और पृष्ठ धीरे-धीरे लोड होता है। अब कभी-कभी जब आप वेब ब्राउज़ करते हैं, तो आप केवल
GET अनुरोधों के साथ पृष्ठों का अनुरोध नहीं कर रहे हैं। कभी-कभी जब आप कोई फ़ॉर्म भरते हैं
या सर्च क्वेरी टाइप करते हैं तो सूचना भेजते हैं। आपका ब्राउज़र HTTP पोस्ट अनुरोध का
उपयोग करके यह जानकारी सादे टेक्स्ट में वेब सर्वर को भेजता है।
मान लीजिए कि आप टम्बलर पर लॉग इन करते हैं। सबसे पहले आप पोस्ट
अनुरोध करते हैं, टम्बलर के लॉग इन पृष्ठ के लिए एक पोस्ट है,
जिसमें कुछ डेटा संलग्न है। इसमें आपका ईमेल पता, आपका पासवर्ड है। यह टम्बलर के
सर्वर पर जाता है। टम्बलर सर्वर बताता है यह ठीक है, आप डेविड हैं। यह वेब पेज को
वापस आपके ब्राउज़र पर भेजता है, जो कहता है, सफलता! डेविड के रूप में लॉग इन किया। लेकिन उस वेब पेज के साथ,
यह एक छोटा अदृश्य कुकी डेटा भी संलग्न करता है, जिसे आपका ब्राउज़र देखता है और सहेजना जानता है।
और यह वास्तव में महत्वपूर्ण है क्योंकि यही एकमात्र तरीका है जिससे वेबसाइट याद रख सकती है कि
आप कौन हैं। यह एक नंबर है, जो डेविड के रूप में
आपकी पहचान करता है। और आपका वेब ब्राउज़र उस नंबर को सहेजता है और अगली बार जब आप टम्बलर
को रीफ़्रेश करते हैं, जब आप Tumblr.com पर जाते हैं, तो आपका वेब ब्राउज़र उस ID नंबर को
स्वचालित रूप से उस अनुरोध के साथ संलग्न करना जानता है जो वह टम्बलर के सर्वरों को भेजता है। तो अब
टम्बलर के सर्वर आपके ब्राउज़र से आने वाले अनुरोध को देखते हैं, ID नंबर देखते हैं, और जानते हैं
"ठीक है, यह अनुरोध डेविड की तरफ से आया है।"
अब, इंटरनेट पूरी तरह से खुला है। इसके
सभी कनेक्शन शेयर्ड हैं और जानकारी सादे टेक्स्ट में भेजी जाती है। इससे हैकर्स के लिए आपके द्वारा
इंटरनेट पर भेजी जाने वाली जानकारी में ताक झाँक करना संभव हो जाता है। लेकिन
सुरक्षित वेबसाइटें आपके वेब ब्राउज़र को सिक्योर सॉकेट्स लेयर और उसके उत्तराधिकारी ट्रांसपोर्ट लेयर
सिक्योरिटी इस्तेमाल करके किसी सुरक्षित चैनल पर संवाद करने के लिए कहकर इसे रोकती हैं।
आप SSL और TLS को अपने संचार के चारों ओर सुरक्षा की एक परत के रूप में
देख सकते हैं, ताकि उन्हें जासूसी या छेड़छाड़ से बचाया जा सके।
जब आपको HTTPS के बगल में अपने ब्राउज़र
एड्रेस बार में एक छोटा लॉक दिखाई देता है, तो SSL और TLS सक्रिय होते हैं। HTTPS प्रोटोकॉल
यह सुनिश्चित करती हैं कि आपके HTTP अनुरोध सुरक्षित और संरक्षित हैं। जब कोई वेबसाइट आपके ब्राउज़र को
सुरक्षित कनेक्शन से जुड़ने के लिए कहती है, तो यह पहले एक डिजिटल प्रमाणपत्र प्रदान करता है। यह एक
तरह से आधिकारिक ID की तरह है, जो बताता है कि वेबसाइट जो दावा कर रही है, वो सही है। डिजिटल प्रमाणपत्र
प्रमाणपत्र अधिकारियों द्वारा प्रकाशित किए जाते हैं, जो विश्वसनीय संस्थाएं हैं जो वेबसाइटों
की पहचान को सत्यापित करती हैं और उनके लिए प्रमाण पत्र जारी करती हैं। सरकार द्वारा जारी किये जाने वाले
ID या पासपोर्ट की तरह। अब यदि कोई वेबसाइट ठीक से जारी डिजिटल प्रमाण पत्र के बिना सुरक्षित
कनेक्शन शुरू करने की कोशिश करती है, तो आपका ब्राउज़र आपको चेतावनी देगा। यह वेब ब्राउज़िंग की मूल बातें है!
इंटरनेट का वह हिस्सा जो हम दिन-प्रतिदिन देखते हैं।
संक्षेप में, HTTP और DNS HTML, मीडिया
फ़ाइलों या वेब पर कुछ भी भेजने और प्राप्त करने को प्रबंधित करते हैं। हुड के तहत जो इसे संभव
बनाता है वो है TCP/IP और राउटर नेटवर्क, जानकारी को तोड़कर छोटे पैकेट्स में
भेजते हैं। वे पैकेट स्वयं बाइनरी, 1s और 0s के अनुक्रमों में बने होते हैं जो भौतिक रूप से बिजली के तारों,
फाइबर ऑप्टिक केबल और वायरलेस नेटवर्क के माध्यम से भेजे जाते हैं।
एक बार जब आप समझ जाते हैं कि इंटरनेट की एक परत कैसे काम करती है, तो आप सभी विवरणों
को याद किए बिना उस पर भरोसा कर सकते हैं। और हमें भरोसा है कि यह सभी परतें एक साथ काम करेंगी
और लगातार बड़े पैमाने पर और भरोसे के साथ जानकारी देंगी।