यूआरएल पार्सर
किसी भी यूआरएल को तेज़ी से पार्स करें—अपनी ज़रूरत के साफ़ हिस्से प्राप्त करें, कोई परेशानी नहीं।
इस टूल के बारे में
<पी>तो, आपको एक यूआरएल मिला है - शायद एक लॉग फ़ाइल से, एक उपयोगकर्ता इनपुट से, या वेब से कॉपी की गई किसी चीज़ से - और आपको इसे तोड़ने की ज़रूरत है। न केवल इसे देखें, बल्कि वास्तव में समझें कि प्रत्येक भाग का क्या अर्थ है। यहीं पर एक यूआरएल पार्सर आता है। यह जादू नहीं है, लेकिन यह करीब है। इसे वेब पतों के लिए स्विस आर्मी चाकू की तरह समझें। आप उस पर एक गन्दा या जटिल यूआरएल फेंकते हैं, और यह साफ, लेबल वाले टुकड़े वापस सौंप देता है: प्रोटोकॉल, डोमेन, पथ, क्वेरी पैरामीटर, टुकड़ा - जो कुछ भी वहां है।<पी>मैंने पिछले कुछ वर्षों में इन उपकरणों का एक समूह उपयोग किया है, और अधिकांश या तो अत्यधिक या बहुत बुनियादी हैं। कुछ लोग सब कुछ करने की कोशिश करते हैं - सत्यापन, पुनर्निर्देशन, स्वच्छता - जबकि अन्य बस तारों को विभाजित करते हैं और इसे समाप्त कर देते हैं। यह वाला? यह सीधा है. यह पार्स करता है. इतना ही। कोई फुलझड़ी नहीं. यदि आपको और अधिक की आवश्यकता है, तो आप इसके ऊपर निर्माण करें। सरल।मुख्य विशेषताएं
- किसी भी मानक URL को उसके मुख्य घटकों-स्कीम, होस्ट, पोर्ट, पथ, क्वेरी और खंड में तोड़ देता है।
- लापता प्रोटोकॉल, डिफ़ॉल्ट पोर्ट और एन्कोडेड वर्ण जैसे किनारे के मामलों को क्रैश किए बिना संभालता है।
- क्वेरी पैरामीटर को एक साफ़ ऑब्जेक्ट या शब्दकोश के रूप में लौटाता है, ताकि आपको मैन्युअल रूप से विभाजित और डिकोड न करना पड़े।
- पूर्ण और सापेक्ष दोनों यूआरएल के साथ काम करता है, क्योंकि ईमानदारी से कहें तो, हर लिंक "https://" से शुरू नहीं होता है।
- हल्का और तेज़—कोई निर्भरता नहीं, कोई सूजन नहीं। बस विश्लेषण करें और जाएं।
- कई भाषाओं (जावास्क्रिप्ट, पायथन, आदि) में उपलब्ध है, इसलिए आप जहां भी आपका कोड रहता है वहां इसका उपयोग कर सकते हैं।
अक्सर पूछे जाने वाले प्रश्न
<पी>प्रश्न: क्या यह यूआरएल को मान्य करता है, या बस उन्हें पार्स करता है?ए: यह पार्स करता है। यदि आप इसे "htp:/broken-url" जैसा कचरा खिलाते हैं, तो यह अभी भी इसका अर्थ निकालने का प्रयास करेगा, लेकिन यह नहीं कहेगा कि "अरे, यह अमान्य है।" वह आप पर है यदि आपको सत्यापन की आवश्यकता है, तो इसे रेगेक्स या समर्पित सत्यापनकर्ता के साथ जोड़ें। पार्सिंग और सत्यापन करना अलग-अलग कार्य हैं।<पी>प्रश्न: अंतर्राष्ट्रीय डोमेन या अजीब एन्कोडिंग के बारे में क्या?
उत्तर: हां, यह प्रतिशत-एन्कोडेड वर्णों को संभालता है (जैसे रिक्त स्थान के लिए %20) और उन्हें ठीक से डिकोड करता है। अंतरराष्ट्रीय डोमेन (जैसे .рф या .中国) के लिए, यह माना जाता है कि यदि आवश्यक हो तो वे पहले से ही पुनीकोड में हैं - अधिकांश आधुनिक सिस्टम यूआरएल के आपके पार्सर तक पहुंचने से पहले ही इसे संभाल लेते हैं। बस यह अपेक्षा न करें कि यह आपके लिए सिरिलिक का अनुवाद करेगा।