PowerShell का उपयोग करके किसी भी वेबपेज से लिंक कैसे निकालें
PowerShell 3 में बहुत सारी नई सुविधाएँ हैं, जिनमें कुछ शक्तिशाली नई वेब-संबंधी सुविधाएँ भी शामिल हैं। वे नाटकीय रूप से वेब को स्वचालित करना आसान बनाते हैं, और आज हम आपको दिखाने जा रहे हैं कि आप वेबपेज से हर एक लिंक को कैसे निकाल सकते हैं, और यदि आप चाहें तो संसाधन को वैकल्पिक रूप से डाउनलोड कर सकते हैं।.
PowerShell के साथ वेब को स्क्रैप करना
दो नए cmdlets हैं जो वेब को स्वचालित करना आसान बनाते हैं, Invoke-WebRequest जो कि मानव पठनीय सामग्री को आसान बनाता है, और Invoke-RestMethod जो मशीन पठनीय सामग्री को पढ़ने के लिए आसान बनाता है। चूंकि लिंक एक पृष्ठ के HTML का हिस्सा हैं, वे मानव पठनीय सामान का हिस्सा हैं। एक वेबपेज प्राप्त करने के लिए आपको बस इतना करना है कि Invoke-WebRequest का उपयोग करें और इसे URL दें.
इनवोक-वेबरेस्ट -यूरी 'http://howtogeek.com'
यदि आप नीचे स्क्रॉल करते हैं, तो आप देखेंगे कि प्रतिक्रिया के पास एक लिंक संपत्ति है, हम PowerShell 3 की नई सदस्य गणना सुविधा का उपयोग कर सकते हैं ताकि उन्हें फ़िल्टर किया जा सके.
(इनवोक-वेबरैनेस्ट-उड़ी 'http://howtogeek.com') ।लिंक
जैसा कि आप देख सकते हैं कि आप बहुत सारे लिंक वापस पा सकते हैं, यह वह जगह है जहाँ आपको अपनी कल्पना का उपयोग करने की आवश्यकता है ताकि आप जिन लिंक्स को देख रहे हैं, उन्हें फ़िल्टर कर सकें। मान लें कि हम फ्रंट पेज पर सभी लेखों की एक सूची चाहते हैं.
((इनवोक-वेबरेस्ट -यूरी 'http://howtogeek.com') .Links | जहाँ-जहाँ $ _। Href- जैसा "http *" | जहाँ-वर्ग "शीर्षक")।
एक और बढ़िया चीज जो आप नए cmdlets के साथ कर सकते हैं वह है रोज़ डाउनलोड को स्वचालित करना। नेट जियो वेबसाइट से दिन की छवि को स्वचालित रूप से स्क्रैप करने की सुविधा देता है, ऐसा करने के लिए हम नए वेब cmdlets को स्टार्ट-बिट्सट्रांसफर के साथ जोड़ देंगे.
$ IOTD = ((Invoke-WebRequest -Uri 'http://photography.nationalgeographic.com/photography/photo-of-the-day/').Links | जहां इनर-HTML- जैसे "* डाउनलोड वॉलपेपर *") href
स्टार्ट-बिट्सट्रांसफर-स्रोत $ IOTD -Destination C: \ IOTD \
यही सब है इसके लिए। क्या आपकी खुद की कोई साफ सुथरी चाल है? हमें टिप्पणियों में बताएं.