Comment extraire des liens de n'importe quelle page Web à l'aide de PowerShell

Nov 3, 2024
Cloud et Internet

PowerShell 3 propose de nombreuses nouvelles fonctionnalités, notamment de nouvelles fonctionnalités puissantes liées au Web. Ils simplifient considérablement l'automatisation du Web, et aujourd'hui, nous allons vous montrer comment extraire chaque lien d'une page Web et éventuellement télécharger la ressource si vous le souhaitez.

Racler le Web avec PowerShell

Il existe deux nouvelles applets de commande qui facilitent l'automatisation du Web, Invoke-WebRequest, qui facilite l'analyse du contenu lisible par l'homme, et Invoke-RestMethod qui facilite la lecture du contenu lisible par machine. Puisque les liens font partie du HTML d'une page, ils font partie des éléments lisibles par l'homme. Tout ce que vous avez à faire pour obtenir une page Web est d'utiliser Invoke-WebRequest et de lui donner une URL.

Invoke-WebRequest –Uri «http://howtogeek.com»

Si vous faites défiler vers le bas, vous verrez que la réponse a une propriété de liens, nous pouvons utiliser la nouvelle fonctionnalité d'énumération des membres de PowerShell 3 pour les filtrer.

(Invoke-WebRequest –Uri «http://howtogeek.com»).

Comme vous pouvez le voir, vous récupérez beaucoup de liens, c'est là que vous devez utiliser votre imagination pour trouver quelque chose d'unique pour filtrer les liens que vous recherchez. Supposons que nous voulons une liste de tous les articles sur la première page.

((Invoke-WebRequest –Uri ‘ http://howtogeek.com ») .Liens | Where-Object {$_.href -like “http*”} | Où classe -eq «titre»). Titre

Une autre grande chose que vous pouvez faire avec les nouvelles applets de commande est d'automatiser les téléchargements quotidiens. Jetons un œil à la récupération automatique de l'image du jour sur le site Web Nat Geo, pour ce faire, nous combinerons les nouvelles applets de commande Web avec Start-BitsTransfer.

$ IOTD = ((Invoke-WebRequest -Uri ' http://photography.nationalgeographic.com/photography/photo-of-the-day/’).Links | Où innerHTML -comme «* Télécharger le fond d'écran *»). Href
Start-BitsTransfer -Source $ IOTD -Destination C: \ IOTD \

C'est tout ce qu'on peut en dire. Avez-vous des astuces de votre choix? Faites le nous savoir dans les commentaires.

Using PowerShell To Work With SharePoint Lists

How To Check Open/Close Ports Of Any Website Using PowerShell

Intro To PowerShell For SharePoint

How To Scrape A Web Page With PowerShell

How To Manage IIS Websites In PowerShell


Cloud et Internet - Most Popular Articles

Comment restaurer Firefox à ses paramètres par défaut et recommencer

Cloud et Internet Nov 14, 2024

N'importe quel navigateur peut ralentir et devenir encombré au fil du temps lorsque vous installez des modules complémentaires, créez un historique et modifiez les paramètres. F..


Comment modifier le moteur de recherche par défaut de Chrome

Cloud et Internet Jan 31, 2025

CONTENU NON CACHÉ Google Chrome le moteur de recherche par défaut est, sans surprise, Google . Pour la grande majorité des utilisateurs, c'est très ..


Comment récupérer des fichiers, des contacts, des calendriers et des photos supprimés à partir d'iCloud

Cloud et Internet Aug 14, 2025

ICloud d’Apple vous permet désormais d’annuler la suppression des fichiers que vous avez supprimés d’iCloud Drive, de restaurer des photos récemment supprimées et de réta..


Fini les frais de mise à niveau: utilisez Google Docs ou Office Web Apps au lieu de Microsoft Office

Cloud et Internet May 4, 2025

Microsoft a récemment lancé Office 2013 ainsi qu'Office 365 , un service d'abonnement. Office 365 vous coûtera 9,99 $ par mois ou 99 $ par an, tandis qu'Office 201..


Comment personnaliser et décorer vos codes QR avec des images

Cloud et Internet Oct 31, 2025

Nous connaissons tous les codes QR. Quelques cases noires et blanches contenant des données encodées. C'est ennuyeux, non? Découvrons et rendons votre code QR plus élégant et p..


Ajouter des signets de Firefox ou Chrome à IE 9 Beta

Cloud et Internet Sep 21, 2025

Maintenant que IE 9 Beta est sorti depuis un certain temps et que vous avez eu le temps de l'explorer, vous pouvez importer des signets à partir d'autres navigateurs. Voici comment procéder..


Obtenez Safari Reader sur Chrome et Firefox avec iReader

Cloud et Internet Aug 16, 2025

Souhaitez-vous utiliser la nouvelle fonctionnalité Reader de Safari, mais ne souhaitez pas changer de navigateur pour une seule fonctionnalité? Voici comment ajouter un outil de lecture sim..


Rechercher Wikipedia dans Google Chrome en toute simplicité

Cloud et Internet Feb 2, 2025

CONTENU NON CACHÉ Avez-vous besoin d'un moyen rapide et facile d'accéder à Wikipedia tout en naviguant tout au long de la journée? Si tel est le cas, vous voudrez jeter un coup d'œil �..


Catégories