Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

Video Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

Vous pouvez importer des données à partir de n'importe quelle page Web à l'aide de la fonction ImportXML de Google Sheets. Voici comment utiliser la fonction ImportXML sur Google Sheets.

En maîtrisant la fonction ImportXML de Google Sheet, vous aurez l'impression de posséder déjà un Assistant Feuilles certifié. ImportXML obtient des informations à partir de n'importe quel champ XML. Grâce à cela, vous pouvez télécharger les données et les métadonnées générées sur celui-ci n'importe où.

Bases de XML et HTML

Le langage de balisage XML spécifie les ensembles de données dans une page Web. En substance, tout ensemble de <something> et </something> - les blocs de construction du code source Web ou un certain ensemble de données résideront à l'intérieur. Le code source du Web aura du texte dans la balise <p> aragraph - un paragraphe, contenant parfois <b> ancien - en gras et éventuellement <a> un lien - lien (suivi de </ a > </b>. </p> </body> pour fermer la balise entière).

La fonction Google Sheets ImportXML peut trouver un certain ensemble de données XML et copier des données en dehors de celui-ci. Dans l'exemple ci-dessus, si nous voulons obtenir tous les liens sur la page, nous devons demander à la fonction ImportXML d'entrer toutes les informations dans la balise <a> </a> . Si vous voulez tout le texte d'un site Web, vous pouvez commencer par tout prendre dans <body> </body> ou dans chaque version de <p> </p> , puis supprimer les données à des étapes ultérieures.

Comment extraire une liste des codes postaux et des comtés de la ville

Les tableaux de Wikipedia sont d'excellents exercices ImportXML. Cet article prendra l'exemple du téléchargement de l'intégralité du code postal à Edmonton, en Alberta. Trouvez une liste des codes postaux canadiens commençant par la lettre T. Ouvrez cette page dans une nouvelle fenêtre de navigateur pour commencer.

Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

Sélectionnez un code postal, faites un clic droit dessus et sélectionnez Inspecter pour ouvrir l'outil de navigation afin d'afficher la source de la page. Vous verrez que le code source de chaque page est dans une balise (identifiez une cellule dans le tableau). Après cela, l'article importera toutes les balises TD contenues à partir d'Edmonton.

Créez une nouvelle feuille Google vierge. L'article prendra tout le contenu de la balise TD, y compris <span> et un lien en spécifiant les données que vous souhaitez utiliser la syntaxe XPath. ImportXML prend l'URL et la balise que vous recherchez comme argument à importer dans Google Sheets.

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td")

Vous obtiendrez le résultat suivant:

Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

Pour revenir à la page source, nous verrons le code postal en gras dans la balise <b> </b>, le nom de la ville qui renvoie aux articles Wikipedia sous <a> </a>. Essayez maintenant d'obtenir des liens uniquement dans chaque zone de grande ville et supprimez les autres liens (quartiers). Modifiez-les dans deux colonnes de raccourcis clavier A et B:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / span / a [1]")

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / b [1]")

Vous devez affiner un peu les résultats:

Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

Cette action vous aide à comprendre le fonctionnement de la syntaxe de requête XPath: une balise ne fournit que la première version de <tag> dans la <balise parent>. Par conséquent, td / span / a [1] vous donne le premier lien dans <span> à chaque <td>. De même, td / b [1] vous donne le premier texte en gras dans chaque <td> ou seulement le code postal dans ce cas.

La grande chose est que vous pouvez exécuter deux requêtes dans une fonction. Par conséquent, l'article combine deux demandes avec un symbole | au milieu:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / span / a [1] | // td / b [1]")

Cependant, vous n'obtiendrez pas les mêmes résultats précédents. Il alternera la demande entière combinée dans une longue liste, au lieu de deux colonnes. Il présente de nombreux avantages mais n'est pas nécessaire dans cet article.

Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

Pour sélectionner le code postal dans les cases contenant le lien «Edmonton». Nous utiliserons ce code:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td [span / a = 'Edmonton'] / b [1]")

Mettez la «recherche» - texte éligible pour affiner les résultats entre crochets sans affecter la façon d'obtenir des résultats.

Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

Passons maintenant aux noms des zones voisines. Écrivez la fonction importXML appropriée dans la colonne suivante, en obtenant le texte suivant de «Edmonton».

L'article prend l'intégralité du contenu de la plage [1] et utilise des parenthèses et des réticules pour diviser le contenu, en mettant "Edmonton" dans la première colonne et le nom du quartier dans la colonne suivante. On peut alors combiner le code postal avec le nom correspondant:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td [span / a = 'Edmonton'] / span [1]")

Ensuite, utilisez la fonction Fractionner et concaténer certaines des colonnes suivantes pour fractionner et regrouper les données en cours de traitement:

= SPLIT (concaténer (B2: J2), "(/)")

Enfin, voici le tableau des résultats avec les informations nécessaires:

Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

Comment copier automatiquement des adresses e-mail depuis le Web

Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

L'article vous expliquera comment obtenir les courriels de tous les employés sur la page À propos | Zapier. En regardant le code source, vous verrez que l'adresse e-mail de chaque membre se trouve dans le champ class = "email". Lorsque vous souhaitez spécifier un attribut de balise, utilisez la fonction Google Sheets ImportXML comme suit:

= importxml ("https://zapier.com/about//", "// span [@ class = 'email']")

Comment utiliser Regex pour importer des adresses e-mail à partir du Web dans Google Sheets.

Pour obtenir des adresses Zapier en utilisant la "puissance" de Regex, nous allons entrer la commande <span> au lieu de chercher la classe. Nous allons maintenant effectuer cette tâche en deux étapes: appeler les informations de la page Zapier dans la première colonne, puis trier l'e-mail dans la deuxième colonne:

= importxml ("https://zapier.com/about//", "// span")

= regexextract (A1, "[a-zA-Z0-9 _ \. \ + -] + @ [a-zA-Z0-9 - \.] + \. [a-zA-Z0-9 -] {2, 15} ")

Enfin, nous aurons ce tableau:

Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

N'oubliez pas, ImportXML remplit toutes les colonnes et lignes par lui-même en fonction des données qu'il trouve. La requête d'expression régulière doit être remplie dans chaque cellule dont vous souhaitez obtenir les résultats. Pour tout rassembler, il vous suffit d'utiliser la commande Regexextract , qui est une formule de constante de tableau:

= ArrayFormula (IFERROR (REGEXEXTRACT (IMPORTXML ("https://zapier.com/about//", "// span"), "[a-zA-Z0-9 _ \. \ + -] + @ [a- zA-Z0-9 - \.] + \. [a-zA-Z0-9 -] {2,15} ")))))

Et voici le résultat:

Comment utiliser la fonction Google Sheets ImportXML pour collecter des données partout

J'espère que l'article vous sera utile!

Sign up and earn $1000 a day ⋙

Comment insérer une minuterie dans Google Slides

Comment insérer une minuterie dans Google Slides

Lors d'une présentation Google Slide, vous devez chronométrer la durée pendant laquelle vous restez sur une diapositive ou donner à votre public la possibilité de participer à des discussions ou de répondre à des questions.

Test du OnePlus 5 : le OnePlus 5T est encore meilleur sans augmentation de prix

Test du OnePlus 5 : le OnePlus 5T est encore meilleur sans augmentation de prix

Le OnePlus 5 était l'un des meilleurs téléphones de 2017. Puis le OnePlus 5T est arrivé et l'a amélioré de nombreuses manières modestes mais importantes, sans rien ajouter.

Comment ajouter de largent dans lapplication Cash

Comment ajouter de largent dans lapplication Cash

Dans Cash App, vous pouvez envoyer de l'argent aux gens, investir dans des actions ou des actions d'entreprises, échanger des crypto-monnaies et payer vos factures. Cependant, vous devez ajouter des fonds à votre Cash

Comment découper une forme dans Illustrator

Comment découper une forme dans Illustrator

Vous pouvez utiliser plusieurs méthodes pour découper des formes dans Adobe Illustrator. En effet, de nombreux objets ne sont pas créés de la même manière. Malheureusement,

Téléchargeurs YouTube de télégrammes

Téléchargeurs YouTube de télégrammes

Si vous souhaitez télécharger des vidéos et profiter de contenu sans publicité sur YouTube, vous devez être un abonné premium. C’est là qu’interviennent les robots Telegram pratiques.

Comment réparer Outlook nenvoyant pas de-mails

Comment réparer Outlook nenvoyant pas de-mails

Chaque fois que vous envoyez un e-mail sur Outlook, vous vous attendez à ce qu'il soit envoyé instantanément. Cependant, comme les autres plateformes de messagerie, Outlook est sujet à des dysfonctionnements et

Comment désactiver lécran tactile sur un Chromebook

Comment désactiver lécran tactile sur un Chromebook

https://www.youtube.com/watch?v=13ei1TYS8uk Les Chromebooks sont des appareils géniaux, si vous n'avez pas besoin d'un ordinateur portable capable de gérer des programmes exigeants. Si tu es dans

La réalité virtuelle peut-elle un jour nous surprendre comme le cinéma des débuts ?

La réalité virtuelle peut-elle un jour nous surprendre comme le cinéma des débuts ?

L'histoire raconte qu'en 1896, lorsque les frères Lumière montrèrent pour la première fois un train arrivant en gare de La Ciotat, le public du cinéma fut plongé dans le chaos,

Comment obtenir de grosses commandes avec DoorDash

Comment obtenir de grosses commandes avec DoorDash

Si vous voulez devenir un dasher bien rémunéré, vous ne pouvez pas simplement télécharger l'application et commencer à gagner de l'argent immédiatement. Ce n'est pas aussi simple que d'effectuer des livraisons.

Le chien robot des années 90 de Sony est de retour et plus fidèle que jamais

Le chien robot des années 90 de Sony est de retour et plus fidèle que jamais

J'ai harcelé mes parents pour un chiot quand j'étais enfant jusqu'à ce qu'ils cèdent et m'en offrent un pour Noël. Eh bien, un robot au moins. C'était l'Aibo de Sony. Le

Comment désactiver les photos en direct sur un iPad

Comment désactiver les photos en direct sur un iPad

Une Live Photo est constituée de quelques secondes de son et de vidéo enregistrées avant et après la prise d'une image. Ces vidéos prennent plus de place que les images fixes, ce qui consomme beaucoup

Comment trouver votre clé de produit Microsoft Office

Comment trouver votre clé de produit Microsoft Office

Réponse rapide : exécutez l'invite de commande en tant qu'administrateur. Tapez ce qui suit : cscript C:Program Files (x86)Microsoft OfficeOffice16OSPP.vbs /dstatus et

Pourquoi est-ce que je ne reçois pas plus de courses dans Lyft ?

Pourquoi est-ce que je ne reçois pas plus de courses dans Lyft ?

Vous êtes devenu chauffeur Lyft et êtes prêt à prendre la route et à gagner de l'argent. Vous attendez votre premier ramassage, mais vous ne recevez aucune demande de trajet

MoiNous Vs. Facebook

MoiNous Vs. Facebook

Que recherchez-vous dans une plateforme de réseautage social ? Voulez-vous de la sécurité, des fonctionnalités, des options de personnalisation et un moyen sécurisé d'envoyer des messages ?

Types de chargeurs de tablette Fire – Un guide rapide

Types de chargeurs de tablette Fire – Un guide rapide

Les tablettes Fire d'Amazon sont devenues parmi les appareils mobiles les plus populaires disponibles. Bien qu'Amazon ait commencé avec une tablette qui était essentiellement un

Quel Amazon Fire Stick est le plus récent ? [Mai 2023]

Quel Amazon Fire Stick est le plus récent ? [Mai 2023]

L’incursion d’Amazon dans le grand monde des appareils de streaming multimédia a généralement été bien accueillie. Le prix accessible de la Fire TV, aux côtés d'Amazon

Pourquoi mon numéro est-il interdit dans Telegram ?

Pourquoi mon numéro est-il interdit dans Telegram ?

Avez-vous déjà reçu la notification « Ce numéro de téléphone est banni » dans Telegram ? Si tel est le cas, vous vous demandez peut-être ce que cela signifie. Telegram a des restrictions

Comment fusionner des fichiers PowerPoint en un seul fichier

Comment fusionner des fichiers PowerPoint en un seul fichier

https://www.youtube.com/watch?v=isTnCfYDxs4 Les présentations PowerPoint sont monnaie courante dans de nombreux domaines de travail, et il est souvent nécessaire de combiner

Comment exécuter du code dans un terminal dans VS Code

Comment exécuter du code dans un terminal dans VS Code

Le terminal VS Code (Visual Studio Code) autorise les commandes de texte. Les résultats et la sortie peuvent être visualisés dans l'éditeur, et il prend en charge des shells comme bash,

Comment annuler votre abonnement à Paramount Plus

Comment annuler votre abonnement à Paramount Plus

Vous ne pouvez annuler un abonnement Paramount Plus que sur la même plateforme avec laquelle vous vous êtes abonné. Bien que la méthode la plus simple consiste à utiliser le site Web Paramount Plus, elle