Introduction à la Manipulation de XML avec Python

XML
Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtriser Python
Revoir le teaser Je m'abonne
5,0
Transcription


99,00€ Je commande

Formation incluse dans l'abonnement Elephorm Je m'abonne à Elephorm

DescriptionProgrammeAvis
5,0

99,00€ Je commande

Formation incluse dans l'abonnement Elephorm Je m'abonne à Elephorm

Les objectifs de cette vidéo sont les suivants:

  • Introduire le format XML et ses usages.
  • Montrer comment lire, parcourir et modifier un document XML en Python.
  • Décrire les fonctionnalités de la bibliothèque standard ElementTree.
  • Présenter la bibliothèque lxml comme alternative pour des manipulations avancées.

Découvrez comment manipuler le XML en Python, un format de données riche auquel on peut encore avoir recours malgré l'omniprésence du JSON.

Bien avant que le JSON ne devienne populaire, le XML était largement utilisé comme format d'échange de données. Aujourd'hui, bien que moins courant, le XML reste pertinent pour certaines applications en raison de ses nombreuses fonctionnalités avancées.

Le XML permet la validation de documents et la définition de types via des schémas. Il possède également des langages spécialisés pour transformer des documents XML. Par conséquent, il reste un excellent choix pour les données structurées et riches nécessitant des traitements complexes.

Les bureaux Suite, tels que Microsoft Office et LibreOffice, utilisent des fichiers XML pour la structuration interne des documents DOCX et ODT. De plus, bien qu'il soit de moins en moins utilisé pour les échanges de données à travers des WebAPI (remplacés par JSON), le XML reste présent dans certains contextes comme les services SOAP.

En Python, l'utilisation du module ElementTree pour la manipulation du XML est courante. Cette vidéo démontre comment parser, parcourir et modifier des documents XML, ainsi que les fonctionnalités d'ElementTree et d'une bibliothèque alternative, lxml, pour des opérations plus avancées.

Voir plus
Questions réponses
Pourquoi le XML est-il encore utilisé malgré la popularité du JSON?
Le XML est encore utilisé parce qu'il offre des fonctionnalités avancées comme la validation de structure, la définition de types, et l'utilisation de langages spécialisés pour transformer des documents XML.
Quels sont les principaux modules Python pour manipuler du XML?
Les principaux modules Python pour manipuler du XML sont ElementTree, Minidom, SAX, et lxml.
Dans quel contextes trouve-t-on encore le XML utilisé aujourd'hui?
Le XML est encore utilisé dans des contextes comme les formats de fichier pour suites bureautiques (DOCX, ODT), et certains services WebAPI comme SOAP.

Programme détaillé

2 commentaires
5,0
2 votes
5
4
3
2
1
michelkreutner
Il y a 11 months
Commentaire
Les explications sont claires et concises. Ce cours sur l'utilisation avancée de Python est tres intéressant. Il vous apportera des connaissances que vous pourrez ensuite approfondir.
Je suis vraiment tres satisfait par cette première formation suivie sur Python.
yvan.vogel
Il y a 2 years
Commentaire
Hello, sur la video autour de asyncio, vous utilisez python 2.7.12. J'utilise python 3.10, aussi je souhaite faire partager mon code (qui fonctionne) selon ma vision et compréhension sur le sujet d'étude que vous avez proposé. Yvan Vogel.

#CODE en python 3.10.0 64 bits (VScode 1.62.3)
import datetime
import asyncio
import aiohttp
import requests


# ----------------------------------------------------------------------------------------------------------------------------
def req_bloquante(num):
print(f"Get {num}")
uid = requests.get("https://httpbin.org/uuid").json()["uuid"]
print(f"Res {num}: {uid}")


def faire_toutes_les_requetes():
for x in range(51):
req_bloquante(x)


print("=====> ### Bloquant : ")
start = datetime.datetime.now()
faire_toutes_les_requetes()
exec_time = (datetime.datetime.now() - start).seconds
print(f"Downloading all take {exec_time} seconds\n")

# ----------------------------------------------------------------------------------------------------------------------------


async def requeteSansBloquer(semaphore, num, session):
print(f"Get {num}")
# await semaphore.acquire() # putting this await semaphore commande the Res is ordering but process very slow ~60 sec
async with session.get("https://httpbin.org/uuid") as response:
uid = (await response.json())["uuid"]
# await asyncio.sleep(delay=3) #delay = number of seconds
# semaphore.release()
print(f"Res {num}: {uid}")
# return uid # ?


async def main():
semaphore = asyncio.Semaphore(value=1)
tasks = []
async with aiohttp.ClientSession(
loop=loop, connector=aiohttp.TCPConnector(ssl=False)
) as session:
for x in range(51):
tasks.append(requeteSansBloquer(semaphore, x, session))
await asyncio.gather(*tasks)
print("This is after the loop...")


if __name__ == "__main__":
print("=====> ### Non Bloquant : ")
start = datetime.datetime.now()
loop = asyncio.get_event_loop()
loop.run_until_complete(main())
exec_time = (datetime.datetime.now() - start).microseconds
print(f"Downloading all take {exec_time} micro seconds\n")