Description et Utilisation du XML
Objectifs
Les objectifs de cette vidéo sont les suivants:
- Introduire le format XML et ses usages.
- Montrer comment lire, parcourir et modifier un document XML en Python.
- Décrire les fonctionnalités de la bibliothèque standard ElementTree.
- Présenter la bibliothèque lxml comme alternative pour des manipulations avancées.
Résumé
Découvrez comment manipuler le XML en Python, un format de données riche auquel on peut encore avoir recours malgré l'omniprésence du JSON.
Description
Bien avant que le JSON ne devienne populaire, le XML était largement utilisé comme format d'échange de données. Aujourd'hui, bien que moins courant, le XML reste pertinent pour certaines applications en raison de ses nombreuses fonctionnalités avancées.
Le XML permet la validation de documents et la définition de types via des schémas. Il possède également des langages spécialisés pour transformer des documents XML. Par conséquent, il reste un excellent choix pour les données structurées et riches nécessitant des traitements complexes.
Les bureaux Suite, tels que Microsoft Office et LibreOffice, utilisent des fichiers XML pour la structuration interne des documents DOCX et ODT. De plus, bien qu'il soit de moins en moins utilisé pour les échanges de données à travers des WebAPI (remplacés par JSON), le XML reste présent dans certains contextes comme les services SOAP.
En Python, l'utilisation du module ElementTree pour la manipulation du XML est courante. Cette vidéo démontre comment parser, parcourir et modifier des documents XML, ainsi que les fonctionnalités d'ElementTree et d'une bibliothèque alternative, lxml, pour des opérations plus avancées.
Je suis vraiment tres satisfait par cette première formation suivie sur Python.
#CODE en python 3.10.0 64 bits (VScode 1.62.3)
import datetime
import asyncio
import aiohttp
import requests
# ----------------------------------------------------------------------------------------------------------------------------
def req_bloquante(num):
print(f"Get {num}")
uid = requests.get("https://httpbin.org/uuid").json()["uuid"]
print(f"Res {num}: {uid}")
def faire_toutes_les_requetes():
for x in range(51):
req_bloquante(x)
print("=====> ### Bloquant : ")
start = datetime.datetime.now()
faire_toutes_les_requetes()
exec_time = (datetime.datetime.now() - start).seconds
print(f"Downloading all take {exec_time} seconds\n")
# ----------------------------------------------------------------------------------------------------------------------------
async def requeteSansBloquer(semaphore, num, session):
print(f"Get {num}")
# await semaphore.acquire() # putting this await semaphore commande the Res is ordering but process very slow ~60 sec
async with session.get("https://httpbin.org/uuid") as response:
uid = (await response.json())["uuid"]
# await asyncio.sleep(delay=3) #delay = number of seconds
# semaphore.release()
print(f"Res {num}: {uid}")
# return uid # ?
async def main():
semaphore = asyncio.Semaphore(value=1)
tasks = []
async with aiohttp.ClientSession(
loop=loop, connector=aiohttp.TCPConnector(ssl=False)
) as session:
for x in range(51):
tasks.append(requeteSansBloquer(semaphore, x, session))
await asyncio.gather(*tasks)
print("This is after the loop...")
if __name__ == "__main__":
print("=====> ### Non Bloquant : ")
start = datetime.datetime.now()
loop = asyncio.get_event_loop()
loop.run_until_complete(main())
exec_time = (datetime.datetime.now() - start).microseconds
print(f"Downloading all take {exec_time} micro seconds\n")