Coder avec l’IA : scraping de cinéma en Python

スクレイピング

🚀 20$ offerts sur Bright Data en créant un compte avec ce lien : https://brdta.com/docstring
Retrouvez Bright Data sur leur chaîne YouTube : @BrightData

Dans ce projet, nous allons utiliser le module requests et le réseau de proxy résidentiels de Bright Data pour mettre en place un script de scraping nous permettant de récupérer les horaires de tous les cinémas autour de chez moi. Nous allons voir comment développer l’application avec Cursor et le modèle Claude 3.5 de Anthropic.

Dans une deuxième partie, nous mettrons en place un VPS pour stocker ces données et les présenter via une interface web.

———————————————————-

PRÉREQUIS
Pour suivre cette formation avec Python, vous devez maîtriser les bases du langage : https://www.youtube.com/watch?v=LamjAFnybo0

Vous pouvez également visionner ma formation complète au Scraping :

Scraping avec Python : Formation Complète 2024

———————————————————-

🔗 Code source du script
https://github.com/DocstringFr/scraping-cinema

🔗 La formation sur Docstring
https://www.docstring.fr/formations/scraping-cinema-recuperation-des-donees/?utm_source=youtube&utm_campaign=scraping-cinema

🔗 Ma formation complète Python sur Udemy (+60h de formation)
● https://bit.ly/3iGZu9a

📝 Créer un compte sur Docstring
● https://www.docstring.fr/compte/signup/?utm_source=youtube&utm_campaign=scraping-cinema

🔖 Abonne-toi à Docstring
● https://www.docstring.fr/formules/?utm_source=youtube&utm_campaign=scraping-cinema

💬 Rejoins-nous sur le serveur Discord
● https://www.docstring.fr/discord/?utm_source=youtube&utm_campaign=scraping-cinema

———————————————————-

===== CHAPITRES =====
00:00:00 Introduction
00:01:26 Préparation du projet et stack technique
00:12:40 Tentative avec le module requests
00:17:10 Récupérer la liste des films
00:23:31 Filtrer les informations du JSON
00:36:27 Mise en place de Bright Data
00:42:15 Modifier le script pour utiliser le proxy
00:48:09 Utiliser le certificat SSL
00:52:07 Basculer de requests au proxy de Bright Data
00:59:09 Récupérer les horaires pour un film
01:09:46 Ajout d’un logger
01:13:31 Debug du UUID
01:21:35 Régler les problèmes d’encodage
01:24:27 Uniformiser le format des dates
01:33:33 Introduction au refactoring
01:37:02 Gérer les données avec des dataclasses
01:48:03 Création d’une classe pour gérer les données
01:57:07 Exporter les données avec un manager
02:02:47 Écrire les logs sur le disque
02:06:36 Extensions possibles du script
02:09:29 Fin de la première partie

コメント

  1. @oliverwiggins5134 より:

    Est-ce que HasData a un scraper pour les horaires de cinéma ? Je suis curieux de savoir comment ça marche comparé à requests !

  2. @demolyx7792 より:

    Merci, je te souhaite un bon début d’année, aussi pour la chaine que 2025 soit une année de réussite.

タイトルとURLをコピーしました