Mes installations se font avec le gestionnaire de paquets Python pip.
pip permet d’installer les paquets disponibles sur le Python Package Index
Pour installer pip sur Mac, la commande est la suivante :
sudo easy_install pip
Ensuite, parce que je suis sur Mac et je ne veux pas mélanger les environnements de travail, j’ai créé un environnement virtuel
Pour installer virtualenvwrapper :
sudo -H pip install virtualenvwrapper
Ensuite, après avoir créé le dossier bs4 et activé l’environnement virtuel, l’installation se fait classiquement avec pip
virtualenv bs4 cd bs4 source bin/activate
pip install beautifulsoup4 pip install lxml
Puisque lxml est installé dans le même environnement que beautifulsoup, BS4 l(utilisera en priorité
In other words, just installing lxml
in the same python environment makes it a default parser.
Un premier test pour vérifier que ça marche (afficher tous les liens de la première page du site marchand www.scandles.fr ) – c’est un des sites qui « alimente » via les scripts Python le moteur de recherche www.les-bougies.com
from bs4 import BeautifulSoup soup = BeautifulSoup (open("www.scandles.fr")) links = soup.find_all('a') for link in links: print link