14th jan 2008
Référencement de votre site dans Google et autres moteurs de recherche (1/2)
Le Référencement a toujours été un point important dans l’étude d’un site internet, principale source de trafic, il est important d’être présent dans les moteurs de recherche et annuaires.
Dans cet article (première partie), vous trouverez un résumé de ce qu’on peut lire dans les livres et sur internet à propos du référencement et principalement l’indexation de votre site dans Google.
Fonctionnement d’un moteur de recherche
- Recherche spécifique
Critères pris en compte
- Le titre de vos pages, balise <title>
- La balise <META NAME="description" …>
- Vos mots clés, balise <meta name="keywords" …>
Outils pour le webmaster
- Choix des pages à indexer
- Robots.txt
- Balise META robots
- Google Sitemap
Fonctionnement d’un moteur de recherche
Des milliards d’informations circulent sur internet, sous forme de sites, blogs, fils rss et autres moyens de communication. Comment s’y retrouver et trouver une information précise sans un moteur de recherche, sinon de connaitre l’adresse du site que l’on souhaite visiter.
Le robot d’indexation du moteur de recherche (en anglais "spiders") explore en permanence internet suivant successivement les liens qu’il trouve, il va extraire des pages les mots clés significatifs permettant l’indexation de la page et stocker cela dans des bases de données (fonctionnant comme un index terminologique).
Cycle de vie d’une recherche Google (source : google.com)
Recherche spécifique
Les moteurs de recherches vous permettent d’effectuer des recherches spécifiques, souvent pour les webmasters, en utilisant des opérateurs que vous saisissez comme une recherche:
Opérateur
Description
Syntaxe
site:
Liste des pages du site indexées
site:www.votre-site.com
link:
Pages extérieures reliées à votre site
link::www.votre-site.com
linkdomain(yahoo)
linkdomain::www.votre-site.com
cache:
La version qui est en cache
cache::www.votre-site.com
info:
Information sur le site
info::www.votre-site.com
related:
Pages au contenu similaires à celui de votre site
related::www.votre-site.com
Title:
Recherche de mots clés dans le titre de vos pages
title::www.votre-site.com
url:
Recherche de mots clés dans les urls
url::www.votre-site.com
domain:
Recherche de mots clés dans le nom de domaine
domain::www.votre-site.com

Critères pris en compte
Le titre de vos pages, balise <title>
Le titre doit à la fois rester simple mais contenir des mots clés, c’est le contenu de cette balise qui va apparaître en premier lors d’une recherche et informer le futur visiteur sur ce qu’il peut trouver sur votre page.

- Éviter les énumérations de mots clés.
- Placer les mots clés les plus importants en début de titre.
- Entre 15 et 20 mots maximum.
La balise <META NAME="description" …>
En plus du titre, et suivant le moteur de recherche utilisé, les visiteurs pourront également lire une description de la page trouvée. Cette balise permet de résumer en une phrase le contenu de votre page, essayer quand même de la limiter à 250 caractères.
Lors de sa rédaction il faut se mettre à la place du visiteur et se poser la question de savoir si cette description l’incitera à clicker sur votre lien plutôt qu’un autre.
Avec certains moteurs de recherche (ex:Google) et annuaires, il se peut que la description affichée ne corresponde pas à cette présente sur la page de votre site, mais plutôt à une partie de la page contenant le/les mots clés.
Exemple:

Alors que la description de cette page est: Présent dans la grande famille des framework javacript, Mootools est un de mes… mon préféré ! Dès que je suis confronté à un nouveau projet web qu’il soit personnel ou professionnel je pense directement Mootools.
Certains moteurs de recherches vous laissent le choix, afin d’afficher la description réelle de votre page, de travailler avec une nouvelle balise contenant pour certaines le nom du robot d’indexation, la langue et l’option content="NOODP". (Plus d’information sur cette balise - WebRankInfo)
<meta name="robots" content="noodp" /> ou spécialement pour Google: <meta name="Googlebot" lang="Fr" content="NOODP">
Vos mots clés, balise <meta name="keywords" …>
Keywords, une des balises les plus importantes! Elle contient tous les mots susceptibles d’être saisi par le futur visiteur sur un moteur de recherche, il faut donc bien définir ces mots clés et leurs différentes orthographes possibles.
Il existe différentes manières d’arriver à définir de bons mots clés, analyser la concurrence et les premiers résultats affichés recevoir des conseils de personnes faisant partie du milieu ou utiliser des générateurs de mots clés.
Générateurs de mot clés
Parmi les milliards de ressources d’internet, on peut trouver des générateurs de mots clés pour des expressions en français ou en anglais.
En voici 3 particulièrement intéressants:
Outiref.com
Vous propose de tester l’audit d’un mot clé et ensuite d’avoir des suggestions de mots clés en cliquant sur "Suggestions de mots clés connexes".
Google AdWords: Générateur de mots clés
vous indique sur les mots clés à envisager, le nombre d’annonceurs qui enchérissent sur ces mots clés et le volume de recherche effectueé sur ceux-ci.
N’hésiter pas à inclure plusieurs orthographes de vos mot clés importants, exemple: sponge stats, spongestat, SpongeStats.
Importance de la mise en valeur de vos mots clés dans vos pages
Les moteurs donnent de l’importance aux balises titre, sous titres (série des H1), gras et italiques. Celle-ci sont en principe essentielle à la structuration de la page.
Importance de la présence du titre et de mots clés dans l’url
faisant partie des nombreux critères de positionnement dans les moteurs de recherche, l’utilisation de l’url "explicite" pour vos pages, qui n’est pas toujours facile pour un débutant, est d’une importance capitale.
Cette technique est appelée l’Url Rewriting, elle consiste à remplacer les urls des pages dites dynamiques en urls de pages statiques contenant la catégorie et le titre de la page.
Exemple:
www.votre-site.com/pages/index.php?id=314
n’est pas très explicite pour le moteur de recherche et le visiteur tandis que
www.votre-site.com/catégorie/souscatégorie/nom_de_l’article_unmotcle.html
devient beaucoup plus efficace car elle contient des mots clés.
Outils pour le webmaster
Choix des pages à indexée
robots.txt
Ce fichier texte est installé à la racine de votre site et permet de donner des instructions d’indexation aux moteurs de recherches, il indique les pages/répertoires à ne pas lire (le cas d’une page en construction ou n’ayant aucun intérêt d’être indexée).
Le fichier robots.txt est un fichier texte pouvant contenir les instructions:
User Agent: permet de s’adresser à un moteur de recherche en particulier * ou Googlebot (liste complète sur robotstxt.org)
Disallow: permet d’exclure des dossiers des fichiers.
Voici des exemples de fichier robots.txt :
- Exclusion de toutes les pages :
User-Agent: *
Disallow: /
- Exclusion d’aucune page (équivalent à l’absence de fichier robots.txt, toutes les pages sont visitées) :
User-Agent: *
Disallow:
- Autorisation d’un seul robot :
User-Agent: nomDuRobot
Disallow :
User-Agent: *
Disallow: /
- Exclusion d’un robot :
User-Agent: NomDuRobot
Disallow: /
User-Agent: *
Disallow:
- Exclusion d’une page :
User-Agent: *
Disallow: /repertoire/chemin/page.html
- Exclusion de plusieurs page :
User-Agent: *
Disallow: /repertoire/chemin/page.html
Disallow: /repertoire/chemin/page2.html
Disallow: /repertoire/chemin/page3.html
- Exclusion de toutes les pages d’un répertoire et ses sous-dossiers :
User-Agent: *
Disallow: /repertoire/
(exemples repris du site CommentCaMarche.net)
Il faut retenir un principe de base de ce système, tout ce qui n’est pas exclu est autorisé. Le fichier texte peut-être commenté si les commentaires sont précédés du signe #.
Spécificité du moteur Google
Google va un peu plus loin dans l’utilisation du fichier robots.txt en permettant des instructions supplémentaires:
Utilisation de l’astérisque * dans le champ Disallow afin de remplacer le nom des fichiers, exemple: disallow: /docs/*.pdf n’indexera pas le contenu de vos fichiers pdf.
plus d’information sur le site google: Outils google.
Balise META robots
Le choix des pages à indexée peut se faire plus précisément grâce à une nouvelle balise <meta name="robots" content="…>
Cette balise permet d’indiquer aux moteurs si l’on souhaite qu’ils indexent la page et/ou qu’ils suivent les liens de la page (afin d’indexer les pages liées).
L’attribut content doit contenir 2 valeurs séparées par virgule:
- index : autorise l’indexation du fichier
- noindex : interdit l’indexation du fichier
- follow : autorise le robot à suivre les liens du fichier
- nofollow : interdit au robot de suivre les liens du fichier
Voici 4 exemples :
<meta name="robots" content="index, follow">
<meta name="robots" content="noindex, follow">
<meta name="robots" content="index, nofollow">
<meta name="robots" content="noindex, nofollow">
Il est également possible d’utiliser l’un des deux raccourcis suivants :
<meta name="robots" content="all"> : équivalent à <meta name="robots" content="index, follow">
<meta name="robots" content="none"> : équivalent à <meta name="robots" content="noindex, nofollow">
(Spécification reprises du site webrankinfo.com "Quelle est la syntaxe complète de la balise META robots ?")
Google Sitemap
Google Sitemap est le plan d’accès de votre site et également la meilleure manière de fournir à Google la liste de vos pages.
Voici une page qui expliquera mieux que quiconque l’outil Sitemap de google.
Si vous n’en possédez pas déja un, il faut créer un compte Google et ajouter/vérifier son site.
Il existe également un générateur de Sitemap dans le coffre à outils de Google mais réservez plutôt aux webmasters ayant leur propre serveur.
Pour les Bloggeurs et autres, il existe des plugins générateurs de fichiers XML Sitemap:
Wordpress (http://wordpress.org/extend/plugins/google-sitemap-generator/)
DotClear (http://plugins.dotaddict.org/dc1/details/Gsitemap)
Il suffit de faire une recherche "Lenomdevotreediteurblog plugins" et puis "sitemap" pour trouver le plugin Sitemap correspondant à votre éditeur de blog.
Vous voila déja avec les informations nécessaires afin de commencer le référencement de votre site. Le sujet de la deuxième partie sera de voir la prise en compte de votre référencement dans le temps, l’échange de lien et le positionnement de votre site internet.
Le Référencement a toujours été un point important dans l’étude d’un site internet, principale source de trafic, il est important d’être présent dans les moteurs de recherche et annuaires.
Dans cet article (première partie), vous trouverez un résumé de ce qu’on peut lire dans les livres et sur internet à propos du référencement et principalement l’indexation de votre site dans Google.
Fonctionnement d’un moteur de recherche
- Recherche spécifique
Critères pris en compte
- Le titre de vos pages, balise <title>
- La balise <META NAME="description" …>
- Vos mots clés, balise <meta name="keywords" …>
Outils pour le webmaster
- Choix des pages à indexer
- Robots.txt
- Balise META robots
- Google Sitemap
Fonctionnement d’un moteur de recherche
Des milliards d’informations circulent sur internet, sous forme de sites, blogs, fils rss et autres moyens de communication. Comment s’y retrouver et trouver une information précise sans un moteur de recherche, sinon de connaitre l’adresse du site que l’on souhaite visiter.
Le robot d’indexation du moteur de recherche (en anglais "spiders") explore en permanence internet suivant successivement les liens qu’il trouve, il va extraire des pages les mots clés significatifs permettant l’indexation de la page et stocker cela dans des bases de données (fonctionnant comme un index terminologique).
Cycle de vie d’une recherche Google (source : google.com)
Recherche spécifique
Les moteurs de recherches vous permettent d’effectuer des recherches spécifiques, souvent pour les webmasters, en utilisant des opérateurs que vous saisissez comme une recherche:
Opérateur Description Syntaxe site: Liste des pages du site indexées site:www.votre-site.com link: Pages extérieures reliées à votre site link::www.votre-site.com linkdomain(yahoo) linkdomain::www.votre-site.com cache: La version qui est en cache cache::www.votre-site.com
info: Information sur le site info::www.votre-site.com related: Pages au contenu similaires à celui de votre site related::www.votre-site.com Title: Recherche de mots clés dans le titre de vos pages title::www.votre-site.com url: Recherche de mots clés dans les urls url::www.votre-site.com domain: Recherche de mots clés dans le nom de domaine domain::www.votre-site.com
Critères pris en compte
Le titre de vos pages, balise <title>
Le titre doit à la fois rester simple mais contenir des mots clés, c’est le contenu de cette balise qui va apparaître en premier lors d’une recherche et informer le futur visiteur sur ce qu’il peut trouver sur votre page.
- Éviter les énumérations de mots clés.
- Placer les mots clés les plus importants en début de titre.
- Entre 15 et 20 mots maximum.
La balise <META NAME="description" …>
En plus du titre, et suivant le moteur de recherche utilisé, les visiteurs pourront également lire une description de la page trouvée. Cette balise permet de résumer en une phrase le contenu de votre page, essayer quand même de la limiter à 250 caractères.
Lors de sa rédaction il faut se mettre à la place du visiteur et se poser la question de savoir si cette description l’incitera à clicker sur votre lien plutôt qu’un autre.Avec certains moteurs de recherche (ex:Google) et annuaires, il se peut que la description affichée ne corresponde pas à cette présente sur la page de votre site, mais plutôt à une partie de la page contenant le/les mots clés.
Exemple:
Alors que la description de cette page est: Présent dans la grande famille des framework javacript, Mootools est un de mes… mon préféré ! Dès que je suis confronté à un nouveau projet web qu’il soit personnel ou professionnel je pense directement Mootools.
Certains moteurs de recherches vous laissent le choix, afin d’afficher la description réelle de votre page, de travailler avec une nouvelle balise contenant pour certaines le nom du robot d’indexation, la langue et l’option content="NOODP". (Plus d’information sur cette balise - WebRankInfo)
<meta name="robots" content="noodp" /> ou spécialement pour Google: <meta name="Googlebot" lang="Fr" content="NOODP">
Vos mots clés, balise <meta name="keywords" …>
Keywords, une des balises les plus importantes! Elle contient tous les mots susceptibles d’être saisi par le futur visiteur sur un moteur de recherche, il faut donc bien définir ces mots clés et leurs différentes orthographes possibles.
Il existe différentes manières d’arriver à définir de bons mots clés, analyser la concurrence et les premiers résultats affichés recevoir des conseils de personnes faisant partie du milieu ou utiliser des générateurs de mots clés.
Générateurs de mot clés
Parmi les milliards de ressources d’internet, on peut trouver des générateurs de mots clés pour des expressions en français ou en anglais.
En voici 3 particulièrement intéressants:Outiref.com
Vous propose de tester l’audit d’un mot clé et ensuite d’avoir des suggestions de mots clés en cliquant sur "Suggestions de mots clés connexes".
Google AdWords: Générateur de mots clés
vous indique sur les mots clés à envisager, le nombre d’annonceurs qui enchérissent sur ces mots clés et le volume de recherche effectueé sur ceux-ci.N’hésiter pas à inclure plusieurs orthographes de vos mot clés importants, exemple: sponge stats, spongestat, SpongeStats.
Importance de la mise en valeur de vos mots clés dans vos pages
Les moteurs donnent de l’importance aux balises titre, sous titres (série des H1), gras et italiques. Celle-ci sont en principe essentielle à la structuration de la page.
Importance de la présence du titre et de mots clés dans l’url
faisant partie des nombreux critères de positionnement dans les moteurs de recherche, l’utilisation de l’url "explicite" pour vos pages, qui n’est pas toujours facile pour un débutant, est d’une importance capitale.
Cette technique est appelée l’Url Rewriting, elle consiste à remplacer les urls des pages dites dynamiques en urls de pages statiques contenant la catégorie et le titre de la page.
Exemple:www.votre-site.com/pages/index.php?id=314
n’est pas très explicite pour le moteur de recherche et le visiteur tandis que
www.votre-site.com/catégorie/souscatégorie/nom_de_l’article_unmotcle.html
devient beaucoup plus efficace car elle contient des mots clés.
Outils pour le webmaster
Choix des pages à indexée
robots.txt
Ce fichier texte est installé à la racine de votre site et permet de donner des instructions d’indexation aux moteurs de recherches, il indique les pages/répertoires à ne pas lire (le cas d’une page en construction ou n’ayant aucun intérêt d’être indexée).
Le fichier robots.txt est un fichier texte pouvant contenir les instructions:
User Agent: permet de s’adresser à un moteur de recherche en particulier * ou Googlebot (liste complète sur robotstxt.org)
Disallow: permet d’exclure des dossiers des fichiers.Voici des exemples de fichier robots.txt :
- Exclusion de toutes les pages :
User-Agent: *
Disallow: /- Exclusion d’aucune page (équivalent à l’absence de fichier robots.txt, toutes les pages sont visitées) :
User-Agent: *
Disallow:- Autorisation d’un seul robot :
User-Agent: nomDuRobot
Disallow :
User-Agent: *
Disallow: /- Exclusion d’un robot :
User-Agent: NomDuRobot
Disallow: /
User-Agent: *
Disallow:- Exclusion d’une page :
User-Agent: *
Disallow: /repertoire/chemin/page.html- Exclusion de plusieurs page :
User-Agent: *
Disallow: /repertoire/chemin/page.html
Disallow: /repertoire/chemin/page2.html
Disallow: /repertoire/chemin/page3.html- Exclusion de toutes les pages d’un répertoire et ses sous-dossiers :
User-Agent: *
Disallow: /repertoire/(exemples repris du site CommentCaMarche.net)
Il faut retenir un principe de base de ce système, tout ce qui n’est pas exclu est autorisé. Le fichier texte peut-être commenté si les commentaires sont précédés du signe #.
Spécificité du moteur Google
Google va un peu plus loin dans l’utilisation du fichier robots.txt en permettant des instructions supplémentaires:
Utilisation de l’astérisque * dans le champ Disallow afin de remplacer le nom des fichiers, exemple: disallow: /docs/*.pdf n’indexera pas le contenu de vos fichiers pdf.
plus d’information sur le site google: Outils google.
Balise META robots
Le choix des pages à indexée peut se faire plus précisément grâce à une nouvelle balise <meta name="robots" content="…>
Cette balise permet d’indiquer aux moteurs si l’on souhaite qu’ils indexent la page et/ou qu’ils suivent les liens de la page (afin d’indexer les pages liées).L’attribut content doit contenir 2 valeurs séparées par virgule:
- index : autorise l’indexation du fichier
- noindex : interdit l’indexation du fichier
- follow : autorise le robot à suivre les liens du fichier
- nofollow : interdit au robot de suivre les liens du fichierVoici 4 exemples :
<meta name="robots" content="index, follow">
<meta name="robots" content="noindex, follow">
<meta name="robots" content="index, nofollow">
<meta name="robots" content="noindex, nofollow">Il est également possible d’utiliser l’un des deux raccourcis suivants :
<meta name="robots" content="all"> : équivalent à <meta name="robots" content="index, follow">
<meta name="robots" content="none"> : équivalent à <meta name="robots" content="noindex, nofollow">(Spécification reprises du site webrankinfo.com "Quelle est la syntaxe complète de la balise META robots ?")
Google Sitemap
Google Sitemap est le plan d’accès de votre site et également la meilleure manière de fournir à Google la liste de vos pages.
Voici une page qui expliquera mieux que quiconque l’outil Sitemap de google.
Si vous n’en possédez pas déja un, il faut créer un compte Google et ajouter/vérifier son site.
Il existe également un générateur de Sitemap dans le coffre à outils de Google mais réservez plutôt aux webmasters ayant leur propre serveur.
Pour les Bloggeurs et autres, il existe des plugins générateurs de fichiers XML Sitemap:Wordpress (http://wordpress.org/extend/plugins/google-sitemap-generator/)
DotClear (http://plugins.dotaddict.org/dc1/details/Gsitemap)Il suffit de faire une recherche "Lenomdevotreediteurblog plugins" et puis "sitemap" pour trouver le plugin Sitemap correspondant à votre éditeur de blog.
Vous voila déja avec les informations nécessaires afin de commencer le référencement de votre site. Le sujet de la deuxième partie sera de voir la prise en compte de votre référencement dans le temps, l’échange de lien et le positionnement de votre site internet.
Posted in Billets, referencement | No Comments »





