31
Google & le référencement 90% de trafic en France et 57 % aux USA

Google & le référencement

  • Upload
    quang

  • View
    30

  • Download
    0

Embed Size (px)

DESCRIPTION

Google & le référencement. 90% de trafic en France et 57 % aux USA. 2 créateurs : Lawrence Page et Sergey Brin. 1995 – 1997 : Leurs rencontrent à l’université du Michigan. - PowerPoint PPT Presentation

Citation preview

Page 1: Google & le référencement

Google & le référencement

90% de trafic en France et 57 % aux USA

Page 2: Google & le référencement

La genèse

2 créateurs : Lawrence Page et Sergey Brin.◦ 1995 – 1997 : Leurs rencontrent à l’université du

Michigan.◦ 1996 : Ils décident de développer un moteur de

recherche appelé : BackRub, qui présente la particularité d’analyser les « backlinks  » des pages analysés.

◦ La notion de PageRank naît de ses travaux.◦ Le manque de moyen leurs fait imaginer une

technologie serveur utilisant des machines peu puissante couplé en parallèle. C’est toujours la même technologie qui est utilisé dans les data center GOOGLE.

Page 3: Google & le référencement

1998 – A la recherche d’un Financement

Les deux chercheurs achetent des disques durs d’occasion pour constituer une base de données d’un terabyte (en 1998 !!!).

Ils louent un bureau et se mettent en quêtent de financeurs.

David Filo(Yahoo) leur conseillent de créer leurs propre moteur de recherche et de ne pas vendre leur concept.

Page 4: Google & le référencement

100 000 $ plus tard

Andy l’un des fondateurs de Sun Microsystems se laisse convaincre par l’entousiasme des 2 jeunes hommes et leur fait un chèque de 100000$.

La famille est les amis de Sergey et Larry se cotisent et parviennent à réunir 1 millions de dollars, quelques jours plus tard Google est née.

Page 5: Google & le référencement

Démenagement

Google devient trop grand en 1999 pour le petit garage et se déplace dans un bureau sur l’avenue de Palo Alto.

8 personnes travaillent désormais pour Google et le moteur répond à plus de 500000 requêtes quotidiennes.

En Juin 1999, Google obtient 25 millions de dollars d’investissements de sociétés à capitaux à risques.

Page 6: Google & le référencement

3 millions

En fin d’année 1999 Google n’est plus un simple projet mais un véritable moteur de recherche qui réponds à 3 millions de requête par jour.

Page 7: Google & le référencement

2000 – Intégrer l’innovation

Google devient le premier moteur de recherche.

1 milliards de page indexé.

Développement de Adwords et partenariat avec les moteurs concurrent.

Page 8: Google & le référencement

2001 – La maturité

2001 – Google rachètent déjà.com et met en place son moteur de newsgroups.

Google annonce qu’elle vient de trouver quelque chose qui a manqué à la pluspart des autres sites sur internet : La rentabilité.

Les partenariats se multiplie dans le monde.

Google fonctionne dans 26 langues.

Page 9: Google & le référencement

2002 – Les boites jaunes

Les relations entre Google et ses utilisateurs sont au beau fixe.

Le programme Google Ad sense exploseGoogle obtient le statut universel de

premier moteur de recherche.Le programme Google API se développe.Lancement de Google News.

Page 10: Google & le référencement

2004 – La course à l’index

L’index de Google passe à 4,8 milliards de page.

En Avril lancement de Gmail.En Juillet rachat de Picasa.La société passe la barre des 100 data-

center.CA : 809 millions de dollars pour 1

trimestre.

Page 11: Google & le référencement

2005 – Toujours plus loin

Sortie de Google Map

Sortie de Google Earth

Création des boites bleus

Page 12: Google & le référencement

Page Rank

Valeur Numérique qui traduit l’importance d’une page sur le web.

Si de nombreux liens pointent sur une page, c’est qu’elle doit être importante.

Une page jugée importante par Google a plus de voix qu’une page avec un faible PageRank.

Page 13: Google & le référencement

Page Rank

On peut connaître le PageRank d’un site avec la barre Google Search.

L’échelle du Page Rank va de 1 à 10 pour Google Search.

Il faut distinguer le Page Rank de Google et celui de la barre Google Search.

Page 14: Google & le référencement

Page Rank

Le Page Rank de Google est inaccessible et varie de 0,15 en partant de 1 jusqu’à l’infini.

On ne connaît pas la correspondance entre les deux échelles mais on peut supposer qu’elle correspond à une échelle logarithmique.

Page 15: Google & le référencement

Page Rank

En partant sur cette échelle, on se rend compte combien il peut être difficile de passer d’un niveau à un autre.

Dans notre hypothèse il s’agirait d’un logarithme de base 10. Certains chercheurs avancent l’hypothèse que se pourrais être une Base 5 ou 6.

Sur une base 10 il faudrait 1 milliard de liens vers une page pour un rang 10.

Page 16: Google & le référencement

Calcul du PageRank

PR(A)=(1-d)+d(PR(T1)/C(T1)+…+PR(Tn)/C(Tn))

PR signifie PageRank A est une page web PAR(A) est donc le PageRank de la page A T1…Tn sont n pages web C est le nombre de liens sortant d’une page C(T1) est le nombre de liens sortants d’une page C(T1) est le nombre de liens sortants existants dans la page

T1. PR(T1)/C(T1) est le vote de la page T1 pour la page A. D est un facteur d’amortissement sa valeur de défaut est

de 0,85.

Page 17: Google & le référencement

Quelques conséquences

Si il n’y a aucun lien pointant vers APR(A)=(1-0,85)+0=0,15

0,15 est la valeur minimale du PR. En fait Google ne peut indexer une page que si il existe des liens vers elle dans des pages déjà indexé par Google.

Plus il existe de page pointant vers A plus le PageRank va augmenter.

Page 18: Google & le référencement

Quelques conséquences

La valeur du vote que donne une page T1 est divisé par le nombre de liens présent dans la page.

Une page de 100 liens affectera faiblement votre PR.

Donc si T1 n’a qu’un seul lien vers A alors le PR de A augmentera du PR de T1 multiplier par 0,85.

Page 19: Google & le référencement

Exemple de calcul

Site à 2 pagesDans la page A => un lien vers BDans la page B => un lien vers A

C(A)=1C(B)=1

Hypothèse PR = 1

Page 20: Google & le référencement

Conclusion

C’est la structure des liens qui impose le résultat.

C’est l’interaction des liens entre les pages qui rend impossible un calcul direct.

Le PR total maximum correspond au nombre de pages du site. (sauf site mal conçu).

Page 21: Google & le référencement

Liens entrants

Plus les liens pointant vers votre page sont nombreux : plus votre PageRank va augmenter.

Google les nomme : backlink

Les liens font augmenter le PageRank si ils proviennent de page différente.

Page 22: Google & le référencement

Liens sortant

Ils font baisser le PageRank

Choisir soigneusement les pages ou les liens vont apparaître.

Si vous avez des liens sortant essayer d’avoir des liens entrant vers votre site.

Page 23: Google & le référencement

Autres critères

Le PageRank

Le texte d’un lien

Différents éléments liés au texte présent dans une page et à son environnement.

Page 24: Google & le référencement

Différents éléments

Google fait une copie (code HTML) Sans les images

A partir de cette copie GOOGLE fait une analyse du contenu : Nbre de mots Position d’un mot Occurrences des mots Proximité d’un mot par rapport à un autre Taille de police La casse Balises Gras ETC

Page 25: Google & le référencement

A Eviter

Google n’aime pas les petits caractèresMême couleur de fond et de texte

Google analyse également le contenu des pages voisines, si Google y retrouve les mêmes mots clés alors il estimera que l’ensemble forme un contenu cohérent.

Page 26: Google & le référencement

L’ancienneté

SandboxEspace provisoire ou sont stockés les sites

entrant dan l’index.Permet de s’assurer du sérieux du site

Par exemple un site utilisant un référencement automatique créant une centaine de lien par jour pourrais sembler suspect.

Page 27: Google & le référencement

Google Bombing

Technique qui permet d’associer des mots à une page particulière dans les résultats du moteur, sans que le résultat entre eux ne soit évident.

Utilise le PageRank et les mots clés.

Page 28: Google & le référencement

TrustRank

Algorithme permettant de calculer l’indice de confiance d’une page web.

Lutter contre le web spamming.

Se base sur 200 sites dit de confiance.

Page 29: Google & le référencement

Affichage dans Google

Un titre (si pas de titre l’URL)

Un texte

Une description(dmoz.org)

Une catégorie

L’URL

Une date (passage du robot)

Page 30: Google & le référencement

Site bannis et site punis

Les farms link

Le cloaking

Texte blanc sur fond blanc

Texte en très petit

Page 31: Google & le référencement

Site bannis

Raison inconnus

Localisation géographique

Nombre important de page satellites et re-direction javascript