2009-09-30 9 views
10

Ist es möglich, Richtlinien an Google so anzupassen, dass ein Teil einer Seite ignoriert wird und der Rest dennoch indiziert wird?Gibt es eine Möglichkeit, den Googlebot daran zu hindern, bestimmte Teile einer Seite zu indizieren?

Es gibt ein paar verschiedenen Themen, die wir sind gekommen, über die durch diesen geholfen werden würde, wie zum Beispiel:

  • RSS-Feed/Newsticker-Typ Text auf einer Seite Anzeige von Inhalten von einer externen Quelle
  • Benutzer Kontakt Telefon usw. Details eingeben, die sie sichtbar auf der Website wollen aber lieber sein sie nicht google-able

ich bin mir bewusst, dass beide die oben über andere Techniken (wie zB das Schreiben adressiert werden der Inhalt mit JavaScript), aber wundere mich Wenn jemand weiß, ob es bereits eine sauberere Option von Google gibt?

Ich habe einige graben auf diese und stieß auf Erwähnungen von googleon and googleoff tags, aber diese scheinen ausschließlich Google Search Appliances zu sein.

Weiß jemand, ob es einen ähnlichen Satz von Tags gibt, an denen der Googlebot bestehen wird?

Bearbeiten: Nur um zu verdeutlichen, ich möchte nicht den gefährlichen Weg der Tarnung verschiedener Inhalte zu Google gehen, weshalb ich sehe, ob es einen "legitimen" Weg gibt zu erreichen, was ich hier machen möchte.

Antwort

9

Was Sie verlangen, kann nicht wirklich getan werden, Google nimmt entweder die gesamte Seite oder nichts davon.

Sie könnten auch ein paar raffinierte Tricks machen, wie den Teil der Seite einfügen, der nicht in einem iFrame indiziert werden soll, und robots.txt verwenden, um Google zu bitten, diesen iFrame nicht zu indizieren.

1

Kurz gesagt NEIN - es sei denn, Sie verwenden Cloaking mit wird von Google entmutigt.

-2

Es gibt Meta-Tags für Bots, und es gibt auch die robots.txt, mit der Sie den Zugriff auf bestimmte Verzeichnisse einschränken können.

+0

Meta-Tags und robots.txt sowohl Zugriff erlauben oder auf Dateiebene zu beschränken, ich bin neugierig, wenn Sie eine Seite indiziert werden lassen kann, aber einen gewissen Teil davon blockieren. – ConroyP

-2

Alle Suchmaschinen indizieren oder ignorieren die gesamte Seite. Die einzige Möglichkeit, das umzusetzen, was Sie wollen, ist zu:

(a) zwei verschiedene Versionen der gleichen Seite

(b) erkennt der Browser

verwendet

(c) Wenn es sich um eine Suchmaschine , diene der zweiten Version deiner Seite.

This link könnte sich als hilfreich erweisen.

+6

Dies ist ein guter Weg, um Ihre Website von Google zu sperren – Greg

+2

Tatsächlich (http://www.google.com/support/webmasters/bin/answer.py?hl=de&answer=66355): "Verschiedene Ergebnisse basierend auf User Agent kann dazu führen, dass Ihre Website als irreführend wahrgenommen und aus dem Google-Index entfernt wird. " – Anax

-1

Auf Ihrem Server erkennen Sie den Such-Bot per IP mit PHP oder ASP. Geben Sie den IP-Adressen, die in diese Liste fallen, eine Version der Seite, die Sie indizieren möchten. Verwenden Sie in dieser suchmaschinenfreundlichen Version Ihrer Seite das kanonische Link-Tag, um der Suchmaschine die Seitenversion anzugeben, die nicht indiziert werden soll.

Auf diese Weise wird die Seite mit dem Inhalt, der indexiert werden soll, nur nach Adresse indexiert, während nur der Inhalt indexiert wird, der indiziert werden soll. Diese Methode wird Sie nicht von den Suchmaschinen blockiert und ist völlig sicher.

+1

Wie in einem separaten Kommentar erwähnt, kann dies dazu führen, dass Ihre Website aus Google entfernt wird. – Phrogz

-1

Ja auf jeden Fall „Unerwünschten Text aus dem Index ausschließen“ Sie Google indiziert einige Teile stoppen Erstellen Sie eine benutzerdefinierte robots.txt-Datei und schreiben Sie, welche Teile Sie nicht wie wpadmins oder einen bestimmten Post oder eine Seite indexieren möchten. Erstellen Sie dazu einfach diese robots.txt-Datei, bevor Sie check y erstellen unsere Website robots.txt zum Beispiel www.yoursite.com/robots.txt.

0

Es wurde eine nützliche Ressource für die Verwendung bestimmter Duplikate gefunden und kein Index der Suchmaschine für diesen Inhalt erlaubt.

<p>This is normal (X)HTML content that will be indexed by Google.</p> 

<!--googleoff: index--> 

<p>This (X)HTML content will NOT be indexed by Google.</p> 

<!--googleon: index> 
Verwandte Themen