GoogleBot bekommt 406



  • Hi.

    Da der GoogleBot sich bisher stur geweigert hat, Links auf meine Seite zu folgen und somit immer nur die Startseite erwischt hat, habe ich vor einer Weile die Parameteruebergabe an die Index.php (vorher ueber GET geregelt) ein wenig geaendert:
    Beim Apache gibt es dieses nette Feature, dass Seiten/Scripte auch aufgerufen werden, wenn man deren Name als Verzeichnis aufruft - zB.
    http://bla.com/index/bla/blo
    um index.php im Stammverzeichnis (also direkt unter http://bla.com/) aufzurufen - die Anhaengsel hinter "index/" kann man dann benutzen, um Daten mitzuschicken...

    Resultat ist, dass die URLs jetzt netter aussehen und Google immernoch nicht weitercrawled.

    Nun ist aber irgendein Komiker auf die Idee gekommen, eine der Seiten mit dieser "alternativen Parameteruebergabe" zu verlinken, so dass Google nun doch auf eine dieser Seiten kommt.
    Dabei bekommt der Bot jedoch immer einen Fehler 406 (Not Acceptable) gemeldet...
    Was hat dieser Fehler zu bedeuten?
    IMHO kann der nicht durch mein *tolles* ( 😃 ) neues URL-Konzept ausgeloest worden sein, oder? 😕


  • Mod

    ist die seite mehrsprachig und leitest du basierend auf der sprache des clients auf die richtige seite (zb index.htm.de) um?

    Wenn ja: das führt zu vielen Problemen, also uU auch einem 406 (das ist die einzige Situation die ich kenne die einen 406 produziert).



  • Noe, ist einsprachig...
    Irgendwelche automatischen Weiterleitungen gibt es normalerweise auch nicht.



  • So, habe nun auch nochmal mit Telnet nachgehakt.

    Wenn ich zB. "/index/page_1" ohne Accept-Header abrufe, geht alles glatt, der Content-Type wird auch als "text/html" angegeben.
    Wenn ich nun aber einen Accept-Header mit "text/html" vorher abschicke, gibt's 'nen 406.
    Wenn ich dagegen die noch zusaetzlich implementierte alte URI-Syntax nehme, also "/index.php?p=1" (was die selbe Seite aufruft) und diesen Accept-Header dazuschicke, wird die Seite ohne Murren rausgerueckt.
    Koennte IMHO an dieser Merkwuerdigkeit liegen... 😕
    Fuer Vorschlaege wie sich das umgehen laesst waere ich dankbar...
    Alternativ faellt mir ansonsten nur URI vom apache umschreiben lassen ein. 🙄


Anmelden zum Antworten