google sieht was was ich nicht seh ...



  • OOP-Kanibale schrieb:

    hmm. Irgendwie bin ich immer noch im Unklaren 😕

    Hilft meine Antwort auch nicht weiter? Soweit ich weiß gibt es eine Feedback-Option in dem Ding, worüber google auch besuchte URLs weiterleiten kann um ihre Datenbank zu vervollständigen.



  • Die erkennen vermutlich den Google Bot User Agent String und lassen den durch. Such vielleicht mal den Google Bot User Agent String (gibt Seiten, die so etwas auflisten, google einfach nach "http user agent" oder so) und stell den bei deinem Browser ein (beim Firefox kann man das afaik ganz bequem über eine Extension machen). Vielleicht kommst du ja durch.



  • kingruedi schrieb:

    Die erkennen vermutlich den Google Bot User Agent String und lassen den durch. Such vielleicht mal den Google Bot User Agent String (gibt Seiten, die so etwas auflisten, google einfach nach "http user agent" oder so) und stell den bei deinem Browser ein (beim Firefox kann man das afaik ganz bequem über eine Extension machen). Vielleicht kommst du ja durch.

    MÖP glaub ich nicht!

    Also wer sich schon mal bemüht hat seine Website in Google weit nach oben zu bekommen, der weiß, dass das nicht nur über die Suchbegriffe die auf der Seite vorhanden sind funktioniert, sondern dass da viele Kriterien mit rein spielen. Die Seite ist auch für den Google Suchbot gesperrt!

    Wenn diese Website oft verlinkt wird oder viel einfacher die Suchbegriffe sind ja auch publik, irgendwie muss man ja auf der Seite auch suchen und wenn auf diese Suchbegriffe oft zugegriffen wird, dann steigt die Seite im Ranking. Es ist google also völlig unbekannt was hinter geschützen Dateien Steht, solange der Suchbegriff in verlinkungen steht findet das google auch!



  • Polofreak schrieb:

    Wenn diese Website oft verlinkt wird oder viel einfacher die Suchbegriffe sind ja auch publik, irgendwie muss man ja auf der Seite auch suchen und wenn auf diese Suchbegriffe oft zugegriffen wird, dann steigt die Seite im Ranking. Es ist google also völlig unbekannt was hinter geschützen Dateien Steht, solange der Suchbegriff in verlinkungen steht findet das google auch!

    aber wie kann es dann sein dass google in seiner mini-vorschau relevanten text anzeigt?

    /EDIT: abgesehen davon muss es nicht unbedingt als agent identifier laufen, man kann auch einfach die google-bot-IP rauskriegen und danach durchlassen.



  • was noch interessanter ist: kann man auf die ge-"cache"-ten seiten zugreifen?



  • zeig doch bitte mal ein konkretes Beispiel, damit wir alle wissen worüber wir reden.

    Und sag mir doch bitte mal die IP vom Bot! Die ändert sich bestimmt auch nie! Und man kann bestimmt einfach in seinem PWD schutz sagen if IP = Bot IP then let him durch!

    K L A R!!!



  • Polofreak schrieb:

    zeig doch bitte mal ein konkretes Beispiel, damit wir alle wissen worüber wir reden.

    Und sag mir doch bitte mal die IP vom Bot! Die ändert sich bestimmt auch nie! Und man kann bestimmt einfach in seinem PWD schutz sagen if IP = Bot IP then let him durch!

    K L A R!!!

    konkretes beispiel fehlt mir, probiers mal mit den gamasutra-artikeln... und zum rest: na klar! die IP verändert sich nur sehr selten, und so ein check ist ja wohl einfach machbar...

    /EDIT: da haste, der 2. link:
    http://www.google.de/search?hl=de&q=gamasutra+postmortem+&btnG=Google-Suche&meta=

    /EDIT2: oder noch besser der hier:
    http://www.google.de/search?hl=de&q=http%3A%2F%2Fwww.gamasutra.com%2Ffeatures%2F19980731%2Fregier_01.htm&btnG=Google-Suche&meta=



  • Polofreak schrieb:

    Und sag mir doch bitte mal die IP vom Bot! Die ändert sich bestimmt auch nie! Und man kann bestimmt einfach in seinem PWD schutz sagen if IP = Bot IP then let him durch!

    Natürlich "ändert" sich die IP vom Googlebot ständig. Ich hab z.B. auf meiner Homepage alleine letzte Woche (30. Mai - 5. Juni) schon 36 verschiedene IPs von Googlebot.

    Aber ein simpler Lookup ergibt (bei jeder "Googlebot-IP" ;)):

    OrgName:    Google Inc. 
    OrgID:      GOGL
    Address:    1600 Amphitheatre Parkway
    City:       Mountain View
    StateProv:  CA
    PostalCode: 94043
    Country:    US
    [b]
    NetRange:      66.249.64.0 - 66.249.95.255 [/b]
    CIDR:       66.249.64.0/19 
    NetName:    GOOGLE
    NetHandle:  NET-66-249-64-0-1
    Parent:     NET-66-0-0-0-0
    NetType:    Direct Allocation
    

    😉

    Im Übrigen mein ich mal gelesen zu haben, dass manche Seitenbetreiber gezielt Google Einblick in ihr kostenpflichtes Angebot gewähren.





  • ca$h schrieb:

    mach mal JS aus.

    ui... wie geht das denn? jetzt funktioniert es tatsächlich... strange



  • WOW hier erfährt man sachen!
    hier ist übrigens das Script wenn es jemanden Interessiert was da passiert!
    Naja dann wäre ja nun geklärt, dass das nichts mit IP-Filtern zu tun hat! Sondern viel mehr mit der Browser-einstellung!


Anmelden zum Antworten