<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Wie googlet google eigentlich?]]></title><description><![CDATA[<p>Ich meine: Hat google denn etwa irgendwo ne liste von dns-namen/ip-hostst,m wleches es der reihe nach druchläuft? google braucht ja eine liste von webseiten, die es durchsuchen soll. Aber woher bekomt man diese liste?</p>
]]></description><link>https://www.c-plusplus.net/forum/topic/187154/wie-googlet-google-eigentlich</link><generator>RSS for Node</generator><lastBuildDate>Wed, 01 Jul 2026 17:23:01 GMT</lastBuildDate><atom:link href="https://www.c-plusplus.net/forum/topic/187154.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 16 Jul 2007 13:16:46 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Mon, 16 Jul 2007 13:16:46 GMT]]></title><description><![CDATA[<p>Ich meine: Hat google denn etwa irgendwo ne liste von dns-namen/ip-hostst,m wleches es der reihe nach druchläuft? google braucht ja eine liste von webseiten, die es durchsuchen soll. Aber woher bekomt man diese liste?</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1326552</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1326552</guid><dc:creator><![CDATA[frage_zu_google]]></dc:creator><pubDate>Mon, 16 Jul 2007 13:16:46 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Mon, 16 Jul 2007 13:20:27 GMT]]></title><description><![CDATA[<p>webcrawler.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1326555</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1326555</guid><dc:creator><![CDATA[thordk]]></dc:creator><pubDate>Mon, 16 Jul 2007 13:20:27 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Mon, 16 Jul 2007 13:33:40 GMT]]></title><description><![CDATA[<p>es gibt nue begrenzt viele IPs</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1326562</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1326562</guid><dc:creator><![CDATA[Krux]]></dc:creator><pubDate>Mon, 16 Jul 2007 13:33:40 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Mon, 16 Jul 2007 13:37:56 GMT]]></title><description><![CDATA[<p>Nix IP`s.<br />
Unter einer IP kann es tausende Domains und Subdomains geben welche wiederum tausende Seiten haben.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1326566</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1326566</guid><dc:creator><![CDATA[Unix-Tom]]></dc:creator><pubDate>Mon, 16 Jul 2007 13:37:56 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Mon, 16 Jul 2007 13:43:10 GMT]]></title><description><![CDATA[<p>Krux schrieb:</p>
<blockquote>
<p>es gibt nue begrenzt viele IPs</p>
</blockquote>
<p>klar, sind auch nur 2^32. sind wir mal großzügig, da viele davon ja gar nicht öffentlich zugänglich sind und man diese ausschließen kann, und machen nur 2^31 draus. sind wir weiterhin so großzügig und gönnen dem crawler 2 sekunden spass mit jeder seite. dann braucht er nur knapp 35 jahre, um sich alle IPs mal angeguckt zu haben.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1326575</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1326575</guid><dc:creator><![CDATA[thordk]]></dc:creator><pubDate>Mon, 16 Jul 2007 13:43:10 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Mon, 16 Jul 2007 13:56:28 GMT]]></title><description><![CDATA[<p>a) Gibt es eine möglichkeit google zu sagen &quot;Indexir mal meine Site&quot; (<a href="http://google.com/webmasters" rel="nofollow">google.com/webmasters</a> ?)<br />
b) Wer von anderen verlinkt wird, der wird auch gefunden (der crawler folgt Links auf Websites)</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1326592</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1326592</guid><dc:creator><![CDATA[darthdespotism]]></dc:creator><pubDate>Mon, 16 Jul 2007 13:56:28 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Mon, 16 Jul 2007 13:59:57 GMT]]></title><description><![CDATA[<p><a href="http://infolab.stanford.edu/~backrub/google.html" rel="nofollow">http://infolab.stanford.edu/~backrub/google.html</a></p>
]]></description><link>https://www.c-plusplus.net/forum/post/1326593</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1326593</guid><dc:creator><![CDATA[rüdiger]]></dc:creator><pubDate>Mon, 16 Jul 2007 13:59:57 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Wed, 18 Jul 2007 09:09:40 GMT]]></title><description><![CDATA[<p>thordk schrieb:</p>
<blockquote>
<p>Krux schrieb:</p>
<blockquote>
<p>es gibt nue begrenzt viele IPs</p>
</blockquote>
<p>klar, sind auch nur 2^32. sind wir mal großzügig, da viele davon ja gar nicht öffentlich zugänglich sind und man diese ausschließen kann, und machen nur 2^31 draus. sind wir weiterhin so großzügig und gönnen dem crawler 2 sekunden spass mit jeder seite. dann braucht er nur knapp 35 jahre, um sich alle IPs mal angeguckt zu haben.</p>
</blockquote>
<p>Hm, und wenn, sagen wir 2 crawler im Einsatz sind?<br />
Dann müsste das ganze ja nur noch 17,5 Jahre dauern... ok, machen wir vier, nein acht, besser 300 crawler daraus. Cool, dann ist die Sache in nem knappen Monat erledigt <img
      src="https://www.c-plusplus.net/forum/plugins/nodebb-plugin-emoji/emoji/emoji-one/1f609.png?v=ab1pehoraso"
      class="not-responsive emoji emoji-emoji-one emoji--winking_face"
      title=";)"
      alt="😉"
    /> :p</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1327611</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1327611</guid><dc:creator><![CDATA[W0lf]]></dc:creator><pubDate>Wed, 18 Jul 2007 09:09:40 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Wed, 18 Jul 2007 11:00:41 GMT]]></title><description><![CDATA[<p>Unix-Tom schrieb:</p>
<blockquote>
<p>Nix IP`s.<br />
Unter einer IP kann es tausende Domains und Subdomains geben welche wiederum tausende Seiten haben.</p>
</blockquote>
<p><img
      src="https://www.c-plusplus.net/forum/plugins/nodebb-plugin-emoji/emoji/emoji-one/1f44d.png?v=ab1pehoraso"
      class="not-responsive emoji emoji-emoji-one emoji--thumbs_up"
      title=":+1:"
      alt="👍"
    /> zudem gibt es auch einfach nur seiten zu denen von den domains/subdomains keine verlinkung gibt.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1327691</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1327691</guid><dc:creator><![CDATA[rapso]]></dc:creator><pubDate>Wed, 18 Jul 2007 11:00:41 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Mon, 23 Jul 2007 05:15:46 GMT]]></title><description><![CDATA[<p>google verfügt auch über riesenserver mit riesigen datenbänken.<br />
die inhalte der webseiten werden von den crawlern thematisch indexiert und zu jeder seite existiert ein stichwortkatalog.<br />
darum funktioniert auch sowas: <em>Ergebnisse 1 - 10 von ungefähr 69.200.000 für porno. (0,03 Sekunden)</em></p>
<p>würden die crawler erst bei einer suchanfrage bei google anfangen im web zu suchen, könnte man u.U. tatsächlich ein paar monate warten, bis man 69.200.000 seiten verfügbar hätte. so dauert das nicht einmal eine zehntel sekunde</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1330492</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1330492</guid><dc:creator><![CDATA[asümüöäügül]]></dc:creator><pubDate>Mon, 23 Jul 2007 05:15:46 GMT</pubDate></item><item><title><![CDATA[Reply to Wie googlet google eigentlich? on Mon, 23 Jul 2007 06:05:20 GMT]]></title><description><![CDATA[<p>darthdespotism schrieb:</p>
<blockquote>
<p>a) Gibt es eine möglichkeit google zu sagen &quot;Indexir mal meine Site&quot; (<a href="http://google.com/webmasters" rel="nofollow">google.com/webmasters</a> ?)</p>
</blockquote>
<p>ich erinnere mich mal dran, im rahmen eines total unspektakulären praktikum ich glaube mit hilfe von python so etwas gemacht zu haben. google bietet so eine möglichkeit an, dass man den website-verzeichnisbaum bereitstellt und es dann angeblich schneller gehen soll, dass er alle ebenen der site erfasst. falls es das ist was du meinst.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1330508</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1330508</guid><dc:creator><![CDATA[_tmp_ohne_login]]></dc:creator><pubDate>Mon, 23 Jul 2007 06:05:20 GMT</pubDate></item></channel></rss>