Google asuwerten



  • Ich möchte gerne ein Programm schreiben das durch google nach einem Wort sucht und mir gefundene URL's ausgibt .
    Den Socket habe ich schon fertig allerdings weiß ich nicht wie ich den Output von google analysieren soll um auf die URLs zu kommen.
    google C Socket Client:

    #include <stdio.h>
    #include <stdlib.h>
    #include <string.h>
    #include <sys/types.h>
    #include <sys/socket.h>
    #include <netinet/in.h>
    #include <arpa/inet.h>
    #include <unistd.h>
    #include <netdb.h>
    
    #define BUF_SIZ 4096
    
    int send_request(const int sock, const char *hostname)
    {   char request[BUF_SIZ];
    
        snprintf(request, sizeof(request),"GET http://www.google.de/search?hl=de&q=google+auswerten&btnG=Google-Suche&meta= HTTP/1.1 \r\n"      
    "Host: %s\r\n"
    "Connection: Close\r\n\r\n",hostname);
    
    if (send(sock, request, strlen(request), 0) == -1)
        {
            perror("send() failed");
            return 1;
        }   
    
        return 0;
    }
    
    int view_response(const int sock)
    {
        char response[BUF_SIZ];
        int bytes;
    
        while((bytes = recv(sock, response, sizeof(response), 0)) > 0)
            fwrite(response, 1, bytes, stdout);
    
        if (bytes < 0)
        {
            perror("recv() failed");
            return 1;
        }
    
        return 0;
    }
    
    int main(int argc, char *argv[])
    {
        struct hostent *host;
        struct sockaddr_in addr;
        int s;
    
        if (argc < 2)
        {
            fprintf(stderr, "verwendung: %s <host>\n ", argv[0]);
            return 1;
        }
    
        if (!inet_aton(argv[1], &addr.sin_addr))
        {
            host = gethostbyname(argv[1]);
            if (!host)
            {
                herror("gethostbyname() failed");
                return 2;
            }
            addr.sin_addr = *(struct in_addr*)host->h_addr;
        }
    
        s = socket(PF_INET, SOCK_STREAM, 0);
        if (s == -1)
        {
            perror("socket() failed");
            return 3;
        }
    
        printf("connecting to %s:80...", inet_ntoa(addr.sin_addr));
        fflush(stdout);
    
        addr.sin_port = htons(80);
        addr.sin_family = AF_INET;
    
        if (connect(s, (struct sockaddr*)&addr, sizeof(addr)) == -1)
        {
            perror("connect() failed");
            return 4;
        }
    
        puts("ok.");
    
        if (send_request(s, argv[1]))
            return 5;
    
        if (view_response(s))
            return 6;
    
        close(s);
    
        return 0;
        }
    

    der suchstring ist in diesem Fall google asuwerten
    So wenn ich jetzt starte:

    gcc GoogleClient.c -o google

    google www.google.de
    

    dann erhalte ich

    HTTP/1.1 200 OK
    Cache-Control: private
    Content-Type: text/html; charset=ISO-8859-1
    Set-Cookie: PREF=ID=602866d84ba7561e:TM=1198498593:LM=1198498593:S=OeHBeWiSHmiQtH4Y; expires=Wed, 23-Dec-2009 12:16:33 GMT; path=/; domain=.google.de
    Server: gws
    Transfer-Encoding: chunked
    Date: Mon, 24 Dec 2007 12:16:33 GMT
    Connection: Close
    
    1981
    <html><head><meta http-equiv=content-type content="text/html; charset=ISO-8859-1"><title>google auswerten - Google-Suche</title><style><!--
    .ts td,.tc{padding:0}.ts,.tb{border-collapse:collapse}div,td{color:#000}
    .f{color:#666}
    .flc,.fl:link{color:#77c}
    a:link,.w,a.w:link,.w a:link,.q:visited,.q:link,.q:active,.q{color:#00c}
    a:visited,.fl:visited{color:#551a8b}
    a:active,.fl:active{color:red}
    .t{background:#e5ecf9;color:#000}
    .bb{border-bottom:1px solid #36c}
    .bt{border-top:1px solid #36c}
    .j{width:34em}
    .h{color:#36c}
    .i,.i:link{color:#a90a08}
    .a,.a:link{color:green}
    .z{display:none}
    div.n{margin-top:1ex}
    .n a{font-size:10pt;color:#000}
    .n .i{font-size:10pt;font-weight:bold}
    .b a{font-size:12pt;color:#00c;font-weight:bold}
    .ch{cursor:pointer;cursor:hand}
    .ta{padding:3px 3px 3px 5px}#tpa2,#tpa3{padding-top:9px}#gbar{float:left;font-weight:bold;height:22px;padding-left:2px}#gbh{border-top:1px solid #c9d7f1;font-size:0;height:0;position:absolute;right:0;top:24px;width:200%}#gbi{background:#fff;border:1px solid;border-color:#c9d7f1 #36c #36c #a2bae7;top:24px;z-index:1000}#guser{padding-bottom:7px !important}#gbar,#guser{font-size:13px;padding-top:1px !important}@media all{.gb1,.gb3{height:22px;margin-right:.73em;vertical-align:top}}#gbi,.gb2{visibility:hidden;position:absolute}.gb2{z-index:1001}#gbar a,#gbar a:active,#gbar a:visited{color:#00c;font-weight:normal}.gb2 a,.gb3 a{text-decoration:none}.gb2 a{display:block;padding:.2em .5em}#gbar .gb2 a:hover{background:#36c;color:#fff}.sl,.r{font-weight:normal;margin:0;display:inline}
    .sl{font-size:84%}
    .r{font-size:100%}
    .e{margin:.75em 0}
    .mblink:visited{color:#00c}
    .sm{display:block;margin:0;margin-left:40px}
    .slk td{padding-top:5px;padding-left:40px;vertical-align:top;font-size:84%}.slk div{text-indent:-10px;padding-left:10px}body,td,div,.p,a{font-family:arial,sans-serif}
    .g{margin:1em 0}
    #sd{font-size:113%;font-weight:bold}
    #ap{font-size:64%}
    --></style>
    <script>window.google={kEI:"IaNvR6adOpjQ-AKr47HkDw",kEXPI:"17259,17735",kHL:"de"};
    window.gbar={};(function(){;var i=window.gbar,a,n,b,o="visible";function p(c,g,f){c.visibility=c.visibility==o?"hidden":o;c.left=g+"px";c.top=f+"px"}i.tg=function(c){var g=0,f,d,k,e=0,h=0,l=window.navExtra;!n&&(n=document.getElementById("gbar"));!b&&(b=n.getElementsByTagName("span"));(c||window.event).cancelBubble=true;if(!a){a=document.createElement(Array.every||window.createPopup?"iframe":"div");a.frameBorder="0";a.id="gbi";a.scrolling="no";a.src="#";document.body.appendChild(a);if(l&&b[8])for(var q in l){var m=document.createElement("span");m.appendChild(l[q]);m.className="gb2";b[0].parentNode.insertBefore(m,b[8])}document.onclick=i.close}for(;b[e];e++){d=b[e];k=d.className;if(k=="gb3"){f=d.offsetLeft;while(d=d.offsetParent)f+=d.offsetLeft}else if(k=="gb2"){p(d.style,f+1,25+g);h=Math.max(h,d.offsetWidth);g+=20}}for(e=0;b[e];e++){if(b[e].className=="gb2"){b[e].style.width=h+"px"}}var j=a.style;j.height=g+"px";j.width=h+"px";p(j,f,24)};i.close=function(c){a&&a.style.visibility==o&&i.tg(c)};})();</script></head><body bgcolor=#ffffff topmargin=3 marginheight=3><div id=gbar><nobr><span class=gb1>Web</a></span> <span class=gb1><a href="http://images.google.de/images?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wi">Bilder</a></span> <span class=gb1><a href="http://maps.google.de/maps?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wl">Maps</a></span> <span class=gb1><a href="http://news.google.de/news?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wn">News</a></span> <span class=gb1><a href="http://www.google.de/products?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wf">Shopping</a></span> <span class=gb1><a href="http://mail.google.com/mail?um=1&ie=UTF-8&sa=N&tab=wm">Google Mail</a></span> <span class=gb3><a href="http://www.google.de/intl/de/options/" onclick="this.blur();gbar.tg(event);return false"><u>Mehr</u> <span style=font-size:11px>▼</span></a></span> <span class=gb2><a href="http://blogsearch.google.de/blogsearch?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wb">Blogs</a></span> <span class=gb2><a href="http://books.google.de/books?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wp">Bücher</a></span> <span class=gb2><a href="http://docs.google.com/?um=1&ie=UTF-8&sa=N&tab=wo">Dokumente</a></span> <span class=gb2><a href="http://picasaweb.google.de/lh/searchbrowse?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wq">Fotos</a></span> <span class=gb2><a href="http://groups.google.de/groups?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wg">Groups</a></span> <span class=gb2><a href="http://www.google.com/calendar?um=1&ie=UTF-8&sa=N&tab=wc">Kalender</a></span> <span class=gb2><a href="http://www.google.de/reader?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wy">Reader</a></span> <span class=gb2><a href="http://video.google.de/videosearch?hl=de&q=google+auswerten&um=1&ie=UTF-8&sa=N&tab=wv">Video</a></span> <span class=gb2><a href="http://www.google.de/intl/de/options/">und noch mehr &raquo;</a></span> </nobr></div><div id=gbh></div><div align=right id=guser style="font-size:84%;padding:0 0 4px" width=100%><nobr><a href="https://www.google.com/accounts/Login?continue=http://www.google.de/search%3Fhl%3Dde%26q%3Dgoogle%2Bauswerten%26btnG%3DGoogle-Suche%26meta%3D&hl=de">Anmelden</a></nobr></div><table class=tb style=clear:left width=100%><tr><form name=gs method=GET action=/search><td class=tc valign=top><a href="http://www.google.de/webhp?hl=de" title="Gehe zur Google Homepage"><img src="/images/logo_sm.gif" width=150 height=55 alt=Google border=0 vspace=12></a></td><td style="padding:0 0 7px;padding-left:8px"  valign=top width=100%><table class=tb style=margin-top:25px><tr><td class=tc nowrap><input type=hidden name=hl value="de"><input type=hidden name=ie value="ISO-8859-1"><input type=text name=q size=41 maxlength=2048 value="google auswerten" title="Suche"> <input type=submit name="btnG" value="Suche"></td><td class=tc nowrap width=100%><span id=ap>&nbsp;&nbsp;<a href=/advanced_search?q=google+auswerten&hl=de&ie=UTF-8>Erweiterte Suche</a><br>&nbsp; <a href=/preferences?q=google+auswerten&hl=de&ie=UTF-8>Einstellungen</a></span></td></tr><tr><td class=tc colspan=2><font size=-1> Suche: <input id=all type=radio name=meta value="" checked><label for=all> Das Web </label><input id=lgr type=radio name=meta value="lr=lang_de"><label for=lgr> Seiten auf Deutsch </label><input id=cty type=radio name=meta value="cr=countryDE"><label for=cty> Seiten aus Deutschland </label> </font></td></tr></table></td></tr></form></table>
    11b3
    <table border=0 cellpadding=0 cellspacing=0 width=100%><tr><td bgcolor=#3366cc><img width=1 height=1 alt=""></td></tr></table><table border=0 cellpadding=0 cellspacing=0 width=100% bgcolor=#e5ecf9><tr><td nowrap><font size=+1>&nbsp;<b>Web&nbsp;</b></font></td><td align=right nowrap><font size=-1>Ergebnisse <b>1</b> - <b>10</b> von ungefähr <b>289.000</b> für <b>google auswerten</b>.  (<b>0,21</b> Sekunden)&nbsp;</font></td></tr></table><table cellspacing=0 cellpadding=0  width=25% align=right id=mbEnd bgcolor=#ffffff border=0 class=ra><tr><td colspan=4><font size=-1>&nbsp;</font></td></tr><tr><td id=rhsline rowspan=5 >&nbsp;&nbsp;</td><td width=1 bgcolor=#c9d7f1 rowspan=5><img width=1 height=1 alt=""></td><td rowspan=5 >&nbsp;&nbsp;</td><td height=25 align=center><h2 class="sl f">Anzeigen</h2></td></tr><tr height=7><td><img width=1 height=1 alt=""></td></tr><tr><td nowrap onmouseover="return true"><font size=-1>  <font size=+0><a id=an1 href=/pagead/iclk?sa=l&ai=BNLvWIaNvR8_YO6G0-wLQw5XuA_nxiDKV89S6BKT1zgmgnAEQARgBOAFQo4j-YWCVAqABt4q-_gPIAQHZAwUyXmbjmAIZ4AMQ&num=1&adurl=https://adwords.google.de/select/Login%3Fsourceid%3DAWO%26subid%3Demea-de-ha-aw-aganzeigengooglemisc%26medium%3Dha%26term%3Danzeigen%2520google><b>Google</b> Anzeigen Schalten</a></font><br>Testen Sie diese kostengünstige und<br>effektive Werbemöglichkeit!<br><span class=a>AdWords.<b>Google</b>.de</span><br>  </font></td></tr><tr height=7><td><img width=1 height=1 alt=""></td></tr><tr><td height=25 align=center><font size=-1></font></td></tr><tr><td id=rhspad height=0></td></tr></table><div id=res>    <table cellpadding=0 cellspacing=0 border=0 style="margin-top:1em"><tr><td><font size=-1>Tipp: Anstatt auf "Suche" zu klicken, können Sie auch die Eingabetaste drücken, um Zeit zu sparen.</font></td></tr></table><div><div class=g><h2 class=r><a href="http://www.manjie.net/stat/" class=l>manjie.net - <b>Google</b> Statistik</a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j"><font size=-1><b>google</b> position, de, 1, /tools/positions-check.php, 19.12.2007. pennergame scripte, de, 1, /stat/index.php, 19.12.2007. <b>google auswertung</b>, de, 1 <b>...</b><br><span class=a>www.manjie.net/stat/ - 684k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:vZx0yE-ptdcJ:www.manjie.net/stat/+google+auswerten&hl=de&ct=clnk&cd=1&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:www.manjie.net/stat/">Ähnliche Seiten</a></nobr></font></td></tr></table></div> <div class=g><h2 class=r><a href="http://www.digital-inspiration.com/google-analytics.php" class=l><b>Google</b> Analytics Hilfe -  Installation Konfiguration Einbindung <b>...</b></a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j"><font size=-1><b>Google</b> Analytics <b>Google</b> Analytics ist ein Tool für die Analyse von Website-Besuchen, das im Sommer 2006 freigegeben wurde und nun auch ohne lange Wartezeit <b>...</b><br><span class=a>www.digital-inspiration.com/<b>google</b>-analytics.php - 6k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:9qi0XX2vqNIJ:www.digital-inspiration.com/google-analytics.php+google+auswerten&hl=de&ct=clnk&cd=2&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:www.digital-inspiration.com/google-analytics.php">Ähnliche Seiten</a></nobr></font></td></tr></table></div> <div class=g><h2 class=r><a href="http://martin.ringehahn.de/blog/?p=42" class=l>zeiteisen » Blog Archive » <b>google auswerten</b></a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j"><font size=-1><b>google auswerten</b>. werd ich vielleicht mal einbinden via MeX. Dieser Eintrag wurde am Samstag, den 5. Juli 2003 um 21:24 Uhr erstellt und ist in der <b>...</b><br><span class=a>martin.ringehahn.de/blog/?p=42 - 13k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:Yurppb7qpCEJ:martin.ringehahn.de/blog/%3Fp%3D42+google+auswerten&hl=de&ct=clnk&cd=3&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:martin.ringehahn.de/blog/%3Fp%3D42">Ähnliche Seiten</a></nobr></font></td></tr></table></div> <div class=g style="margin-left:2.5em;"><h2 class=r><a href="http://martin.ringehahn.de/blog/archives/000042.html" class=l>zeiteisen: <b>google auswerten</b></a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j hc"><font size=-1><b>google auswerten</b>. werd ich vielleicht mal einbinden via MeX. Posted by chrono at 05.07.03 21:24
    24f0
    | TrackBack. Comments. Post a comment. Name: Email Address: <b>...</b><br><span class=a>martin.ringehahn.de/blog/archives/000042.html - 7k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:-twswxGO7RYJ:martin.ringehahn.de/blog/archives/000042.html+google+auswerten&hl=de&ct=clnk&cd=4&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:martin.ringehahn.de/blog/archives/000042.html">Ähnliche Seiten</a></nobr></font></td></tr></table></div> <div class=g><h2 class=r><a href="http://groups.google.com/group/de.etc.beruf.selbstaendig/browse_thread/thread/76276c430fdf0a3f" class=l>Renner-Penner-<b>Auswertung</b> - de.etc.beruf.selbstaendig | <b>Google</b> Groups</a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j"><font size=-1><b>Google</b> Groups Home <b>......</b> anschliesend die Abweichungen <b>auswerten</b>. Geht üblicherweise schneller.  &gt; id, Datum, Menge (und dann natürlich die Auftragsnummer, <b>...</b><br><span class=a>groups.<b>google</b>.com/group/de.etc.beruf.selbstaendig/ browse_thread/thread/76276c430fdf0a3f - 197k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:xLpibwE0C1EJ:groups.google.com/group/de.etc.beruf.selbstaendig/browse_thread/thread/76276c430fdf0a3f+google+auswerten&hl=de&ct=clnk&cd=5&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:groups.google.com/group/de.etc.beruf.selbstaendig/browse_thread/thread/76276c430fdf0a3f">Ähnliche Seiten</a></nobr></font></td></tr></table></div> <div class=g style="margin-left:2.5em;"><h2 class=r><a href="http://groups.google.com/group/de.comp.text.xml/browse_thread/thread/b3aee214e45fb2f3" class=l>Tool mit XPath-<b>Auswertung</b> - de.comp.text.xml | <b>Google</b> Groups</a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j hc"><font size=-1><b>Google</b> Groups Home <b>...</b> <b>Auswerten</b> eines XPath-Ausdrucks u.a. das Resultat als XML-Fragment dargestellt und lässt sich auch als solches kopieren. <b>...</b><br><span class=a>groups.<b>google</b>.com/group/de.comp.text.xml/ browse_thread/thread/b3aee214e45fb2f3 - 44k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:pizJc-LeP1QJ:groups.google.com/group/de.comp.text.xml/browse_thread/thread/b3aee214e45fb2f3+google+auswerten&hl=de&ct=clnk&cd=6&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:groups.google.com/group/de.comp.text.xml/browse_thread/thread/b3aee214e45fb2f3">Ähnliche Seiten</a></nobr><br>[ <a class=fl href="/search?hl=de&ie=UTF-8&q=+site:groups.google.com+google+auswerten">Weitere Ergebnisse von groups.google.com</a> ]</font></td></tr></table></div> <div class=g><h2 class=r><a href="http://www.fi-ausbilden.de/blog/2007/11/03/google-analytics-auswertung-fur-suche-einrichten/" class=l><b>Google</b> Analytics: <b>Auswertung</b> für Suche einrichten <b>...</b></a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j"><font size=-1>Die Suche ist neben des normalen Menüs sicherlich eine der Hauptnavigationselemente einer Webseite. <b>Google</b> Analytics bietet nun die Möglichkeit, <b>...</b><br><span class=a>www.fi-ausbilden.de/blog/2007/11/ 03/<b>google</b>-analytics-auswertung-fur-suche-einrichten/ - 39k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:VlRBjAC6-6wJ:www.fi-ausbilden.de/blog/2007/11/03/google-analytics-auswertung-fur-suche-einrichten/+google+auswerten&hl=de&ct=clnk&cd=7&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:www.fi-ausbilden.de/blog/2007/11/03/google-analytics-auswertung-fur-suche-einrichten/">Ähnliche Seiten</a></nobr></font></td></tr></table></div> <div class=g><h2 class=r><a href="http://naschkontrolle.de/blog/2007/07/17/interne-suche-mit-google-analytics-erfassen" class=l>Interne Suche mit <b>Google</b> Analytics erfassen | Naschkontrolle-DE</a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j"><font size=-1>Benutzt man die <b>Google</b> Custom Search Engine (CSE) für die Suche innerhalb der eigenen Webseite, so bekommt man nicht immer einen Überblick über die <b>...</b><br><span class=a>naschkontrolle.de/blog/2007/07/ 17/interne-suche-mit-<b>google</b>-analytics-erfassen - 23k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:CH_wifyI4RAJ:naschkontrolle.de/blog/2007/07/17/interne-suche-mit-google-analytics-erfassen+google+auswerten&hl=de&ct=clnk&cd=8&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:naschkontrolle.de/blog/2007/07/17/interne-suche-mit-google-analytics-erfassen">Ähnliche Seiten</a></nobr></font></td></tr></table></div> <div class=g><h2 class=r><a href="http://mitra.ch/netzkultur/google-analytics-vs-reinvigorate-vs-mint" class=l><b>Google</b> Analytics vs. Reinvigorate vs. Mint</a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j"><font size=-1>Reinvigorate gibt es eigentlich schon Jahre und  war schon vor <b>Google</b> Analytics eine gute <b>Auswertung</b>! Leider haben sich die Macher von der letzten Version zu <b>...</b><br><span class=a>mitra.ch/netzkultur/ <b>google</b>-analytics-vs-reinvigorate-vs-mint - 38k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:CNa1c6IROFUJ:mitra.ch/netzkultur/google-analytics-vs-reinvigorate-vs-mint+google+auswerten&hl=de&ct=clnk&cd=9&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:mitra.ch/netzkultur/google-analytics-vs-reinvigorate-vs-mint">Ähnliche Seiten</a></nobr></font></td></tr></table></div> <div class=g><h2 class=r><a href="http://www.webmasterpark.net/forum/archive/index.php/t-48791.html" class=l>Nickpage [Archiv] - WebmasterPark</a></h2><table border=0 cellpadding=0 cellspacing=0><tr><td class="j"><font size=-1>Hallo! also ich werde dann mal über <b>google auswerten</b> von datenbanken sowie schreiben suchen! falls jemand gerade einen link hat, kann ihn mir ja geben! <b>...</b><br><span class=a>www.webmasterpark.net/forum/ archive/index.php/t-48791.html - 14k - </span><nobr><a class=fl href="http://209.85.129.104/search?q=cache:N9NEn_HaadMJ:www.webmasterpark.net/forum/archive/index.php/t-48791.html+google+auswerten&hl=de&ct=clnk&cd=10&gl=de&ie=UTF-8">Im&nbsp;Cache</a> - <a class=fl href="/search?hl=de&ie=UTF-8&q=related:www.webmasterpark.net/forum/archive/index.php/t-48791.html">Ähnliche Seiten</a></nobr></font></td></tr></table></div> </div><br clear=all><div id=navbar class=n><table border=0 cellpadding=0 width=1% cellspacing=0 align=center><tr align=center style=text-align:center valign=top><td valign=bottom nowrap><font size=-1>Ergebnisseite:&nbsp;</font><td nowrap><img src=/intl/de/nav_first.gif width=18 height=26 alt=""><br><td nowrap><img src=/intl/de/nav_current.gif width=16 height=26 alt=""><br><span class=i>1</span><td nowrap><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=10&sa=N"><img src=/intl/de/nav_page.gif width=16 height=26 alt="" border=0><br>2</a><td nowrap><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=20&sa=N"><img src=/intl/de/nav_page.gif width=16 height=26 alt="" border=0><br>3</a><td nowrap><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=30&sa=N"><img src=/intl/de/nav_page.gif width=16 height=26 alt="" border=0><br>4</a><td nowrap><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=40&sa=N"><img src=/intl/de/nav_page.gif width=16 height=26 alt="" border=0><br>5</a><td nowrap><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=50&sa=N"><img src=/intl/de/nav_page.gif width=16 height=26 alt="" border=0><br>6</a><td nowrap><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=60&sa=N"><img src=/intl/de/nav_page.gif width=16 height=26 alt="" border=0><br>7</a><td nowrap><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=70&sa=N"><img src=/intl/de/nav_page.gif width=16 height=26 alt="" border=0><br>8</a><td nowrap><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=80&sa=N"><img src=/intl/de/nav_page.gif width=16 height=26 alt="" border=0><br>9</a><td nowrap><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=90&sa=N"><img src=/intl/de/nav_page.gif width=16 height=26 alt="" border=0><br>10</a><td nowrap class=b><a href="/search?q=google+auswerten&hl=de&ie=UTF-8&start=10&sa=N"><img src=/intl/de/nav_next.gif width=100 height=26 alt="" border=0><br><b>Vorwärts</b></a></table></div></div><center>
    <br clear=all><br><table border=0 cellpadding=0 cellspacing=0 width=100% bgcolor="#e5ecf9"><tr><td bgcolor="#3366cc"><img width=1 height=1 alt=""></td></tr><tr><td align=center>&nbsp;<br><table border=0 cellpadding=0 cellspacing=0 align=center><form method=GET action=/search><tr><td nowrap>
    <font size=-1><input type=text name=q size=31 maxlength=2048 value="google auswerten" title="Suche"> <input type=submit name=btnG value="Suche"><input type=hidden name=hl value="de"><input type=hidden name=ie value="ISO-8859-1"></font></td></tr></form></table><br><font size=-1><nobr><a href="/swr?q=google+auswerten&amp;hl=de&amp;ie=UTF-8&amp;swrnum=289000">In den Ergebnissen suchen</a></nobr> | <nobr><a href="/language_tools?q=google+auswerten&amp;hl=de&amp;ie=UTF-8">Sprachtools</a></nobr> | <nobr><a href="/intl/de/help.html">Suchtipps</a></nobr><nobr><a href="/quality_form" target=_blank></a></nobr></font><br><br></td></tr><tr><td bgcolor="#3366cc"><img width=1 height=1 alt=""></td></tr></table></center>
    17d
    <center><p><hr class=z><table border=0 cellpadding=2 cellspacing=0 width=100%><tr><td align=center><font size=-1><a href="/">Google Home</a> - <a href="/intl/de/ads/">Werbeprogramme</a> - <a href="/services/">Unternehmensangebote</a> - <a href="/intl/de/about.html">Über Google</a></font></td></tr></table><br><font size=-1 class=p>&copy;2007 Google</font></center></body></html>
    
    0
    

    Jetzt brauche ich eine möglichkeit die URLs herasuzufiltern ( hab es bisjetzt nur mit dem Shell
    befehl grep versucht) , vielleicht kennt jemand ein möglichkeit.

    Danke

    Frohe Weihnachten



  • such mal nach im internet nach 'google-api'.
    🙂



  • such mal nach im internet nach 'google-api'.
    🙂

    Hab nichts gefunden für C/C++

    Muss ja eine Möglichkeit geben URL s herauszufiltern...

    Danke



  • Ok habs zwar jetzt nich mit C gemacht aber so funktioniert es auch:

    google www.google.de | grep -o "http://[^ \"']*"
    

    Danke



  • google liefert dir ne html-seite als ergebnis, die kannst du parsen 😉



  • Die prinzipielle Vorgehensweise ist, dass du nach einem String suchst, der vor jedem gefundenen Link vorkommt. Das wäre zum Beispiel "<div class=g>". Von da aus suchst du dann so lange weiter, bis du ein Anführungszeichen findest und alles was sich zwischen diesem und dem nächsten Anführungszeichen befindet, ist dein Link.
    Es wäre wohl auch ratsam, die Seite vorher von der Chunked-Form in die "Normalform" zu bringen.



  • 4aoo9ecjw 78t5kxt0ikic zsxslkxr7azk8



  • Transfer-Encoding: chunked
    ...
    
    1981 /* chunk size in hex */
    ...
    

    http://tools.ietf.org/html/rfc2616#section-3.6.1

    Sie sind nicht berechtigt, die Dienste in missbräuchlicher Art und Weise zu nutzen, in die Dienste einzugreifen oder auf die Dienste in anderer Weise als über die von Google bereitgestellten Benutzeroberflächen und/oder Schnittstellen zuzugreifen. Sie müssen sich an die Vorgaben halten, die in den robots.txt-Dateien der Dienste hinterlegt sind. Es ist Ihnen untersagt, auf die Dienste in automatisierter Weise zuzugreifen, beispielsweise mit Robots oder Scripts.

    :p


Anmelden zum Antworten