<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Servername&#x2F;ip nach Umleitung mit CHttpConnection]]></title><description><![CDATA[<p>Hallo,</p>
<p>Ich schreibe ein Programm zur rekursiven Analyse von Internetseiten auf bestimmte Inhalte.<br />
Dabei soll das Programm eine Internetseite öffnen, den Quellcode nach Inhalten Analysieren und gleichzeitig dabei Links auf andere Websites finden. Den Links wird dann bis zu einer bestimtmen Tiefe gefolgt und jede Seite genauso analysiert.</p>
<p>Das ganze funktionert so weit, bis auf Links die eine Umleitung enthalten:<br />
Dann wird zwar die verlinkte Seite richtig geladen, aber der Servername ist nicht mehr zwangsläufig derselbe wie auf dem Link: Ich kann dann zwar die Inhalte analysieren, aber von relativen Links auf der Seite fehlt mir der Serverbezeichner, um diese Links verfolgen zu können.</p>
<p>Ich verwende folgende Befehle zum öffnen der Websites (server und file sind char[], die die Serverbezeichner und sub-Sites des zu öffnenden Links enthalten):</p>
<pre><code class="language-cpp">CInternetSession is1;
CHttpConnection * pHttpCo1 = NULL;
CHttpFile * pHttpFile1 = NULL;
INTERNET_PORT nPort = 80;

pHttpCo1 = is1.GetHttpConnection (server, nPort);
pHttpFile1 = pHttpCo1-&gt;OpenRequest (CHttpConnection::HTTP_VERB_GET, file);
pHttpFile1-&gt;SendRequest();
</code></pre>
<p>Eingelesen wird dann mit pHttpFile1-&gt;Read().</p>
<p>Auf welche Weise kann ich jetzt den tatsächlichen Server der eingelesenen Seite herausbekommen? (kann ja durch eine Umleitung von server[] abweichen)</p>
]]></description><link>https://www.c-plusplus.net/forum/topic/50763/servername-ip-nach-umleitung-mit-chttpconnection</link><generator>RSS for Node</generator><lastBuildDate>Sun, 31 May 2026 09:02:49 GMT</lastBuildDate><atom:link href="https://www.c-plusplus.net/forum/topic/50763.rss" rel="self" type="application/rss+xml"/><pubDate>Fri, 03 Oct 2003 09:20:20 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to Servername&#x2F;ip nach Umleitung mit CHttpConnection on Sat, 04 Oct 2003 09:51:07 GMT]]></title><description><![CDATA[<p>Hallo,</p>
<p>Ich schreibe ein Programm zur rekursiven Analyse von Internetseiten auf bestimmte Inhalte.<br />
Dabei soll das Programm eine Internetseite öffnen, den Quellcode nach Inhalten Analysieren und gleichzeitig dabei Links auf andere Websites finden. Den Links wird dann bis zu einer bestimtmen Tiefe gefolgt und jede Seite genauso analysiert.</p>
<p>Das ganze funktionert so weit, bis auf Links die eine Umleitung enthalten:<br />
Dann wird zwar die verlinkte Seite richtig geladen, aber der Servername ist nicht mehr zwangsläufig derselbe wie auf dem Link: Ich kann dann zwar die Inhalte analysieren, aber von relativen Links auf der Seite fehlt mir der Serverbezeichner, um diese Links verfolgen zu können.</p>
<p>Ich verwende folgende Befehle zum öffnen der Websites (server und file sind char[], die die Serverbezeichner und sub-Sites des zu öffnenden Links enthalten):</p>
<pre><code class="language-cpp">CInternetSession is1;
CHttpConnection * pHttpCo1 = NULL;
CHttpFile * pHttpFile1 = NULL;
INTERNET_PORT nPort = 80;

pHttpCo1 = is1.GetHttpConnection (server, nPort);
pHttpFile1 = pHttpCo1-&gt;OpenRequest (CHttpConnection::HTTP_VERB_GET, file);
pHttpFile1-&gt;SendRequest();
</code></pre>
<p>Eingelesen wird dann mit pHttpFile1-&gt;Read().</p>
<p>Auf welche Weise kann ich jetzt den tatsächlichen Server der eingelesenen Seite herausbekommen? (kann ja durch eine Umleitung von server[] abweichen)</p>
]]></description><link>https://www.c-plusplus.net/forum/post/365308</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/365308</guid><dc:creator><![CDATA[MarMac]]></dc:creator><pubDate>Sat, 04 Oct 2003 09:51:07 GMT</pubDate></item><item><title><![CDATA[Reply to Servername&#x2F;ip nach Umleitung mit CHttpConnection on Sat, 04 Oct 2003 09:51:41 GMT]]></title><description><![CDATA[<p>Nachtrag:<br />
Ist die Frage zu kompliziert?<br />
Ich habe mich inzwischen etwas mehr über Netzwerkkommunikation informiert, und festgestellt, dass bei der Empfangenen Seite auf jeden Fall mindestens eine Absender-IP im Header stehen muss. (was mir wohl rechen müsste)<br />
Ich habe da schon etliche CHttpFile-&gt;QueryInfo()-Parameter durchprobiert, allerdings kam nirgends was brauchbares dabei raus.<br />
Gibt es vielleicht eine Möglichkeit, den gesamten Header im Rohtext auszulesen?</p>
]]></description><link>https://www.c-plusplus.net/forum/post/365747</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/365747</guid><dc:creator><![CDATA[MarMac]]></dc:creator><pubDate>Sat, 04 Oct 2003 09:51:41 GMT</pubDate></item></channel></rss>