HTTP Requestheader - Endsequences?



  • Ich schreibe derzeit einen kleinen textbasierten Httpclient, welcher von nahezu allen Servern die html-dateien laden kann. Gestern wurde ich von einem Betatester darauf aumerksam gemacht, dass manche Server mit dem Requestheader nicht klarzukommen scheinen.

    Hier ist der Requestheader.

    "GET %s HTTP/1.1\r\nHost: %s\r\nConnection: close\r\nAccept: text/html, application/xml;q=0.9, application/xhtml+xml, image/png, image/jpeg, image/gif, image/x-xbitmap, */*;q=0.1\r\nAccept-Language: en;q=0.9\r\nConnection: close\r\nAccept-Charset: iso-8859-1, utf-8, utf-16, *;q=0.1\r\nUser-Agent: MyClient\r\nReferer: %s/\r\n\r\n"
    

    %s werden via sprintf angepasst.

    Es muss an den Endsequences liegen, welche bestimmte Server nicht auswerten können. Sie warten und warten bis zum Timeout, und beginnen nicht mit der Übertragung des Responses. Wie gesagt, die meisten getesten Server kommen mit dem Request zurecht.



  • Bei mir sieht das so aus: Villeicht kannst ja nen Unterschied rauslesen

    21:55:01 - 15.06.2005	Protocol: TCP	Service: HTTP
    Source Address: 192.168.0.55    Destination Address: 145.97.39.139
    Source Port: 2949    Destination Port: 80
    45 00 02 17 7a 7f 40 00 80 06 04 96 c0 a8 00 37 91 61     E   z@        7 a
    27 8b 0b 85 00 50 06 b7 ae e1 1d 13 e0 0b 50 18 ff ff     '    P        P   
    64 5f 00 00 47 45 54 20 2f 77 69 6b 69 2f 48 61 75 70     d_  GET /wiki/Haup
    74 73 65 69 74 65 20 48 54 54 50 2f 31 2e 31 0d 0a 48     tseite HTTP/1.1  H
    6f 73 74 3a 20 64 65 2e 77 69 6b 69 70 65 64 69 61 2e     ost: de.wikipedia.
    6f 72 67 0d 0a 55 73 65 72 2d 41 67 65 6e 74 3a 20 4d     org  User-Agent: M
    6f 7a 69 6c 6c 61 2f 35 2e 30 20 28 57 69 6e 64 6f 77     ozilla/5.0 (Window
    73 3b 20 55 3b 20 57 69 6e 64 6f 77 73 20 4e 54 20 35     s; U; Windows NT 5
    2e 31 3b 20 65 6e 2d 55 53 3b 20 72 76 3a 31 2e 37 2e     .1; en-US; rv:1.7.
    38 29 20 47 65 63 6b 6f 2f 32 30 30 35 30 35 31 31 20     8) Gecko/20050511 
    46 69 72 65 66 6f 78 2f 31 2e 30 2e 34 0d 0a 41 63 63     Firefox/1.0.4  Acc
    65 70 74 3a 20 74 65 78 74 2f 78 6d 6c 2c 61 70 70 6c     ept: text/xml,appl
    69 63 61 74 69 6f 6e 2f 78 6d 6c 2c 61 70 70 6c 69 63     ication/xml,applic
    61 74 69 6f 6e 2f 78 68 74 6d 6c 2b 78 6d 6c 2c 74 65     ation/xhtml+xml,te
    78 74 2f 68 74 6d 6c 3b 71 3d 30 2e 39 2c 74 65 78 74     xt/html;q=0.9,text
    2f 70 6c 61 69 6e 3b 71 3d 30 2e 38 2c 69 6d 61 67 65     /plain;q=0.8,image
    2f 70 6e 67 2c 2a 2f 2a 3b 71 3d 30 2e 35 0d 0a 41 63     /png,*/*;q=0.5  Ac
    63 65 70 74 2d 4c 61 6e 67 75 61 67 65 3a 20 65 6e 2d     cept-Language: en-
    75 73 2c 65 6e 3b 71 3d 30 2e 35 0d 0a 41 63 63 65 70     us,en;q=0.5  Accep
    74 2d 45 6e 63 6f 64 69 6e 67 3a 20 67 7a 69 70 2c 64     t-Encoding: gzip,d
    65 66 6c 61 74 65 0d 0a 41 63 63 65 70 74 2d 43 68 61     eflate  Accept-Cha
    72 73 65 74 3a 20 49 53 4f 2d 38 38 35 39 2d 31 2c 75     rset: ISO-8859-1,u
    74 66 2d 38 3b 71 3d 30 2e 37 2c 2a 3b 71 3d 30 2e 37     tf-8;q=0.7,*;q=0.7
    0d 0a 4b 65 65 70 2d 41 6c 69 76 65 3a 20 33 30 30 0d       Keep-Alive: 300 
    0a 43 6f 6e 6e 65 63 74 69 6f 6e 3a 20 6b 65 65 70 2d      Connection: keep-
    61 6c 69 76 65 0d 0a 49 66 2d 4d 6f 64 69 66 69 65 64     alive  If-Modified
    2d 53 69 6e 63 65 3a 20 57 65 64 2c 20 31 35 20 4a 75     -Since: Wed, 15 Ju
    6e 20 32 30 30 35 20 31 38 3a 33 36 3a 33 36 20 47 4d     n 2005 18:36:36 GM
    54 0d 0a 43 61 63 68 65 2d 43 6f 6e 74 72 6f 6c 3a 20     T  Cache-Control: 
    6d 61 78 2d 61 67 65 3d 30 0d 0a 0d 0a                    max-age=0    
    ----------------------------------------------------------------------------
    

    Ich seh jedoch kein Unterschied, es hört mit 0x0d0a0d0a auf das wird wohl \r\n\r\n sein...


Log in to reply