100%ig Zuverlässige TCP/IP Kommunikation...

thordk

du musst dir nicht alle IDs merken, wenn du sequenzielle IDs für eine verbindung verwendest. dann kann der server nämlich pakete, die kleiner als die bereits abgearbeiteten sequenznummern sind, stickum als bereits erledigt bestätigen.

Jochen Kalmbach

Jetzt hab ich nur noch das Problem, dass ich mehrere Clients haben kann... die wissen ja nix voneinandern, somit können diese auch keine "forlaufende" ID bilden...

Jochen Kalmbach schrieb:

loks schrieb:

Jochen Kalmbach schrieb:

Auf der Empfängerseite habe ich beim "recv" als Timeout auch 2 Sekunden angegeben!!!!

2 Sekunden timeout erscheinen mir aber auch viel zu kurz für das beschriebene scenario. Ich würde da eher sowas wie 10 Sekunden erwarten. Der Timeout sollte ja shcon so gewählt werden das er im Normalbetrieb nicht erreicht wird. Und wie Du selber beschreibst sind 2 Skunden ja im Normalbetrieb durchaus möglich.

Die länge des Timeouts spielt bei "zuverlässig" *keine* Rolle! Entweder eine Übertragung ist zuverlässig oder nicht!
Und mir geht ja gerade *nicht* um den Normalbetrieb!

Unzuverlässig definiert sich doch darüber das Pakete verloren gehen. Ein timeout gibt dabei den Zeitpunkt an, ab dem ein Paket als verloren gilt wenn es bis dato nicht erschienen ist. Und 2 Sekunden erscheinen mir in em Zusammenhang als zu kurz, weil damit nach Deiner beschreibung ja Pakete als verloren betrachtet werden, die einfach nur "zu langsam" waren... Du sagst ja selber:

Jochen Kalmbach schrieb:

Wie gesagt, das Betrifft nur die ISO-Ebene 3!!! Die Pakete kommen da ja auch wunderbar an! und werden eben im Treiber jetzt gepuffert bis sie jemand abholt!
Ich bin aber mit meiner Anwendung auf Ebene 8 und hab jetzt das Problem dass die Daten womöglich gerade auf Ebene 3 eingetroffen sind ich auf Ebene 8 aber gleichzeitig in den Timeout reinlaufe. Somit wurden die Daten perfekt auf EBene 3 übertragen, aber ich hab sie nicht bekommen...

Demnach wird deine Übertragung unzuverlässig (Ebene 8 erkennt verlorene Pakete) obwohl diese eigentlich angekommen sein (liegen auf ebene 3). Daher meine Frage: Warum ein so kurzer timeout?

Man könnte die Id an die MAC anhängen, somit muss jeder Client nur eine fortlaufende Nummer generieren.

Jochen Kalmbach

loks schrieb:

Warum ein so kurzer timeout?

Auch wenn ich mein Timeout auf 10 Sec machen hat sich das Problem nicht gelöst... wenn das Kundennetzt es erst erlaubt nach 10 sec. die Daten auf Ebene 3 korrekt zu übertragen hab ich auch nix gewonnen...

pale dog

Jochen Kalmbach schrieb:

Jetzt hab ich nur noch das Problem, dass ich mehrere Clients haben kann... die wissen ja nix voneinandern, somit können diese auch keine "forlaufende" ID bilden...

der server kann ja anhand der 'sockaddr_in' (portnummer und ip adresse die der client benutzt) die clients unterscheiden. wenn z.b. auf einer client-maschine zwei instanzen der client-software eine verbindung zum server haben, kann dieser anhand der portnummern die clients unterscheiden, obwohl die ip-adressen gleich sind.

Unix-Tom

Ein 100% kann es nicht geben. Wenn du eine Sequenznummer und ein Angekommen sendet musst du auf Clientseite wieder bestätigen das die Bestätigung angekommen ist.
Solange aber der Socket offen ist kannst du dir immer sicher sein das dir TCP vieles abnimmt.
Wenn die Daten bereits beim Empfänger sind dann kann der Sender schon wieder weiter machen. Der Empfänger kann zwar einen Timeout bekommen aber IMHO bekommt er das vom Treiber der den Socket steuert.

hustbaer

Jochen Kalmbach schrieb:

Hallo hustbaer!

hustbaer schrieb:

Ok, also du hast grundsätzlich 2 Fälle: "ja" -> alles angekommen wie es sollte und "nein" -> nicht angekommen.
Mittels 2x Empfang quittieren (1x Empfang der Nachricht und 1x Empfand der Bestätigung) kannst du "sicher ja" feststellen. Wenn dabei allerdings etwas daneben geht heisst das nicht "sicher nein", sondern eben "unbekannt: ja oder nein".

Endlich einer der mich versteht!

Hehe, ja, weil ich eben genau so ein Problem schon hatte

hustbaer schrieb:

Was du schreibst erinnert mich daran wie ich vor dem Problem stand gewisse Daten (Events aus einem Log) zu übertragen. Dabei war wichtig dass die Daten Clientseitig erst gelöscht werden wenn sie übertragen und am Server gespeichert wurden, und dass Daten nicht 2x am Server eingetragen wurden.
Die Lösung: man verpasst jedem Datensatz Clientseitig eine unique ID (ich hab' einfach ne GUID genommen).
Dann schickt man alle Datensätze an den Server. Der Server verwirft alle Datensätze mit einer bereits bekannten GUID, alle anderen werden abgespeichert.

Wenn alles abgespeichert ist schickt der Server ein ACK an den Client, woraufhin der alle übertragenen Datensätze löscht.

Wird der Vorgang unterbrochen werden einfach alle alten Datensätze bei der nächsten Übertragung nochmal mitgeschickt. Ob die dann schon eingetragen wurden oder nicht ist egal, da ja bereits eingetragene Datensätze anhand ihrere GUID erkannt und verworfen werden.

Vielleicht hilft dir das weiter.

Das ist bisher auch die Lösung die ich mir vorstellen kann... leider ist das nicht so einfach mit einer eindeutigen ID... ich müsste mir ja auf der Server-Seite *alle* IDs merken und immer nachschlagen. Das ist etwas "overpowered"...

Sowas muss es doch (einfacher) geben!!! 2-Phase-Commit-Protokoll... ich hab bloß noch nichts gefunden wie man das auf TCP anwendet...

Naja, du musst dir auf der Server Seite nur die IDs merken von Transaktionen von denen der Server nicht sicher sein kann dass der Client bereits weiss dass sie auch committed wurden, und dass der Client sie seinerseits als "fertig" markiert hat (bzw. einfach gelöscht hat).

Nachdem der Server eine Transaktion "committed" hat schickt er einfach zum Client "Transaktion #1234 ist committed". Der Client kann nun seinerseits diese Transaktion löschen bzw. als "fertig" markieren, und _danach_ schickt er an den Server "OK, habe Transaktion #1234 als fertig markiert". Sobald der Server das empfangen hat kann er die Daten über Transaktion #1234 löschen, da er sicher sein kann diese vom Client nicht nochmals geschickt zu bekommen.

Das einzige was hier nun passieren kann ist dass der Server eine Transaktion (die bereits committed ist) für einen Client noch gespeichert hat, der Client diese aber schon gelöscht hat (da die Verbindung unterbrochen wurde bevor der Client das "OK, habe Transaktion #1234 als fertig markiert" an den Server schicken konnte).
Der Fall ist aber nicht weiter tragisch, das lässt sich einfach damit regeln dass bei jedem Verbindungsaufbau der Server die IDs der Transaktionen die bereits committed wurden an den Client schickt, und der Client diese dann auf seiner Seite löscht. Hat er sie schon gelöscht findet er sie nicht und ignoriert sie einfach, in dem Fall schickt er dann ein "OK, habe Transaktion #1234 nicht gefunden, muss ich damals schon gelöscht haben" an den Server, und dieser kann die Daten wiederum löschen.

Soetwas würde ich allerdings nur implementieren wenn das System nicht sowieso Daten über sämtliche Transaktionen irgendwo aufheben muss. Das Nachschlagen der IDs sehe ich nicht als Problem ansich, höchstens eben den Speicherplatz der dafür draufgeht, was aber eben nur ein Problem ist wenn nicht sowieso alles aufgehoben werden muss.
Das Nachschlagen in einer kleinen Detailtabelle (bzw. einem "Covering Index") mit nur Transaktions ID + Zustand sollte auf jeden Fall sehr schnell gehen - so eine GUID ist gerademal 16 Byte lang, mit Zustand und Overhead kommt das auf sagen wir mal 17-20 Byte pro Zeile - regt mich ehrlich gesagt nicht sonderlich auf. So viele Zeilen können das garnicht sein dass ein B-Baum da besonders tief werden könnte.
Und wenn man statt GUIDs noch fortlaufende Nummern vergibt muss auch nur ein ganz kleiner Teil dieser Tabelle im Speicher gehalten werden, nämlich die IDs der letzten paar Tage.
(Und wenn man die IDs Serverseitig vergibt sollte man auch mit 8 oder 10 Byte auskommen, was die Tabelle nochmal schmäler macht)

p.S.: über Timeouts oder die Details von TCP/IP muss (bzw. sollte oder noch besser: darf) man sich bei sowas überhaupt keine Gedanken machen. Man behandelt die TCP/IP Verbindung einfach als Verbindung die jederzeit abreissen kann, und wenn sie abreisst muss man davon ausgehen dass minimal garnix bis maximal alles was seit der letzten Bestätigung zur Gegenstelle geschickt wurde nicht angenommen ist. Dadurch erübrigt es sich auch darüber nachzudenken ob die Gegenstelle vielleicht abstürzen könnte oder den Strom verliert oder sonstwas -- wenn das Protokoll mit "Verbindung kann jederzeit abreissen" klarkommt sind diese Fälle alle automatisch mit abgedeckt.

Unix-Tom

IMHO ist sein Problem ja nicht die TCP-Verbindung. Die Daten landen ja auf dem Client wenn sie vom Server gesendet wurden. Er hat ein Problem auf Daten der Netzwerkebenen 3 (wo die Daten bereits im BS-Buffer liegen) und bekommt beim Abfrage einen Timeout. (wie auch immer dieser dann aussieht den eigetlich macht dies der Treiber bzw. Protokoll ).
Wenn er nun ein OK sendet liegen diese Daten dann auch im Buffer und er kann diese wieder nicht abholen. Da musst er dann ein OK für ein OK und wieder eine OK für dieses OK u.s.w. senden.
IMHO weiß ich nicht ob der Timeout nicht sowieso vom Treiber selbst kommt dem man sagt das er nach X Sekunden timeouten soll und dann die Verbindung beendet. Das bekomme auch beide Seiten mit.
Wenn die Daten bereits im Buffer des Empfängers liegen dann sollte es eigetlich nie eine Fall geben das man die nicht bekommet. Somit kann der Sender sicher sein das die Daten beim Client angekommen sind. Kommen sie dort nicht an regelt dies TCP selbst.

hustbaer

Unix-Tom schrieb:

IMHO ist sein Problem ja nicht die TCP-Verbindung. Die Daten landen ja auf dem Client wenn sie vom Server gesendet wurden. Er hat ein Problem auf Daten der Netzwerkebenen 3 (wo die Daten bereits im BS-Buffer liegen) und bekommt beim Abfrage einen Timeout. (wie auch immer dieser dann aussieht den eigetlich macht dies der Treiber bzw. Protokoll ).
Wenn er nun ein OK sendet liegen diese Daten dann auch im Buffer und er kann diese wieder nicht abholen. Da musst er dann ein OK für ein OK und wieder eine OK für dieses OK u.s.w. senden.
IMHO weiß ich nicht ob der Timeout nicht sowieso vom Treiber selbst kommt dem man sagt das er nach X Sekunden timeouten soll und dann die Verbindung beendet. Das bekomme auch beide Seiten mit.
Wenn die Daten bereits im Buffer des Empfängers liegen dann sollte es eigetlich nie eine Fall geben das man die nicht bekommet. Somit kann der Sender sicher sein das die Daten beim Client angekommen sind. Kommen sie dort nicht an regelt dies TCP selbst.

Tut mir leid aber das ist ganz grosser Blödsinn.
TCP/IP kann z.B. schonmal garnixmehr regeln wenn ich den Netzwerkstecker gezogen habe, das Modem abgeraucht ist, der Strom ausgefallen oder was auch immer.
TCP/IP unternimmt auch nix besonderes wenn es mal entschieden hat dass eine Verbindung unterbrochen wurde.

Das eigentliche Problem hat mit TCP/IP *nichts* zu tun und kann auch nicht von TCP/IP gelöst werden.
Das eigentliche Problem nennt sich "distributed transactions".

Unix-Tom

TCP Regel sehr wohl ob ein Packet angekommen ist, doppelt vorhanden ist, in falscher Reihenfolge angekommen ist u.s.w.
Es geht ja nicht darum den Verkehr zwiscchen Puffer Sender und Puffer Empfänger sicher zu machen. Dies macht TCP.
Deshalb nennt man es ja Transmission Control Protocol.
Kommt ein Packet in einem vereinbarten Timeout nicht beim Empfänger an sender der Sender nochmals.

hustbaer

Unix-Tom schrieb:

TCP Regel sehr wohl ob ein Packet angekommen ist, doppelt vorhanden ist, in falscher Reihenfolge angekommen ist u.s.w.
Es geht ja nicht darum den Verkehr zwiscchen Puffer Sender und Puffer Empfänger sicher zu machen. Dies macht TCP.
Deshalb nennt man es ja Transmission Control Protocol.
Kommt ein Packet in einem vereinbarten Timeout nicht beim Empfänger an sender der Sender nochmals.

Alles richtig. Das ermöglicht aber nur eine "sichere" FIFO Verbindung *solange die Verbindung nicht abreisst*.
Wenn die Verbindung erstmal abgerissen ist kann TCP/IP aber auch nix mehr regeln, das ist es was ich meine. Und eben den Punkt dass der Umstand dass man etwas senden konnte nicht bedeutet dass es auch empfangen werden konnte.

Daher ist TCP/IP für distributed transactions nicht ausreichend, und man muss selbst entsprechende Mechanismen implementieren damit das geht.

pale dog

hustbaer schrieb:

Und eben den Punkt dass der Umstand dass man etwas senden konnte nicht bedeutet dass es auch empfangen werden konnte.

doch, schon, daten werden vom empfänger bestätigt. kommte keine bestätigung, versucht's der sender nochmal. ist im TCP alles schon eingebaut. wenn die verbindung fehlerfrei geschlossen wird, haben beide teilnehmer alles bekommen, was der andere gesendet hat.

Jochen Kalmbach

pale dog schrieb:

hustbaer schrieb:

Und eben den Punkt dass der Umstand dass man etwas senden konnte nicht bedeutet dass es auch empfangen werden konnte.

doch, schon, daten werden vom empfänger bestätigt. kommte keine bestätigung, versucht's der sender nochmal. ist im TCP alles schon eingebaut. wenn die verbindung fehlerfrei geschlossen wird, haben beide teilnehmer alles bekommen, was der andere gesendet hat.

Nein eben nicht! Du redest hier nur von Ebene 3 und da stimmt das alles auch... meine Anwendung läuft aber auch Ebene 8!
Und da kann ich z.B. genau in dem Zeitpunkt in einen Timeout laufen, während das Paket gerade auf Ebene 3 als angekommen bestätigt wurde...

Das Warten geschieht übrigens mittels "WSAWaitForMultipleEvents", wobei man ja den Timeout angeben kann. Und vorbereitet wird der Socket mittels "WSAAsyncSelect und FD_READ|FD_CLOSE".

pale dog

Jochen Kalmbach schrieb:

Nein eben nicht! Du redest hier nur von Ebene 3 und da stimmt das alles auch... meine Anwendung läuft aber auch Ebene 8!
Und da kann ich z.B. genau in dem Zeitpunkt in einen Timeout laufen, während das Paket gerade auf Ebene 3 als angekommen bestätigt wurde...

ja, das kann passieren, aber wenn du beim timeout z.b. den socket killst, kriegt die gegenstelle das mit und weiss, dass obwohl sie alles senden konnte, du die kommunikation abgebrochen hast. selbst wenn die gegenstelle schon die close-sequenz gestartet hat, bemerkt sie ein killen der verbindung deinerseits.
ist das netz down o.ä. und die gegenstelle bekommt deinen erzwungenen verbindungsabbruch nicht mit, dann misslingt auch das von ihr initiierte schliessen der verbindung. in allen fällen klappt die erkennung, erfolg oder misserfolg, sehr zuverlässig. wenn's nicht so wäre, würde das ganze internet verdammt schlecht funktionieren

Jochen Kalmbach schrieb:

Das Warten geschieht übrigens mittels "WSAWaitForMultipleEvents", wobei man ja den Timeout angeben kann. Und vorbereitet wird der Socket mittels "WSAAsyncSelect und FD_READ|FD_CLOSE".

beim FD_CLOSE kannste ja mit dem 'lparam' o.ä. herausfinden, ob irgendwas schief ging. alle wichtigen events sollten eigentlich bis zum layer 8 irgendwie durchgereicht werden...

hustbaer

pale dog schrieb:

hustbaer schrieb:

Und eben den Punkt dass der Umstand dass man etwas senden konnte nicht bedeutet dass es auch empfangen werden konnte.

doch, schon, daten werden vom empfänger bestätigt. kommte keine bestätigung, versucht's der sender nochmal. ist im TCP alles schon eingebaut. wenn die verbindung fehlerfrei geschlossen wird, haben beide teilnehmer alles bekommen, was der andere gesendet hat.

Äh. Das ist mir schon klar dass das gilt wenn die Verbindung "gracefully closed" wurde.
Bloss was ist wenn sie abreisst?
Was bringt mir ein Protokoll welches nur dann "korrekt" funktioniert wenn die Verbindung nie abreisst?
Verstehe das nicht so ganz... *wunder*

pale dog

hustbaer schrieb:

Bloss was ist wenn sie abreisst?

wenn die verbindung abreisst dann muss die ganze sendung irgendwann wiederholt werden (unter der voraussetzung, dass beide 100%ige gewissheit brauchen).

hustbaer schrieb:

Was bringt mir ein Protokoll welches nur dann "korrekt" funktioniert wenn die Verbindung nie abreisst?

kein verbindungsorientiertes protokoll funktioniert richtig, wenn die verbindung abreisst

btw: ich weiss, dass manche lieber ihre eigenen protokolle mit irgendwelchen packet-ID's und acknowledgements auf TCP aufsetzen, anstatt einer seit jahrzehnten bewährten technik zu vertrauen, aber dann kann man besser gleich UDP nehmen.
das geht dann meistens sogar schneller

hustbaer

pale dog schrieb:

hustbaer schrieb:

Bloss was ist wenn sie abreisst?

wenn die verbindung abreisst dann muss die ganze sendung irgendwann wiederholt werden (unter der voraussetzung, dass beide 100%ige gewissheit brauchen).

hustbaer schrieb:

Was bringt mir ein Protokoll welches nur dann "korrekt" funktioniert wenn die Verbindung nie abreisst?

kein verbindungsorientiertes protokoll funktioniert richtig, wenn die verbindung abreisst

btw: ich weiss, dass manche lieber ihre eigenen protokolle mit irgendwelchen packet-ID's und acknowledgements auf TCP aufsetzen, anstatt einer seit jahrzehnten bewährten technik zu vertrauen, aber dann kann man besser gleich UDP nehmen.
das geht dann meistens sogar schneller

Ich meinte mit "Protokoll" nicht TCP/IP sondern ein "Anwendungsprotokoll" welches auf TCP/IP (oder sonstwas) aufsetzt. Eben etwas mit dem ich verteilte Transaktionen machen kann, oder eben so eine "100%ige Sicherheit" bekommen kann.

Vielleicht habe ich Jochen doch nicht richtig verstanden, aber ich habe den Eindruck dass es darum geht einen Fall wo die Verbindung abgerissen ist richtig zu handhaben. Und wenn die Verbindung abgerissen ist können eben die netten Garantien von TCP/IP die nur für den Fall gelten wo die Verbindung nicht abgerissen ist auch logischerweise nicht helfen. Klar jetzt was ich meine?

pale dog

hustbaer schrieb:

Vielleicht habe ich Jochen doch nicht richtig verstanden, aber ich habe den Eindruck dass es darum geht einen Fall wo die Verbindung abgerissen ist richtig zu handhaben.

das hab' ich auch so verstanden.

hustbaer schrieb:

Und wenn die Verbindung abgerissen ist können eben die netten Garantien von TCP/IP die nur für den Fall gelten wo die Verbindung nicht abgerissen ist auch logischerweise nicht helfen. Klar jetzt was ich meine?

klar, aber wenn die verbindung abgerissen ist, kann gar nichts mehr helfen, ausser vielleicht irgendwelche alternativen kommunikationswege. das wichtigste aber ist doch, dass beide kommunikationspartner feststellen können, das irgendwas schief gegangen ist und das bringt TCP schon mit.
es gibt keine absolute sicherheit, dass die übertragung immer klappt.
denn wenn das netz tot ist, helfen auch keine auf TCP aufgesetzten protokolle mehr.

Unix-Tom

Selbst wenn die Verbindung abreißt. Den Timeout verursacht doch nicht Ebene 8 oder ire ich mich da. Man teil der API doch mit wann der Timeout kommen soll. Wenn ein Timeout dann auf TCP-Ebene da ist dann sendet der Empfänger auch kein OK mehr an den Server und teil dem Programm mit das ein Timeout da ist.
Habe Jochen vielleicht auch falsch verstanden.
Ich verstehe aber nicht was Schicht 3 ist den TCP im OSI-Model läuft in Schicht 4 und das Programm selbst in Schicht 7. Schicht 3 ist das Netzwerk selbst.
Schicht 4 ist das Protokoll. Schicht 7 macht nur das was im die Darunterliegenden Mitteilen.