Daten aus Datei einlesen



  • Hallo ihr Lieben,

    ich versuche gerade Daten aus einer Datei einzulesen und lese im C++ Primer den Abschnitt über IO Library: File Input and Output.
    Dabei verwirrt mich ein wenig die Beschreibung [1]:

    When we want to read a file, we must define our own objects, and bind them to the desired files. Assuming that ifile is a string with the names of the files we want to reand, we might write code such as:

    ifstream infile(ifile.c_str());
    

    to define and open a fstream object.

    Also das ist jetzt nichts anderes als eine Initialisierung des Typs ifstream mit dem Bezeichner infile. Dass infile nun wie ein Funktion verwendet wird, liegt schätzungsweise daran, wie man string initialisieren kann, vergleiche z.B. mit

    std::string s1;
    std::string s2(s1);     Initialize s2 as a copy of s1
    

    Und dieses ifile muss wohl schon bekannt sein [2].
    Jetzt geht es weiter

    infline is a stream that we can read. Supplying a file name as an initializer to an ifstream object has the effect of opening the specific file

    Gehört diese Beschreibung noch zum ersten Beispiel, wo davon ausgegangen wird, dass die Namen der Dateien bekannt sind und man den ifstream direkt an den Dateinamen gebunden hat? Denn die nächste Kommandozeile ist sehr verwirrend

    ifstream infile;   // unbound input file stream
    

    Hä? Wieso sollte ich jetzt nochmal infile initialsieren als ifstream ? Und dann der Text

    This definition defines infile as a stream object that will read from a file. This object is as yet to bound to a file. Before we use an fstream object, we must also bind it to a file to read or write

    infile.open("in");    // open file named "in" in the current director
    

    Hä? 😕
    Kriege ich jetzt gerade zwei Mal dasselbe erklärt? Also dass ich einen ifstream initialsieren muss und ihn dann an eine Datei binden muss? Einmal geht das ganze wie oben beschrieben in einer Zeile und das andere Mal, kann ich es in zwei Schritten tun?

    Ich steh glaube gerade echt auf dem Schlauch oder die Reihenfolge der Erklärung ist komisch gewählt.

    Gruß,
    Klaus.

    [1] Ich lasse die äquivalenten Formulierungen für output mal außen vor
    [2] auf das c_str() gehe ich gar nicht näher ein. Habe die Erklärung zwar gelesen, aber die Feinheit noch nicht recht verstanden


  • Mod

    Ja, das sind zwei separate Beispiele, das erste ist die kompakte Schreibweise für das zweite.

    Dass infile nun wie ein Funktion verwendet wird, liegt schätzungsweise daran, wie man string initialisieren kann, vergleiche z.B. mit

    Korrekt, das ist ein Aufruf des Konstruktors.

    Und dieses ifile muss wohl schon bekannt sein

    Ja, das muss ein string mit diesem Namen sein.

    auf das c_str() gehe ich gar nicht näher ein. Habe die Erklärung zwar gelesen, aber die Feinheit noch nicht recht verstanden

    Das braucht man aus alten historischen Gründen (Sprich: C). Wenn dein Compiler C++11 kann, kannst du es auch weglassen.

    Gehört diese Beschreibung noch zum ersten Beispiel, wo davon ausgegangen wird, dass die Namen der Dateien bekannt sind und man den ifstream direkt an den Dateinamen gebunden hat?

    Ja.

    Denn die nächste Kommandozeile ist sehr verwirrend

    Dies ist das zweite Beispiel, dass man nicht unbedingt gleich eine konkrete Datei öffnen muss. Braucht man zugegebenerweise äußerst selten. Sieht man sehr oft in schlechten Lehrbüchern (als einzige Methode!), wenn die Leute "C mit Klassen" programmieren.



  • Hi,

    danke für die ausführliche Antwort.

    SeppJ schrieb:

    Dies ist das zweite Beispiel, dass man nicht unbedingt gleich eine konkrete Datei öffnen muss. Braucht man zugegebenerweise äußerst selten. Sieht man sehr oft in schlechten Lehrbüchern (als einzige Methode!), wenn die Leute "C mit Klassen" programmieren.

    Na toll, ich kannte bisher nur dieses Beispiel. Obwohl ich sonst nur in Dateien geschrieben habe und nicht daraus gelesen habe. Das hatte ich dann derart konstruiert:

    #include <iostream>
    #include <fstream>
    
    using namespace std;
    
    int main()
    {
    	fstream f;
    	f.open("data.dat",ios::out);
    
    	for(int i = 0; i < 10; ++i)
    	{
    		f << i << endl;
    	}
    
    	return 0;
    }
    

    Ist das jetzt schlechter Programmierstil? 😞

    Gruß,
    Klaus.


  • Mod

    Klaus82 schrieb:

    Ist das jetzt schlechter Programmierstil? 😞

    Nicht sehr, aber einen Tacken besser wäre hier:

    ofstream f("data.dat");
    

    Das ios::out ist beim ofstream implizit, genauso wie das ios::in beim ifstream. Da du hier nur ausgibst, kannst du den spezialisierteren ofstream gegenüber dem fstream wählen.



  • Ja, du solltest immer, wenn es geht, Initialisierung (also Konstruktor) bevorzugen.



  • Okay,

    also ich habe mir zu Übungszwecken eine kleine Datei mit Wertepaaren erstellt:

    1  1
    2  4
    3  9
    4  16
    

    und habe diese als data.dat abgespeichert.

    Jetzt möchte ich die Datei einlesen, d.h. ich beginne mittels:

    #include <iostream>
    #include <fstream>
    
    int main()
    {
    	std::ifstream in("data.dat");
    
    	return 0;
    }
    

    Jetzt muss ich nur gestehen, dass ich nicht so genau weiß, was jetzt eingelesen wird, da ich in meiner Datei Leerzeichen habe und Strings sehen das als Abbruchkriterium (kann man das so forumlieren?) wie eben das Beispiel zeigt:

    #include <iostream>
    #include <fstream>
    #include <string>
    
    int main()
    {
    	std::string s;
    	std::cin >> s;
    	std::cout << s << std::endl;
    
    	return 0;
    }
    

    Das liefert mir folgendes:

    1 1
    1
    

    Ich gebe das Wertepaar 1 1 ein, erhalte aber nur eine (die erste) 1 zurück.

    Also irgendwie finde ich das noch sehr verwirrend mit diesen Strings und Streams und das ganze umleiten...

    Aber mal eine Zwischenfrage: Sehe ich das richtig, dass diese Operatoren < << >> > die gleichen sind wie bei Linux, mit denen ich in der Konsole umleiten kann? Also das Ergebnis des einen Befehls in einen anderen leiten wie z.B.

    ls -l >> infofile.dat
    

    Viele Grüße,
    Klaus.



  • Wenn Du eine Datei einlesen willst, mußt Du ja die gesamte Datei durchlaufen, das kann man gut mit einer Schleife (while, for) machen.

    Der Dateiinhalt wird in der Regel zeilenweise oder aber auch zeichenweise eingelesen.

    Zeilenweises einlesen geht mit getline(), ein Beispiel dafür findest Du bei
    http://www.cplusplus.com/reference/iostream/istream/getline/

    Zeichenweises einlesen wiederum geht mit get(), ein Beispiel hierfür findest Du bei
    http://www.cplusplus.com/reference/iostream/istream/get/



  • Hi,

    redrew99 schrieb:

    Wenn Du eine Datei einlesen willst, mußt Du ja die gesamte Datei durchlaufen, das kann man gut mit einer Schleife (while, for) machen.

    Zeilenweises einlesen geht mit getline(), ein Beispiel dafür findest Du bei
    http://www.cplusplus.com/reference/iostream/istream/getline/

    Ja, solche Beispiele hatte ich schon gesehen. Wobei ich mich momentan mehrere Sachen frage, wahrscheinlich weil ich hier ja ständig dazu angehalten werde 'richtig' C++ zu lernen. 😉

    Zum Einen dieser Aufbau eines strings :
    Da müssen ja einige Informationen mitgegeben werden, nach denen sich z.B. das Einlesen eines strings richtet.
    Also wenn ich habe:

    #include <iostream>
    #include <string>
    
    int main()
    {
    	std::string s;
    
    	std::cin >> s;
    	std::cout << s << std::endl;
    
    	return 0;
    }
    

    Dann kriege ich bei Ausführung des Programms:

    Hello World
    Hello
    

    Das bedeutet, dass das Einlesen nach dem Leerzeichen abbricht, also hält das Einlesen 'Ausschau danach'.
    Noch cooler wird es, wenn ich aber mit getline arbeite:

    #include <iostream>
    #include <string>
    
    int main()
    {
    	char word[256];
    
    	std::cin.getline(word,256);
    	std::cout << word << std::endl;
    
    	return 0;
    }
    

    Wobei mich hier gerade wundert, dass mit einem char gearbeitet wird? Also dieser Syntax getline(word,256) ist nun der Konstruktor dafür, dass der istream der Kommandozeileneingabe in word geschrieben wird?

    Wobei dieses getline scheinbar Etiquetten-Schwindel ist, wenn ich das gerade richtig sehe, denn dieses Kommando liest einfach (in diesem Fall) 256 Zeichen ein, egal ob Leerzeichen oder nicht.
    Ich dachte, neben Leerzeichen erkennt dieses getline auch eine 'Markierung für Zeilenumbruch' (gibt es das?). Aber es geht gar nicht um die Zeile, sondern um die Anzahl der Zeichen!
    D.h. wenn ich das ganze mit z.B. 8 Zeichen mache, dann bin ich genauso angeschmiert, dann kriege ich

    Hello World
    Hello W
    

    Aber hinter diesen ganzen Streams muss doch noch viel mehr stecken, also es muss z.B. ein Rückgabewert dahinterstecken, sonst würde folgendes Beispiel gar nicht funktionieren:

    #include <iostream>
    #include <string>
    
    int main()
    {
      std::string s;
    
      while(std::cin >> s)
      {
        std::cout << s << std::endl;
      }
    
    	return 0;
    }
    

    Also muss cin einen Rückgabewert true oder false haben, denn nur was ich als Argument in eine while-Schleife packe macht Sinn, dass mir auch Rückgabewerte liefert!

    Alter ist das gerade spannend! 😮

    Gruß,
    Klaus.



  • Klaus82 schrieb:

    Aber hinter diesen ganzen Streams muss doch noch viel mehr stecken, also es muss z.B. ein Rückgabewert dahinterstecken, sonst würde folgendes Beispiel gar nicht funktionieren:

    std::cin ist ein std::istream , das wiederum ein std::ios ist. std::ios überlädt den Negierungsoperator und gibt den (aktuellen) Rückgabewert der Memberfunktion fail() zurück (oder stellt ein Äquivalent dazu dar).
    Oder wiederum, wie in deinem Beispiel, wird der o perator void* aufgerufen. Dann wird entweder 0 zurückgegeben (fail() würde dann true zurückgeben) oder irgendeine andere Adresse (die nur indiziert dass fail() false zurückgeben würde).

    Puh.


  • Mod

    Es gibt im Header string ein getline, welches dir eher passen dürfte:
    http://www.cplusplus.com/reference/string/getline/

    Das getline welches Member der istreams ist und auf char-Feldern arbeitet ist eher historisch interessant.

    Ja, die Einlesefunktionen (und auch die Ausgabefunktionen) der Streams geben (fast) alle den Stream selber zurück. Nur so ist es möglich, mehrere dieser Funktionen aneinander zu reihen:

    int a,b;
    std::cin >> a >> b; // std::cin >> a gibt std::cin zurück, darauf kann dann std::cin >> b arbeiten
    

    Außerdem können Streams auf ihren Status geprüft werden, indem man sie in einem boolschen-Ausdruck auswertet. Dabei spielen eine Rolle:
    http://www.cplusplus.com/reference/iostream/ios/operatornot/
    http://www.cplusplus.com/reference/iostream/ios/operator_voidpt/
    Da, wie schon gesagt, die Eingabefunktionen den Stream selber zurück liefern, kann man daher das gezeigte

    while(std::cin >> s)
    

    benutzen, um bis zum Auftreten eines Fehlers zu lesen. Dies ist auch eine sehr übliche Art und Weise aus einem Stream zu lesen. Hier wird also erst der operator>> benutzt, dieser liefert wieder std::cin, dieses wird dann in einen void* konvertiert und dieser kann dann 0 oder etwas anderes sein, je nach Fehler oder kein Fehler. Und dies ist für die while-Schleife dann eben false oder true.

    (Achtung: Die mögliche Konvertierung der Streams nach void* führt manchmal zu interessanten Anfängerfehlern:

    std::stringstream foo("Hallo Welt");
    std::cout << foo;
    

    Dies ist kein Compilerfehler, gibt aber nicht "Hallo Welt" aus, sondern einen kryptischen Zahlenwert.)



  • SeppJ schrieb:

    (Achtung: Die mögliche Konvertierung der Streams nach void* führt manchmal zu interessanten Anfängerfehlern:

    std::stringstream foo("Hallo Welt");
    std::cout << foo;
    

    Dies ist kein Compilerfehler, gibt aber nicht "Hallo Welt" aus, sondern einen kryptischen Zahlenwert.)

    Öm, ja. Das hatte ich gestern erst. 🙄 😃

    'unschuldig-an-die-Decke-guck-und-pfeif'

    EDIT:
    Na immerhin kann ich es reproduzieren:

    #include <iostream>
    #include <string>
    #include <fstream>
    
    int main()
    {
    	std::string filename("data.dat");
    
    	std::ifstream infile(filename.c_str());
    
    	std::cout << infile << std::endl;
    
    	return 0;
    }
    

    Dann kriege ich

    0x7fff0b4474f0
    

    Also ich nehme an, dass ich mir damit die Adresse zeigen lasse, wo der 'Stream liegt' und ich eigentlich den Inhalt sehen möchte?

    So wie ich z.B. einen Pointer derefenzieren muss, wenn ich das verändern möchte, worauf er zeigt?

    Kann man das so vergleichen?

    Gruß,
    Klaus.



  • Juhuuuu!!! Es funktioniert!

    #include <iostream>
    #include <string>
    #include <fstream>
    
    int main()
    {
    	std::string filename("data.dat");
    
    	std::ifstream infile(filename.c_str());
    
    	std::string x_value, y_value;
    
    	for(int i = 0; i < 4; ++i)
    	{
    		infile >> x_value;
    		infile >> y_value;
    
    		std::cout << x_value << "\t" << y_value << std::endl;
    	}
    
    	return 0;
    }
    

    Liefert tatsächlich:

    1	1
    2	4
    3	9
    4	16
    

    Genau was in der Datei steht! 🕶

    Gruß,
    Klaus.



  • Klaus82 schrieb:

    Also ich nehme an, dass ich mir damit die Adresse zeigen lasse, wo der 'Stream liegt' und ich eigentlich den Inhalt sehen möchte?

    Hier der Standard:

    C++-Standard 27.4.4.3 Klausel 1 schrieb:

    Returns: If fail() then a null pointer; otherwise some non-null pointer to indicate success then a value that will
    evaluate false in a boolean context; otherwise a value that will evaluate true in a boolean context. The value type
    returned shall not be convertible to int.

    Es ist also (seit C++11?) nicht definiert, welchen Rückgabetyp der überladene Operator hat. Lediglich, dass der Rückgabetyp zu bool konvertierbar sein muss. Außerdem ist festgehalten, dass der Typ nicht zu einem Integral (sprich: zu int, long, short, char oder long long ) konvertierbar sein darf (was eigentlich schon impliziert, dass es sich um einen Pointer handeln soll, ich sehe keinen Grund es anders zu machen).

    Lange Rede kurzer Sinn: Versuch ja nicht, etwas mit dieser Adresse zu machen 😉


  • Mod

    Hacker schrieb:

    Klaus82 schrieb:

    Also ich nehme an, dass ich mir damit die Adresse zeigen lasse, wo der 'Stream liegt' und ich eigentlich den Inhalt sehen möchte?

    Hier der Standard:

    C++-Standard 27.4.4.3 Klausel 1 schrieb:

    Returns: If fail() then a null pointer; otherwise some non-null pointer to indicate success then a value that will
    evaluate false in a boolean context; otherwise a value that will evaluate true in a boolean context. The value type
    returned shall not be convertible to int.

    Es ist also (seit C++11?) nicht definiert, welchen Rückgabetyp der überladene Operator hat. Lediglich, dass der Rückgabetyp zu bool konvertierbar sein muss. Außerdem ist festgehalten, dass der Typ nicht zu einem Integral (sprich: zu int, long, short, char oder long long ) konvertierbar sein darf (was eigentlich schon impliziert, dass es sich um einen Pointer handeln soll, ich sehe keinen Grund es anders zu machen).

    Lange Rede kurzer Sinn: Versuch ja nicht, etwas mit dieser Adresse zu machen 😉

    Bitte nur als Standard zitieren, was auch Standard ist.

    n3290 schrieb:

    27.5.5.4 basic_ios flags functions [iostate.flags]
    explicit operator bool() const;
    1 Returns: !fail().



  • camper schrieb:

    Hacker schrieb:

    Klaus82 schrieb:

    Also ich nehme an, dass ich mir damit die Adresse zeigen lasse, wo der 'Stream liegt' und ich eigentlich den Inhalt sehen möchte?

    Hier der Standard:

    C++-Standard 27.4.4.3 Klausel 1 schrieb:

    Returns: If fail() then a null pointer; otherwise some non-null pointer to indicate success then a value that will
    evaluate false in a boolean context; otherwise a value that will evaluate true in a boolean context. The value type
    returned shall not be convertible to int.

    Es ist also (seit C++11?) nicht definiert, welchen Rückgabetyp der überladene Operator hat. Lediglich, dass der Rückgabetyp zu bool konvertierbar sein muss. Außerdem ist festgehalten, dass der Typ nicht zu einem Integral (sprich: zu int, long, short, char oder long long ) konvertierbar sein darf (was eigentlich schon impliziert, dass es sich um einen Pointer handeln soll, ich sehe keinen Grund es anders zu machen).

    Lange Rede kurzer Sinn: Versuch ja nicht, etwas mit dieser Adresse zu machen 😉

    Bitte nur als Standard zitieren, was auch Standard ist.

    n3290 schrieb:

    27.5.5.4 basic_ios flags functions [iostate.flags]
    explicit operator bool() const;
    1 Returns: !fail().

    In welchem Standard bin ich denn?

    www.open-std.org/jtc1/sc22/wg21/docs/papers/2005/n1905.pdf
    Und du?



  • Hi,

    jetzt natürlich die Masterfrage:
    Wie kriege ich die Werte meiner Strings in wissenschaftlicher Notation in einen integer umgewandelt.
    Also bisher habe ich

    #include <iostream>
    #include <string>
    #include <fstream>
    #include <vector>
    #include <stdlib.h>
    
    int main()
    {
    	std::string filename("f.positive.dat");
    
    	std::ifstream infile(filename.c_str());
    
    	std::string s1,s2,s3;
    	double energy;
    	long int number, integrated_number;
    
    	for(int i = 0; i < 4; ++i)
    	{
    		infile >> s1;
    		infile >> s2;
    		infile >> s3;
    
    		energy = atof(s1.data());
    		number = atol(s2.data());
    
    		std::cout << s1 << "\t" << s2 << std::endl;
    		std::cout << energy << "\t" << number << std::endl;
    	}
    
    	return 0;
    }
    

    Was mir dann die Ausgabe liefert

    0.000000000000000E+000	7.460079967364139E+023
    0	7
    3.300000000000000E-002	9.496822501615066E+020
    0.033	9
    6.600000000000000E-002	7.581970551546497E+020
    0.066	7
    9.900000000000002E-002	6.117185676453359E+020
    0.099	6
    

    Also die eine Zeile zeigt schön den Inhalt des Strings, während die andere Zahl gerade bei der Konvertierung in einen Integer leider versagt. 😞

    Also Bonus will ich das ganze sowieso noch durch 1.0e16 teilen, geht das nicht auch direkt mit dem String?
    Die einfache Zeile

    s2 / 1.0e16
    

    führt leider zu einer Fehlermeldung.

    Gruß,
    Klaus.



  • @Klaus: Lies doch gleich eine Zahl anstatt eines Strings ein 😕



  • Du meinst anstatt

    infile >> s1;
    infile >> s2;
    infile >> s3;
    

    eben nur

    infile >> energy;
    infile >> number;
    infile >> integrated_number;
    

    EDIT:
    Ne, geht nicht. 😞

    Gruß,
    Klaus.



  • Klaus82 schrieb:

    eben nur

    infile >> energy;
    infile >> number;
    infile >> integrated_number;
    

    EDIT:
    Ne, geht nicht. 😞

    Das kann nicht sein.
    Zeig den Fehler.


  • Mod

    Hacker schrieb:

    In welchem Standard bin ich denn?

    www.open-std.org/jtc1/sc22/wg21/docs/papers/2005/n1905.pdf

    In gar keinem. Wie schon auf der ersten Seite steht handelt es sich nur um einen Entwurf, noch dazu um einen uralten (wie man auch an der url erkennen kann).

    n3290 ist zwar auch nur ein Entwurf, bis auf die Formatierung (und Kleinigkeiten wie Vorwort etc.) aber identisch mit dem Standard.

    Der letzte frei zugängliche Entwurf ist n3242, der recht nah am endültigen Standard ist (die Änderungen seit 3242 sind in 3292 aufgefüht, man kann es sich also theoretisch selbst zusammensuchen).


Anmelden zum Antworten