Klassenfrage :)

EL europ

@Th69
Ich allociere sequenziell den speicher weil ich mit [x][y] einfacher rechnen kann als mit [x*y] (im Kopf bei der Bitverschieberei), verstehe aber grade nicht wo das ein prob sein kann. Oder vermutest du Rechenfehler?
Zu den Threads: Ich brauche ja ein array von Threads für jeden Abschnitt der x-Achse, weil ich sie ja alle wieder joinen muss und zuvor nicht weiß wieviele Threads es pro Abschnitt sind. Ich verstehe grade ein weing die std::vektor, und hab keine Ahnung wie ich in c++ ein Array von Threads, denen ein Zeiger auf eine lokale Variable übergeben wird mit dem sie die getItter()-Funktion aufrufen und deren Rückgabewert in matrix und colormatrix schreiben, erstelle. Die loaken thr_matrix und thr_colors Arrays sind nur zum kopieren weil ich nicht weis wie ich die "eigentliche" Threadfunktion umgesetzt bekomme und meinen c-code benutzen muss. Aus den Funktionen Methoden zu machen scheint mir unnötig wenn ich sie eh nicht "richtig" nutzen kann. Die sind praktisch nur weil ich mit der *thrFunction() nicht auf Apple->matrix und Apple->colormatrix zugreifen kann.

Und die Threadfunktion befinde ich als gut weil sie ohne "Semaphoren" und "Raceconditions" auskommt von denen ich noch weniger Ahnung als vom ganzen Rest

Ich beutze eine RPI5 (4-kerner) und gcc 12.2

EL europ

@Th69 sagte in Klassenfrage :

...
Aber ich denke, auf diese Art wirst du nicht wirklich weiterkommen, da dir anscheinend grundlegendes C bzw. C++ Wissen fehlt.

Dein teile deines doch bitte mit mir zumindest bezüglich der Threads

Th69

@EL-europ sagte in Klassenfrage :

Ich allociere sequenziell den speicher ...

Tust du doch nicht, s. meinen geposteten Code von dir bzgl. malloc...

Ich be(n)utze eine RPI5 (4-kerner) und gcc 12.2

Und warum dann 13 Threads, wenn du eh nur 4 Kerne auslasten kannst (die anderen Threads müssen sich ja dann abwechseln - und dann kannst du gleich diese sequentiell bearbeiten)?!

Dein teile deines doch mit mir zumindest bezüglich des Threads

Ich meinte damit hauptsächlich dein Verständnis bzgl. der Speicherallokationen und -zugriffe.
Und ich hatte dir doch den Link zu C++ std::thread gegeben - dann mach dich mal darüber schlau...

EL europ

@Th69 sagte in Klassenfrage :

@EL-europ sagte in Klassenfrage :

...
Und warum dann 13 Threads, wenn du eh nur 4 Kerne auslasten kannst (die anderen Threads müssen sich ja dann abwechseln - und dann kannst du gleich diese sequentiell bearbeiten)?!

Das regelt die Systembibliothek

EL europ

@Th69 sagte in Klassenfrage :

@EL-europ sagte in Klassenfrage :

...
Ich meinte damit hauptsächlich dein Verständnis bzgl. der Speicherallokationen und -zugriffe.
Und ich hatte dir doch den Link zu C++ std::thread gegeben - dann mach dich mal darüber schlau...

Das ich in c++ rohe c-array benötige ist vielleicht schwach, aber wo liegt der Fehler?

Schlangenmensch

Ich habe gerade mal in dein Makefile geguckt. Du scheint immer noch keine Optimierungsflags zu nutzen. Das solltest du immer machen, z.b. -O2: https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html
Das ist viel wichtiger, als zu versuchen manuell mit mehreren Threads irgendwie die Performance zu optimieren.

memcpy kopiert einen zusammenhängenden Speicherblock, deine Matrix ist aber kein zusammenhängender Block, sondern ein Array, in dem jeder Eintrag auf einen anderen Block zeigt.

Hier im Forum gibt es irgendwo einen Thread, in dem sehr gute erklärt wird, wie man eine Matrix Klasse in C++ programmieren würde, damit man (x, y) Zugriff hat, aber trotzdem den Speicher direkt im Block vorliegen hat, was auch aus Performance Gründen Vorteile hat.

Wenn du den Malloc Teil weglassen würdest, und zum Beispiel einfach mit std::vector<std::vector<int>> arbeiten würdest, wären es immer noch kein zusammenhängender Speicherblocke und es ging schöner, aber du bräuchtest kein malloc kein free und einzelne Komponenten kopieren würde einfach so funktionieren, wie du es erwarten würdest.

EL europ

@Schlangenmensch sagte in Klassenfrage :

Ich habe gerade mal in dein Makefile geguckt. Du scheint immer noch keine Optimierungsflags zu nutzen. Das solltest du immer machen, z.b. -O2: https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html
Das ist viel wichtiger, als zu versuchen manuell mit mehreren Threads irgendwie die Performance zu optimieren.

memcpy kopiert einen zusammenhängenden Speicherblock, deine Matrix ist aber kein zusammenhängender Block, sondern ein Array, in dem jeder Eintrag auf einen anderen Block zeigt.

Hier im Forum gibt es irgendwo einen Thread, in dem sehr gute erklärt wird, wie man eine Matrix Klasse in C++ programmieren würde, damit man (x, y) Zugriff hat, aber trotzdem den Speicher direkt im Block vorliegen hat, was auch aus Performance Gründen Vorteile hat.

Wenn du den Malloc Teil weglassen würdest, und zum Beispiel einfach mit std::vector<std::vector<int>> arbeiten würdest, wären es immer noch kein zusammenhängender Speicherblocke und es ging schöner, aber du bräuchtest kein malloc kein free und einzelne Komponenten kopieren würde einfach so funktionieren, wie du es erwarten würdest.

Die colormatrix schreibe ich ja auch entsprechend ihres Aufbaus in den fbspiegel den ich dann mit memcpy ins Devicefile kopiere. Da liegt der Fehler nicht und es funktioniert ja ohne die Sanitizer bis auf die Meldung, das er die Breite des Wertes einer arithmetischen Operation nicht kennt, in der Thread-Funktion.

Quiche Lorraine

@EL-europ sagte in Klassenfrage :

Das ich in c++ rohe c-array benötige ist vielleicht schwach, aber wo liegt der Fehler?

Sorry, aber das Kernproblem liegt daran dass du auf Ratschläge anderer nicht hörst und vor allen Dingen du dich nicht weiterbildest und Sachen prüfst.

Sehr viele Sachen in der Informatik lassen sich beweisen. So auch die Aussage "Du kannst nicht einfach ein per Doppelzeiger angelegtes Array (int** matrix) sequentiell kopieren"

Eine kleines Prüfprogramm ergäbe dann folgendes:

#include <stdlib.h>
#include <stdio.h>

// Testprogramm
int main() {
	int xres = 5;
	int yres = 5;
	int **matrix = (int**)malloc(xres * sizeof(int*)); 
	for (int i = 0; i < xres; i++)
		matrix[i] = (int*)malloc(yres * sizeof(int));

	int Count = 0;

	for (int x = 0; x < xres; x++)
	{
		for (int y = 0; y < yres; y++)
		{
			matrix[x][y] = Count++;
		}
	}

	// memcpy greift sequenziell zu, also gebe ich diese mal sequenziell aus
	int* P = matrix;
	//int* P = *matrix;

	for (int i = 0; i < xres * yres; i++)
	{
		printf("%i ", *P);
		if (i % xres == 0 && i != 0)
			printf("\n");
		P++;
	}
	return 0;
}

EL europ

@Quiche-Lorraine memcpy schreibt nur den fbspiegel ins Devicefile, putSpiegel und putDevice übersetzen die Matrizen

Schlangenmensch

@EL-europ

memcpy(matrix, thr_matrix, paras.xres*paras.yres*sizeof(int));

Von hier: https://github.com/momefilo/mandelbrodt/blob/main/include/_Apple.cpp

EL europ

@Schlangenmensch
Ah mom das Funktioniert also nur weil er zufällig zusammenhängenden Speicher alloziert? Oder wo ist das prop?
die matrix ist ja std::vector und die thr_matrix ein rohes array, ist dort ein pproblem?

Schlangenmensch

@EL-europ Es "funktioniert" gar nicht. Du kopierst paras.xres*paras.yres*sizeof(int) Bytes von thr_matrix[0][0] beginnend nach matrix[0][0].
Wenn dir der Speicher gehört, wird das kopiert was da drinnen steht. Wenn dir der Speicher nicht gehört, macht vermutlich dein Programm nen Abflug.

In dem Code der im Github ist gibt es an der Stelle keinen std::vector, das ist ein int **matrix; siehe (https://github.com/momefilo/mandelbrodt/blob/main/include/_Apple.h)

EL europ

@Schlangenmensch
ich muss wohl warten bis ich mir ein neues Buch Kaufe und die Ganze Thread-Funktion im sauberem c++ hinzubekommen. so das dort die c-arrays überflüssig werden. Denn wenn ich darüber iterieren muss um zu kopieren geht mir der Vorteil durch die threads zum Teil zumindest wieder verloren

EL europ

@Schlangenmensch
Ja genau die matrix hab ich ja deswegen als solches definiert, also wo soll da das Problem sein?
Das ist kein Lehrbuchcode aber er läuft auf meinem Raspi5, nach dem beheben des groben Schnitzers, bei mir einwandfrei

Bin grad wieder am Funktionen hizufügen weil ich sonst nichts mit dem Code machen kann ohne neues Buch. Und die Funktionen sind einfach ohne Threads, dazu reicht mir Internet

Quiche Lorraine

@EL-europ sagte in Klassenfrage :

Ah mom das Funktioniert also nur weil er zufällig zusammenhängenden Speicher alloziert? Oder wo ist das prop?

Führe doch mal das Beispiel aus! Ist nicht schwer und beisst dich nicht! Aber der Erkenntnisgewinn wird groß werden!

Th69

@EL-europ sagte in Klassenfrage :

Das ist kein Lehrbuchcode aber er läuft auf meinem Raspi5, nach dem beheben des groben Schnitzers, bei mir einwandfrei

Kennst du nicht den Programmieren-Witz: "Es kompiliert (bzw. funktioniert) bei mir, ich kann ausliefern"?

Welchen groben Schnitzer meinst du jetzt?

EL europ

@Th69
Das Freigeben des zu vor allozierten speichers um wieder neuen unter der selben Variable zu allozieren, in Apple->calc() für die lokalen rohen c-arrays

EL europ

@Quiche-Lorraine
Führe doch mal das Beispiel aus! Ist nicht schwer und beisst dich nicht! Aber der Erkenntnisgewinn wird groß werden!
er kopiert den inhalt beginnend der start adressen
Es sind ja beides rohe c-arrays

Quiche Lorraine

@EL-europ sagte in Klassenfrage :

er kopiert den inhalt beginnend der start adressen
Es sind ja beides rohe c-arrays

Ok, du möchtest keine Hilfe.

Und Tschüss..

Schlangenmensch

@EL-europ
Es kann zufällig funktionieren. Es kann blödsinn ausgeben. Es kann abstürzen. Der Code ist einfach inhaltlich falsch, auch wenn es kompiliert und ausgeführt wird.

    int** matrix = (int**)malloc(xres * sizeof(int*));
    for (int i = 0; i < xres; i++)
      matrix[i] = (int*)malloc(yres * sizeof(int));
    int Count = 0;

    for (int x = 0; x < xres; x++)
    {
      for (int y = 0; y < yres; y++)
      {
        matrix[x][y] = Count++;
      }
    }

    int** matrix2 = (int**)malloc(xres * sizeof(int*));
    for (int i = 0; i < xres; i++)
      matrix2[i] = (int*)malloc(yres * sizeof(int));

    memcpy(matrix2, matrix, xres * yres * sizeof(int));
    //int* P = *matrix;

    for (int x = 0; x < xres; x++)
    {
      for (int y = 0; y < yres; y++)
      {
        printf("%i ", matrix2[x][y]);
      }
      printf("\n");

    }
    free(matrix);
    free(matrix2);

Führe das 10 mal aus. Kann gut gehen, muss aber nicht.

int main() {
  int xres = 5;
  int yres = 5;
 

  for (int z = 0; z < 10; ++z)
  {
    int** matrix = (int**)malloc(xres * sizeof(int*));
    for (int i = 0; i < xres; i++)
      matrix[i] = (int*)malloc(yres * sizeof(int));
    int Count = 0;

    for (int x = 0; x < xres; x++)
    {
      for (int y = 0; y < yres; y++)
      {
        matrix[x][y] = Count++;
      }
    }



    int** matrix2 = (int**)malloc(xres * sizeof(int*));
    for (int i = 0; i < xres; i++)
      matrix2[i] = (int*)malloc(yres * sizeof(int));

    memcpy(matrix2, matrix, xres * yres * sizeof(int));
    //int* P = *matrix;

    for (int x = 0; x < xres; x++)
    {
      for (int y = 0; y < yres; y++)
      {
        printf("%i ", matrix2[x][y]);
      }
      printf("\n");

    }

    free(matrix);
    free(matrix2);
  }
  return 0;
}

Schleife drum rum, und noch keinen Durchlauf hinbekommen bei dem das passiert wäre, was du hoffst.