Implementierung des Hamming-Abstandes mit double??

freekickchamp

hallöschen,

ich arbeite gerade an einem Projekt und muss anstatt eines euklidischen Abstandes den Hamming-Abstand implementieren.

Mein bisheriger Ansatz stammt von Wikipedia, nur in meine passende Form geändert:

// Implementation of Hamming-Distance
	descd=0;
	  for(int v=9;v<dims1[0];v++){
			  unsigned val = feat1[f1+v] ^ feat2[f2+v];
				while(val){
				  descd++;
				  val &= val - 1;
				}
	  }

Dabei sind feat1[] und feat2[] vorgegeben und vom Typ double. Deswegen bekomme ich immer eine Fehlermeldung.

Meine Frage an euch wären:
1.) Ist die Implementierung so korrekt?
2.) Wie löse ich das Problem "double"? Konvertiere ich das in words oder integer? Aber wie vermeide ich in so einem Fall Informationsverlust?

Ich hoffe, dass ihr mir helfen könnt.

mfg freekickchamp

SeppJ

Verstehe ich nicht, was du da vor hast. feat1 und feat2 sind bei dir garantiert nicht double, sondern irgendeine Form von Array und wenn sie doch doubles sind, dann ist das gerade das Problem, dass du sie wie Arrays behandelst. Selbst wenn es double-Arrays sind, versuchst du irgendwelche Bit-Tricksereien auf die Werte anzuwenden, was gewagt ist und nicht funktioniert.

Du willst also den Hamming-Abstand von zwei double-Arrays berechnen? Mit den möglichen Werten eines double als Alphabet? Falls ja, dann verstehe ich kaum, wie du auf den Code kommst, außer, dass du ihn wohl abgeschrieben hast, ohne ihn zu verstehen. Falls nein: Was willst du dann?

freekickchamp

also ich bekomme diese Fehlermeldung später.

c_eoverlap_orb.cxx(139) : error C2296: '^' : illegal, left operand has type 'const double'

Das gleiche für den rechten Operand eben.

Warum funktioniert das nicht?

Abgeschrieben ist falsch. Er wurde als Vorlage gegeben und ja: Ich habe ihn noch nicht ganz durchschaut. Aber aus meiner Sicht ist das auch nicht von großer relevanz, denn ich weiß, was rauskommt.

Aber um kurz das mal zu erklären. Der ursprüngliche Code beinhaltete an dieser Stelle:

for(int v=9;v<dims1[0];v++){
	descd+=((feat1[f1+v]-feat2[f2+v])*(feat1[f1+v]-feat2[f2+v]));
      }
      descd=sqrt(descd);

Es handelt sich eigentlich um Bildverarbeitung. Einm Bild besitzt einen markanten Punkt, z.B. eine Ecke. Dieser Punkt wird durch einen "Deskriptor" beschrieben. In meinem Verfahren ist dieser "Deskriptor" binär und 256 bit lang.
Bisher erhalte ich aber keinen 256 bitkette, sondern 32 Elemente mit jeweils 8 Bit. Das ganze geschieht mit C++ und OpenCV und sind, meines Erachtes, vom Typ uchar. Also mit 8 Bit kann ich eben von 0 bis 255 einen Helligkeitswert zuweisen.
Jedenfalls werden diese 32 Elemente an dieses C-Programm übergeben. Und anstatt des euklidischen Abstandes wird der Hamming-Abstand berechnet. Damit können Deskriptoren vergliechen werden.
Und jetzt bin ich bei diesem Problem mit dem Double.

Deswegen suche ich gerade nach Lösungswegen und Hinweise und hatte mir gedacht, dass die Konvertierung von double in ein anderes Format eine mögliche lösung wäre.

Das will ich, sozusagen.

SeppJ

Wie kommt's denn überhaupt, dass die Daten double sind? Bei Bildverarbeitung und Bitfeldern denkt man nicht gerade an double als Datentyp.

Deswegen suche ich gerade nach Lösungswegen und Hinweise und hatte mir gedacht, dass die Konvertierung von double in ein anderes Format eine mögliche lösung wäre.

Ja. Je nachdem, wieso du da überhaupt doubles hast, kann das die trivale Lösung sein (wenn du an dem Bitmuster hinter dem double interessiert bist) oder etwas ganz anderes als du möchtest (wenn es einen guten Grund gibt, wieso du da überhaupt double hast).

freekickchamp

Wenn ich die Hamming-Distanz so implementiere, wie sie im Internet vorzufinden ist, dann bekomme ich ebene diese Meldung:

c_eoverlap_orb.cxx(139) : error C2296: '^' : illegal, left operand has type 'const double'

Deswegen double. Aber wenn ich den Code jetzt so überblicke, dann wird hauptsächlich mit double const und float gearbeitet.
Warum das so ist, weiß ich selber nicht genau.

Weißt du was der Oeprator ^ macht?

freekickchamp

Das "^" entspricht doch dem EXOR oder wie meinst du das?

Richtig. Und das ist bei Fließkommazahlen nicht sinnvoll.

Wenn dich nur das Bitmuster interessiert, kannst du den Wert vorher casten.
Dabei musst du aber den Umweg über Zeiger gehen, da sonst der Zahlenwert genommen wird.

Oder du betrachtest das gleich als Array von Worten deiner gewünschten Bit-Breite.

typedef meinDatentyp unsigned long long;  
....
meinDatentyp *ft1 = (meinDatentyp *)feat1;
meinDatentyp *ft2 = (meinDatentyp *)feat2;
...

    meinDatentyp val = ft1[f1+v] ^ f2[f2+v];

Achte dabei aber auf die Anzahl der Elemente. Wenn sizeof(meinDatentyp) != sizeof(double) musst du das berücksichtigen.

knivil

Mein bisheriger Ansatz stammt von Wikipedia, nur in meine passende Form geändert

Wie waere es denn mal damit, auch die Datentypen der Variablen zu posten. Ich kann mir nicht vorstellen, dass ein einfacher Cast die Loesung sein soll.

SeppJ

freekickchamp schrieb:

Wenn ich die Hamming-Distanz so implementiere, wie sie im Internet vorzufinden ist, dann bekomme ich ebene diese Meldung:

c_eoverlap_orb.cxx(139) : error C2296: '^' : illegal, left operand has type 'const double'

Deswegen double.

Nein, nicht deswegen. Im Gegenteil, der Fehler ist die Folge davon, dass du double hast. Aber wieso hast du double? Das ist der letzte Datentyp, den ich mit deiner Problembeschreibung

Es handelt sich eigentlich um Bildverarbeitung. Einm Bild besitzt einen markanten Punkt, z.B. eine Ecke. Dieser Punkt wird durch einen "Deskriptor" beschrieben. In meinem Verfahren ist dieser "Deskriptor" binär und 256 bit lang.
Bisher erhalte ich aber keinen 256 bitkette, sondern 32 Elemente mit jeweils 8 Bit. Das ganze geschieht mit C++ und OpenCV und sind, meines Erachtes, vom Typ uchar. Also mit 8 Bit kann ich eben von 0 bis 255 einen Helligkeitswert zuweisen.

in Verbindung bringen würde.

freekickchamp

void mexFunction(int nlhs,       mxArray *plhs[],
                 int nrhs, const mxArray *prhs[])
{
  // must have single double array input.
  if (nrhs != 3) { printf("in nrhs != 3\n"); return; }
  if (mxGetClassID(prhs[0]) != mxDOUBLE_CLASS) { printf("input must be a double array\n"); return; }
  if (mxGetClassID(prhs[1]) != mxDOUBLE_CLASS) { printf("input must be a double array\n"); return; }

  // must have single output.
  if (nlhs != 4) { printf("out nlhs != 4\n"); return; }

  // get size of x.
  int const num_dims1 = mxGetNumberOfDimensions(prhs[0]);
  int const *dims1 = mxGetDimensions(prhs[0]);
  int const num_dims2 = mxGetNumberOfDimensions(prhs[1]);
  int const *dims2 = mxGetDimensions(prhs[1]);
  int const num_dims3 = mxGetNumberOfDimensions(prhs[2]);
  int const *dims3 = mxGetDimensions(prhs[2]);
  if(dims1[0]<9 || dims2[0]<9 || dims1[0]!=dims2[0] || dims3[0]!=1){ printf("dims != 9\n"); return; }

  // create new array of the same size as x.

  int *odim = new int[2];
  odim[0]=dims2[1];
  odim[1]=dims1[1];
  plhs[0] = mxCreateNumericArray(2, odim, mxDOUBLE_CLASS, mxREAL);
  plhs[1] = mxCreateNumericArray(2, odim, mxDOUBLE_CLASS, mxREAL);
  plhs[2] = mxCreateNumericArray(2, odim, mxDOUBLE_CLASS, mxREAL);
  plhs[3] = mxCreateNumericArray(2, odim, mxDOUBLE_CLASS, mxREAL);

  // get pointers to beginning of x and y.
  double const *feat1 = (double *)mxGetData(prhs[0]);
  double const *feat2 = (double *)mxGetData(prhs[1]);
  double const *flag = (double *)mxGetData(prhs[2]);
  double       *over_out = (double *)mxGetData(plhs[0]);
  double       *mover_out = (double *)mxGetData(plhs[1]);
  double       *desc_out = (double *)mxGetData(plhs[2]);
  double       *mdesc_out = (double *)mxGetData(plhs[3]);

  float *feat1a = new float[9];
  float *feat2a = new float[9];
  float *tdesc_out = new float[dims2[1]*dims1[1]];
  float *tover_out = new float[dims2[1]*dims1[1]];

Das sind die Deklarationen aus der C-Datei, die ich verwenden soll.
Warum da das so gewählt wurde, weiß ich nicht auf Anhieb.
Aber ich habe gerade nachgeschaut. Mein Matlab-programm übergibt die Daten an das C-Programm und in Matlab sind als ein double array deklariert.
Matlab bekommt die Proramme vom C++, das mittels OpenCv eben vom Typ uchar eine Matrix von Deskriptoren erstellt hat.

Bisher konnte ich das so feststelle.

Hätte nie gedacht, dass das so kompliziert ist, denn es handelt sich hierbei eigentlich nur um ein Seminar.

knivil

Hätte nie gedacht, dass das so kompliziert ist, denn es handelt sich hierbei eigentlich nur um ein Seminar.

Der Grund ist wohl eher bei dir zu suchen: Keine Ahnung von C/C++ und deine Problembeschreibung absolut bescheiden.

Fangen wir also von vorne an: Welche Funktion soll implementiert werden? Hammingdistanz? Wie sieht der Matlabaufruf auf in der die Funktion benutzt wird? Von welchem Typ sind die Daten in Matlab? Gib ein Beispiel!

Wutz

Außerdem ist der gezeigte Code C++ und nicht C.
Entweder du kannst nicht richtig abschreiben oder dein Lehrer hat auch keine Ahnung von C.

SeppJ

Wutz schrieb:

Außerdem ist der gezeigte Code C++ und nicht C.
Entweder du kannst nicht richtig abschreiben oder dein Lehrer hat auch keine Ahnung von C.

Von C++ aber auch nicht.

freekickchamp

Ja, das ich kaum Ahnung habe ist mir schon bewusst. Leider habe ich die Aufgabe, die fertig werden muss. Und da bleibt kaum Zeit erstmal die Sprache komplett zu lernen. Darum bin ich hier gelandet, da ich einfach hoffe, dass Ihr mir helfen könntet, bitte.

Aber ich fasse nochmal kurz zusammen:

Matlab ruft mit dem Befehl:

[wout, twout, dout, tdout]=c_eoverlap(feat1,feat2t,common_part);

Das Programm auf, dass wie folgt aussieht:

#include <mex.h>
#include <math.h>

// This mex function implements the equivalent of:
//
//   function y = example_mat(x)
//   y = 2 * x + 1;
//   return

// [y, z] = foo(a, b, c)
//
//  nrhs = 3
//  a : prhs[0]
//  b : prhs[1]
//  c : prhs[2]
//
//  nlhs = 2
//  y : plhs[0]
//  z : plhs[1]

void mexFunction(int nlhs,       mxArray *plhs[],
                 int nrhs, const mxArray *prhs[])
{
  // must have single double array input.
  if (nrhs != 3) { printf("in nrhs != 3\n"); return; }
  if (mxGetClassID(prhs[0]) != mxDOUBLE_CLASS) { printf("input must be a double array\n"); return; }
  if (mxGetClassID(prhs[1]) != mxDOUBLE_CLASS) { printf("input must be a double array\n"); return; }

  // must have single output.
  if (nlhs != 4) { printf("out nlhs != 4\n"); return; }

  // get size of x.
  int const num_dims1 = mxGetNumberOfDimensions(prhs[0]);
  int const *dims1 = mxGetDimensions(prhs[0]);
  int const num_dims2 = mxGetNumberOfDimensions(prhs[1]);
  int const *dims2 = mxGetDimensions(prhs[1]);
  int const num_dims3 = mxGetNumberOfDimensions(prhs[2]);
  int const *dims3 = mxGetDimensions(prhs[2]);
  if(dims1[0]<9 || dims2[0]<9 || dims1[0]!=dims2[0] || dims3[0]!=1){ printf("dims != 9\n"); return; }

  // create new array of the same size as x.

  int *odim = new int[2];
  odim[0]=dims2[1];
  odim[1]=dims1[1];
  plhs[0] = mxCreateNumericArray(2, odim, mxDOUBLE_CLASS, mxREAL);
  plhs[1] = mxCreateNumericArray(2, odim, mxDOUBLE_CLASS, mxREAL);
  plhs[2] = mxCreateNumericArray(2, odim, mxDOUBLE_CLASS, mxREAL);
  plhs[3] = mxCreateNumericArray(2, odim, mxDOUBLE_CLASS, mxREAL);

  // get pointers to beginning of x and y.
  double const *feat1 = (double *)mxGetData(prhs[0]);
  double const *feat2 = (double *)mxGetData(prhs[1]);
  double const *flag = (double *)mxGetData(prhs[2]);
  double       *over_out = (double *)mxGetData(plhs[0]);
  double       *mover_out = (double *)mxGetData(plhs[1]);
  double       *desc_out = (double *)mxGetData(plhs[2]);
  double       *mdesc_out = (double *)mxGetData(plhs[3]);

  float *feat1a = new float[9];
  float *feat2a = new float[9];
  float *tdesc_out = new float[dims2[1]*dims1[1]];
  float *tover_out = new float[dims2[1]*dims1[1]];

  int common_part=(int)flag[0];

   for(int j=0;j<dims1[1];j++){    
    for (int i=0; i<dims2[1]; i++){
      over_out[j*dims2[1]+i]=100.0;
      desc_out[j*dims2[1]+i]=1000000.0;
    }
   } 

   // printf("%f %f\n",flag[0],flag[1]);
  // total number of elements in arrays.
  /*int total = 1;
  for (int i=0; i<num_dims1; ++i){
    total *= dims1[i];  
    printf("feat1 %d  %d  \n",num_dims1, dims1[i]);
  }
  */

  float max_dist,fac,dist,dx,dy,bna,bua,descd,ov;
  for(int j=0,f1=0;j<dims1[1];j++,f1+=dims1[0]){    
    max_dist=sqrt(feat1[f1+5]*feat1[f1+6]);
    if(common_part)fac=30/max_dist;
    else fac=3;
    max_dist=max_dist*4;
    fac=1.0/(fac*fac);
    feat1a[2]=fac*feat1[f1+2];
    feat1a[3]=fac*feat1[f1+3];
    feat1a[4]=fac*feat1[f1+4];
    feat1a[7] = sqrt(feat1a[4]/(feat1a[2]*feat1a[4] - feat1a[3]*feat1a[3]));
    feat1a[8] = sqrt(feat1a[2]/(feat1a[2]*feat1a[4] - feat1a[3]*feat1a[3]));
    for (int i=0,f2=0; i<dims2[1]; i++,f2+=dims1[0]){
      //compute shift error between ellipses
      dx=feat2[f2]-feat1[f1];
      dy=feat2[f2+1]-feat1[f1+1];
      dist=sqrt(dx*dx+dy*dy);
      if(dist<max_dist){
	feat2a[2]=fac*feat2[f2+2];
	feat2a[3]=fac*feat2[f2+3];
	feat2a[4]=fac*feat2[f2+4];
	feat2a[7] = sqrt(feat2a[4]/(feat2a[2]*feat2a[4] - feat2a[3]*feat2a[3]));
	feat2a[8] = sqrt(feat2a[2]/(feat2a[2]*feat2a[4] - feat2a[3]*feat2a[3]));
	//find the largest eigenvalue
	float maxx=ceil((feat1a[7]>(dx+feat2a[7]))?feat1a[7]:(dx+feat2a[7]));
	float minx=floor((-feat1a[7]<(dx-feat2a[7]))?(-feat1a[7]):(dx-feat2a[7]));
	float maxy=ceil((feat1a[8]>(dy+feat2a[8]))?feat1a[8]:(dy+feat2a[8]));
        float miny=floor((-feat1a[8]<(dy-feat2a[8]))?(-feat1a[8]):(dy-feat2a[8]));

	float mina=(maxx-minx)<(maxy-miny)?(maxx-minx):(maxy-miny);
	float dr=mina/50.0;
	bua=0;bna=0;int t1=0,t2=0;
	//compute the area
	for(float rx=minx;rx<=maxx;rx+=dr){
	  float rx2=rx-dx;t1++;
	  for(float ry=miny;ry<=maxy;ry+=dr){
	    float ry2=ry-dy;
	    //compute the distance from the ellipse center
	    float a=feat1a[2]*rx*rx+2*feat1a[3]*rx*ry+feat1a[4]*ry*ry;
	    float b=feat2a[2]*rx2*rx2+2*feat2a[3]*rx2*ry2+feat2a[4]*ry2*ry2;
	    //compute the area
	    if(a<1 && b<1)bna++;
	    if(a<1 || b<1)bua++;
	  }
	}
	ov=100.0*(1-bna/bua);
	tover_out[j*dims2[1]+i]=ov;
	mover_out[j*dims2[1]+i]=ov;
	//printf("overlap %f  \n",over_out[j*dims2[1]+i]);return;
      }else {
	tover_out[j*dims2[1]+i]=100.0;
	mover_out[j*dims2[1]+i]=100.0;
      }
     [b] descd=0;
      for(int v=9;v<dims1[0];v++){
	descd+=((feat1[f1+v]-feat2[f2+v])*(feat1[f1+v]-feat2[f2+v]));
      }
      descd=sqrt(descd);[/b]
      tdesc_out[j*dims2[1]+i]=descd;  
      mdesc_out[j*dims2[1]+i]=descd;  
    }
  }

  float minr=100;
  int mini=0;
  int minj=0;
  do{
      minr=100;
      for(int j=0;j<dims1[1];j++){    
	for (int i=0; i<dims2[1]; i++){
	  if(minr>tover_out[j*dims2[1]+i]){
	    minr=tover_out[j*dims2[1]+i];
	    mini=i;
	    minj=j;
	  }
	}
      }
      if(minr<100){
	for(int j=0;j<dims1[1];j++){
	  tover_out[j*dims2[1]+mini]=100;
	}   
	for (int i=0; i<dims2[1]; i++){
	  tover_out[minj*dims2[1]+i]=100;
	}
	over_out[minj*dims2[1]+mini]=minr;
      }
  }while(minr<70);

  int dnbr=0;
  do{
    minr=1000000;
    for(int j=0;j<dims1[1];j++){    
      for (int i=0; i<dims2[1]; i++){
	if(minr>tdesc_out[j*dims2[1]+i]){
	  minr=tdesc_out[j*dims2[1]+i];
	  mini=i;
	  minj=j;
	}
      }
    }
    if(minr<1000000){
      for(int j=0;j<dims1[1];j++){
	tdesc_out[j*dims2[1]+mini]=1000000;
	}   
      for (int i=0; i<dims2[1]; i++){
	tdesc_out[minj*dims2[1]+i]=1000000;
      }
      desc_out[minj*dims2[1]+mini]=dnbr++;//minr
    }
  }while(minr<1000000);

  delete []odim;
  delete []tdesc_out;
  delete []tover_out;
  delete []feat1a;
  delete []feat2a;
}

Matlab übergibt feat1 (siehe oben), also dem ersten Input
eine Matrix <41x2413 double>

Soweit konnte ich das bisher verfolgen.
Und an die fettgedruckte Stelle im Code wollte ich jetzt den Hamming-Abstand implementieren.

viele Grüße

Bashar

Der Hamming-Abstand ist für Bitvektoren definiert. Vielleicht solltest du erstmal angeben, inwiefern deine doubles als Bitvektoren interpretiert werden sollen (oder das in Erfahrung bringen), das scheint nämlich das einzige zu sein, an dem es noch hängt.

freekickchamp

Achso:
also für das eine Beispiel habe ich die Matrix 41x2413double
Von dieser Matrix interessiert mich immer eine Spalte. Und aus dieser jeweiligen Spalte die Zeilen 10 bis 41.
Der Vektor ist also ein Spaltenvektor. Beginnt bei Zeile 10 und Endet in Zeile 41.

Zum Beispiel stehen in Spalte 1 und Zeile 10 : 82
in Spalte 1 und Zeile 11: 163
und so weiter.
Wenn ich jetzt diese einzelen Elemente binär ausdrücke:
82 --> 1010010
163 --> 1010010
usw.
Mein Vektor wäre dann: 10100101010010....

Das gleiche passiert eben für Matrix 2 und dann soll der Hamming-Abstand ermittelt werden.

Ich hoffe, dass ich das einigermaßen verständlich erklären konnte, wie der Bitvektor interpretiert wird.

Bashar

freekickchamp schrieb:

Zum Beispiel stehen in Spalte 1 und Zeile 10 : 82
in Spalte 1 und Zeile 11: 163
und so weiter.
Wenn ich jetzt diese einzelen Elemente binär ausdrücke:
82 --> 1010010
163 --> 1010010

Der Wertebereich wäre interessant gewesen, aber das sieht ja ganz nach 0-255 aus. Du musst deine doubles also nach unsigned char casten:

// Implementation of Hamming-Distance 
    descd=0; 
      for(int v=9;v<dims1[0];v++){ 
              unsigned val = static_cast<unsigned char>(feat1[f1+v]) ^ static_cast<unsigned char>(feat2[f2+v]); 
                while(val){ 
                  descd++; 
                  val &= val - 1; 
                } 
      }

freekickchamp

Recht Vielen Dank. Ich probiere das gleich mal aus.
Wäer natürlich spitze, wenn das klappt

knivil

Normalerweise kann Matlab mehr als double. Es ist schon seltsam, Bits in uchar in doubles umzuwandeln und dann wieder zurueck.