designfrage



  • Hallo, in einem Projekt haben wir eine Klasse für einen CSV-Artigen Datentyp geschrieben. Das Projekt ist in Python geschrieben.

    Nun sollte es hierfür noch einige Statistik-Funktionen geben.
    Statt nun alles mögliche selbst zu schreiben, hab ich mir gedacht eine Anbindung an R (rpy2) zu nutzen.

    Nun frage ich mich, wie man das am besten gestaltet. R hat ja seine eigenen Datentypen.

    Ich mache besser mal ein Beispiel, unsere Klasse nenne ich csv.
    Eine nötige Funktion wäre zB die Korrelation zwischen 2 Spalten.

    Ich fage mich ob das gut wäre, zB:

    // Aufruf
    csv.cor(col1, col2)
    
    //Funktion in Pseudocode
    cor(col1, col2):
      R.cor( FloatVector(this.get_data(col1)), FloatVector(this.get_data(col2)) )
    
    // WObei R die Anbindung an R wäre, konkreter rpy2.robjects.r
    

    Was mir hieran nicht gefällt, ist dass ich dem Nutzer zwar schöne Funktionen mitgebe, aber im Grunde nur die R-Methoden kapsele und die nötigen Casts durchführe.

    Im Grunde könnte der Nutzer aber auch einfach unser Datenformat mit Hilfe von read.table slebst öffnen und hätte damit alle Möglichkeiten von R offen.

    Irgendwie weiß ich nicht wie ich unser Format am besten mit R anfreunden soll, vlt ein paar Tipps?


Anmelden zum Antworten