neue packmethode



  • hi leute!

    ich hab mir in letzter zeit immer ma wieder gedanken über eine neue packmethode gemacht. wenn man mal annimt, dass jeder PC, auf dem gepackt und entpackt werden soll, am inet angesclossen ist, dann kann man doch mal alle möglichen daten nach bestimmten mustern hin analysieren und diesen (von mir aus millionen) versch. muster auf einem zentralen server speichern. in der gepackten datei steht dann, welches muster zu benuztzen ist und ensprechende infos, wie das muster zu füllen ist. da könnte man, wenn man das richtig macht, ne menge sparn. war jetzzt ein bissl scheiße erklärt, aber bessser wirds jetzt net *g*

    cu todo



  • Naja, Platz "sparen" könnte man durch dieses System vielleicht aber es würde wohl sehr zu Lasten der Geschwindigkeit gehen. Prinzipiell ist die Idee nicht schlecht einen Pool an Mustern Global für alle zugänglich zu machen und nur Verweise auf diese in der Datei zu speichern. Blöd ist allerdings nur, dass man dann auch _immer_ einen Anschluss ans Inet zum entpacken braucht. Ausserdem müsste man das System absichern und die Pakete möglichst klein halten um zu verhindern, dass dritte an die Daten gelangen können. Nur, nach welchen Kriterien willst du die Pakete auswählen?



  • Achso, und ein weiteres Problem: Wenn jemand den Server und die Backups zerstört dann sitzt du gewaltig in der Tinte. Millionen von Dateien kann dann kein Schwein mehr entpacken. Ein gefundenes Fressen für die Al Kaida 😉 ...



  • stell dir mal vor, man würde alle möglichen n-Muster speichern. Dann müsste man die ja mit einer Zahl referenzieren. Der Speicherplatz für die Zahl wäre genauso groß, wie der Platz für das Muster.
    Kompression wird ja nur möglich, weil man davon ausgeht, dass nicht alle Elemente gleichverteilt/-häufig auftreten. Wenn man aber alle Muster speichern will, hat man einfach eine bijektive Abbildung.



  • man müsste mal was weiß ich terabytes an daten (unterschiedl. art) untersuchen und darin best. strukturen erkennen, denn in allen informationen stecken irgendwelche strukturen bzw. muster. und da muss man ansetzen. was die lasten der geschw. angeht: das is ja momentan ohnehin nur theorie und angenommen, man macht das mal, dann is das inet schnell genug und dann is auch wirklich fast jeder PC am inet. und ich sage ja auch nicht, dass in der datei nur verweise stehen. da müssten verweise + infos stehen, wie man die muster füllt, keine ahnung wie, aber irgendwie müsste das gehn. dann kann man ja auch immer noch die verweise+infos mit einem herkömmlichen verfahren packen

    cu todo



  • die ganzes exe codes analysieren



  • da war wohl einer dazwischengekommem 😃 wer sagt denn, dass die muster nur so groß wie die verweise sind?? und außerdem meine ich mit mustern nicht unbedingt eine feste zeichenkette o.ä. sondern halt nur eine struktur, die aufschluss darüber gibt, wie ein best. muster aufgebaut ist und zusammen mit der zusätzlichen info in der datei muss man dann das muster füllen, wobei die info aber nicht byte für byte wiedergibt. is sch**** zu erklären, weiß auch nicht, wie ichs ausdrücken soll.

    cu todo



  • hier ein beispiel: der text in einer textdatei ist ja nicht irgendwie angeordnet, sondern hat eine best. struktur, also z.b. absätze usw. kein mensch wird nach jedem buchstaben eine neue zeile beginnen. man muss dann angenommen für alle möglichen textsorten strukturen anlegen. das gleiche in bild-dateien die pixel sind nie zufällig angeordnet, es sind strukturen wie landschaften, personen usw. drin. ebenfalls könnte man das in musik-dateien anwenden. z.b. der grundbeat in einem techno-stück. den könnte man als muster speichern und dann nur mit dem eig. klang einmal füllen. aber das geht dann auch in richtung KI und is derzeit net wirklich realisierbar

    cu todo

    [ Dieser Beitrag wurde am 11.06.2003 um 15:44 Uhr von todo editiert. ]



  • Ausserdem: Alle großen Erfindungen haben mal klein angefangen. Ist ja wohl klar, dass das noch nicht ausgereift ist.



  • Ich hab ne neue Kompressionas-Methode erfunden.

    Geht mal auf meine Homepage und testet. Danke.

    www.winace.de

    🙂 🙂 🙂 🙂 🙂 🙂 🙂 🙂



  • rofl

    Nene, das funzt so nicht. Wie schon gesagt wurde würdest du zur Indizierung der "Muster" mindestens genauso viel Platz benötigen wie für die "Muster" selber.



  • Warum? Kommt ganz auf die Größe des Musters darauf an? Es heißt ja nicht, dass der komplette Code in Muster umgesetzt werden muss.

    Aber insgesamt dürfte man nicht besonders viel sparen.

    MfG SideWinder



  • ? Es kommt nicht auf die Größe der Muster an... Es bringt einfach nix



  • Man könnte doch, da in einer Zufallszahlenfolge irgendwann jede Teilfolge vorkommt, jeweils den Startwert für den Generator speichern. Damit kann man beliebige Datenmengen auf einen einfachen Integer reduzieren. (Jedenfalls theoretisch)



  • die Anzahl der Zahlenfolgen ist durch die Anzahl der möglichen Seed-Werte begrenzt.



  • Original erstellt von <SeriousSam>:
    Damit kann man beliebige Datenmengen auf einen einfachen Integer reduzieren. (Jedenfalls theoretisch)

    Da kommst du wieder mit dem Int nicht aus 😉


Anmelden zum Antworten