Unicode, UTF8 und Multiybyte - etwas verwirrt.
-
wchar_t bzw. L"" sind 16 Bit breit, also zum speichern von UTF-16 oder anderen 16 Bit Codierungen gedacht. Da UTF-16 deprecated ist und andere Codierungen zu Gunsten von Unicode sowieso nicht mehr verwendet werden sollten, sind wchar_t und L"" ebenfalls deprecated.
-
Pedobear schrieb:
wchar_t bzw. L"" sind 16 Bit breit, also zum speichern von UTF-16 oder anderen 16 Bit Codierungen gedacht.
Nein. Unter meinem Linux zB hat wchar_t 32 Bit und speichert UTF-32.
Pedobear schrieb:
Da UTF-16 deprecated ist ...
Schön wärs, aber offiziell ists glaub ich nicht so.
-
.filmor schrieb:
Pedobear schrieb:
wchar_t bzw. L"" sind 16 Bit breit, also zum speichern von UTF-16 oder anderen 16 Bit Codierungen gedacht.
Nein. Unter meinem Linux zB hat wchar_t 32 Bit und speichert UTF-32.
Mag sein. Aber das ist nicht portabel. Ergo: Sollte nicht verwendet werden.
-
Pedobear schrieb:
wchar_t bzw. L"" sind 16 Bit breit, also zum speichern von UTF-16
Nein! wchar_t ist eher für fixedsize Zeichensätze gedacht. UTF-16 dort reinzustecken ist eher eine Aushilfslösung.
Pedobear schrieb:
Da UTF-16 deprecated ist
Quelle? Du meinst wohl eher UCS-2
Pedobear schrieb:
sind wchar_t und L"" ebenfalls deprecated.
nö
Pedobear schrieb:
.filmor schrieb:
Pedobear schrieb:
wchar_t bzw. L"" sind 16 Bit breit, also zum speichern von UTF-16 oder anderen 16 Bit Codierungen gedacht.
Nein. Unter meinem Linux zB hat wchar_t 32 Bit und speichert UTF-32.
Mag sein. Aber das ist nicht portabel. Ergo: Sollte nicht verwendet werden.
hö?
-
rüdiger schrieb:
Pedobear schrieb:
sind wchar_t und L"" ebenfalls deprecated.
nö
Pedobear schrieb:
.filmor schrieb:
Pedobear schrieb:
wchar_t bzw. L"" sind 16 Bit breit, also zum speichern von UTF-16 oder anderen 16 Bit Codierungen gedacht.
Nein. Unter meinem Linux zB hat wchar_t 32 Bit und speichert UTF-32.
Mag sein. Aber das ist nicht portabel. Ergo: Sollte nicht verwendet werden.
hö?
wchar_t ist nicht immer 32 Bit breit! Also ist es nicht portabel und deprecated! Jetzt verstanden?

-
rüdiger schrieb:
Pedobear schrieb:
wchar_t bzw. L"" sind 16 Bit breit, also zum speichern von UTF-16
Nein! wchar_t ist eher für fixedsize Zeichensätze gedacht. UTF-16 dort reinzustecken ist eher eine Aushilfslösung.
Diese Aushilfslösung wird aber von vielen Windows Programmieren verwendet. Schau dir nur mal unseren Artikel an.
-
Pedobear schrieb:
wchar_t ist nicht immer 32 Bit breit! Also ist es nicht portabel und deprecated! Jetzt verstanden?

Sag mir, wie du auf anderem wege mit Betriebssystemfunktionen arbeiten willst. Wenn die nen wchar_t wollen, dann hast du ihnen einen wchar_t zu geben, sonst quittieren sie den dienst.
-
otze schrieb:
Pedobear schrieb:
wchar_t ist nicht immer 32 Bit breit! Also ist es nicht portabel und deprecated! Jetzt verstanden?

Sag mir, wie du auf anderem wege mit Betriebssystemfunktionen arbeiten willst. Wenn die nen wchar_t wollen, dann hast du ihnen einen wchar_t zu geben, sonst quittieren sie den dienst.
Ich sprach von Portabilität. Wenn man portabel sein möchte, verwendet man für Gewöhnlich auch keine Betriebssystemfunktionen sondern die Standardbibliothek oder boost oder etwsa ähnliches.
Wenn du allerdings nicht portabel sein möchtest, weißt du ja wie groß deine Datentypen sind und kannst auch wchar_t benutzen. Dann bleibst du dann allerdings auf Windows beschränkt.
-
also, wenn alles was nicht portabel ist auch deprecated ist, dann ist ja fast alles in C++ deprecated.
-
ähm schrieb:
also, wenn alles was nicht portabel ist auch deprecated ist, dann ist ja fast alles in C++ deprecated.
Nö, C++ ist eigentlich sehr portabel.
-
Pedobear schrieb:
otze schrieb:
Pedobear schrieb:
wchar_t ist nicht immer 32 Bit breit! Also ist es nicht portabel und deprecated! Jetzt verstanden?

Sag mir, wie du auf anderem wege mit Betriebssystemfunktionen arbeiten willst. Wenn die nen wchar_t wollen, dann hast du ihnen einen wchar_t zu geben, sonst quittieren sie den dienst.
Ich sprach von Portabilität. Wenn man portabel sein möchte, verwendet man für Gewöhnlich auch keine Betriebssystemfunktionen sondern die Standardbibliothek oder boost oder etwsa ähnliches.
Wenn du allerdings nicht portabel sein möchtest, weißt du ja wie groß deine Datentypen sind und kannst auch wchar_t benutzen. Dann bleibst du dann allerdings auf Windows beschränkt.und was ist mit den mb*wc(s) und den wc* funktionen in der standard c library?
die gibt es beide unter Windows und unter Linux(für andere Betriebsysteme wie *BSD und andere weis ich es nicht) und jeweils mit wchar_t als einen der erwarteten Parameter.
z.b. mbstrtowcs und wcstombs
-
firefly schrieb:
Pedobear schrieb:
otze schrieb:
Pedobear schrieb:
wchar_t ist nicht immer 32 Bit breit! Also ist es nicht portabel und deprecated! Jetzt verstanden?

Sag mir, wie du auf anderem wege mit Betriebssystemfunktionen arbeiten willst. Wenn die nen wchar_t wollen, dann hast du ihnen einen wchar_t zu geben, sonst quittieren sie den dienst.
Ich sprach von Portabilität. Wenn man portabel sein möchte, verwendet man für Gewöhnlich auch keine Betriebssystemfunktionen sondern die Standardbibliothek oder boost oder etwsa ähnliches.
Wenn du allerdings nicht portabel sein möchtest, weißt du ja wie groß deine Datentypen sind und kannst auch wchar_t benutzen. Dann bleibst du dann allerdings auf Windows beschränkt.und was ist mit den mb*wc(s) und den wc* funktionen in der standard c library?
die gibt es beide unter Windows und unter Linux(für andere Betriebsysteme wie *BSD und andere weis ich es nicht) und jeweils mit wchar_t als einen der erwarteten Parameter.
z.b. mbstrtowcs und wcstombsDie sind für leagcy Programme gedacht, die noch mit alten Codierungen umgehen müssen. Nichts, was man in modernen Programmen verwenden sollte..
-
Pedobear schrieb:
firefly schrieb:
Pedobear schrieb:
otze schrieb:
Pedobear schrieb:
wchar_t ist nicht immer 32 Bit breit! Also ist es nicht portabel und deprecated! Jetzt verstanden?

Sag mir, wie du auf anderem wege mit Betriebssystemfunktionen arbeiten willst. Wenn die nen wchar_t wollen, dann hast du ihnen einen wchar_t zu geben, sonst quittieren sie den dienst.
Ich sprach von Portabilität. Wenn man portabel sein möchte, verwendet man für Gewöhnlich auch keine Betriebssystemfunktionen sondern die Standardbibliothek oder boost oder etwsa ähnliches.
Wenn du allerdings nicht portabel sein möchtest, weißt du ja wie groß deine Datentypen sind und kannst auch wchar_t benutzen. Dann bleibst du dann allerdings auf Windows beschränkt.und was ist mit den mb*wc(s) und den wc* funktionen in der standard c library?
die gibt es beide unter Windows und unter Linux(für andere Betriebsysteme wie *BSD und andere weis ich es nicht) und jeweils mit wchar_t als einen der erwarteten Parameter.
z.b. mbstrtowcs und wcstombsDie sind für leagcy Programme gedacht, die noch mit alten Codierungen umgehen müssen. Nichts, was man in modernen Programmen verwenden sollte..
und was soll man dann deiner Meinung nach in modernen Programmen verwenden?
-
firefly schrieb:
Pedobear schrieb:
firefly schrieb:
Pedobear schrieb:
otze schrieb:
Pedobear schrieb:
wchar_t ist nicht immer 32 Bit breit! Also ist es nicht portabel und deprecated! Jetzt verstanden?

Sag mir, wie du auf anderem wege mit Betriebssystemfunktionen arbeiten willst. Wenn die nen wchar_t wollen, dann hast du ihnen einen wchar_t zu geben, sonst quittieren sie den dienst.
Ich sprach von Portabilität. Wenn man portabel sein möchte, verwendet man für Gewöhnlich auch keine Betriebssystemfunktionen sondern die Standardbibliothek oder boost oder etwsa ähnliches.
Wenn du allerdings nicht portabel sein möchtest, weißt du ja wie groß deine Datentypen sind und kannst auch wchar_t benutzen. Dann bleibst du dann allerdings auf Windows beschränkt.und was ist mit den mb*wc(s) und den wc* funktionen in der standard c library?
die gibt es beide unter Windows und unter Linux(für andere Betriebsysteme wie *BSD und andere weis ich es nicht) und jeweils mit wchar_t als einen der erwarteten Parameter.
z.b. mbstrtowcs und wcstombsDie sind für leagcy Programme gedacht, die noch mit alten Codierungen umgehen müssen. Nichts, was man in modernen Programmen verwenden sollte..
und was soll man dann deiner Meinung nach in modernen Programmen verwenden?
Wie ich oben schon sagte: UTF-8 (char*) zum speichern von Unicode, da es die kürzeste der Unicode-Codierungen ist und UTF-32 (basic_string<uint32_t>) zum bearbeiten von Unicode, da man dann keine Probleme mit variabler Zeichenbreite hat.
-
Pedobear schrieb:
UTF-32 (basic_string<uint32_t>) zum bearbeiten von Unicode, da man dann keine Probleme mit variabler Zeichenbreite hat.
Hehe. Was ein frommer Traum. Aber den musst du leider begraben (es sei denn, du treibst dich ausschließlich im 8859-Gebiet rum und brauchst deshalb sowieso kein Unicode ;)). http://en.wikipedia.org/wiki/Unicode_normalization
-
Gibt es eigentlich eine Library die mir einen Unicode String in ein bitmap* rendert?
* Nicht als Datei sondern im Speicher z.B. als
struct bitmap { int width, height; char *data };
-
Hallo
Ja jede beliebige Grafikbibliothek mit einer Text-Funktion. Zum Beispiel die WinAPI kann mit DrawText in ein temporäres HBITMAP zeichnen.
bis bald
akari
-
Damit man nicht an eine bestimmte Grafiklibrary gebunden ist empfehle ich eine reine Text-Render-Library wie FreeType zu verwenden.
Ich weiß allerdings nicht, ob FreeType mit zusammengesetzten Symbolen zurecht kommt. Weiß da jemand genaueres?
-
Pedobear schrieb:
Die sind für leagcy Programme gedacht, die noch mit alten Codierungen umgehen müssen. Nichts, was man in modernen Programmen verwenden sollte..
Nenne bitte eine Quelle. Ich halte deine Aussagen so einfach für totalen Blödsinn.
Interessierte schrieb:
Gibt es eigentlich eine Library die mir einen Unicode String in ein bitmap* rendert?
Freetype2 und ansonsten so gut wie jeder aktuelle Fontrenderer.
-
Pedobear! Deine Meinung ist ziemlich irrelevant. Wenn etwas deprecated ist, dann hat das nur und nur alleine die ISO-C++-Norm zu bestimmen. Ob dir wchar_t persönlich gefällt oder missfällt, interessiert nicht die Bohne.
wchar_t ist jedenfalls nicht deprecated. Kann auch garnicht gehen, da es seit 1998 keinen neuen Standard gab (nur 2003 eine Korrektur).