Der perfekte Stasi Staat !



  • Ich denke das Gesetzt kommt viel zu spät ausserdem ist es sinnlos. Wie mein Vorposter schon gesagt hat, was hindert mich ein E-Mail in Russland zu erstellen? Online-Geschäfte werden schon seit Jahren per E-Mail bestätigt und erst jetzt kommen die Gesetzgeber darauf man könnte das ja kontrollieren. Das ist sowas von typisch für die Politiker.



  • Headhunter schrieb:

    rüdiger schrieb:

    [..]
    So betreibt der Staat doch eh nur einen immer größeren DOS auf seine eigenen Behörden. Wer soll das alles Filtern?[..]

    Schöner Gedanke, leider unrealistisch (wenn wäre es auch eher ein DDOS 😉

    Die Antwort auf deine Frage lautet "Der Computer".
    Nicht nur die Amis sponsorn massivst diverse Information Retrieval Systeme, die automatische relevanten Fakten aus beliebigen Daten extrahieren können.
    Entity Extraction als Schlagwort. Aus Emails/Telefonaten können automatisch Namen/Orte/Gegenstände/Aktionen extrahiert werden. Soweit so gut, ein alter Hut. Jetzt kann man aber noch aus diesen Daten Beziehungen und implizite Informationen extrahieren. Beispiel: Auch passiv mitgesnifften Daten ziehst du den Schluss, dass Terroristen, die Bomben legen, Wochen vor dem Anschlag ihr Kommunikationsverhalten extrem erhöhen und regelmäßig einem Wörterbuch unbekannte Begriffe verwenden. Das nur als kleines Beispiel, möglich ist viel mehr.
    Und das ist auch das erschreckende: Die Technik schreitet auch hier mal wieder schneller voran als unsere Moral.
    Ich sage: Der Staat kann alles mithören und wenn er es tut (bzw. tun wird) dann kann er auch das Meiste davon automatisch auswerten. Ob das den angeblichen Grund (Terrors töten) erfüllt sei mal dahingestellt..

    Mh, mir fällt gerade ein Bsp ein, was schon heute möglich ist:
    Microsoft scannt (nach Angaben eines Mitarbeiters) automatisch Internet Blogs nach negativen Produktfeedbacks. Schon jetzt und das mit ziemlich primitiven Mitteln..

    Ich bezweifle gar nicht, das es solche Technologie gibt. Aber die Technologie ist eben nicht sehr weit. Es ist eben nicht leicht ein Programm zu schreiben, das Texte versteht. Die menschliche Kommunikation läuft dazu auf zu vielen Ebenen ab. Dinge wie Ironie oder Floskeln sind eben nicht leicht zu verstehen. Selbst wenn man es zB schafft eine Technologie zu entwickeln, die das englische Perfekt beherrscht, dann kann man die eben nicht einfach auf zB arabisch oder chinesisch umprogrammieren. Dann muss man noch zusätzlich beachten, welche Rechenleistung das alles bedarf. Wir reden hier ja nicht über zwei oder drei millionen Mails/Telefongespräche/SMS/etc., sondern über Milliarden an Daten täglich. Da braucht man selbst für einen simplen Filter, der nur nach dem Wort Bombe suchen würde, einen Supercomputer.

    Oder schau dir mal Formate an, die man nicht so leicht digitalisieren kann. Telefongespräche, Faxe, Bilder etc. Schau dir mal an, wie gut Technologie ist, die gesprochenes in Text umwandelt. Wenn du sagst, dass das ziemlich gut ist, dann nimm mal ein Gespräch im GSM Netz auf und sprich mit einem starken Dialekt oder sprich gleich eine andere Sprache.

    Schaut euch nur mal die Demo von Vista an, als der Vorführer die Spracheingabe demonstrieren wollte und da irgend ein Blödsinn rauskam und Microsoft sich damit entschuldigte, dass die Hintergrundgeräusche in dem Saal zu laut gewesen wären (schaut mal bei Youtube oder so).

    Natürlich werden in dem Bereich ständig Fortschritte erzielt. Aber dennoch wächst das "Können" dieser Systeme arg langsam.

    Außerdem kann man mit solchen Systemen wohl höchstens Pseudo-Attentäter, wie die in England packen. Die sich irgend welche unrealistischen Bombenpläne ausdenken und vielleicht rummailen.

    Aber vermutlich kommt aus der Bestrebung auch das Gesetz. Bisher ist es ja unmöglich, die E-Mail-Adressen konkreten Personen zuzuordnen und dann erst irgend welche Foren-Account 😉



  • rüdiger schrieb:

    Wenn du sagst, dass das ziemlich gut ist, dann nimm mal ein Gespräch im GSM Netz auf ...

    Menschliche Sprachlaute unterscheiden sich im Verhältnis weniger Frequenzen. Und genau auf diese Frequenzen ist die Sprachübertragung optimiert. Die anderen Frequenzen fallen entweder ganz weg oder werden in deutlich schlechterer Qualität übertragen. Dadurch klingt die Stimme am Telefon schlechter als im Original, ist aber ohne Probleme zu verstehen. Für eine maschinelle Verarbeitung benötigt man aber natürlich nicht die volle Qualität der Stimme, sondern diese wichtigen Frequenzen. Und genau die bekommt man eben auch geliefert.



  • minhen schrieb:

    rüdiger schrieb:

    Wenn du sagst, dass das ziemlich gut ist, dann nimm mal ein Gespräch im GSM Netz auf ...

    Menschliche Sprachlaute unterscheiden sich im Verhältnis weniger Frequenzen. Und genau auf diese Frequenzen ist die Sprachübertragung optimiert. Die anderen Frequenzen fallen entweder ganz weg oder werden in deutlich schlechterer Qualität übertragen. Dadurch klingt die Stimme am Telefon schlechter als im Original, ist aber ohne Probleme zu verstehen. Für eine maschinelle Verarbeitung benötigt man aber natürlich nicht die volle Qualität der Stimme, sondern diese wichtigen Frequenzen. Und genau die bekommt man eben auch geliefert.

    gut, mit dem Thema habe ich mich noch nicht so detailiert beschäftigt, wie man sicher aus der amateurhaften Aussage schließen kann. Aber ich halte es dennoch für nicht so leicht, beachtet man zB die Blamage von Microsoft. Außerdem bedarf das eben schon einiges an Rechenleistung und mach das mal mit mehreren Millionen Gesprächen gleichzeitig.



  • Hallo,

    ich denke schon, dass die überwachte Datenmenge sehr wohl auswertbar ist.

    Folgende Probleme gibt es:

    1. Sprache in Text umwandeln
    2. Text analysieren
    3. in allen Sprachen und Dialekten

    Zu 1) :
    Ich denke, dass eine 70% Lösung für Überwachungszwecke ausreicht. Wörter die falsch oder gar nicht verstanden, können mit simplen Heuristiken herausgefiltert werden. Vom Aufwand ist das denke ich schon vertretbar, da man keine allzugute Lösung braucht - schon wenn nur ein paar Ferngespräche textuell umgewandelt werden können, hat man ein sehr effizientes System. Die Masse macht's, nicht die individuelle Qualität der Daten.

    Zu 2) :
    Kein Thema, genügend CPU-Power vorausgesetzt.
    Mit einfachen Wortfiltern und Whitelists kann man einen großen Teil der Kommunikation herausfiltern. Wieviel Prozent der Gespräche sind wohl für die Staatssicherheit relevant? Ich rate mal einfach 10% - das reduziert die Datenmenge schon enorm.
    Weitere interessante Texte kann man mit einer einfachen bayesischen Heuristik oder mit Wortfilterlisten sehr billig festmachen. Wie schon gesagt, es wird keine 100% Lösung erwartet.
    Die Dokumente, die als interessant übrig bleiben können dann aufwendig analysiert werden - kein Problem genügend Rechner vorausgesetzt. Wieviele Computer stehen in Googles Rechenzentren? Wenn man noch neben der Textanalyse stark parallelisierte Programme schreibt umso besser.

    Zu 3) :
    Sprachen kann man sehr einfach klassifizieren, Problem sind hier IR-Systeme für die jeweiligen Sprachen. Das könnte komplizierter werden. Gut, für die westlichen Sprachen sollte es nicht allzu schwer sein passende Algorithmen zu finden. Auf arabische oder asiatische Sprachen kann man statische Algorithmen anwenden (ohne genaue Kenntnisse der Sprache) - der Rest wird manuell gefiltert. Alles machbar genügend CPU Power vorausgesetzt.

    Was braucht man also um den Welttraffic zu überwachen?
    - Gute IR Systeme und gute Filtermöglichkeiten für Daten (Informationsmenge reduzieren)
    - Rechnercluster a la Google
    - Ein paar tausend Menschen, die die übrig gebliebenen Daten filtern
    - Noch 1-2 Jahre Forschung
    - Infrastruktur & Rechtsgrundlagen (existieren schon bzw. werden gerade erweitert)

    Brave New World!



  • Headhunter schrieb:

    Hallo,

    ich denke schon, dass die überwachte Datenmenge sehr wohl auswertbar ist.

    Folgende Probleme gibt es:

    1. Sprache in Text umwandeln
    2. Text analysieren
    3. in allen Sprachen und Dialekten

    Ach. Und wie weiß man, ob die Nachrichten "Tante Heidi ist krank, wir müssen die Party leider absagen.", "Zeigs Ihnen", "Sei Tapfer!" jetzt harmlos sind oder nicht. Auswerten bedeutet doch auch Verbindungen zu erkennen und zu analysieren. Dazu muss man viele Datenquellen analysieren. Und trotzdem kann ich die Überwachung mit relativ einfachen Codes umgehen.
    Was ich sagen will ist, momentan ist doch mehr als ein grober Filter (auf dem Großteil der Daten) illusorisch. Und es gibt keine Möglichkeit zu erkennen welcher Teil genau analysiert werden soll.



  • @Headhunter
    ich denke, dass das Vorfiltern schwierig ist. Man kann eben nicht einfach nach Bombe suchen und alle die das Wort Bombe irgend wo benutzt haben überwachen. Man müsste sich dafür, wie jakob.f schon gesagt hat, eben einen Kontext aufbauen. Das ist nicht so leicht.

    Vermutlich soll das neue Gesetz dazu dienen, dass man leichter diesen Kontext schaffen kann oder zumindest das man wenn man eine Person gezielt beobachtet, das man auch wirklich alles überwachen kann.



  • Was wäre wenn die Überwachung gar nicht als Ziel hätte den Terror zu bekämpfen sondern den Datenverkehr zu regulieren. Stichwort DRM.

    Es wäre aufwendig sämtliche Dateien zu überwachen und gegen eine Datenbank abzugleichen allerdings glaub ich, ist das nur eine Frage der Rechnerleistung. Es wäre natürlich immer noch möglich mit wenig verbreiteten Protokolen zu schmuggeln aber es wäre definitive das Ende von P2P Netzwerken mit Illegalen Content, auch decentralen.

    Man könnte natürlich so gegensteuern, dass man Dateien so codiert, dass man nur mit großem Rechenaufwand die Originaldatei wiederherstellen kann und somit die Überwachung erheblich erschweren. Es bleibt jedoch nur eine Frage der Rechnenzeit.



  • Ben04 schrieb:

    Was wäre wenn die Überwachung gar nicht als Ziel hätte den Terror zu bekämpfen sondern den Datenverkehr zu regulieren. Stichwort DRM.

    Wissen ist Macht. Wenn ich weiss, was der andere denkt oder vor hat, dann bin ich klar im Vorteil. Die Politik hat immer Interesse daran, was die Leute so reden oder vorhaben. Das wird nicht nur in der Terrorbekämpfung Verwendung finden. - Big Brother



  • Um meiner Big Brother allesüberwachen These Nachdruck zu verleihen:
    - "Pentagon lässt Supercomputer bauen", http://www.netzeitung.de/internet/455022.html



  • Zum Thema Big Brother gibts doch eine einfache Lösung:

    Erstellt Euren Email mit einen Editor, verschlüsselt sie mit 2048bit und fügt das Dokument in die Email ein. Zum guten Schluss eine automatische Signatur mit Wörtern wie:

    Empire State Bilding, G.W.Bush, Pantagon usw... Die Freaks von der NSA fangen die Mail ab und können nix mit anfangen 😉 Hehe wieder Rechenpower der Amis verbraten, das ist es mir wert 🙂

    Wenn Ihr die Emailadresse auch noch in Chine habt, sollen die sich mal mit den Chinesen rumärgern 😉

    Gruß Ivo



  • Ivo schrieb:

    Empire State Bilding, G.W.Bush, Pantagon usw... Die Freaks von der NSA fangen die Mail ab und können nix mit anfangen 😉 Hehe wieder Rechenpower der Amis verbraten, das ist es mir wert 🙂

    Das bringt, lass mich überlegen, ziemlich genau gar nichts und ist einfach nur pubertärer Schwachsinn. Wer tatsächlich denkt, man würde wirklich nur mit primitiven Keywords arbeiten, der ist ziemlich naiv - oder eben halt pubertär 😃



  • Wie meinst Du wollen unsere Freunde denn die Emails, Telefongespräche usw filtern? Das geht am einfachsten über Schlüsselwörter.
    Du hast aber recht, das es mir gar nix bringt, nur die Schadenfreude über die Amis. Ich durfte damals im Einsatz miterleben, was die Kerle mit der s.g. Striker Brigade alles abhören, mitschneiden usw können... Und was abgehört werden kann, wird auch mitgeschnitten und gespeichert. Laut Aussagen in einen Buch, ist die NSA etwa eine Woche mit dem entschlüsseln hinterher. Da kann man sich vorstellen was die an Daten von unbescholtenen Bürgern sammeln.

    Gruß Ivo



  • Ivo schrieb:

    Wie meinst Du wollen unsere Freunde denn die Emails, Telefongespräche usw filtern? Das geht am einfachsten über Schlüsselwörter.

    Geht am einfachsten so, aber auch um uneffektivsten. Schlüsselwörter sind kein guter Filter, du du zu viele false-positive und positive-false erzeugst.

    Für den Geheimdienst ist es nicht wichtig möglichst viele E-Mails mit dem Wort Bombe zu finden, sondern Netzwerke aufzudecken und verdächtige Personen zu ermitteln.

    Du hast aber recht, das es mir gar nix bringt, nur die Schadenfreude über die Amis. Ich durfte damals im Einsatz miterleben, was die Kerle mit der s.g. Striker Brigade alles abhören, mitschneiden usw können... Und was abgehört werden kann, wird auch mitgeschnitten und gespeichert. Laut Aussagen in einen Buch, ist die NSA etwa eine Woche mit dem entschlüsseln hinterher. Da kann man sich vorstellen was die an Daten von unbescholtenen Bürgern sammeln.

    Was für ein Buch? Woher haben die bitte ihre Quellen. Ich glaube kaum, das in irgend einem Buch einfach so geheime Details der NSA stehen. Das hört sich sehr waage an.

    minhen schrieb:

    Ivo schrieb:

    Empire State Bilding, G.W.Bush, Pantagon usw... Die Freaks von der NSA fangen die Mail ab und können nix mit anfangen 😉 Hehe wieder Rechenpower der Amis verbraten, das ist es mir wert 🙂

    Das bringt, lass mich überlegen, ziemlich genau gar nichts und ist einfach nur pubertärer Schwachsinn. Wer tatsächlich denkt, man würde wirklich nur mit primitiven Keywords arbeiten, der ist ziemlich naiv - oder eben halt pubertär 😃

    Was hat das mit Pubertät zu tun? Keine Ahnung != Pubertät.



  • Ivo schrieb:

    Wie meinst Du wollen unsere Freunde denn die Emails, Telefongespräche usw filtern?

    Mit mathematischen Modellen wie z.B. HMMs. Auf jeden Fall eben nicht mit der primitiven Suche nach Schlüsselwörtern. Damit fängt man keine Terroristen. Nicht mal die einfältigsten Terroristen aus den einfältigsten Fernsehfilmen. Ich hab es glaube ich schon mal hier einem bei ähnlicher Gelegenheit gesagt, es ist völlig trivial maschinell zu erkennen, dass deine Schlüsselwörter eine künstliche und sinnlose Aneinanderreihung von Wörtern ist. Das System muss die Wörter dabei noch nicht mal kennen oder verstehen.
    http://en.wikipedia.org/wiki/Zipf's_law

    rüdiger schrieb:

    Was hat das mit Pubertät zu tun? Keine Ahnung != Pubertät.

    Klar, keine Ahnung != Pubertät. Aber nachdem du das festgestellt hast, hättest du dich eigentlich fragen müssen, ob ich vielleicht etwas anderes meine. Schon mal in Betracht gezogen, dass ich das Verhalten an sich und die Motivation gemeint haben könnte?



  • Das Buch, welches ich meine, ist "Die wahre Macht der Geheimdienste - von Olaf Ulfkottke". Die NSA gibt es ja offen zu, damit sie den Etat für die neuen Rechner bekommt.

    Die Motivation, warum ich meine Mails mit belangslosen Sachen auch so verschlüssel ist meine Einstellung gegenüber dem Amerikanern und ihren System. Wenn jeder so denken würde, wäre das riesige Machtinstrument, meiner Meinung auch die größte Gefahr für die Welt, völlig wirkungslos. Es reicht ja schon das unsere Herren und Damen in der Politik meistens nach der Pfeife der Amerikaner tanzen, da müssen wir es doch auch nicht noch tun oder?

    Die Sieger sind die Helden, die Verlierer die Verbrecher, stimmts? Früher mussten wir im Osten mit den Sowjets Freund sein, heut mit den Amis. Wer ist es in 50 Jahren, die Moslems villeicht? Also kann ein wenig Wiederstand gar nicht so falsch sein...

    Gruß Ivo


Anmelden zum Antworten