Wie greift "google" bei PCs auf das Micro zu?



  • https://www.youtube.com/watch?v=zBnDWSvaQ1I

    Aber wie? Google ist ja zunächst mal eine Website, die im Browser läuft. Die wird wohl kaum verantwortlich sein.
    Eher der Browser selber, auch von Google. Aber der war ja währenddessen geschlossen. Hat der Hintergrundprozesse am Laufen, oder wie?
    Ich sehe zumindestens keinen google-related task, wenn ich auch kein Chrome-Fenster auf haben.
    Also wie?



  • Keine Ahnung ob Google wirklich zuhört, ich glaub da erstmal nicht dran. Möglich wäre das natürlich über den browser, bei mir laufen immer mehrere Chrome-Prozesse im Hintergrund, auch wenn grad kein Chrome Fenster offen ist. Google könnte auch über andere Geräte, wie z.B. Smartphones, zuhören.



  • Falls es sich nicht nur um einen (bemerkenswerten) Zufall handelt, und die Sache nicht von dem Video-Autor "inszeniert" wurde, muss es nicht unbedingt an Google liegen. Auf seinem Desktop sehe ich z.B. dass Cortana aktiv ist. Bei dem ganzen Bullshit, mit dem man heutzutage rechnen muss, würde es mich nicht wundern, wenn das der Vektor ist, über den die Information zu den Werbenetzwerken gelangt ist.

    Für alle anderen weniger mysteriösen Fälle sei auch noch auf die Webaudio API verwiesen, falls du dich schon wunderst wie eine "eine Website, die im Browser läuft" auf dein Mikrofon zugreifen kann.



  • Gruum schrieb:

    Google könnte auch über andere Geräte, wie z.B. Smartphones, zuhören.

    Ich vermute, dass es in dem Fall das Smartphone war, das irgendwo in der Nähe lag. Das ergibt am meisten Sinn. Er hat ja die berühmten "in der Nähe" Stichworte verwendet.
    Das kann dann eventuell über seinen verknüpften Google-Account dazu geführt haben, dass er auch an seinem Rechner die gleiche Werbung bekommt.

    Finnegan schrieb:

    Auf seinem Desktop sehe ich z.B. dass Cortana aktiv ist. Bei dem ganzen Bullshit, mit dem man heutzutage rechnen muss, würde es mich nicht wundern, wenn das der Vektor ist, über den die Information zu den Werbenetzwerken gelangt ist.

    Hm. Dachte nicht, dass MS daran interessiert ist, Google solche Informationen zukommen zu lassen. Aber ist natürlich theoretisch möglich, ja.

    Finnegan schrieb:

    Für alle anderen weniger mysteriösen Fälle sei auch noch auf die Webaudio API verwiesen, falls du dich schon wunderst wie eine "eine Website, die im Browser läuft" auf dein Mikrofon zugreifen kann.

    Das ist schon klar, aber das wird die Website wohl kaum können, während der Browser geschlossen ist. Deswegen ist sie erstmal auszuschließen.



  • Mit HTML5 kann man doch auf die lokalen Resourcen zugreifen. Solange man das nicht konnte, brauchte man deshalb auch Flash. Flash ist obsolet, seit dem man mit jeder HTML5-Webseite auch auf die lokalen PC-Resourcen (Kamera, Microphone, Festplatte usw.) zugreifen kann.

    Geschichte wiederholt sich. 😃 🙄



  • UAZ schrieb:

    Hm. Dachte nicht, dass MS daran interessiert ist, Google solche Informationen zukommen zu lassen. Aber ist natürlich theoretisch möglich, ja.

    Auch hier sehe ich nicht unbedingt eine Verbindung zu Google, schliesslich gibt es auch noch eine ganze Reihe anderer "Werbenetzwerke". Fakt ist, dass das, was Cortana über das Mikrofon aufschnappt, an MS-Server weitergeleitet wird und dort auch genutzt werden kann um das "Nutzererlebnis zu verbessern". Das kann vieles bedeuten, personalisierte Werbung ist unter diesem Begriff jedoch so gut wie immer zu verstehen. Ich habe jetzt keinen Nerv mir die Nutzungsbedingunen nochmal genau anzusehen, bin mir aber ziemlich sicher, dass dort auch die Rede davon ist, dass solche Daten auch an "Partner" weitergegeben werden. Cortana ist also duchaus eine plausible Erklärung für das beobachtete Phänomen.

    Natürlich kann auch wie schon erwähnt wurde das Smartphone den mitgehört haben.



  • Hier glüht wieder mal der Aluhut.
    Für mich gilt bis auf weiteres die einfachste Erklärung: das Video ist fake.



  • Ich schließe mich hustbaer an. Für jemanden der normalerweise 1,2K Views hat ist ein Video mit > 1M Views eine Goldgrube in €. Da lohnt sich die Produktion eines Fakes.

    MfG SideWinder



  • Noch eine paar Anmerkung dazu:
    - Den Benutzer ohne seine Kenntnis&Einverständnis abzulauschen wäre eine übelste Verletzung der Privatsphäre und vermutlich in den meisten 1. Welt ländern schwerstens illegal.
    - Ob Daten vom Miko übertragen werden lässt sich wirklich einfach checken. Speziell wenn es ein USB-Mikro ist - gibt ja genügend USB Sniffer/Protocol Analyzer.
    - Es gibt genug schwer paranoide Computerfreaks die genügend Fachkenntnisse haben so ein Tool zu bedienen.
    - In Kombination heisst das: Wenn Microsoft oder Google seine Benutzer ohne Einverständnis belauschen würde, wäre das mit an Sicherheit grenzender Wahrscheinlichkeit bekannt. Und mit bekannt meine ich nicht so ein Video wo so ein Typ irgendwas behauptet, sondern mit harten Fakten belegt.

    Die ersten drei Punkte sind allerdings sowieso nur relevant wenn man unterstellt dass die LED die bei Webcams üblicherweise anzeigt wenn sie aktiv sind in betrügerischer Weise manipulierbar ist. (Ich hab's bei meiner jetzt extra ausprobiert: ja, die LED leuchtet auch wenn nur das Mikro angesteuert wird!)

    Äusserst pfiffige Verschwörungstheoretiker könnten jetzt natürlich einwerfen dass auch USB Protocol Sniffer manipuliert sind oder gar von Windows mit gefälschten Daten beschickt werden. Ist natürlich schwer was dagegen zu sagen. Bielefeld existiert ja schliesslich auch nicht.



  • hustbaer schrieb:

    Noch eine paar Anmerkung dazu:
    - Den Benutzer ohne seine Kenntnis&Einverständnis abzulauschen wäre eine übelste Verletzung der Privatsphäre und vermutlich in den meisten 1. Welt ländern schwerstens illegal.

    Niemand hat behauptet dass Kenntnis und Einverständnis nicht vorliegen. Dieser Punkt wird meist mit dem abnicken der berühmten Nutzungsbedingungen und Datenschutzerklärungen abgehandelt, die sich nur die wenigsten durchlesen. Das hat sicher auch der Autor des Videos getan. Auch wenn ich es - wie ich bereits erwähnte - durchaus für möglich halte, dass der Autor das Video inszeniert hat, wäre ich nicht so gutgläubig, das Thema ohne weitere Prüfung einfach als "Verschwörungsquatsch" zu den Akten zu legen, nur weil es nicht in mein Weltbild passt. Hier ist zumindest eine grobe Plausibilitätsprüfung angebracht, anstatt direkt "Blödsinn!" zu schreien und jeden der nicht gleich auf diesen Zug mit aufspringen mag, implizit als "Spinner" zu beleidigen.

    Da der Autor dem Weg, den seine gesprochene Information mutmaßlich genommen hat nicht wirklich auf den Grund geht, und wir auch nicht wissen, ob er irgendwo ein Smartphone/Alexa/andere Geräte, die potentiell lauschen könnten herumliegen hat, bleibt erstmal nur Cortana als Ansatzpunkt, das zu diesem Zeitpunkt offensichtlich aktiv war.

    Schauen wir uns mal die Info-Seite "Cortana und Datenschutz" an, dort heißt es:

    Wie Cortana Ihre Daten verwendet, um für Sie zu arbeiten

    Wenn Sie sich nicht anmelden und Cortana nicht Ihre Zustimmung zur Verwendung Ihrer persönlichen Daten geben, steht Cortana unter Windows trotzdem bereit, um Sie mit Windows Search bei der Suche im Internet und auf Ihrem Windows-Gerät zu unterstützen, Ihnen schnelle Antworten, Übersetzungen und Berechnungen zu bieten, Alarme für Sie einzurichten und andere Aufgaben auszuführen, die keine Personalisierung erfordern. Cortana kann Ihnen Suchvorschläge unterbreiten, sobald Sie mit der Eingabe oder dem Sprechen beginnen. Dazu sendet Cortana Ihre Text- oder Spracheingaben an den Bing-Dienst, der sie in Echtzeit interpretiert, um Vorschläge zu liefern.

    Und weiter:

    Cortana verwendet Ihre Daten nicht für personalisierte Werbung. Wie bei der Suche auf Bing.com können von Cortana bereitgestellte Suchergebnisse Werbung enthalten, und Ihre Bing-Suchabfragen werden – selbst wenn Cortana diese für Sie ausführt – wie jede andere Bing-Suchabfrage behandelt. Weitere Informationen dazu finden Sie im Abschnitt „Bing” der Datenschutzerklärung von Microsoft.

    Gut, Cortana verwendet die Daten nicht für "personalisierte Werbung", dennoch wird explizit darauf verwiesen, dass die von Cortana angestoßenen Suchanfragen (ergo: Die Worte, die man in den Raum spricht, sofern man diese Windows-Funktionen nicht akribisch deaktiviert hat) "wie jede andere Bing-Suchabfrage behandelt" wird. Recherchiert man weiter, was obige Formulierung wohl bedeuten mag, so findet man in der Datenschutzerklärung von MS, in die man bei der Installation eingewilligt hat (s.o. bzgl. "Kenntnis&Einverständnis"), so liest man dort:

    Die dargestellte Werbung kann auf Daten wie Ihren Interessen und Favoriten, Ihrem aktuellen Standort, Ihren Transaktionen, der Verwendung unserer Produkte, Suchkriterien oder auf Inhalten basieren, die Sie sich gerade ansehen. Wenn Sie sich beispielsweise Inhalte auf MSN zum Thema Auto anschauen, zeigen wir Autowerbungen an. Wenn Sie „Pizzerien in Seattle” auf Bing suchen, sehen Sie Werbungen in Ihren Suchergebnissen für Restaurants in Seattle.

    Irgendwie passt das nicht ganz zu meinem Verständnis von "Daten werden nicht für personalisierte Werbung verwendet". Das mag aber entweder an meinem altmotischen Verständnis von "persönlichen Daten" liegen, oder auch an der Spitzfindigkeit, dass die Daten ja nicht von Cortana, sondern von Bing verwendet werden.

    Zurück zu der Sache mit dem Hundespielzeug. MS scheint die Suchanfragen und identifizierenden Cookies nicht direkt mit Drittanbietern zu teilen, allerdings scheinen Drittanbieter durchaus ihre eigenen Daten erheben zu dürfen, die indirekt auch einen Bezug zu den "gesprochenen Worten" haben können - z.B. über Schlüsselwörter, mit denen diese Drittanbieter-Werbung ausgewählt wird:

    Daten, die von anderen Unternehmen erfasst werden. Werbetreibende integrieren mitunter eigene Web-Beacons (bzw. die anderer Werbepartner) in die von uns angezeigte Werbung, um eigene Cookie- zu platzieren. Zusätzlich werden Microsoft-Partner mittels Drittanbieter-Ad-Unternehmen dabei helfen, einige unserer Werbe-Dienste anzubieten und wir erlauben auch anderen Drittanbieter-Ad-Unternehmen, Werbung auf unseren Seiten zu platzieren. Diese Drittanbieter können auch Cookies auf Ihrem Computer platzieren und Informationen über Ihre Onlineaktivitäten auf Webseiten oder Onlinediensten erheben. Dazu gehören momentan u. a. folgende Unternehmen: A9, AppNexus, Criteo, Facebook, MediaMath, nugg.adAG, Oath, Rocket Fuel, Yahoo!. Sie erhalten weitere Informationen über die Praktiken jedes einzelnen Unternehmens, einschließlich der angebotenen Optionen, indem Sie auf den Firmennamen oben klicken. Viele von ihnen sind Mitglieder der NAI oder der DAA, die jeweils eine einfache Methode zur Ablehnung von Zielgruppenwerbung von Seiten der teilnehmenden Unternehmen anbieten.

    Es lässt sich also durchaus eine möglicher Weg der gesprochenen Worte via Cortana konstruieren, weshalb ich mich hüten würde, die Möglichkeit, dass so etwas passieren kann, einfach als "Spinnerei" abzubügeln.

    Allerdings funktioniert das Ganze in dem gezeigten Video einfach "zu gut" um es dem Autor einfach so abzukaufen. Auch ist fraglich, ob ein Drittanbieterwerbung bei einer Hintergrundabfrage via Cortana überhaupt so aktiviert wird dass sie ein wie auch immer geartetes Cookie absetzen kann. Es ist schon richtig, da etwas mehr zu verlangen als nur ein Video, wo ein paar Webseiten aufgerufen werden. Eine Anleitung mit einem gut reproduzierbaren Beispiel, das auch von anderen bestätigt werden kann, wäre da schon eine ganze Ecke glaubwürdiger.

    Dennoch: Die oben zitierten Auszüge aus der Datenschutzerklärung sind durchaus bedenklich und bieten für sich genommen schon genug Anlass für gesunde Skepsis. Selbst wenn das Video ein Fake ist, so ist der Schritt es Realität werden zu lassen nur ein sehr kleiner: Dazu müsste MS lediglich die Kriterien, nach denen Bing die Werbung auswählt (und sei es nur "anonymisiert") an andere Webenetzwerke ("Partner") weitergeben oder selbst als solches Werbenetzwerk auftreten.



  • Finnegan schrieb:

    wäre ich nicht so gutgläubig, das Thema ohne weitere Prüfung einfach als "Verschwörungsquatsch" zu den Akten zu legen, nur weil es nicht in mein Weltbild passt. Hier ist zumindest eine grobe Plausibilitätsprüfung angebracht, anstatt direkt "Blödsinn!" zu schreien und jeden der nicht gleich auf diesen Zug mit aufspringen mag, implizit als "Spinner" zu beleidigen.

    Aber du ignorierst einfach mal so was ich weiter geschrieben habe, damit du dich drüber aufregen kannst dass ich ein dummer Naivling bin.

    Die Frage des OP "Wie greift "google" bei PCs auf das Micro zu?" scheinst du auch bereits vergessen zu haben.

    ----

    Du weisst schon dass man die üblichen Sprachsteuerung/-erkennungs Services wie Cortana, Alexa etc. alle über eine Key-Phrase triggern muss, oder? Ob das in den Nutzungsbedingungen drin steht oder nicht weiss ich nicht. Sollte mMn. aber irrelevant sein, sobald sich sowas eingebürgert hat muss man wenn man es anders machen will fast darauf hinweisen dass es eben anders ist. Ebenso wie alle mir bekannten Systeme einen visuellen Indikator haben dafür dass sie gerade lauschen. Und wenn sie den nicht haben wäre das ebenso etwas auf das man hinweisen müsste. Und dann sind wir wieder bei ohne Kenntnis&Einverständnis und den glühenden Aluhüten.

    Sobald nämlich der "ich hör dir zu" Indikator an ist, halte ich es auch durchaus für möglich dass alles gesprochene u.U. für alles mögliche inklusive targeted Ads verwendet wird. Darum geht's aber in dem Video mMn. nicht. Mag zwar nicht explizit gesagt worden sein dass kein solcher Indikator aktiv war, aber man kann davon ausgehen, denn sonst wäre das ganze echt nicht grossartig verwunderlich.

    Auch impliziert die hier gestellte Frage dass kein solcher Indikator vorhanden ist, denn wäre er vorhanden, wüsste man ja wohl welches System gerade das Mikro verwendet.


  • Global Moderator

    hustbaer schrieb:

    Du weisst schon dass man die üblichen Sprachsteuerung/-erkennungs Services wie Cortana, Alexa etc. alle über eine Key-Phrase triggern muss, oder?

    Was übrigens auch ein weiteres Argument bei der Plausibilitätsprüfung ist, denn das hat ja durchaus auch einen technischen Hintergrund: Spracherkennung ist ziemlich aufwändig. Handys haben extra einen spezialisierten Chip, der nur auf das (aus diesem Grund unveränderliche) Signalwort lauscht und schicken danach die aufgezeichneten Geräusche zu einer Auswertemaschine, die die Sprache erkennt, weil es sowohl viel zu aufwändig wäre, das lokal zu machen. Und auch qualitativ zu schlecht, weil man weniger Lerndaten für die Maschine hätte.

    Wenn ein Gerät ständig alle Mikrofonaufzeichnungen in Rohform senden würde, würde das sofort auffallen, denn das wäre eine enorme Datenmenge und viele Leute achten sehr genau auf verbrauchtes Datenvolumen. Bliebe noch die Möglichkeit, dass ein PC in der Lage wäre, die Daten lokal vorzuverarbeiten, denn nur die erkannten Signalwörter würden nicht viel Datenvolumen verbrauchen. Der PC wäre dazu gewiss leistungsfähig genug. Aber auch da würde man doch stark annehmen, dass diese fehlende Leistung sofort auffallen würde. Selbst wenn Windows selber die abgezwackten Ressourcen vielleicht vor dem Nutzer verstecken könnte, so würde es doch sofort auffallen, wenn das Windows z.B. in einer virtuellen Maschine läuft, wenn das System unerklärlich viele Ressourcen verbraucht. Außer man postuliert eine große Verschwörung aller Software- und Hardwarehersteller, sowie aller Kommunikationsanbieter.



  • hustbaer schrieb:

    Finnegan schrieb:

    wäre ich nicht so gutgläubig, das Thema ohne weitere Prüfung einfach als "Verschwörungsquatsch" zu den Akten zu legen, nur weil es nicht in mein Weltbild passt. Hier ist zumindest eine grobe Plausibilitätsprüfung angebracht, anstatt direkt "Blödsinn!" zu schreien und jeden der nicht gleich auf diesen Zug mit aufspringen mag, implizit als "Spinner" zu beleidigen.

    Aber du ignorierst einfach mal so was ich weiter geschrieben habe, damit du dich drüber aufregen kannst dass ich ein dummer Naivling bin.

    Nein, die Aufregung darüber rührt daher, dass ich mich indirekt als "Aluhutträger", "paranoider Computerfreak" und "Verschwörungstheoretiker" bezeichnet sah, obwohl ich der Sache durchaus Skepsis entgegengebracht habe - sie aber dennoch für möglich halte. Das was du weiter geschreiben hast, habe ich lediglich deswegen ignoriert, weil ich darin keine Relevanz erkennen konnte:

    hustbaer schrieb:

    Die Frage des OP "Wie greift "google" bei PCs auf das Micro zu?" scheinst du auch bereits vergessen zu haben.

    Es ist wie erwähnt völlig unklar, ob Google überhaupt auf irgendentwas zugreift und ich sehe auch nicht, dass wenn so ein Zugriff tatsächlich stattfindet, dieser irgendwie so getarnt erfolgen sollte, dass ich das mit irgendwelcher Spezialsoftware analysieren müsste. Falls die Sache zutrifft gehe, ich davon aus, dass es sich um eine recht offene Funktionalität handelt, die notwendig ist, um ein bestimmtes Feature wie z.B. Spracherkennung zur Verfügung zu stellen, die aber tief in den Nutzungsbedingungen versteckte Implikationen hat, bei denen die meisten aus allen Wolken fallen würden, wenn sie sich derer bewusst werden.

    Etwas vergleichbares passiert z.B. bei WhatsApp: Alle meine Freunde automatisch in der Kontaktliste zu haben ist ein tolles Feature, dass man WhatsApp allerdings das Recht einräumt, regelmässig das Adressbuch mit sämtlichen Kontaktdaten auszulesen, und die Informationen - auch von Personen, die keine WhatsApp-Kunden sind - zu speichern und zu verarbeiten, schokiert die meisten, die man darauf hinweist, in was sie da eingewilligt haben (Auch interessant bezüglich "Einwilligung": WhatsApp wälzt hier die Verantwortung auf die Nutzer ab und verlangt in den Nutzungsbedingungen, dass man dazu befugt ist, diese Daten anderer zu teilen).

    Ich halte "Stealth-Lauschen" nicht für plausibel, daher habe ich hier auch keine Relevanz gesehen. Vielleicht hätte ich das besser näher ausführen sollen - betrachte das bitte hiermit als nachgeholt 😉

    hustbaer schrieb:

    Du weisst schon dass man die üblichen Sprachsteuerung/-erkennungs Services wie Cortana, Alexa etc. alle über eine Key-Phrase triggern muss, oder? Ob das in den Nutzungsbedingungen drin steht oder nicht weiss ich nicht. Sollte mMn. aber irrelevant sein, sobald sich sowas eingebürgert hat muss man wenn man es anders machen will fast darauf hinweisen dass es eben anders ist. Ebenso wie alle mir bekannten Systeme einen visuellen Indikator haben dafür dass sie gerade lauschen. Und wenn sie den nicht haben wäre das ebenso etwas auf das man hinweisen müsste. Und dann sind wir wieder bei ohne Kenntnis&Einverständnis und den glühenden Aluhüten.

    Das mag sein, ich verwende solche Dienste nicht, da ich die Nutzungsbedingungen nicht akzeptieren kann. Die für Cortana habe ich mir gestern recht genau angesehen, und dort steht nichts von einer Key-Phrase oder irgendwelchen Lausch-Indikatoren. Mag sein, dass diese "üblich" sind, laut Nutzungsbedingungen können sie diese jedoch jederzeit weglassen - das ist nichts worauf ich mich verlassen würde, dass das auch in Zukunft immer so gemacht wird. Schau dir doch die Forumlierung an:

    Cortana kann Ihnen Suchvorschläge unterbreiten, sobald Sie mit der Eingabe oder dem Sprechen beginnen.

    Dass es in der Praxis nur mit Key-Phrase und Indikator läuft beruhigt mich da nur bedingt.

    hustbaer schrieb:

    Sobald nämlich der "ich hör dir zu" Indikator an ist, halte ich es auch durchaus für möglich dass alles gesprochene u.U. für alles mögliche inklusive targeted Ads verwendet wird. Darum geht's aber in dem Video mMn. nicht. Mag zwar nicht explizit gesagt worden sein dass kein solcher Indikator aktiv war, aber man kann davon ausgehen, denn sonst wäre das ganze echt nicht grossartig verwunderlich.

    Auch impliziert die hier gestellte Frage dass kein solcher Indikator vorhanden ist, denn wäre er vorhanden, wüsste man ja wohl welches System gerade das Mikro verwendet.

    In dem Video ist eine Cortana-Sucheingabe mit einem Mikrofon-Symbol zu sehen. Ob sich dieses Symbol verändern müsste, wenn Cortana Mikrofon-Input bekommt weiss ich nicht, ich habe diese Funktion noch nie verwendet. Mir ist lediglich das Suchfeld aufgefallen, und es war erstmal die plausibleste Erklärung für das im Video gezeigte Phänomen - neben der Möglichkeit dass die Sache inszeniert war.

    Nachtrag:

    hustbaer schrieb:

    Die ersten drei Punkte sind allerdings sowieso nur relevant wenn man unterstellt dass die LED die bei Webcams üblicherweise anzeigt wenn sie aktiv sind in betrügerischer Weise manipulierbar ist. (Ich hab's bei meiner jetzt extra ausprobiert: ja, die LED leuchtet auch wenn nur das Mikro angesteuert wird!)

    Dem Webcam-Argument kann ich nicht wirklich folgen: Es geht erstmal um Sprache, also Mikrofone. Ich habe bisher noch kein Mikrofon besessen, welches ähnlich einer Webcam eine laufende Aufnahme angezeigt hat. Für Mikrofone kenne ich diese Indikatoren nur aus der jeweiligen Aufnahme-Software. Für eine separate Webcam kann ich mir jedoch durchaus vorstellen, dass dort eine LED leuchtet, wenn nur Ton aufgezeichnet wird - die integrierte Webcam in meinem Notebook hier z.B. ist allerdings nur eine Webcam - Ton wird über das Mikrofon des Notebooks aufgezeichnet und für dieses gibt es keinen Hardware-Indikator. Abgesehen davon halte ich das auch für weniger relevant, da ich, wie oben erwähnt, nicht von einem "Stealth-Lauschen" ausgehe (das ist MIR nämlich jetzt zu verschwörungstehoretisch ;)).



  • SeppJ schrieb:

    Wenn ein Gerät ständig alle Mikrofonaufzeichnungen in Rohform senden würde, würde das sofort auffallen, denn das wäre eine enorme Datenmenge und viele Leute achten sehr genau auf verbrauchtes Datenvolumen.

    Das muss nicht unbedingt sein. Zwar habe ich mich noch nicht näher mit Spracherkennung auseinandergesetzt, dennoch kann ich mir vorstellen, dass gesprochene Worte ähnlich wie bei Gesichts- und Fingerabdruckerkennung in eine reduzierte Form überführt werden können, die nur die relevanten Merkmale enthält - beispielsweise nur die Parameter der Frequenzen und Pegel die in menschlicher Sprache gesprochene Worte von einer Maschine unterscheidbar machen. Das sollten deutlich weniger sein, als notwendig ist, um die Worte für Menschen verstehbar zu rekonstruieren. Definitiv wird das wohl nur jemand beantworten können, der sich gut mit der Thematik auskennt, ich denke aber dass ich da nicht so falsch liege 😉

    SeppJ schrieb:

    Bliebe noch die Möglichkeit, dass ein PC in der Lage wäre, die Daten lokal vorzuverarbeiten, denn nur die erkannten Signalwörter würden nicht viel Datenvolumen verbrauchen.

    Das wäre noch ein Schritt weiter als die "relevanten Merkmale" die ich oben erwähnt habe und natürlich noch deutlich weniger Daten. Dass überhaupt eine Vorverarbeitung stattfindet, halte ich für sehr wahrscheinlich, da sich damit in der Summe eine Menge Rechenzentrums-Kapazität (Kohle!) einsparen lässt - welches Unternehmen würde da ohne Not drauf verzichten, so viel wie möglich vom Client vorverarbeiten zu lassen? 😉

    SeppJ schrieb:

    Der PC wäre dazu gewiss leistungsfähig genug. Aber auch da würde man doch stark annehmen, dass diese fehlende Leistung sofort auffallen würde. Selbst wenn Windows selber die abgezwackten Ressourcen vielleicht vor dem Nutzer verstecken könnte, so würde es doch sofort auffallen, wenn das Windows z.B. in einer virtuellen Maschine läuft, wenn das System unerklärlich viele Ressourcen verbraucht. Außer man postuliert eine große Verschwörung aller Software- und Hardwarehersteller, sowie aller Kommunikationsanbieter.

    Ich habe da meine Zweifel ob das wirklich auf so viel Rechenaufwand hinausläuft. Ende der 90er Jahre habe ich schon ein Diktierprogramm, damals noch unter OS/2 verwendet, welches leidlich gut funktionierte und den damaligen Rechner auch nicht übermäßig belastete. Das waren Zeiten als selbst die Echtzeitdecodierung einer MP3-Datei den Rechner schon spürbar belastet hat. Ich denke dass wenn die Vorverarbeitung auf dem Niveau der damaligen Spracherkennung abläuft und das auch nur während der Assistent "lauscht", das nicht wirklich spürbar ist Gewicht fallen würde. Auch wenn ich mir ansehe, wie sehr auf menschliche Sprache spezialisierte Codecs wie z.B. Speex gesprochene Worte eindampfen können, halte ich selbst ein Szenario, bei der die gesamten Sprachdaten auf den Servern verarbeitet werden für möglich. Damit wäre die "große Verschwörung" auch nicht notwendig 😉

    Ferner glaube ich auch dass der größte Teil der Rechenleistung nicht für die "Spracherkennung" sondern für das "Sprachverständnis" benötigt wird. Ich denke der Sprach-"Lexer" ist durchaus etwas, das auf dem Client-Rechner laufen kann, beim Parsen und der Semantischen Analyse wirds besonders bei natürlichen Sprachen schon deutlich aufwändiger (um mal Compiler-Strache zu verwenden ;)) - das ist wohl eher was für ein Rechenzentrum.


  • Global Moderator

    Du schreibst viel "ich vermute" und "ich zweifle", aber beginnst mit der Formulierung, dass du dich gar nicht damit beschäftigt hast. Was soll also der viele Text?

    Wahrscheinlichkeitsanalyse der Verschwörungshypothese:
    * Motivation dafür: Großer Geldgewinn
    * Folgen, wenn entdeckt: Groß
    * Technische Schwierigkeit: Groß bis unüberwindbar
    * Schwierigkeit der Geheimhaltung: Enorm

    Wahrscheinlichkeitsanalyse der Fakehypothese:
    * Motivation dafür: Großer Geldgewinn
    * Folgen, wenn entdeckt: Keine
    * Technische Schwierigkeit: Keine
    * Schwierigkeit der Geheimhaltung: Eine Person muss schweigen

    Fazit: Die Wahrscheinlichkeit dafür, dass die Aussage im Video gefälscht ist, ist so ungleich viel größer ist als die Wahrscheinlichkeit einer großen Abhörverschwörung zu Werbezwecken, dass ein rationaler Denker von der Fälschungshypothese ausgehen muss. Es wären ganz wesentliche neue Erkenntnisse nötig, um die Verschwörungstheorie wahrscheinlicher zu machen.



  • SeppJ schrieb:

    Du schreibst viel "ich vermute" und "ich zweifle", aber beginnst mit der Formulierung, dass du dich gar nicht damit beschäftigt hast. Was soll also der viele Text?

    Ich habe dargelegt, weshalb ich glaube, dass dein Argument mit den großen Datenmengen und der hohen Rechenlast nicht unbedingt greift. Ist das ein Problem wenn ich etwas detaillierter begründe, wie ich dazu komme? Keine Nachfrage von dir wenn ich nur "nein, glaub ich nicht." geschrieben hätte?. Wenn du über intimere Kentnisse verfügst, wie diese Systeme funktionieren, und weshalb meine Vermutungen nicht anwendbar sind dann sag das bitte, und kläre mich auf, weshalb das nur so und nicht anders funktioneren kann. Bis dahin bleibt mir eben nur übrig Vermutungen anzustellen, die mir plausibel erscheinen. Deine Vermutung: Zu groß und schwer für Dauerbetrieb. Meine Vermutung: Muss nicht, Problem lässt sich so verteilen, dass es nicht auffällt.

    SeppJ schrieb:

    Wahrscheinlichkeitsanalyse der Verschwörungshypothese:
    * Motivation dafür: Großer Geldgewinn
    * Folgen, wenn entdeckt: Groß
    * Technische Schwierigkeit: Groß bis unüberwindbar
    * Schwierigkeit der Geheimhaltung: Enorm

    Wahrscheinlichkeitsanalyse der Fakehypothese:
    * Motivation dafür: Großer Geldgewinn
    * Folgen, wenn entdeckt: Keine
    * Technische Schwierigkeit: Keine
    * Schwierigkeit der Geheimhaltung: Eine Person muss schweigen

    Fazit: Die Wahrscheinlichkeit dafür, dass die Aussage im Video gefälscht ist, ist so ungleich viel größer ist als die Wahrscheinlichkeit einer großen Abhörverschwörung zu Werbezwecken, dass ein rationaler Denker von der Fälschungshypothese ausgehen muss. Es wären ganz wesentliche neue Erkenntnisse nötig, um die Verschwörungstheorie wahrscheinlicher zu machen.

    Ich glaube du willst du mich veräppeln, wenn du jetzt auch mit diesem Verschwörungszeug ankommst, oder? 😉

    Ich habe hier nirgends eine Verschwörung postuliert. Die Essenz meiner Antworten: Entweder Fake oder eben keine Verschwörung, sondern eine offenes, in den Nutzungsbedingungen erwähntes Feature um das "Nutzerelebnis" zu optimeren.


  • Global Moderator

    Finnegan schrieb:

    Ich glaube du willst du mich veräppeln, wenn du jetzt auch mit diesem Verschwörungszeug ankommst, oder? 😉

    Ich habe hier nirgends eine Verschwörung postuliert. Die Essenz meiner Antworten: Entweder Fake oder eben keine Verschwörung, sondern eine offenes, in den Nutzungsbedingungen erwähntes Feature um das "Nutzerelebnis" zu optimeren.

    Wie würdest du sonst eine getarnte Aktion von großem öffentlichen Interesse nennen, von der aber niemand weiß und niemand etwas mitbekommen hat, außer einem zufälligen Youtuber?



  • SeppJ schrieb:

    Wie würdest du sonst eine getarnte Aktion von großem öffentlichen Interesse nennen, von der aber niemand weiß und niemand etwas mitbekommen hat, außer einem zufälligen Youtuber?

    Hab ich doch schon erwähnt: "Verbessertes Nutererlebnis", das erst vor kurzem "live" gegangen ist. Schliesslich schreiben die Läden doch immer, dass die unermüdlich daran arbeiten und deshalb die ganzen Daten brauchen 😉
    Wäre nicht das erste mal, dass eine Firma ein solches "WTF!?"-Feature implementiert und dann später heftig zurückrudern muss, weil es auf für sie unverständliche Weise gar nicht so gut ankommt.


  • Global Moderator

    Finnegan schrieb:

    SeppJ schrieb:

    Wie würdest du sonst eine getarnte Aktion von großem öffentlichen Interesse nennen, von der aber niemand weiß und niemand etwas mitbekommen hat, außer einem zufälligen Youtuber?

    Hab ich doch schon erwähnt: "Verbessertes Nutererlebnis", das erst vor kurzem "live" gegangen ist.

    😕 Du bist auf einer ganz anderen Ebene unterwegs. Ich: "Das Postulat der Fälschung der Mondlandung ist eine sogenannte Verschwörungstheorie". Du: "Nein, die gefälschte Mondlandung ist das CIA-Programm QX34I/6, da kommt nirgends das Wort "Verschwörung" vor!"