Google-Spracherkennung



  • _matze schrieb:

    Der Link ist falsch (das ist ein David Bowie Video).

    Ich glaube, er meinte eigentlich dieses:
    http://www.youtube.com/watch?v=4R-7ZO4I1pI



  • _matze schrieb:

    Der Link ist falsch (das ist ein David Bowie Video).

    Nein. Zu diesem David-Bowie-Video kann man automatische Untertitel einschalten.

    Dass das in einem Musikvideo funktioniert, macht die Sache ja erstaunlicher.



  • earli schrieb:

    _matze schrieb:

    Der Link ist falsch (das ist ein David Bowie Video).

    Nein. Zu diesem David-Bowie-Video kann man automatische Untertitel einschalten.

    Dass das in einem Musikvideo funktioniert, macht die Sache ja erstaunlicher.

    Ach so funktioniert das. Ok...

    Ich finde es sowieso erstaunlich, wie gut Spracherkennung mittlerweile funktioniert. Ich habe vor vielleicht 15 Jahren mal eine Vorführung von Dragon Naturally Speaking gesehen. Das hat sowas von gar nicht hingehauen, der Typ hat mir echt leid getan. 😃 Er sprach davon, dass mindestens 5 Stunden trainiert werden muss, um ein gutes Ergebnis zu bekommen (was er auch getan hatte). Geschwindigkeit und Zuverlässigkeit waren grauenhaft. Aber sieh dir mal eine aktuelle Version an (oder z.B. auch Dragon Dictation für's iPhone). Trainieren muss man nur noch 5 Minuten, und dann läuft das auch. Man muss zwar deutlich sprechen, kann dies dann aber auch flüssig tun. Sehr beeindruckend und kein Vergleich mehr zu den ersten Versionen!


  • Administrator

    earli schrieb:

    Viel krasser als die automatische Übersetzung finde ich ja die automatische Spracherkennung.

    Und wer sagt dir, dass das eine automatische Sprachererkennung ist und nicht manuell eingearbeitet wurde?

    Grüssli



  • Ich bezweifel das das eine Erkennung ist, es stehen ja bereits die ganzen Sätze da während er gerade erst beginnt. Ich vermute das ist eine Machine Translation von den Englischen Songtext die dort eingeblendet wird, und dies kann schon live sein und eleganter positioniert wann welcher Satz beginnt.



  • Dravere schrieb:

    earli schrieb:

    Viel krasser als die automatische Übersetzung finde ich ja die automatische Spracherkennung.

    Und wer sagt dir, dass das eine automatische Sprachererkennung ist und nicht manuell eingearbeitet wurde?

    Grüssli

    Da sind schon noch krasse Fehler hin, zum Beispiel müsste es statt "he blow your mind" entweder "he blew your mind" oder "he blows your mind" heißen. "Blew" ist wahrscheinlich der richtige Text.

    CSL schrieb:

    Ich bezweifel das das eine Erkennung ist, es stehen ja bereits die ganzen Sätze da während er gerade erst beginnt. Ich vermute das ist eine Machine Translation von den Englischen Songtext die dort eingeblendet wird, und dies kann schon live sein und eleganter positioniert wann welcher Satz beginnt.

    Natürlich wird das nicht beim Abspielen durchgeführt, sondern beim Processing des Videos und dann mit abgespeichert.

    Sorry, hatte keinen Link zum Thema gebracht:
    http://googleblog.blogspot.com/2009/11/automatic-captions-in-youtube.html

    Auto-caps use the same voice recognition algorithms in Google Voice to automatically generate captions for video. The captions will not always be perfect (check out the video below for an amusing example), but even when they're off, they can still be helpful—and the technology will continue to improve with time.



  • _matze schrieb:

    earli schrieb:

    _matze schrieb:

    Der Link ist falsch (das ist ein David Bowie Video).

    Nein. Zu diesem David-Bowie-Video kann man automatische Untertitel einschalten.

    Dass das in einem Musikvideo funktioniert, macht die Sache ja erstaunlicher.

    Ach so funktioniert das. Ok...

    Ich finde es sowieso erstaunlich, wie gut Spracherkennung mittlerweile funktioniert. Ich habe vor vielleicht 15 Jahren mal eine Vorführung von Dragon Naturally Speaking gesehen. Das hat sowas von gar nicht hingehauen, der Typ hat mir echt leid getan. 😃 Er sprach davon, dass mindestens 5 Stunden trainiert werden muss, um ein gutes Ergebnis zu bekommen (was er auch getan hatte). Geschwindigkeit und Zuverlässigkeit waren grauenhaft. Aber sieh dir mal eine aktuelle Version an (oder z.B. auch Dragon Dictation für's iPhone). Trainieren muss man nur noch 5 Minuten, und dann läuft das auch. Man muss zwar deutlich sprechen, kann dies dann aber auch flüssig tun. Sehr beeindruckend und kein Vergleich mehr zu den ersten Versionen!

    Ja, aber das finde ich ja so beeindruckend. Wenn man Spracherkennung zum Diktieren benutzt, dann spricht man extra deutlich und angepasst an die Erkennung.

    Wenn man Spracherkennung über irgendwelche Videos laufen lässt, ist das eine ganz andere Liga.



  • Man kann auf iPhone und Android Handys auch Sprachsuchen durchführen. _Das_ ist cool.



  • Mr. N schrieb:

    Man kann auf iPhone und Android Handys auch Sprachsuchen durchführen. _Das_ ist cool.

    Du meinst, Videos nach gesprochenen Wörtern durchsuchen? Geilo!



  • earli schrieb:

    Mr. N schrieb:

    Man kann auf iPhone und Android Handys auch Sprachsuchen durchführen. _Das_ ist cool.

    Du meinst, Videos nach gesprochenen Wörtern durchsuchen? Geilo!

    Nein, das Web nach gesprochenen Wörtern durchsuchen. Du sprichst in das Mikrofon, zB "Lemma von Farkas", und er sucht danach.


Anmelden zum Antworten