Google DeepMind Challenge



  • Shade Of Mine schrieb:

    Eine KI die eine Krankheit diagnostiziert zB ist leicht zu bewerten: ja, hat die Krankheit erkannt vs nein, hat nicht. Und solche klaren Ergebnisse sind wichtig, sonst funktioniert das lernen naemlich nicht.

    Das Lernen wird sicherlich schwerer wenn das Ergebnis vage ist. Unmöglich aber nicht, und da ist AlphaGo das beste Beispiel für:

    AlphaGo ist vor allem durch reinforced learning so stark geworden. Laut Paper gewinnt die reinforced Variante >80% der Spiele gegen die supervised learning Variante, die rein aus der Datenbank von Zügen Menschlicher Spieler gespeist wurde. Die RL Vorgehensweise sah so aus, dass sie 2 Instanzen von AlphaGo gegeneinander spielen lassen haben, und die Züge des Sieger als gut und die Züge des Verlierers als schlecht in den Datensatz aufgenommen wurden. Anschließend wurde eine neue Variante von AlphaGo angelernt, die gegen eine zufällige alte Variante gespielt hat, wobei wieder die Züge entsprechend gewertet wurden usw.

    Da AlphaGo nur mit einer gewissen Warhscheinlichkeit gute Züge ausspuckt, wird das System auch nur mit vagen Ergebnissen befeuert. Solange die Wahrscheinlichkeit für gute Züge aber > 50% ist und man nicht in eine Sackgasse kommt, wo die KI sich auf sich selbst anpasst (overfitting), macht das System entsprechend Fortschritte bei der Maximierung der Siegwahrscheinlichkeit für jeden Zug. Und das ohne zu wissen welche Variationen alle nach einem Zug folgen können. Das ist das was oft mit Intuition betitelt wird.



  • Tobiking2 schrieb:

    Shade Of Mine schrieb:

    Eine KI die eine Krankheit diagnostiziert zB ist leicht zu bewerten: ja, hat die Krankheit erkannt vs nein, hat nicht. Und solche klaren Ergebnisse sind wichtig, sonst funktioniert das lernen naemlich nicht.

    Das Lernen wird sicherlich schwerer wenn das Ergebnis vage ist. Unmöglich aber nicht, und da ist AlphaGo das beste Beispiel für:

    Nein. Das Ergebnis bei Go ist simpel: man hat gewonnen, man hat nicht gewonnen.

    Das ist etwas komplett anderes. Go ist ein geschlossenes System. Ein sehr komplexes geschlossenes System - und hier ist der Durchbruch und das was AlphaGo so beeindruckend macht: das geschlossene System Go ist extrem Komplex. Aber, es ist ein geschlossenes System mit einer simplen Ergebnisbewertung.

    Ein Flohmarktstand ist ein offenes System mit enorm komplexer (wenn überhaupt möglicher) Ergebnisbewertung.



  • Shade Of Mine schrieb:

    Nein. Das Ergebnis bei Go ist simpel: man hat gewonnen, man hat nicht gewonnen.

    ...

    Ein Flohmarktstand ist ein offenes System mit enorm komplexer (wenn überhaupt möglicher) Ergebnisbewertung.

    Mir ist nicht ganz klar auf welcher Ebene du die Komplexität bei der Ergebnisbewertung siehst. Die Analyse warum ein Mensch einen Flohmarktstand eröffnet, kann zwar durchaus philosophisch werden, wenn es aber z.B. um Geld geht und der Betreiber einfach nur seinen Lebensunterhalt verdienen möchte, warum nicht einfach "Einnahmen > Ausgaben + Lebensunterhalt" als Bewertung nehmen? Das Finanzamt könnte dir die Ergebnisbewertung vermutlich sogar liefern. Was unrealistisch ist, ist das Sammeln der Daten die Einfluss auf die Einnahmen haben. Erst dort kommen Faktoren wie Produkte, Werbung etc. rein.



  • Weil Wirtschaft so nicht funktioniert.

    Als Beispiel: wenn ich alle Besucher meines Standes beklaue habe ich mehr Einnahmen.


  • Mod

    Shade Of Mine schrieb:

    Als Beispiel: wenn ich alle Besucher meines Standes beklaue habe ich mehr Einnahmen.

    Aber nicht sehr lange.



  • SeppJ schrieb:

    Shade Of Mine schrieb:

    Als Beispiel: wenn ich alle Besucher meines Standes beklaue habe ich mehr Einnahmen.

    Aber nicht sehr lange.

    Das ist deine persoenliche Vermutung. Hat mit der Realitaet aber nichts zu tun.
    Beweis: Nicht alle Diebe werden geschnappt.


  • Mod

    Shade Of Mine schrieb:

    SeppJ schrieb:

    Shade Of Mine schrieb:

    Als Beispiel: wenn ich alle Besucher meines Standes beklaue habe ich mehr Einnahmen.

    Aber nicht sehr lange.

    Das ist deine persoenliche Vermutung. Hat mit der Realitaet aber nichts zu tun.
    Beweis: Nicht alle Diebe werden geschnappt.

    War das nicht die Absicht deiner Aussage, dass die KI kurzfristige Vorteile zu hoch bewerten würde? Wenn sie eine Möglichkeit findet, mit Diebstahl davon zu kommen, dann läuft doch alles wie gewünscht beim Geldverdienen 😕

    Oder möchtest du auf moralische Überlegungen hinaus?

    PS: 3:0 und somit Matchgewinn für Alphago



  • Man muss auch bedenken was die KI denn hinterher überhaupt kann. Das ist nämlich identisch mit den was man anlernt. Die KI die ich beschrieben habe kann dann aus gegebenen Flohmarktstand Daten die Wahrscheinlichkeit auf Erfolg bestimmen. Gebe ich die Daten meines aktuellen oder geplanten Flohmarktstand ein, ist das einzige was ich daraus schließen könnte, ob ich eine Chance auf Erfolg habe oder es besser sein lassen sollte.

    Wenn ich meinen Flohmarktstand verbessern möchte, muss ich viele verschiedene Varianten bewerten lassen um zu sehen wo mein Erfolg am höchsten ist. Ob Varianten mit Diebstahl eine valide Option sind, kann man an dieser Stelle entscheiden.

    Hier ist natürlich auch einer der Hauptunterschied zwischen dem Flohmarktstand und Go. In Go ist die Zahl der möglichen Spielzüge die ich in einer Runde machen kann begrenzt und ich kann alle bewerten lassen und kriege damit wirklich den besten den die KI liefern kann. Je nachdem wie viele Features ein Flohmarktstandbeispiel hat, steigt die Zahl der möglichen Varianten aber exponentiell und es wird nicht mehr möglich sein alle Varianten bewerten zu lassen.



  • Ist Denksport nun offiziell tot, wenn Maschinen es sowieso besser können?

    Kann man so sehen. Der Mensch möchte es aber noch nicht wahr haben und spielt lieber gegen schwache menschliche Fehler als gegen unbesiegbare Maschinen. Der Mensch liebt also den Fehler, nicht die Fehlerlosigkeit! Das ist der Punkt.

    Ist es nicht höchste Zeit, ähnlich gemachte Programme für Politik, Volks- und Betriebswirtschaft zu entwickeln und ihnen die Verantwortung für die Welt zu übertragen?

    Keine Ahnung, man müsste es bei einer Firma mal ausprobieren. Ein menschlicher Vorstand verträgt sicher mehr Rotwein und Champagner und hat vlt. auch mehr Humor. Wäre ein interessantes Experiment. Wichtig ist, dass die Dividende und die Betriebsrente stimmt. Merkel wäre sicher leicht durch eine chaotische KI ersetzbar.



  • SeppJ schrieb:

    War das nicht die Absicht deiner Aussage, dass die KI kurzfristige Vorteile zu hoch bewerten würde? Wenn sie eine Möglichkeit findet, mit Diebstahl davon zu kommen, dann läuft doch alles wie gewünscht beim Geldverdienen 😕

    Nein, ich sage dass eine KI solche Bewertungen gar nicht erst vornehmen kann. Denn wenn sie es koennte und nur falsch entscheiden wuerde, dann muesste man nur an der Klassifikation arbeiten.

    Es ist aber einfach nicht moeglich solchen Faktoren zu berechnen.

    Tobiking2 schrieb:

    Die KI die ich beschrieben habe kann dann aus gegebenen Flohmarktstand Daten die Wahrscheinlichkeit auf Erfolg bestimmen. Gebe ich die Daten meines aktuellen oder geplanten Flohmarktstand ein, ist das einzige was ich daraus schließen könnte, ob ich eine Chance auf Erfolg habe oder es besser sein lassen sollte.

    Nein, das ist keine KI.

    Hier ist natürlich auch einer der Hauptunterschied zwischen dem Flohmarktstand und Go. In Go ist die Zahl der möglichen Spielzüge die ich in einer Runde machen kann begrenzt und ich kann alle bewerten lassen und kriege damit wirklich den besten den die KI liefern kann. Je nachdem wie viele Features ein Flohmarktstandbeispiel hat, steigt die Zahl der möglichen Varianten aber exponentiell und es wird nicht mehr möglich sein alle Varianten bewerten zu lassen.

    NEIN NEIN NEIN NEIN!

    So funktioniert das nicht.
    Du kannst nicht einfach durchrechnen lassen von einer KI was die Aenderung der Tischunterlage bedeutet. Die KI kann dir das nicht sagen.

    Offenes System/Geschlossenes System.

    Das ist ein RIESEN unterschied.

    Wenn du sagst es gibt zuviele Varianten, dann brauchst du nur staerkere Hardware. Der Punkt aber ist, es gibt unendlich viele unbekannte Variablen. Die gibt es in Go nicht. In Go gibt es exakt 0 unbekannte Variablen. in einem offenen System gibt es ziemlich genau unendlich viele.

    Irgendwenn mal werden wir auch das von einer KI handhaben lassen koennen aber aktuell nicht und Go ist da auch nicht mal im Ansatz vergleichbar.

    Leute bitte, das ist ein Programmiererforum. Wir sollten so etwas wissen!



  • Also zuerst muss ich den Entwicklern meinen Lob aussprechen. Den Suchraum so zu beschränken ist eine Leistung. Es würde mich interresieren welche Strategie sie nutzten und ob ein entsprechendes Paper schon vorhanden ist.

    Erst kürzlich habe ich eine Strategie (Min Conflicts) zum N Dame Problem kennengelernt mit der man das Problem wesentlich schneller lösen kann.

    ---

    Eine KI in der Politik würde zu massive Umwälzungen führen. Warum noch wählen wenn die KI eh das beste ist? Warum noch X KI's in X Nationen nutzen, wenn es auch eine KI es tut? Wie würde eine KI mit menschlichen Zickereien umgehen?



  • Shade Of Mine schrieb:

    pointercrash() schrieb:

    gegen eine gedrosselte Maschine zu gewinnen, hinterläßt einen schalen Geschmack.

    Also magst du generell keine Computerspiele? Die machen alle es künstlich schwerer für die KI und "drosseln" sie.
    ...
    Auf Dauer werden Computer immer ein 1vs1 gegen Menschen gewinnen. Denn ein Computer ist ja auch nicht "alleine". AlphaGo hat ja was weiß ich wieviele Gigaflops auf unendlich vielen CPUs/GPUs.
    ...
    AlphaGo ist ein komplett anderer Ansatz zu den herkömmlichen KIs in Go.
    Denn "begrenztes" Regelwerk trifft bei Go zwar zu, aber die Anzahl der Züge/Stellungen ist Unendlich. Was es bei Schach zB nicht ist. Go und Schach in Bezug auf KIs zu vergleichen ist witzlos.

    Erstmal, ich mag Computerspiele und ein Spiel als Ganzes muß ausbalanciert sein, um den Anreiz, doch einen Level noch (besser) zu packen, nicht in Frustration umschlagen zu lassen. Heißt, zum Regelwerk gehören auch die Fähigkeiten der KI- Gegner.

    Die "Denkspiele" sind Zweipersonen- Nullsummenspiele mit Anzugsunterschied und schneller oder langsamer verästelndem Spielbaum, keines hat eine unendliche Zahl von Stellungen, nichtmal Go. Also ist jeder Spielbaum per "Brute Force" durchrechenbar, was ja schon etlichen Spielen widerfahren ist. Aber wie beim Knacken effektiver Verschlüsselung gilt, daß das Ergebnis so aufwendig zu gewinnen ist, daß es keinen mehr interessiert.
    Bei explodierenden Spielbäumen müssen Verzweigungen, die man nicht komplett durchrechnen kann, abgeschnitten werden, mit Shannon- A und B-, Minimax- und was weiß ich noch- Strategie. Das zusammen mit einer Eröffnungsbibliothek, Erkennung von identen Stellungen durch Zugumstellung und frühzeitiger Erkennung einer Endspielstellung haben mir Ende der 90er bereits das Leben schwer gemacht, alleine durch die gewachsene Rechenleistung kommen die Programme auf Turnierstufe ein bis zwei Halbzüge weiter als damals - zuviel für mich.

    Klar, wenn jetzt ein lelbstlernender Algo rausfindet, wie er am besten beschneidet, dann kann er aus Eigenerfahrung sein Vorgehen optimieren. Aber das kann er halt nur bei Go, dazu muß er vorprogrammiert werden. Die Selbstlernschleifen werden vorgekaut - und das kann der Mensch insofern besser: Schnapp Dir einen etwa Fünfjährigen und bringe ihm Würfeln und Ziehen mit einer Figur bei, am nächsten Tag Schlagen an Hand von Mensch-Ärgere-Dich-nicht. Ab da kommst Du mit rein deskriptiven Anweisungen aus, um den ganzen Kram von Fang-den-Hut bis Lotti Karotti durchzukriegen, indem Du gültige Züge und Spielziel erklärst, vorausgesetzt, das Kind ist clever genug und optimiert selber sein Spiel (Spielregeln + Spieltrieb + Spielziel + Selbstoptimierung), wirst Du feststellen, dass viele bei einer derart begrenzten "Spielwelt" schnell anfangen, nahezu perfekte Spielzüge zu generieren, anderen es jedoch immer ein Rätsel bleibt, wieso der Erwachsene immer gewinnt.

    Nicht, dass ich AlphaGos Leistungen schlechtreden mag, es hatte viele Väter, die ihm Vieles beibringen mußten. Aber zwischen AlphaGo und einem Fünfjährigen liegen dann doch noch ein paar Welten der Kognition und Abstraktion.

    @Erhard:
    Aber ja, Zweipersonen- Nullsummenspiele, also "Denkspiele" gehören den Automaten.


  • Mod

    Bitte ein Bit schrieb:

    Also zuerst muss ich den Entwicklern meinen Lob aussprechen. Den Suchraum so zu beschränken ist eine Leistung. Es würde mich interresieren welche Strategie sie nutzten und ob ein entsprechendes Paper schon vorhanden ist.

    Das ist im Januar in Nature erschienen:
    http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html


Anmelden zum Antworten