Minecraft: Ein Roboter übte das Spielen, indem er sich 70 000 Stunden YouTube-Videos ansah. Hier ist, was er gelernt hat

OpenAI, die von Elon Musk gegründete Forschungsorganisation für künstliche Intelligenz, hat eine KI darauf trainiert, Minecraft fast so gut wie Menschen zu spielen. Es dauerte nur etwa 70.000 Stunden, um sich Videos auf YouTube anzusehen.

Ein Blogbeitrag, der die Leistung näher erläutert, enthüllt, dass die Forscher eine Technik namens “Video PreTraining (VPT)” verwendeten, um ein neuronales Netz darüber zu trainieren, wie man Minecraft spielt. Dazu sammelten sie 2.000 Stunden an Datenproben von echten Menschen, die Minecraft spielten. Diese Daten umfassten nicht nur das unbearbeitete Videomaterial, sondern auch die genauen Tastendrücke und Mausbewegungen.

vpt minecraft
Ein Überblick über die VPT-Methode.

Davon ausgehend trainierten die Forscher ein Modell der inversen Dynamik (IDM), um bei jedem Schritt in den Videos die zukünftige Handlung vorherzusagen. Schließlich zeigten sie dem “trainierten” IDM 70.000 Stunden YouTube-Videos von Minecraft. Danach konnte das Modell die Verhaltensweisen aus den Videos kopieren, darunter das Fällen von Bäumen, um Holzscheite zu sammeln, und die Umwandlung der Holzscheite in einen echten Fertigungstisch.

Außerdem führte das Modell andere komplexe Fähigkeiten aus, die Menschen im Spiel oft machen, wie z. B. Schwimmen, Tiere jagen, um sich zu ernähren, und dieses Essen essen. Es lernte auch die Technik des “Pfeilerspringens”, ein häufiges Verhalten in Minecraft, bei dem man sich durch wiederholtes Springen und das Platzieren eines Blocks unter sich selbst in die Höhe schraubt.

OpenAI

Die Forscher konnten ein “Grundmodell” erstellen, das auf den Daten basierte, die der KI zur Verfügung gestellt wurden, und auf dieser Grundlage Verhaltensweisen verfeinern oder neue erlernen. Die KI war in der Lage, Fähigkeiten zu Beginn des Spiels auszuführen, wie z. B. die Herstellung von Werkzeugen aus Holz und Stein, das Plündern von Truhen und sogar den Bau von Unterkünften.

“Wir haben ein neuronales Netz trainiert, um kompetent Minecraft zu spielen, indem wir es auf einen großen Satz nicht gekennzeichneter Videodaten des menschlichen Minecraft-Spiels und eine kleine Menge gekennzeichneter Daten des Unternehmers vorformten.”

Je mehr Daten in das Grundmodell eingebracht wurden, desto besser war die KI. Die Forscher setzten sogar “verstärkendes Lernen” ein, um die KI zu “belohnen”, wenn sie besonders schwierige Herausforderungen meisterte. Das Belohnungssystem wurde so effektiv eingesetzt, dass das Modell erfolgreich eine Spitzhacke aus Diamant herstellen konnte, eine Aufgabe, die eine lange Abfolge von Arbeitsschritten erfordert.

Dies ist eine faszinierende Anwendung des maschinellen Lernens, die zeigt, wie Spiele zur Ausbildung von Computern genutzt werden können. Das verwendete KI-Modell könnte vielleicht sogar in die Spiele selbst eingebaut werden, um eine natürlichere Herausforderung zu bieten, ähnlich wie beim Spielen gegen menschliche Gegner.

Quelle des Artikels : Minecraft.fr

Rate this post

Schreibe einen Kommentar