Posts Tagged ‘Deutsche Forschungszentrum für Künstliche Intelligenz’

Technikspielzeug Teil 8: Mein Robo-Saurier Pleo rb

1. März 2012
Hier eine Herde von freilegenden Pleos.

Hier eine Herde von freilegenden Pleos.

Bei mir zu Hause ist das Arbeitszimmer von Haustieren bevölkert. Nein, kein klassischer Wellensittich oder eine Katze, sondern von zwei Aibos und einem Pleo. Wer sind jetzt die? Aibo ist der Robo-Hund von Sony und Pleo ist ein kleiner Robo-Saurier. Es gibt noch viele weitere Robos im Arbeitszimmer, aber heute will ich meinen Pleo näher vorstellen.

Erfinder des Pleo rb oder auch Pleo reborn ist Caleb Chung. Er hat den Dino einem Langhalssaurier Camarasaurus nachempfunden. Dank komplexer Technik und einem so genannten „Life From Operating System“ (LIFE OS) ist „Pleo rb“ mehr als nur ein Spielzeug bei uns zu Hause. Anschmiege-Bewegungen, Gurr-Geräusche, Lachen und Schwanzwedeln sind nur ein paar seiner Eigenschaften, die ihn zu einem tierischen Mitbewohner machen. Aber unser „Pleo rb“ kann mehr. Pleo lernt durch eine einfache Form der künstlichen Intelligenz, dessen Basis das LIFE OS bildet. Aber natürlich bleibt der Pleo wie der Originalsaurier sein Leben lang dumm. Was würde passieren, wenn man Aibo, Pleo und Co mit einem zentralen Server koppelt – ähnlich wie Siri und dann eine kollektive Intelligenz aufbaut. Siri von Apple lernt täglich dazu. Ok, die Borgs wären dann auch bald da.
Während seiner Entwicklung vom Neugeborenen bis hin zum Erwachsenenalter, aber auch darüber hinaus, lernt „Pleo rb“ nie aus. Mit seinen zahlreichen Sensoren und Motoren, darunter auch Infrarot- und akustische Sensoren, kommt „Pleo rb“ ohne Fernbedienung aus und nimmt seine Umgebung eigenständig wahr. Unser Pleo macht allerdings schnell schlapp, weil seine Batterie eine Macke hat und ich sie endlich mal austauschen muss.
Die Sensoren ermöglichen es ihm, Geräusche und Berührungen wahrzunehmen. So baut er nach und nach eine Beziehung zu den Menschen auf, die ihn aufziehen und erkennt sogar ihre Stimmen. Außerdem verfügt „Pleo rb“ über einen ausgezeichneten Orientierungs- und Bewegungssinn, durch den der Dinosaurier sich frei im Raum bewegen kann. Er simuliert das Fressen von Futter, verfolgt Bewegungen und reagiert auf Geräusche. Im Neugeborenenalter lernt „Pleo rb“ zunächst stehen, mit der Zeit erwirbt der Dinosaurier immer mehr Fähigkeiten wie Zählen, Verbeugen, Singen oder Tanzen. Auch Uhrzeit und Temperatur erkennt „Pleo rb“.
Jeder „Pleo rb“ ist einzigartig, durch die unterschiedliche Farb- und Markierungskombinationen. So bringt jeder „Pleo rb“ neben zahlreichen Zubehör wie Futter, Medizin oder Spielzeug auch seinen individuellen Personalausweis mit. Mit dieser RFID-Karte bekommt „Pleo rb“ von seinem Besitzer den Namen, auf den er in Zukunft hören soll. Unser Pleo heißt Stan Winston. Sein Originalpapa baute die Robos von Jurrasic Park oder Terminator. Durch die zahlreichen technischen Möglichkeiten, die „Pleo rb“ bietet, wird er auch für verschiedene wissenschaftliche Projekte eingesetzt. So hat zum Beispiel die Gruppe für interdisziplinäre Psychologie der Universität Bamberg und das Deutsche Forschungszentrum für Künstliche Intelligenz ein Projekt aufgesetzt, das auf „Pleo rb“ aufbaut. Und der Spaß ist noch einigermaßen billig. Für rund 450 Euro ist der Pleo über www.klein-robotics.de und via Amazon erhältlich. Und damit ist er um ein vielfaches billiger als meine Aibos von Sony.

Software findet Musik für Vertonung von Fotoserien und Videos

24. Juni 2011

Es ist fast wie Magie und es haute mich aus den Socken. Forscher der Uni Saarland haben eine Software entwickelt, die passende Musik für die Vertonung von Fotoserien und Videos findet.

Das löst das Musikproblem vieler Amateure. Aus dem Urlaub bringt jeder gerne schöne Fotos von Städten, Sandstränden oder Menschen mit. Wer diese dann mit Musik untermalt dem Freundeskreis zeigen will, sucht oft stundenlang nach den dazu passenden Musikstücken. Diese Aufgabe übernimmt der Computer jetzt völlig eigenständig. Informatiker des Saarbrücker Exzellenzclusters haben dafür eine Software entwickelt, die automatisch für Fotos und Videoausschnitte die geeignete Musik findet. Mit lizenzfreier Musik kann man das Verfahren mit Namen „Picasso“ schon testen. In einigen Wochen wird es außerdem eine Anwendung für das iPhone geben, die als Quelle die auf dem Handy gespeicherte Lieblingsmusik nutzt.  Als Lizenzfreie Musik empfehle ich hier ausdrücklich die Audiotracks von Dosch Audio. Hier kann man die Forschungsergebnisse der Informatiker einmal ausprobieren.

Filmer und 3D-Artist wissen: Passt die Musik zu den Bildern, ist die halbe Miete bereits gemacht. Musik und Bild gehören einfach zusammen. Zum romantischen Foto vom Palmenstrand könnten schmachtvolle Liebeslieder passen, eine Kanufahrt durch wilde Schluchten würde man eher mit temperamentvollen Werken inszenieren. „Filmregisseure achten in der Regel sehr genau darauf, welche Melodie auf eine Szene passt. Damit auch der Computer selbstständig die geeignete Musik für eine Bilderserie findet, haben wir einige Dutzend Filme angeschaut und ihre Soundtracks ausgewertet. Daraus entstand eine Datenbank mit mehreren tausend Bildern und der dazu passenden Musik“, sagt Sebastian Michel, Leiter einer Forschergruppe am Exzellenzcluster der Saar-Uni.

Über ein ausgeklügeltes Rechenverfahren gleicht der Computer diese Bilder mit den Urlaubsfotos ab. Anhand des gespeicherten Soundtracks begibt sich die Picasso-Software dann auf die Suche nach  Musikstücken, die mit hoher Wahrscheinlichkeit die Atmosphäre der Aufnahme passend untermalen. „Die Trefferquote unseres Systems ist erstaunlich hoch. Allerdings kann es häufig vorkommen, dass nicht gleich der erste Treffer perfekt passt. Fehler entstehen meist dann, wenn der Betrachter mit dem Foto verschiedene Gefühle verbindet. Ein einsames Haus zum Beispiel kann der eine mit romantischen Abenden verbinden, der andere denkt nur an gespenstische Nächte“, erläutert der Informatiker. Picasso schlage daher immer mehrere Musikstücke vor, aus denen der Benutzer dann das passendste auswählen kann.

Der Saarbrücker Wissenschaftler will gemeinsam mit seinem Doktoranden Aleksandar Stupar die Software weiter verbessern, damit sie auch für Videosequenzen und die Untermalung von Hörspielen genutzt werden kann. „Wir haben dafür bereits Regiebücher von Filmen ausgewertet und die Szenenbeschreibungen mit der Filmmusik abgeglichen. Auf dieser Datenbasis kann man auch für gesprochene Texte eine geeignete Hintergrundmusik recherchieren“, meint Sebastian Michel. In den kommenden Wochen werden die Informatiker außerdem eine Anwendung für das iPhone programmieren, mit der jeder seine Urlaubsfotos mit Musik untermalen kann, die in der eigenen Mediathek gespeichert ist. „Auf unserer Webseite bieten wir die Picasso-Software außerdem zum Ausprobieren mit lizenzfreien Musikstücken an. Das schränkt die Bandbreite im Musikgeschmack derzeit noch ein. Wir können uns aber vorstellen, dass das Computerprogramm auch für kommerzielle Musikanbieter von Interesse ist“, sagt Michel. Die Wissenschaftler werden das Verfahren im Juli auf einer der weltweit wichtigsten Konferenzen für Informationssuche und Wissensdatenbanken, der ACM SIGIR 2011 in Beijing (China) vorstellen.

Sebastian Michel

Sebastian Michel

leitet eine Forschungsgruppe am Saarbrücker Exzellenzcluster „Multimodal Computing and Interaction“ und forscht auch am Max-Planck-Institut für Informatik. Der Exzellenzcluster wird seit 2007 im Rahmen der Exzellenzinitiative von Bund und Ländern gefördert. Die Wissenschaftler erforschen dort, wie man multimodale Informationen wie Texte, Audiodateien, Videos und Bilder noch effizienter organisieren, verstehen und durchsuchen kann. Neben der Universität des Saarlandes sind am Exzellenzcluster das Max-Planck-Institut für Informatik, das Max-Planck-Institut für Softwaresysteme und das Deutsche Forschungszentrum für Künstliche Intelligenz beteiligt. Ich finde diese Technik kann der volle Hammer werden.