Mann stellt Plakat vor

Die Qualität der synthetischen Stimme

Die Art, wie Internetuser Informationen konsumieren, hat sich stark verändert. War noch vor einigen Jahren die „Lese-Gesellschaft“ Realität, ist es heute die „Seh- und Hör-Gesellschaft“. Davon zeugt nicht zuletzt der Siegeszug von Videoportalen wie Youtube, Vimeo & Co. Das Babelsberger Unternehmen clipnow hat sich diesen Trend zunutze gemacht und eine Technologie zur vollautomatischen Erstellung von vertonten Video-Clips aus Text- und Bildbausteinen entwickelt.

Ralf von Grafenstein ist ein vielbeschäftigter Mann. Als Gründer, Hauptaktionär und Geschäftsführer hat er alle Hände voll zu tun, das rasante Wachstum seines jungen Unternehmens clipnow zu managen. Derzeit richtet sich das mittlerweile zwölfköpfige Team in größeren Räumlichkeiten im Herzen des Potsdamer Stadtteils Babelsberg ein. „Alle ein bis zwei Monate kommt ein Mitarbeiter hinzu. Denn die Zahl unserer Kunden wächst um rund 10 Prozent pro Monat“, freut sich der clipnow-Chef.

Begonnen hatte alles im Februar 2010 mit der Gründung des Unternehmens, damals noch unter dem Namen „45info“. Ralf von Grafenstein und seine Mitstreiter hatten die Idee, die Einträge auf der populären Wissensplattform Wikipedia in jeweils 45-sekündige Videofilme zu verwandeln. Dafür entwickelten sie eine Technologie, mit der die vorhandenen Fotos, Grafiken und Texte vollautomatisch in Bewegtbilder mit Ton transferiert wurden. 800.000 Videos sind nach und nach in Englisch und Deutsch entstanden.

Frühphasenfonds und „F&E von KMU“ fördern die Geschäftsidee

Mit der umfangreichen „Wikipedia-Verfilmung“ im Gepäck hat sich von Grafenstein bei verschiedenen Finanzierungsfonds vorgestellt. Am Ende war – auf Vermittlung der Wirtschaftsförderung Brandenburg – der Frühphasenfonds des Landes Brandenburg (BFB) von Potenzial und Marktorientierung der Geschäftsidee überzeugt und investierte in das Start-up. Die bmp AG wurde mit der Fondsverwaltung beauftragt. Dank des Förderprogramms „Forschung und Entwicklung von KMU“ war 45info/clipnow in der Lage, die semantische Textanalyse voranzutreiben und den Einsatz der Clips für Desktops und mobile Endgeräte zu optimieren. Speziell die Qualität und Intelligenz der synthetischen Stimme bedurften einer Anpassung an die Kundenanforderungen. Bei einem Projekt für einen großen Reisekonzern hatte sich seinerzeit herausgestellt, dass die Aussprache fremdländischer Eigennamen ein Problem für die automatische Sprachgenerierung darstellte.

Nach anderthalb Jahren war es geschafft: Von Grafenstein und sein Team hatten eine eigene „Stimme“ kreiert. Gleichzeitig fanden sie eine Möglichkeit, die Videoerstellung an das vielen Webseiten zugrundeliegende XML-Format zu koppeln.

Ideal für Immobilienmakler und Autohändler

clipnow punktet auf dem Markt durch sein Rund-um-sorglos-Paket. Gerade für Kunden mit hohem Produktumschlag wie Immobilienmakler und Autohändler ist dies attraktiv: Sie können jederzeit ihre Angebote im Netz ergänzen oder verändern – und beinahe in Echtzeit wird ein aktueller Video-Clip vollautomatisch generiert. Darüber hinaus richtet clipnow für jeden seiner Kunden einen hauseigenen Youtube-Kanal ein, als extra Vermarktungsweg. Gemessen am Effekt seien die Kosten für diesen umfassenden Service extrem günstig, so Geschäftsführer von Grafenstein.

Immerhin 60 Prozent aller Videos auf immobilien-scout24 stammen von clipnow. Zahlreiche renommierte Maklerfirmen vertrauen inzwischen der Technologie der Babelsberger. „Bis Ende 2014 wollen wir 1.000 Immobilienkunden gewonnen haben. Und parallel bauen wir den Autobereich aus, bevor wir uns der Internationalisierung widmen“, zeigt sich von Grafenstein zuversichtlich.

Auch auf dem künftigen Weg wird clipnow von Unterstützungsangeboten des Landes Brandenburg profitieren. Stets an seiner Seite weiß Ralf von Grafenstein dabei die Berater von der Wirtschaftsförderung Brandenburg.