04.06.2020

Laut McKinsey können Unternehmen, die Künstliche Intelligenz in vollem Umfang nutzen, ihren Cashflow bis 2030 verdoppeln. Denn Machine Learning Modelle finden in den unterschiedlichsten Geschäftsfeldern im Business-Bereich Anwendung. Schon heute erzielen sie enorme Produktivitäts- und Qualitätssteigerungen durch präzise Vorhersagen. Allerdings ist für viele Unternehmen die Einstiegshürde noch sehr hoch, da sie nicht glauben über das notwendige Know-how oder den geeigneten Datenbestand zu verfügen, um zum Beispiel Deep-Learning-Modelle für Natural Language Processing trainieren zu können. Googles Cloud AI Services können diese Einstiegshürden für Unternehmen wesentlich senken und eignen sich unter anderem für folgende Anwendungsbereiche: 

Bild- und Videoanalyse

Google Vision API verfügt bereits über einen umfangreichen globalen Datenbestand, wodurch Unternehmen sie unmittelbar nutzen können. Ein Computer-Vision-System erfasst und analysiert Bilder, um Informationen zu erzeugen. Dies ermöglicht es einer Maschine Objekte, Szenen und Aktivitäten in der Umgebung wahrzunehmen und so ein visuelles Verständnis von Bildern und deren Inhalte zu erhalten. Nutzer können ganz leicht via Drag and Drop Inhalte hochladen, das Modell trainieren und verwalten. Über eine Rest-API können diese Bilder dann in andere Google Cloud-Dienste eingesetzt werden.

Auf diese Weise können Bilder mit Keywords versehen werden – was für die Erstellung und Pflege einer Bilddatenbank enorm hilfreich ist. Über die Verschlagwortung lässt sich dann prüfen, ob das Visual noch anderweitig im Internet verwendet wird. Im E-Commerce ist dies für Produktbilder interessant: Mit der Cloud Vision-Produktsuche können Händler prüfen, ob ihre Bilder und Motive unrechtmäßig in anderen Shops genutzt werden. Dadurch lassen sich Produktfälschungen schneller auffinden, die mit Bildern des Herstellers beworben werden. Gleiches gilt für Logos: Händler können identifizieren, wo das Logo auftaucht und wie oft es in Bildern oder Videos für Werbezwecke verwendet wird. Darüber hinaus können Händler prüfen, ob Nutzer in Zusammenhang mit ihren Produkten anstößige Inhalte veröffentlichen, zum Beispiel bei Produktbewertungen oder in Kommentaren.

Doch nicht nur für Shopbetreiber, sondern auch für Kunden kann die visuelle Suche nützlich sein. Einem Kunden gefällt zum Beispiel in einem Hotel das Geschirr besonders gut. Er schießt ein Foto davon und lädt es in die Händler-App hoch. Nun kann es unter Anwendung von maschinellem Lernen mit den Bildern in der Produktgruppe des Einzelhändlers verglichen werden. Anschließend erhält der Kunde eine Liste mit optisch und semantisch ähnlichen Produktergebnissen.

Google bietet auch eine API, die Objekte in Videos erkennt: Die Video Intelligence kann das Video verschlagworten, filtert wo und wie oft etwas in der Aufnahme auftaucht und analysiert dadurch, was darin passiert. Dies ist etwa bei Überwachungs- oder Verkehrskameras von großem Vorteil. 

Text- und Sprachverarbeitung

Neben der Bildanalyse kann Machine Learning auch in der Kommunikation effektiv sein und als Sprachagent fungieren, der Menschen versteht und mit ihnen spricht. ML befähigt Computersysteme natürliche Sprache in Wort und Schrift zu erkennen und erzeugen. Hierzu verarbeiten Algorithmen die menschliche Spracheingabe und wandeln sie in maschinenverständliche Darstellung um. 

Das gesprochene Wort wird zu Text und umgekehrt. Dabei unterstützt die Google Speech-to-Text API mehr als 120 Sprachen, die Google Text-to-Speech API konvertiert Text in natürlich klingende Sprache mit 180 unterschiedlichen Stimmen in 30 verschiedenen Sprachen. Dadurch lassen sich Audiodateien erschließen, Videos automatisch mit Untertitel versehen und Texteingaben sowie Befehle per Voice automatisch umsetzen. Eine benutzerfreundliche Interaktion zwischen User und technischen Geräten ist somit gewährleistet.

Geht es darum, aus unstrukturierten Kundenbewertungen, E-Mails oder Dokumenten strukturierte Informationen zu erhalten und diese an die entsprechenden Abteilungen weiterzuleiten, ist Natural Language API (NLP) die optimale Lösung. Diese kann Stimmungen, Entitäten (Orte, Personen, Gegenstände) und Textkategorien erkennen. NLP ist mit der Texterkennungsfunktion für Bilder – Optical Character Recognition (OCR) – verknüpfbar. Damit lassen sich Texte in Bildern oder gescannten Dokumenten einfach und sehr genau erfassen. 

Auch in Sachen Übersetzung ist Machine Learning ein echter Sprachkünstler: Die Google Translation API kann jegliche Art von Inhalt in 104 Sprachen übersetzen. Somit ist beispielsweise das Einrichten von internationalen Websites kein Problem mehr. Denn Unternehmen geben häufig viel Geld für Übersetzungsbüros aus, um Texte für verschiedene Märkte zu veröffentlichen. Dass sich dieser Prozess auch automatisieren lässt, zeigt Google mit AutoML Translate – ein Dienst, der die Unternehmenssprache lernt und dann auf neue Übersetzungen anwenden kann. Die verschiedenen, vortrainierten und vor allem optimierten Machine Learning Modelle können mit eigenen Daten angelernt werden, sodass selbst die eigenen Unternehmenssprache und Fachbegriffe in über 100 Sprachen übersetzen werden. Dabei genügt es auch, die Maschine mit 20-50 Texten (Content-Seiten, Anschreiben, Briefen, etc.) in einer Sprachrichtung anzutrainieren. Das Training dauert nur zwei Stunden und das Modell kann danach umgehend eingesetzt werden. 

Weiteren Support auf Websites, im Service Center oder auch am Arbeitsplatz leisten Chatbots. Google eröffnet mit Dialogflow Enterprise Unternehmen große Flexibilität einen eigenen Chatbot zu betreiben und sprachbasierte Chat-Interfaces zu entwickeln. Dabei handelt es sich um mehr als eine API. Dialogflow Enterprise enthält weitere Werkzeuge zur Analyse oder auch vorgefertigte Chat-Agenten. Zur Entwicklung eines eigenen Chatbots geben Entwickler vor, was Nutzer sagen könnten. Die Software generiert dazu ein passendes Modell und lernt, welche Aktionen auf welche Anfragen hin ausgeführt werden sollen. Die Bots verfügen über ein Verständnis wie man es vom Google Assistent oder Google Home kennt.

Strukturierte Daten erkennen und Prozesse optimieren

Dem Wirtschaftsmagazin Forbes nach sind 80 Prozent der Unternehmensdaten immer noch unstrukturiert. Indem unstrukturierte Daten in strukturierte Daten umgewandelt werden, erhalten Entscheider wichtige Einblicke in Unternehmensabläufe, können die betriebliche Effizienz optimieren und die Kundenzufriedenheit steigern. Document AI unterstützt Unternehmen bei der Digitalen Transformation, indem es Papier- und digitale Dokumente erfasst, klassifiziert, und visualisiert. Die Technologie dahinter ist eine Kombination aus OCR, Natural Language und Knowledge Graph.

Die Google Cloud Inference API ist ein hocheffizientes System, das es sowohl Entwicklern als auch Unternehmen erleichtert, einen Datensatz bestehend aus mehreren Datenquellen zu indizieren, zu laden und schnell Erkenntnisse aus typisierten Zeitreihendatensätzen zu gewinnen. Es ist vollständig in den Google Cloud Storage integriert und kann Datensätze mit einer Größe von mehreren zehn Milliarden Ereignisdatensätzen verarbeiten. Wenn Nutzer darüber hinaus Zeitreihendaten im Cloud Storage speichern, können sie die Cloud Inference API nutzen, um mit der Erstellung von Vorhersagen zu beginnen. Besonders nützlich ist dies etwa, um Datenanomalien zu erkennen, Korrelationen mit Sensordaten in Echtzeit zu ermitteln und auch hochwertige Empfehlungen ableiten zu lassen. 

Stark personalisierte Produktempfehlungen, passende Newsartikel oder empfohlene Inhalte liefert Google schon seit Jahren über führende Kanäle wie Google Ads, die Google-Suche und YouTube. Recommendations AI nutzt diese Erfahrung, um an allen Touchpoints den Kunden entsprechende personalisierte Empfehlungen umzusetzen.

Fazit

Insgesamt betrachtet, ist Machine Learning also keine Zauberei, sondern die selbst lernende Automatisierung von gleichförmigen Arbeitsschritten. Der Einsatz birgt zunächst einmal einige Herausforderungen. Dennoch sollten Unternehmen auf maschinelles Lernen, Deep Learning und künstliche Intelligenz setzen, um Geschäftsprozesse zu vereinfachen, automatisieren und auch zukünftig noch wettbewerbsfähig zu bleiben. Für eine erfolgreiche Implementierung von Machine-Learning-Anwendungen ist neben den technologischen und organisatorischen Voraussetzungen auch eine gewisse mentale Einstellung und Offenheit seitens der Geschäftsführung erforderlich.

Als erster Google Partner mit der Spezialisierung für Machine Learning in Deutschland findet TWT für Ihren Anwendungsfall die richtige Lösung.