Facebook ist immer wieder ein Quell der Belustigung für mich, speziell wenn es um SEO-Themen geht wird es immer abstruser, wie ein Posting in der Alexa Developer Gruppe zeigt. Nicht nur das Google erst Ende letzten Jahres seinen neuen Spracherkennungsalgorithmus BERT vorgestellt hat, jetzt zieht der chinesische Konkurrent Baidu nach und stellt seinen Spracherkennungsalgorithmus ERNIE vor. Im SEO Südwest Blog wird das Ganze sehr detailliert vorgestellt. Quintessenz aus dem Post ist, dass Baidus ERNIE Googles BERT im GLUE Test schlägt.
GLUE steht hier für General Language Understanding Evaluation. Das ist eine Vergleichsmethode, um die Spracherkennung von K.I.-Systemen für menschliche Sprache zu beurteilen. Hier ein Versuch zur Einordnung, während ein Mensch auf der GLUE 100 Punkte-Skala gerade mal nur auf 87 Punkte kommt, gelang es ERNIE auf 90 Punkte zu kommen. Der Erfinder dieses Sprachmodells haben mit ihrer Namensgebung eine gehörige Portion Humor bewiesen. Denn eigentlich ist der Name doch arg konstruiert. ERNIE steht für „Enhanced Representation through kNowledge IntEgration“, also streng genommen eher für ERTKI und nicht ERNIE.
Aber wie in der Sesamstraße auch, hatte Ernie immer am Schluss das Lachen über Bert. Das ERNIE Modell ist in der Lage besser den Sinn von Sätzen zu erfassen. BERT versucht ganz nüchtern in Sesamstraßen-Bert-Manier, über statistische Wahrscheinlichkeiten, eine Vorhersage eines fehlenden Wortes zu treffen. ERNIE versucht den Sinn nicht nur an Hand eines fehlenden Wortes, sondern gleich von mehreren hintereinander liegenden Wörtern zu erkennen. Sprich, die zu erratene Lücke im Text ist größer.
So funktionieren die Methoden im Detail
Das Beispiel von SEO-Südwest war so einfach und treffend, dass ich es kopieren musste. Ich hoffe das ist für Christian Kunz so ok?
Beide NLU Methoden beruhen darauf, die Worte, die vor und nach einem zu erkennenden Wort stehen, mit zu berücksichtigen. So können beide Systeme leichter die Mehrdeutigkeit von Wörtern erkennen.
Die Bedeutung des Wortes „Bank“ ergibt sich erst aus dem Kontext in dem es verwendet wird. In der Grundschule nannten wir solche Wörter Teekesselchen und haben daraus ein Ratespiel gemacht, bei dem die Spieler, anhand einer Umschreibung erraten mussten, um welches Teekesselchen sich handelt. Für germanische und romanische Sprachen scheint der Google-Ansatz recht gut zu funktionieren. Für Symbolsprachen, wie es das chinesische Mandarin ist, eignet sich diese Methode eher weniger. Da hier einzelne Bildsymbole unterschiedliche Bedeutungen haben und man hier noch granularer, den Sinnzusammenhang, anhand der Symbole erkennen muss. (Hoffentlich erschlägt mich kein Ostasienwissenschaftler, wenn ich das so erkläre.)
Beispiel:
BERT würde eine Maskierung wie die folgende verwenden:
„__ Mann geht in den __, um sich Schuhe zu __.“
Bei ERNIE könnte das so aussehen:
„Ein Mann geht __ __ __, um sich Schuhe __ __.“
ERNIE ist weit überlegen
Die Baidu NLU Methode geht neben der Worterkennung eines einzelnen Satzes sogar hinaus und ist in der Lage auf Absatzebene logische Pfade zu erkennen. Dies gelingt in dem ERNIE auch die Reihenfolge und Abstände der Sätze zueinander mitberücksichtigt. Es verfügt zudem über eine „Continous Training“ Methode, die es dem System erlaubt, ständig dazu zu lernen, ohne das zuvor gelernte zu vergessen. Baidu nutzt ERNIE um seinen eigenen Sprachassistenten Xioa zu verbessern.
Die genaue Funktionsweise wurde in dieser wissenschaftlichen Arbeit veröffentlicht. ERNIE soll demnach in der Lage sein ähnliche Texte zu erkennen, Fragen zu beantworten und eine Sentimentanalyse soll auch damit möglich sein. Also die emotionale Einordnung von Texten. ERNIE setzt auf einer Kombination von Vorab-Trainings und Feinabstimmung.
Fazit
Ich finde es höchst spannend was gerade auf dem Feld der Spracherkennung passiert. Mal schauen ,wie schnell die anderen großen Player auf dem Feld, wie Google, Amazon und Apple, diese Methode für ihre Sprachassistenten adaptieren. Wir gehen gerade mit Siebenmeilenstiefeln der Singualrität entgegen.
Hallo, ich bin der Gründer dieses Blogs. Am Anfang habe ich hier nur über SEO-Themen und Suchmaschinen geschrieben. Jetzt schreibe ich hier zusätzlich noch über Technik Themen und andere Dinge, die mich interessieren. Wenn ich Dich inspiriert habe, oder Du Hilfe bei einem Onlinemarketing Thema benötigst, scheue Dich nicht mich zu kontaktieren.