Trainingsdaten für Chatbots

Fallstudie – Erstellung von IT-Support-Anfragen in Textform zum Training eines Artificial IT Service Desk Agents.

Tausende von Clickworkern formulieren zu vorgegebenen IT-Anwender-Problemfällen mögliche Anfragen an einen IT-Support. Damit entsteht eine Vielzahl von Anfrageformulierungen, die demonstrieren, wie reale Anwender über einen IT-Support-Chat kommunizieren könnten. Mit diesen Texten wird ein Chatbot für den Einsatz als Artificial IT Service Desk Agent optimiert und die Erkennungsrate erheblich gesteigert.

Die Herausforderung

Chatbots greifen in der Regel auf vorgefertigte Wissensdatenbanken zu, in denen Antworten auf diverse mögliche Fragen hinterlegt sind. Die wesentliche Herausforderung bei der Programmierung von Chatbots ist es, die Fragestellungen der Nutzer richtig zu erkennen, in der Datenbank korrekt zuzuordnen und die korrekte Antwort auszugeben oder ggf. Nachfragen zu stellen. AI-Chatbots lernen zudem mit jeder neuen Anfrage dazu. Je mehr Anfragen der Chatbot zu verarbeiten hat, desto besser wird er trainiert. Die Wissensdatenbank wird kontinuierlich erweitert und die Erkennungsmuster der Bots werden präzisiert.

chatbots

Je nach Einsatzgebiet des Chatbots werden Tausende von Anfragen zu den jeweiligen Fachbereichen benötigt, um ihn einsatzbereit zu machen. Darüber hinaus ist eine Vielzahl weiterer Anfragen notwendig, um den Bot dahingehend zu optimieren, eine Erkennungsrate von annähernd 100 % zu erreichen.

Die Lösung

Unsere Clickworker formulieren 500 bereits vorhandene IT-Support-Anfragen in sieben Sprachen um und kreieren so zahlreiche neue Varianten, wie die IT-Anwender mit dem Support-Chat kommunizieren könnten. Jede vorgegebene Anfrage wird in jeweils drei Varianten mit unterschiedlicher Perspektive (neutral, er, sie) umgeschrieben.

Beispiel:

Vorgegebener Satz:„Ich kann mich nicht anmelden.“
Neutral- umformuliert:„Eine Anmeldung ist nicht möglich.“
Er- umformuliert:„Mein Kollege kann sich nicht anmelden.“
„Mein Chef kann sich nicht anmelden.“ oder
„Unser neuer Mitarbeiter kann sich nicht anmelden.“
Sie- umformuliert:„Meine Kollegin kann sich nicht anmelden.“ oder
„Meine Praktikantin kann sich nicht anmelden.“

In einer weiteren Aufgabe formulieren Clickworker Anfragen an einen imaginären IT-Support komplett neu. Hierzu bekommen die Clickworker insgesamt 50 verschiedene Sachverhalte/Problemfälle.

Beispiel:

Der Anwender erhält eine der folgenden Fehlermeldungen:1) „Es liegt kein Benutzerkonto vor.“ oder
2) „Es ist kein Konto vorhanden.“ u.a.

… sowie Beispielsätze vorgegeben, die Anfragen von Mitarbeitern eines Unternehmens an die IT-Support-Einheit wiedergeben.
Je 20 Clickworker formulieren pro Sprache und Sachverhalt jeweils 6 Anfragetexte in der „Ich-Form“, wie sie sie selbst in einem IT-Support-Chat stellen würden, um das genannte Problem zu beschreiben.

Mithilfe dieser zahlreichen möglichen Anfrageformulierungen trainiert der Hersteller des Chatbots diesen speziell für den Einsatz als IT Service Desk Agent und erhöht damit die Erkennungsrate und die Qualität des Bots erheblich.

Mehr zum Service “Trainingsdaten für KI-Systeme

Projektdaten

Aufgabe „Umformulierungen“

Anzahl Tasks: 3.500

Anzahl der umformulierten Sätze: 10.500

Sprachen: DE, ES, EN, NL, NO, SE, DK

Datenübermittlung: Datentransfer via API

Aufgabe „Neuformulierungen“

Anzahl Tasks: 7.000

Anzahl der neuformulierten Sätze: 42.000

Sprachen: DE, ES, EN, NL, NO, SE, DK

Datenübermittlung: Datentransfer via API

Der Arbeitsablauf

  1. Das Projekt wird mit dem Kunden besprochen. Die daraus entstehenden Aufgaben werden definiert und in einem Briefing für die Clickworker festgehalten.
  2. clickworker setzt das Projekt auf und stellt die Aufgaben zur Texterstellung bzw. Anfrage-Umformulierung und -Neuformulierung als einzelne Jobs auf die clickworker-Plattform.
  3. Zahlreiche Clickworker mit entsprechenden Muttersprachen nehmen die Jobs parallel an und erstellen die Texte nach Vorgabe auf dem Workplace von clickworker.
  4. Alle erstellten Texte werden dem Kunden über eine API-Anbindung zur Abnahme übermittelt.

Vorteile

  • Schneller Erhalt von Trainingsdaten
  • Einfacher Zugang zu einer breiten, internationalen Vielfalt an Anfragetexten/Trainingsdaten
  • Einfacher Datentransfer
  • Skalierbarer Durchsatz
  • Flexible Workforce
  • Full-Service