Large-Language-Models (LLM) im Unternehmenseinsatz

Was sind LLMs?

Warum hat es eigentlich so lange gedauert, bis ChatGPT und Co. entwickelt wurden? Sprache verbindet schon immer die Menschen und ist viel mehr als Mittel zur Kommunikation. Dank ihr erfahren wir etwas über die Welt, wir verknüpfen Konzepte und bereiten Handlungen vor. Aber obwohl Sprache so zentral ist, waren die Fähigkeiten von Computern im Umgang mit ihr bisher rudimentär.

Warum? Jedes einzelne Wort  hat eine Bedeutung (kalt, heiß) oder repräsentiert ein Konzept (Unternehmen, Verkehrschaos), das gelernt und verstanden werden muss, bevor es sinngemäß und vor allem sinnvoll eingesetzt werden kann. In Kombination mit anderen Wörtern kann sich die Bedeutung verändern, weitere Bedeutungen schwingen mit, und auch der Kontext spielt eine Rolle dafür, wie etwas verstanden werden muss. Missverständnisse sind häufig. Nur wenn Wörter nach sehr komplexen Regeln kombiniert werden, entsteht auch wirklich eine sinnvolle Aussage.  

Mit der Entwicklung sogenannter Large Language Models (LLM) gibt es jetzt zum ersten Mal in der IT ein leistungsfähiges Modell, das in der Lage ist, Sprache so anzuwenden, dass es Artikel zusammenzufassen, eigene Texte verfassen und sogar Gespräche zu führen kann.

Aus technischer Sicht besteht ein LLM aus einem Deep-Learning Algorithmus, der auf Grundlage von äußerst umfangreichen Datensätzen lernt, wie Sprache funktioniert. Entsprechend vielseitig können diese Modelle eingesetzt werden. Grundsätzlich können sie überall dort helfen oder unterstützend zum Einsatz kommen, wo Schriftverkehr oder verbale Kommunikation stattfindet: Beispielsweise in der Kundenbetreuung, oder als Inspirationsquelle für kreative Tätigkeiten wie etwa im Marketing oder für Texter.

Unternehmen, die von dieser Technologie profitieren wollen, können entweder auf Drittanbieter zugreifen. Der bekannteste ist ChatGPT von OpenAi, oder sich für eine firmeneigene Lösung entscheiden. Letztgenannte bietet mehr Flexibilität, da die AI auf firmenspezifisches Fachwissen eingehen kann und auch damit trainiert wird. Wenn zum Beispiel Produktwissen für den Einsatz eines Chat-Bots wichtig ist, kann damit die Kundenbetreuung nicht nur verbessert, sondern auch extrem beschleunigt werden. Der Chat-Bot arbeitet rund um die Uhr.  Ein weiterer Vorteil: Sensible  Firmendaten werden nicht nach außen übermittelt.

Was braucht es, um eine firmeneigene Lösung zu realisieren? Zum Glück braucht niemand bei Null anzufangen. Man kann auf eine Vielzahl nutzbarer Open-Source-Lösungen zurückgreifen. Eine Liste an empfehlenswerten Lösungen haben wir in folgender Tabelle zusammengestellt. Es gilt aber  die jeweiligen Lizenzen zu berücksichtigen. Wichtig: alle genannten Projekte dürfen im kommerziellen Bereich angewendet werden.

Frei verwendbare Large-Language-Models

Model Referenz Veröffentlichung Lizenz
T5 Model, Paper November 2019 Apache 2.0
Cerebras-GPT Webseite, Paper März 2023 Apache 2.0
Dolly Github, Paper März 2023 MIT
Pythia Github, Paper April 2023 Apache 2.0
GPT-NeoX-20B Model, Paper April 2022 Apache 2.0
FastChat-T5 Model Card Model, Paper April 2023 Apache 2.0
OpenLLaMa Model, Paper Mai 2023 Apache 2.0 *
* OpenLLaMa basiert auf dem geleakten Modell von Facebook (hier Querverweis zu Beitrag über Google). Es ist daher nicht klar, ob die Lizenzierung als Apache 2.0 rechtlich Bestand hält. Hier sollte vor kommerzieller Nutzung rechtlicher Rat eingeholt werden.

Möchten Sie AI in Ihrem Unternehmen einsetzen? Sprechen Sie uns an und wir unterstützen Sie bei der Wahl des richtigen LLM und unterstützen Sie bei allen nötigen Schritten.

Share