Serie | Data Science – Das Large Language Model GPT-4

OpenAI’s GPT-4-Modell

Wie bereits im vorherigen Impuls-Bericht “Large Language Models” unserer Data Science-Serie erläutert, ist OpenAI’s GPT-Modell ein leistungsstarkes KI-Modell, die auf umfangreichen Textdaten mittels selbst-überwachtem (self-supervised), überwachtem (supervised) und verstärkendem (reinforcement) Lernen trainiert wird. Es ist dazu in der Lage, natürliche Sprache zu verstehen sowie zu generieren und wird für verschiedene NLP (Natural Language Processing)-Aufgaben eingesetzt, darunter beispielsweise:

 

(Eine detaillierte Erläuterung zur Funktionsweise, zum Training, zu Einsatzmöglichkeiten sowie zu den Vorteilen und Herausforderungen von Large Language Models wie GPT-4 kann in unserem vorherigen Large Language Models-Impuls nachgelesen werden.)

 

Wie kann auf das GPT-4-Modell zugegriffen werden?

Um auf das GPT-4-Modell zuzugreifen, besteht eine Möglichkeit darin, die 2022 von OpenAI veröffentlichte Anwendung ChatGPT zu verwenden. (Plus- oder Team-Version von ChatGPT notwendig, mit Basis-Version nur Zugriff auf GPT-3.5-Modell möglich). Durch die Verwendung spezifischer Anweisungen, sogenannter Prompts, wird das Modell angeleitet, die gewünschten Aufgaben zu erfüllen. Folgende Abbildung zeigt beispielhaft die Durchführung einer einfachen Sentimentanalyse mittels ChatGPT:

 

Tiefgehende Datenanalyse mit ChatGPT

ChatGPT von OpenAI hat sich bereits als leistungsstarkes Werkzeug für Textinteraktion und -analyse etabliert. Um die User Experience weiter zu steigern, hat OpenAI nun ein innovatives Feature nahtlos in das Interface integriert. Ursprünglich als „Advanced Data Analysis“ bekannt, ermöglicht diese Funktion eine noch tiefere Interaktion mit dem Sprachmodell, indem Benutzer direkt ganze Dateien in Formaten wie Excel oder CSV hochladen können. Dies geht weit über die vorherige einfache Texteingabe hinaus und eröffnet neue Möglichkeiten für die Datenverarbeitung.

Ein konkretes Beispiel: Ein Marketing-Experte könnte Verkaufsdaten in einer Excel-Datei hochladen, um Trends zu analysieren, Vorhersagen zu treffen oder spezifische Kundenwünsche basierend auf Kaufmustern zu identifizieren. Die Fähigkeit von ChatGPT, solche Dateien nicht nur zu verstehen, sondern auch maßgeschneiderte Analysen durchzuführen sowie Prognosen aufzustellen, transformiert die Art und Weise, wie wir mit Daten interagieren.

 

Anwendungsbeispiel

Um die Funktionalitäten von ChatGPT nochmals zu verdeutlichen, werden diese anhand eines kurzen Beispiels veranschaulicht:

Der vorliegende Datensatz (ca. 80.000 Zeilen) beinhaltet Bewertungen zu verschiedenen Alexa Skills aus dem Alexa Skill Store und besteht aus folgenden Spalten:

  • „skillName“ (Titel des Skills),
  • „content“ (nutzergenerierte Bewertung)
  • „rating“ (1-5 Sterne)
  • „date“ (Datum, an dem die Bewertung abgegeben wurde)

Folgende Tasks sollen nun von ChatGPT im Rahmen der Datenanalyse- und -verarbeitung durchgeführt werden:

  • Untersuchung des Datensatzes auf Umfang, Struktur und Qualität
  • Visualisierung der “Sterne-Verteilung”
  • Entfernen von Zeilen mit leeren Spalten & Sortieren des Datensatzes nach dem Titel des Skills

Die wichtigsten Ergebnisse werden in folgenden Abbildungen veranschaulicht:

Über folgenden Link kann die gesamte Interaktion mit ChatGPT zu den Tasks eingesehen werden (Die Ansicht des erstellten Diagramms und der Download der neu generierten CSV-Datei ist über diesen Link nicht möglich): LINK

 

Fazit

Die Ergebnisse im Rahmen des obigen Anwendungsfalls unterstreichen die Flexibilität von ChatGPT und seine Anpassungsfähigkeit an die oftmals spezifischen Bedürfnisse und Anforderungen von Nutzern. Es ist ein Schritt hin zu einem intuitiveren und effizienteren Datenmanagement, das Fachleuten in verschiedensten Bereichen zugutekommt. Durch die direkte Einbindung dieser fortschrittlichen Datenanalysefunktionen in das Eingabefeld wird die Schwelle für komplexe Datenanalysen deutlich gesenkt. Nutzer profitieren von einer vereinfachten, aber dennoch leistungsstarken Schnittstelle, die ohne umständliche Zwischenschritte direkten Zugriff auf tiefgehende Analysemöglichkeiten bietet.

 

Übersicht der Data Science (ML & AI) Serie:

 

Haben wir Ihr Interesse geweckt? Kontaktieren Sie uns gerne.

Ihre Ansprechpartnerin

Datalytics Mitarbeiter Vorstellung Susanna-Strobl

Susanna Strobl

susanna.strobl@datalytics-consulting.com
+49 178 3984086