Fortgeschritten

22
Apr

Serie | Database, Data Warehouse & Data Lake – Einführung in NoSQL-Datenbanken

Serie | Database, Data Warehouse & Data Lake – Einführung in NoSQL-Datenbanken NoSQL (englisch für „Not only SQL“) bezeichnet Datenbanken mit einem nicht-relationalen Ansatz zur Speicherung von Daten in einem flexiblen Schema. Dadurch können sowohl strukturierte als auch unstrukturierte Daten effizient gespeichert und genutzt werden, ohne diese in ein bestimmtes Format zu transformieren. Weitere Vorteile von NoSQL-Datenbanken sind eine hohe

Read more

4
Mrz

Serie | Data Science – Entwicklung eines Large Language Modells mit LangChain & OpenAI

Serie | Data Science – Entwicklung eines Large Language Modells mit LangChain & OpenAI Large Language Modelle, wie Chat-GPT, verstehen und generieren menschenähnliche Texte in unterschiedlichen Kontexten. Sie können komplexe Aufgaben wie Übersetzungen, Texterstellung und Problembehandlung bewältigen. Ihr adaptives Lernen ermöglicht es, vielfältige Anfragen zu verstehen und präzise Antworten zu liefern. Allerdings kann beispielsweise Chat-GPT nur die Informationen zur Generierung

Read more

27
Feb

Serie | Data Science – Prompt Engineering in ChatGPT

Serie | Data Science – Prompt Engineering in ChatGPT Einführung Die rasante Entwicklung künstlicher Intelligenz (KI) und natürlicher Sprachverarbeitung (NLP) hat neue Möglichkeiten eröffnet, wie wir mit Technologie interagieren können. Ein Schlüsselelement dieser Interaktion ist das sogenannte “Prompt Engineering“, eine Methode, die entscheidend für die Effizienz und Effektivität von Large Language Models (LLMs) wie ChatGPT geworden ist. Was sind Prompts?

Read more

9
Feb

Serie | Data Science – Das Large Language Model GPT-4

Serie | Data Science – Das Large Language Model GPT-4 OpenAI’s GPT-4-Modell Wie bereits im vorherigen Impuls-Bericht “Large Language Models” unserer Data Science-Serie erläutert, ist OpenAI’s GPT-Modell ein leistungsstarkes KI-Modell, die auf umfangreichen Textdaten mittels selbst-überwachtem (self-supervised), überwachtem (supervised) und verstärkendem (reinforcement) Lernen trainiert wird. Es ist dazu in der Lage, natürliche Sprache zu verstehen sowie zu generieren und wird

Read more

6
Feb

Serie | Data Science – Large Language Models

Serie | Data Science – Was sind Large Language Models? Was sind Large Language Models? Large Language Models (LLMs) sind leistungsstarke KI-Modelle, die auf umfangreichen Textdaten trainiert werden. Sie haben die Fähigkeit, natürliche Sprache zu verstehen und zu generieren. LLMs werden für verschiedene Natural Language Processing (NLP)-Aufgaben eingesetzt, darunter zum Beispiel: Traditionelle Ansätze zur Verarbeitung natürlicher Sprache Traditionelle Ansätze zur

Read more

5
Dez

Serie | Data Governance – Data Mesh vs. Data Fabric: Welche Lösung ist besser für Ihr Unternehmen?

Data Mesh vs. Data Fabric: Welche Lösung ist besser für Ihr Unternehmen? Daten sind das Herzblut jedes modernen Unternehmens, aber sie effektiv zu verwalten, kann eine echte Herausforderung sein. Aufgrund des zunehmenden Volumens, der Vielfalt und der Geschwindigkeit der Daten haben herkömmliche Datenarchitekturen oft Schwierigkeiten, mit den Anforderungen der Datenkonsumenten und -Produzenten zurechtzukommen. Wie können Sie sicherstellen, dass Ihre Daten

Read more

24
Okt

Serie | Microsoft Power Platform – Die passenden Daten für den passenden Datenkonsument

Serie | Microsoft Power Platform – Die passenden Daten für den passenden Datenkonsument Was steckt hinter der Sicherheit auf Zeilenebene (RLS) in Power BI? In der Welt der Datenanalyse und -berichterstattung ist die Datensicherheit von entscheidender Bedeutung. Insbesondere in einem Business Intelligence-Tool wie Power BI, das von Unternehmen weltweit genutzt wird, um wertvolle Einblicke in ihre Daten zu gewinnen. Ein

Read more

26
Sep

Serie | Data Science (ML & AI) – Entwicklung baumartiger Regressionsverfahren zur Prädiktion von Airbnb-Preisen

Serie | Data Science (ML & AI) – Entwicklung baumartiger Regressionsverfahren zur Prädiktion von Airbnb-Preisen Während es im ersten Teil um die Architektur und Funktionsweise von baumartigen Regressionsverfahren ging, folgt nun die praktische Anwendung. Dazu werden ein Regressionsbaum, eine Random Forest Regression sowie eine Gradient Boosting Regression entwickelt, welche die Preise von Airbnb-Unterkünften prädiktieren.   Beschreibung des Datensatzes Der Datensatz

Read more

13
Sep

Serie | Data Science (ML & AI) – Architektur und Funktionsweise von baumartigen Regressionsverfahren

Serie | Data Science (ML & AI) – Architektur und Funktionsweise von baumartigen Regressionsverfahren Entscheidungsbäume eignen sich als Machine Learning Modelle zur Lösung komplexer Klassifikations- und Regressionsprobleme. Zudem bilden Entscheidungsbäume die wesentliche Komponente von Random Forest und Gradient Boosting Verfahren.   Aufbau eines Regressionsbaums Der Wurzelknoten stellt den Beginn des Baums dar und repräsentiert den gesamten Datensatz. Von dort ausgehend

Read more

7
Sep

Serie | Microsoft Power Platform – Parent-child Hierarchien in Power BI zur Abbildung von Organigrammen

Serie | Microsoft Power Platform – Eltern-Kind-Hierarchien in Power BI zur Abbildung von Organigrammen Microsoft Power BI ist häufig das Tool der Wahl für Analysten, die mit Geschäftsdaten arbeiten, die in der Regel in hierarchischen Kategorien wie Organisationsstruktur, Produktfamilien oder Berichtslinien organisiert sind. Die richtige Kategorisierung und Unterscheidung dieser Gruppen verbessert die Tiefe der Analyse erheblich. Diese Datensätze sind durch

Read more