Decoded©

  • Gensim: Die Python-Bibliothek für Topic-Modelling

    Gensim ist eine Open-Source-Bibliothek für die Verarbeitung natürlicher Sprache (NLP) in Python, deren Ziel es ist, die Themenmodellierung (topic modelling) so einfach und effizient wie möglich zu gestalten. Zunächst ist es wichtig zu verstehen, was Themenmodellierung ist. Es ist eine sogenannte „unüberwachte“ Machine-Learning-Technik, die automatisch Textsammlungen analysiert, um die wichtigsten Themen herauszuarbeiten. Die Funktionsweise von […]

    Weiterlesen
  • Data Manager Gehalt: Wie hoch ist das Gehalt eines Datenmanagers?

    Data Manager Gehalt: Das Gehalt eines Data Managers hängt von seiner Branche, seiner Erfahrung, seiner geografischen Region und seinen zusätzlichen Fähigkeiten ab. Erfahre alles, was du wissen musst, in diesem umfassenden Leitfaden!

    Weiterlesen
  • Apache Flume: Was ist das? Wozu dient es?

    Alle Unternehmen, unabhängig von ihrer Größe oder Branche, verwenden Log-Dateien, um alle Ereignisse, die auf dem Webserver stattfinden, zu protokollieren. Aber im Zeitalter der Digitalisierung werden diese Ereignisse immer zahlreicher. Die Logs speichern dann eine exponentiell wachsende Menge an Daten. Um all diese Daten zu verarbeiten, brauchen Netzwerkadministratoren und DevOps leistungsfähige Werkzeuge. An dieser Stelle kommt Apache Flume ins Spiel. Worum handelt es sich dabei? Was sind seine Vor- und Nachteile? In diesem Artikel findest du alle Antworten.

    Weiterlesen
  • Resampling: Eine Methode zum Datenabgleich

    Unausgewogene Daten sind beim Machine Learning sehr häufig anzutreffen. Leider machen sie die vorausschauende Analyse komplexer. Um diese Datensätze auszugleichen, wurden verschiedene Methoden . Dazu gehört auch das Resampling.

    Weiterlesen
  • Wie verändert Data Science die Finanzwelt?

    Data Science stellt die Finanzwelt auf den Kopf. Finde heraus, wie Data Science in dieser Branche eingesetzt wird und wie man Finanz-Data Scientist wird.

    Weiterlesen
  • Gesundheitsdatenanalytik oder Healthcare Data Analytics: Was ist das?

    Healthcare Data Analytics ist die Analyse von Gesundheitsdaten, die vom medizinischen Sektor generiert werden und massiv zur Verbesserung der Versorgung und klinischen Ergebnisse beiträgt. Entdecken Sie alles, was Sie über diese Revolution wissen müssen: Datentypen, Analysemethoden, konkrete Anwendungen… Hier erfährst Du, wie Data Science die moderne Medizin neu definiert!

    Weiterlesen
  • Was sind Self-Organizing Maps (SOM)? Funktionsweise & Einsatzgebiete

    Self-Organizing Maps, oder SOM, sind eine Art von künstlichen neuronalen Netzen (ANN), die für das unüberwachte Lernen genutzt werden. Sie ermöglichen die Reduzierung der Daten-Dimensionalität, während ihre topologische Struktur erhalten bleibt, und sind somit ein mächtiges Werkzeug für das Clustering und die Datenexploration.

    Weiterlesen
  • Web Scraping: Theorie und Anwendung für jedermann

    SQL oder „Structured Query Language“ ist eine Programmiersprache, die heutzutage für die Verwaltung von Datenbanken fast unverzichtbar ist. (Um das SQL-Memoblatt zu finden, Klicke hier). In einer Welt, in der Daten eine eigenständige Ressource sind, ist es leicht zu verstehen, warum die Fähigkeit, diese Sprache zu verwenden, eine sehr gefragte Fähigkeit ist.

    Weiterlesen
  • ChatGPT: Wie funktioniert der NLP Algorithmus ?

    Du hast bestimmt schon von ChatGPT gehört, dem Tool, das all deine Fragen in Echtzeit beantworten kann? Es wird Ende 2022 eingeführt und scheint den Bereich der künstlichen Intelligenz zu revolutionieren. Wir erzählen dir mehr darüber!

    Weiterlesen
  • DeepSeek vs. ChatGPT: Welche KI performt besser?

    DeepSeek und ChatGPT erheben sich mittlerweile als zwei Schwergewichte im Bereich der künstlichen Intelligenz. Doch worin unterscheiden sie sich konkret – in Bezug auf Zugänglichkeit, technische Leistungsfähigkeit und kreative Anwendungsmöglichkeiten? Und vor allem: Welches Modell solltest Du für Deine Projekte wählen? In diesem Artikel vergleichen wir beide Referenzmodelle systematisch, damit Du eine fundierte Entscheidung treffen kannst.

    Weiterlesen
  • Fremdschlüssel SQL: Ein unentbehrliches Verteidigungssystem

    Fremdschlüssel SQL: Wer ein SQL-Datenbankverwaltungssystem entwirft, tut gut daran, das Fremdschlüsselsystem zu kennen und zu implementieren. Langfristig wird er davon profitieren.

    Weiterlesen
  • Beautiful Soup: Einführung in Web Scraping mit Python

    Als User im Internet hat man Zugang zu vielen Informationen, die sich auf Kunden, Angebote, Aktienkurse, physikalische Phänomene usw. beziehen. Diese Daten können von Nutzern gelesen werden, aber man würde sie gerne auswerten, indem man sie in ein brauchbares Format umwandelt, um sie dann zu analysieren und daraus Nutzen zu ziehen. Web Scraping ist die Technik, die es ermöglicht, diese Informationen in ein Format zu bringen, das von Computerprogrammen genutzt werden kann. Wir werden in diesem Artikel herausfinden, wie man sie mit Beautiful Soup durchführen kann.

    Weiterlesen