Achtung:

Sie haben Javascript deaktiviert!
Sie haben versucht eine Funktion zu nutzen, die nur mit Javascript möglich ist. Um sämtliche Funktionalitäten unserer Internetseite zu nutzen, aktivieren Sie bitte Javascript in Ihrem Browser.

Digital Humanities LAB Show image information
DHd 2020 Show image information
Digital Humanities LAB
W1.101 Show image information
DHd 2020 Show image information
DHd 2020 Alan Liu Show image information
Show image information

Digital Humanities LAB

Photo: Janusz Michla

DHd 2020

Photo: Markus Freudinger, Josua Köhler

Digital Humanities LAB W1.101

Photo: Janusz Michla

DHd 2020

Photo: Markus Freudinger, Josua Köhler

DHd 2020 Alan Liu

Photo: Markus Freudinger, Josua Köhler

|

Dr. Frederik Bäumer präsentiert Arbeit zum Thema Web Mining für B2B CRM-Systeme auf der DATA 2019

Gegenstand der 8. Internationalen Konferenz über Datenwissenschaft, Technologie und Anwendungen (DATA) ist es, Forscher, Ingenieure und Praktiker zusammenzubringen, die an Datenbanken, Big Data, Data Mining, Datenmanagement, Datensicherheit und anderen Aspekten von Informationssystemen und -technologien mit fortgeschrittenen Datenanwendungen interessiert sind.

Dr. Frederik Bäumer und Bianca Buff aus der AG Semantische Informationsverarbeitung (Digitale Kulturwissenschaften) widmen sich in ihrem Use Case dem Informationsbedarf moderner B2B CRM-Systeme, dargestellt anhand eines Unternehmens aus OWL. Hierbei handelt es sich um einen Themenbereich, bei dem es insbesondere auf eine hohe Präzision bei der Extraktion unternehmensrelevanter Informationen ankommt. Auf diesem identifizierten Bedarf aufbauend wird das Potential von Lokalen Grammatiken zur web-basierten Informationsakquise untersucht. Hier besteht eine Herausforderung in der stark schwankenden Qualität, Diversität/Heterogenität der im Web befindlichen Informationen, die es erschweren, relevante Informationen in der Masse an Texten zu identifizieren. Bisher finden unter anderem aus diesem Grund maschinelle Lernverfahren vermehrt ihren Einsatz, die auf Grundlage der Trainingsdaten besser abstrahieren können und somit eine höhere Trefferquote erreichen.

Wie dargestellt werden konnte, eignen sich lokale Grammatiken zur Extraktion unternehmensrelevanter Informationen aus dem Web vor allem dann, wenn die gesuchten Angaben regelmäßig mit einer hohen internen und externen Evidenz einhergehen. Die in diesem Use Case extrahierten Angaben wiesen diese Voraussetzungen auf, allerdings waren die Autoren des Beitrags von der überwiegend miserablen Qualität der im Unternehmenskontext online auffindbaren Texte überrascht.

Die DATA 2019 fand vom 26. bis 29. Juli 2019 in Prag, Tschechien, statt.

Weitere Informationen zur DATA: http://www.dataconference.org

The University for the Information Society