Aristoteles (384-322 BCE): Kategorien als "Aussageschemata in Bezug auf etwas Seiendes.
Aristoteles führt mit den Kategorien eine neue Art logischer Ausdrücke ein, die es erlaubt Prädikate
von Subjekten zu unterscheiden und die Prädikate logisch zu klassifizieren. Es geht ihm darum,
grundlegend und vollständig die Formen, nach denen einzelne Wörter sinnvoll zu Aussagen verbunden werden können,
zu bestimmen. Seine Einteilung der Aussageschemata orientiert sich dabei an einfachen, nicht-zusammengesetzten
sprachlichen Ausdrücken wie „Sokrates“, „Mensch“ oder „weiß“. Da Ausdrücke, Begriffe und Bezeichnetes nicht
immer klar unterschieden sind, ist auch eine Lesart möglich, nach der zugleich die Wirklichkeit in Typen
von Objekten und Eigenschaften eingeteilt werden (im Sinne einer Ontologie)."
(Wikipedia)
Kategorien
Grundlage einer Wissensrepräsentation
Ding (substantia)
Größe (quantitas)
Beschaffenheit (qualitas)
Beziehung (relatio)
Ort (ubi)
Zeit (quando)
Lage (situs)
Haben (habitus)
Tun (actio)
Erleiden (passio)
Kategorien
Baum des Wissens als epistemologisches Ordnungssystem
Auf Grundlage der Isagoge des Porphyrius (~270 CE): Hierarchie von Arten/Gattungen (Holzschnitt aus: Boëthius,
Opera varia. Pars I. Venedig 1497).
„Die jeweils höchste Gattung (das summum genus) eines solchen Baumes ist die Kategorie. Sie bestimmt den
höchsten Abstraktionsgrad. Im Gegensatz zu darunter liegenden Ebenen kann die höchste Gattung nicht Art
einer anderen sein. Eine niedrigste Art (infima species) kann im Gegensatz zu darüber liegenden Ebenen
nicht mehr weiter eingeteilt werden. Es handelt sich um einen Individualbegriff.“
(Wikipedia)
Das Semantic Web
Ein „Giant Global Graph“
Quelle: Linking Open Data cloud diagram 2017, by Andrejs Abele, John P. McCrae, Paul Buitelaar, Anja Jentzsch
and Richard Cyganiak. http://lod-cloud.net/
02
Modellierung
Die Welt (und Forschungsdaten) in Begriffe fassen
Grundlagen
Vom „Web of Documents“ zum „Web of Data“
Vorschlag von Tim Berners-Lee: "The Semantic Web is an extension of the current web in which information
is given well-defined meaning, better enabling computers and people to work in cooperation" (Quelle)
Das "Five-Star" LOD Prinzip von Berners-Lee: (Quelle)
★ Stelle Daten im Web unter einer offenen Lizenz bereit. Das Format ist dabei egal
★★ Stelle Daten in einem strukturierten Format bereit
★★★ Verwende offene, nicht proprietäre Formate
★★★★ Verwende URIs um Dinge zu bezeichnen
★★★★★ Verlinke deine Daten mit anderen Daten um Kontexte herzustellen
Grundlagen
Technische Hintergründe
Das Semantic Web baut auf den existierenden Web-Standards (URIs, HTTP, HTML, u.a.) auf
Durch ein standardisiertes Datenmodell (RDF) und eine standardisierte Ontologie (OWL) wird es möglich,
implizite Informationen in und über (Web)Ressourcen zu explizieren, übergreifend miteinander zu verbinden und auch für eine maschinelle Auswertung verfügbar zu machen
RDF ist ein Datenmodell. Es legt nicht fest, in welcher Form es konkret serialisiert wird. Bis heute
haben sich zahlreiche Serialisierungsformate für RDF entwickelt (RDF/XML, Turtle, JSON-LD etc.)
Die Grundeinheit des Semantic Web bildet das Triple. Ein Triple stellt eine Aussage bestehend aus
einem Subjekt, einem Prädikat und einem Objekt dar.
Ein URI besteht nach RFC 3986 aus fünf Teilen:
scheme (Schema oder Protokoll), authority (Anbieter oder Server),
path (Pfad), query (Abfrage) und fragment (Teil).
Nur scheme, authority und path müssen in jedem URI vorkommen.
RDF legt nur ein gemeinsames Modell bzw. eine Syntax für den Datenaustausch fest.
Zur (maschinellen) Interpretation bzw. formalen Beschreibung der in RDF getroffenen
Aussagen werden Vokabulare benötigt. Nur dadurch wird eine maschinelle Auswertbarkeit
möglich.
RDF-Schema (RDFS) stellt ein Vokabular zur Verfügung, mit dem die in einer Fachdomäne vorkommenden
Begriffe und deren Eigenschaften und Relationen modelliert werden können. Mit RDFS lassen sich
einfache Ontologien realisieren.
Enthält ein Vokabular gleichzeitig auch Regeln für die richtige Verwendung der in ihm
definierten Begriffe spricht man von einer Ontologie.
Komplexe Ontologien benötigen eine formale Beschreibungssprache, die ausdrucksmächtiger ist als
RDF-Schema. Hierfür existiert die Web Ontology Language (OWL) des W3C.
Durch die Verwendung von OWL innerhalb einer Ontologie wird es möglich, logische Schlussfolgerungen
auf den Daten auszuführen, die mit dieser Ontologie arbeiten. Hierbei gilt die Open World Assumption:
Ein "Reasoner" nimmt an, dass etwas existiert, solange nicht explizit definiert wurde, dass es nicht existiert.
Einige Fragestellungen, bei deren Beantwortung LOD helfen kann
Welche historischen Personen existieren repositorienübergreifend in welchen spezifischen Kontexten?
Welche kulturellen Objekte existieren zu welchen Zeiten in den verschiedenen Fachdatenkorpora?
Können bestimmte Muster im Auftreten bestimmter historisch-kultureller Phänomene aus den Daten gefolgert werden?
Auf Ebene der Metadaten: Welche geisteswissenschaftlichen Ressourcen beinhaltet ein Repositorium, wie sind diese
strukturiert und in welcher Relation stehen sie zueinander?
Vernetzung und Nachnutzung
LOD für Fachdaten
Fachdaten und/oder Metadaten zu diesen Fachdaten als LOD bereitzustellen ermöglicht
... es Dritten, meine digitalen Ressourcen zu finden.
... einen freien, strukturierten und maschinenlesbaren Zugriff (ggf. zu eigenen Analysezwecken).
... eine standardisierte Bereitstellung der Informationen nach W3C- und ISO-Standards.
... die Daten in einen größeren Kontext zu stellen und Datensilos somit aufzulösen.
Und zwar ohne Kontrollverlust über die eigenen Daten und deren Qualität!