Seminar Document Engineering HT 2004
Themen
1.1 Langzeitarchivierungsaspekte im Dokumentenlebenszyklus
Phasen und Werkzeuge im Dokumentenlebenszyklus
Einfluss auf die Langzeitarchivierung (Wahl der Formate, Anlegen und Weitergeben von Metadaten, Standardisierung)
Allgemeine Literatur zum Dokumentenmanagement
z.B. Jürgen Gulbins, Dokumenten-Management, Springer, 2002
Seiten der Anbieter von DMS/Archivierungssystemen (Begriff: ILM - Information Lifecycle Management)
z.B. ECM
1.2 Aufbewahrungs- und Dokumentationspflichten
Domänen, in denen diese Pflichten vorkommen (national und international)
Sind technische Anforderungen formuliert? In welcher Form?
Wie könnten techn. Lösungen aussehen (grobe Architektur)
Sabine Dauen, Aufbewahrungspflichten, Haufe Verlag, 2004
Seiten der Anbieter von Archivierungssystemen
1.3 Betreiber-/Outsourcing-Modelle für Dokumentenmanagement und Archivierung
Szenarien für Anwendung dieser Modelle (privater Auftraggeber/ öffentlicher Auftraggeber)
Welche Leistungen (Infrastruktur, Dienste) sind hierfür geeignet?
Wie sieht der Anbietermarkt aus?
Wie könnte ein Kostenmodell aussehen?
Peter Bräutigam, IT-Outsourcing, Schmidt, 2003 (u. ä.)
Heike Koch, Olaf Jöptner, ASP: Mehr als nur Mietsoftware, Hessisches Ministerium für Wirtschaft, Verkehr und Landesentwicklung, 2002
2.1 Metadatenmodelle
Metadatenmodelle (DC, LOM, MARC, ...)
Zweck, Syntax, Semantik, Anpassungsmechanismen, Abhängigkeiten von anderen Modellen, Standards
Erstellung einer Synopse (Wahl geeigneter Vergleichseigenschaften)
Was ist wichtig für eine langfristige Reproduktion von Dokumenten?
2.2 Extraktion expliziter Metadaten
Welche Metadaten können in wichtigen Dateiformaten (PDF, TIFF, MS-Word, ...) gespeichert werden?
Gibt es Erweiterungsmgölichkeiten?
Werkzeuge zur Analyse und Extraktion (Jhove, file, ...)
Welche Metadaten könnten für die langfristige Reproduktion der Inhalte wichtig sein?
www.adobe.com
Handbuch file
hul.harvard.edu/jhove/jhove.html
3.1 Methoden zur Analyse natürlichsprachlicher Texte
Darstellung der Grundkonzepte der Methoden
Darstellung der Anwendungszwecke (Rechtschreibprüfung, Generierung von Zusammenfassungen, Generierung semantischer Links, Übersetzungen, ...)
Reginald Ferber, Information Retrieval - Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003
www.kuenstliche-intelligenz.de/Thema/ServiceText-Mining.htm (Literaturhinweise, Links)
3.2 Methoden zur Klassifikation von Dokumenten
Diskussion des Begriffs Klassifikation
Darstellung grundsätzlicher Methoden
Die Rolle von Ontologien im Klassifikationsprozess
Sprachen und Werkzeuge (Topic Maps, RDF, OWL, ...)
Grenzen der Methoden
Reginald Ferber, Information Retrieval - Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003
www.kuenstliche-intelligenz.de/Thema/ServiceText-Mining.htm (Literaturhinweise, Links)
www.topicmaps.org
www.w3c.org (RDF, OWL)
Ching Kang Cheng, Xiao Shan Pan, Franz Kurfess, Ontology-based Semantic Classification of Unstructured Documents, Department of Civil and Environmental Engineering Stanford University, www.stanford.edu/~xpan/Cheng-Pan-Kurfess-2003.pdf
R. Wilkinson, A. F. Smeaton, Automatic link generation, doi.acm.org/10.1145/345966.346024
A. Macedo and M. Pimentel and J. Guerrero, Latent Semantic Linking over Homogeneous Repositories, portal.acm.org/citation.cfm?id=502209&coll=portal&dl=ACM&ret=1#Fulltext
A. Fentechi, S. Gnesi,G. Lami, A. Maccari, Application of Linguistic Techniques for Use Case Analysis, 10th Anniversary IEEE Joint Int. Conf. on Requirements Engineering, 2002
K. Böhm, G. Heyer, U. Quasthoff, C.Wolff, Topic Map Generation Using Text Mining, J. UCS, 2002
C. Biemann, U. Quasthoff , K. Böhm and C. Wolff, Automatic Discovery and Aggregation of Compound Names for the Use in Knowledge Representations, J. UCS, 2003
www.topicmaps.org
www.w3c.org
4.1 Fontmanagement
Einordnung von Schriftarten in Typografie
Darstellung grundsätzlicher Eigenschaften von Schriftarten
Technische Realisierung in Betriebssystemen und wichtigen Dateitypen (auch Grafikformate)
Migrationsrelevante Aspekte (von Betriebssystem zu Betriebssystem, von Dateityp zu Dateityp)
Archivierungsrelevante Aspekte (Reproduktion, Authentizität, Weiterverarbeitung)
www.wikipedia.de (Typographie)
www.dante.de (Latex: Metafonts, Font Types ...)
coli.lili.uni-bielefeld.de/~eva/ Textgestaltung/01_Latex_Einfuehrung/einfuehrung.pdf
www.adobe.com (PS, PDF, Distiller)
Handbücher dvips, ps2pdf, sonst. Konvertierungstools, Betriebssysteme (Windows, Unix/Linux, MacOS)
4.2 Dynamische Inhalte und Formate
Darstellung der wesentliche Konzepte von XSL
Vergleich mit anderen Methoden: "generisches" Markup (Latex), CSS
Archivierungsrelevante Aspekte
www.w3c.org
www.dante.org
Seminar Document Engineering HT 2004 - Prof. Dr. Uwe M. Borghoff
Name | Vortrag / Ausarbeitung | Winf/Inf |
Thema
|
|||
Oesterreich Dominik |
[pdf] / ---
|
dominik.oesterreich@unibw-muenchen.de |
Inf
|
1.1
|
Langzeitarchivierungsaspekte im Dokumentenlebenszyklus | 22.11.2004 |
Aßhauer Alexander | alexander.asshauer@unibw-muenchen.de |
Winf
|
1.2
|
Aufbewahrungs- und Dokumentationspflichten | 22.11.2004 | |
Müller Thomas |
|
thomas.mueller@unibw-muenchen.de |
Winf
|
1.3
|
Betreiber-/Outsourcingmodelle für Dokumentenmanagement und Archivierung | 22.11.2004 |
Stahr Jörg |
[pdf] / ---
|
joerg.stahr@unibw-muenchen.de |
Winf
|
2.1
|
Metadatenmodelle | 29.11.2004 |
Seibert Thomas | thomas-armin.seibert@unibw-muenchen.de |
Winf
|
2.2
|
Extraktion expliziter Metadaten | 29.11.2004 | |
Schulz Jörn-Hendrik |
|
joern-hendrik.schulz@unibw-muenchen.de |
Winf
|
3.1
|
Methoden zur Analyse natürlichsprachlicher Texte | 06.12.2004 |
Jung Matthias |
|
matthias.jung@unibw-muenchen.de |
Winf
|
3.2
|
Methoden zur Klassifikation von Dokumenten | 06.12.2004 |
Boehnke Michael |
[pdf] / ---
|
michael.boehnke@unibw-muenchen.de |
Winf
|
4.1
|
Fontmanagement | 13.12.2004 |
Busch Dennis |
[pdf] / ---
|
dennis.busch@unibw-muenchen.de |
Winf
|
4.2
|
Dynamische Inhalte und Formate | 13.12.2004 |
Uhrzeit: 13.00 - 16.00 | ||||||
Ort: Geb. 41 BT 400 Raum 2417 | ||||||
Vorbesprechung nach Vereinbarung: ca. 1 Woche vorher (Ausarbeitung und Vortrag sollten dann weitgehend fertig sein) | ||||||
Ansprechpartner: Peter Rödig, Tel. 2649, Geb. 41 BT 300 Raum 0323, peter.roedig@informatik.unibw-muenchen.de / Themen 3.1 und 3.2 betreut Jan Scheffczyk | ||||||
Themenbeschreibung und Quellen | ||||||
Hinweise und Vorlagen zur Erstellung der Ausarbeitung (21.10.2004) |