Datenkompremierung
Beschreibung / Inhalt
Das Dokument beschäftigt sich mit verschiedenen Techniken der Datenkompression. Zunächst wird die Datenkompression allgemein vorgestellt und es wird erklärt, dass die meisten Dateien einen hohen Grad an Redundanz aufweisen, woraus sich Einsparungen ergeben können. Es wird darauf hingewiesen, dass Mehrzweck-Verfahren gewisse Dateien verlängern müssen, um beliebig kleine Dateien zu vermeiden.
Im zweiten Abschnitt wird die Lauflängenkodierung vorgestellt und erklärt, wie sich wiederholende Zeichenfolgen kodieren lassen. Es werden zwei Beispiele gegeben, eins für eine Textdatei und eins für ein Bitraster.
Im dritten Abschnitt wird die Kodierung mit variabler Länge vorgestellt. Es wird darauf hingewiesen, dass herkömmliche Verfahren unpraktisch sind, wenn Zeichen oft wiederholt werden. Es wird eine Methode vorgestellt, bei der häufig verwendeten Buchstaben kürzere Bitfolgen zugewiesen werden. Es wird auch ein Trie vorgestellt, der eine eindeutige Decodierung garantiert. Die Huffman-Kodierung wird als Methode zur Bestimmung eines minimalen Huffman-Codes für eine gegebene Zeichenfolge vorgestellt.
Im vierten und letzten Abschnitt wird erklärt, wie man den Huffman-Code aufbaut. Es wird ein Beispiel gegeben, bei dem die Häufigkeiten der Buchstaben in einer Zeichenfolge ermittelt und in einem Feld eingetragen werden. Es wird erklärt, wie man ein Trie aufbaut und wie man darin Knoten mit niedriger Häufigkeit zusammenfasst. Es wird darauf hingewiesen, dass Knoten mit geringer Häufigkeit weit unten und Knoten mit hoher Häufigkeit weit oben im Baum platziert werden sollten.
Direkt das Referat aufrufen
Auszug aus Referat
1) Datenkompremierung (File Compression): Dieser Algorithmus behandelt in erster Linie die Platzreduzierung und erst in zweiter Linie behandelt er die Zeitreduzierung. Diese Technik heißt auch Kodierungsmethode. Im allgemeinen haben Dateien einen hohen Grad an Redundanz. Die Verfahren die wir untersuchen sparen Platz weil die meisten Dateien einen relativ geringen Informationsgehalt haben Einsparungen kann man bei einer Textdatei von 20 bis 50 haben, jedoch bei einer binären Datei hat man Einsparungen von 50 bis 90 . Doch es gibt auch Datentypen bei dem man nur wenig einsparen kann, solche die aus zufälligen Bits bestehen. Tatsächlich ist es so, daß Mehrzweck-Verfahren gewisse Dateien verlängern müssen, den sonst könnte man das Verfahren wiederholen und dadurch beliebig kleine Dateien erzeugen. 2) Lauflängenkodierung (Run-Length Encoding): Man spricht hier von einen Lauf (run) dann, wenn sich lange Folgen sich wiederholender Zeichen darstellt. Siehe dieses Bsp sprich 1.Metode: AAAABBBAABBBBBCCCCCCCCDABAAABBBBCCCD Diese Zeilenfolge kann viel Kompakter kodiert werde, indem man die wiederholenden Zeichen nur einmal angibt und die Anzahl der Wiederholungen davor schreibt. Also würde dann unser Bsp. kodiert so aussehen: 4A3B2A5B8CDABCB3A4B3CD Bei einem Bitraster würde die Lauflängenkodierung so aussehen: 2. Methode oder Bsp.: 000000000000000000000000000111111111111111000000000 28 14 9 000000000000000000000000001111111111111111110000000 26 18 7 ...
Direkt das Referat aufrufen
Autor:
Kategorie:
Sonstiges
Anzahl Wörter:
1317
Art:
Fachbereichsarbeit
Sprache:
Deutsch
Bewertung dieser Hausaufgabe
Diese Hausaufgabe wurde bislang noch nicht bewertet.
Bewerte das Referat mit Schulnoten