En informadiko, datumdensigo (datumkunpremado, datumkunpremado, datenkunpremadodatenkunpremo) estas reduktado (malpliigo) de la volumeno de trakteblaj datumoj por reprezenti difinitajn informojn, uzante malpli grandan kvanton da spaco. La malo de datumdensigo estas nomata «datum-maldensigo».

La spaco, kiun okupas koditaj informoj (datumoj, cifereca signalo ktp.) sen farita kunpremo, estas la produto inter la montrofrekvenco kaj la cifereca detaligeblo. Tial, ju pli da bitoj estas uzataj, des pli vasta estas la grando de la dosiero. Tamen, la detaligeblo venas farita de la cifereca sistemo per kiu oni laboras kaj oni ne povas ŝanĝi la nombron de bitoj laŭvole; pro tio, oni uzas la kunpremon por transsendi la saman kvanton da informo, kiu okupus pli grandan detaligeblon per pli malgranda nombro de bitoj.

La datumdensigo estas partikulara okazo de la kodigo, kies ĉefa karaktero estas ke la rezulta kodo estas pli malgranda ol tiu origina.

La datumdensigo estas bazata fundamente en la serĉado de ripetoj en serioj de datumoj por posta stokado de la datumo kun la nombro de fojoj en kiuj ĝi ripetiĝis. Tiel, por ekzemplo, se en arkivo aperas sekvenco kiel "AAAAAA", okupanta 6 bitojn, tiu estus stokebla simple kiel "6A" kio okupas nur 2 bitojn, en algoritmo RLE (el anglalingva "run-length encoding").

Se paroli pri datumdensigo gravas la du jenaj konceptoj:

  1. Redundo: La mezuro de datumoj, kiuj estas ripetitaj aŭ antaŭvideblaj.
  2. Entropio: La mezuro de novaj aŭ esencaj informoj, kiu estas difinita kiel la diferenco inter la totala kvanto de datumoj de mesaĝo kaj ties redundo.

Vidu ankaŭ

redakti