Der Martin: Systemkollaps

Beitrag lesen

Hallo Sven,

Musikdateien haben das Problem, dass sie "gleichen Inhalts" sein können, obwohl die MD5-Prüfsumme unterschiedlich ist.
[Bitrate] [ID3-Tags] [...]

das ist natürlich völlig richtig. Und die Beispiele ließen sich beliebig fortsetzen: Das eine mp3-Stück hat vielleicht noch 2s Beinahe-Stille am Anfang; bei einem wurde der Pegel angepasst; ...
Es wäre daher wirklich nützlich, wenn es ein Tool gäbe, das klangliche Ähnlichkeiten von Audiodateien bewerten kann.

Für Bilddateien bin ich gerade dabei, Kriterien und algorithmische Ansätze zu sammeln, mit denen Bilder auf "beinahe gleichen" Inhalt überprüft werden können. Dabei sollen dann durch statistische Verfahren Effekte wie Skalierung, Unterschiese in der Gesamt-Helligkeit, ein eventueller Farbstich oder unterschiedliche (Un)schärfe aus der Bewertung rausfallen. Vielleicht wird ja mal was draus. ;-)

Oder noch schlimmer: Ein MP3 mit ID3 V1.0-Tag und ein MP3 mit denselben MP3-Daten, aber editiertem ID3 V1.0-Tag und eines mit immer noch denselben MP3-Daten, aber ID3 V2.0-Tag zusätzlich.

Das würde ich ausschließen wollen, indem ein Tool, das speziell zum Vergleich von mp3-Dateien dient, die ID3-Tags von vornherein ignoriert (da ich die sowieso meistens lösche, würde sich das Problem bei mir gar nicht ergeben).

Und dann ist danach zu fragen, welche Konsequenz die Entdeckung eines Duplikats hat. Behalten? Warum? Löschen? Warum nicht?

Automatisch: Gar keine Maßnahme ergreifen, nur Ähnlichkeiten auflisten. Ich stelle mir als Resultat eine Liste der bearbeiteten Dateien vor, in der als ähnlich erkannte Dateien zusammen gruppiert sind, evtl. mit einer numerischen Angabe, die auf die Ähnlichkeit schließen lässt (z.B. "98.4% match"). Dann kann ich mir die Dateien innerhalb der Gruppe(n) gezielt ansehen oder anhören und selbst entscheiden, welche ich löschen möchte und welche nicht.

Schönen Sonntag noch,
 Martin

--
Wenn Zeit das Kostbarste ist, was wir haben, dann ist Zeitverschwendung die größte aller Verschwendungen.
  (Benjamin Franklin, amerikanischer Tüftler und Politiker)