csv Datei von Duplikaten befreien / Neue Frage von Pit, 16.01.2020 15:06

Beitrag lesen

csv Datei von Duplikaten befreien / Neue Frage

Pit 16.01.2020 15:06

Hallo nochmal,

nachdem das Entfernen von Duplikaten, Triplikaten, Quadrokaten und dergleichen mehr nun wunderbar funktioniert, habe ich festgestellt, dass mein Problem doch etwas tiefgreifender ist:

Oft sind es gar keine echten Duplikate, die mich in den csv-Dateien stören. Denn für meine Nöte sind eigendlich nur 2 Felder der csv-Datei zuständig, also hier zum Beispiel Feld2 und Feld3. D.h., wenn Feld2 und Feld3 einer Zeile mit Feld2 und Feld3 einer anderen zeile identisch sind, würde ich gerne beide Datensätze aus der Datei entfernen.

Feld1|Feld2|Feld3|Feld4|Feld5
Feld1|Feld2|Feld3|Feld4|Feld5
Feld1|Feld2|Feld3|Feld4|Feld5
Feld1|Feld2|Feld3|Feld4|Feld5
Feld1|Feld2|Feld3|Feld4|Feld5
...

Gibt es da eine intelligente und performamnte Lösung, ohne alle Datensätze iterieren zu müssen oder falls nicht, wie stellt man sowas dann trotzdem möglichst effizient an?

Pit

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Pit: csv Datei von Duplikaten befreien / Neue Frage

Beitrag lesen

csv Datei von Duplikaten befreien / Neue Frage

csv Datei von Duplikaten befreien

Kommt drauf an...

csv Datei von Duplikaten befreien / Neue Frage

csv Datei von Duplikaten befreien / Neue Frage und Antwort

NoSQL?

NoSQL? (Korrektur)

Kritik an Deinem Umgang mit Hilfe

Zeilenumbruch in einem CSV-Feld

Zeilenumbruch in einer textarea