hm...: CSV Datei überarbeiten

Beitrag lesen

Moin,

mit diesem code möchte ich ein file erstellen, in welchem nur zeilen drin vorkommen, die eine bestimmte id zweimal im file haben.hat aber ne große laufzeit - habt ihr eine idee, wie ich das mit weniger läufzeit schaffen kann?

Ein Vorteil dürfte sein, wenn du die zweite Datei nicht ständig neu einliest, sondern die Daten im Arbeitsspeicher hälst.
Ich würde das folgendermaßen machen:
   1. beide Dateien in ein mehrdimensionales Array einlesen (2 Felder pro Zeile: id, rest)
   2. IDs vergleichen (Schleifendurchlauf wie oben)
   3. Bei mehrfach auftretender ID entweder nur die IDs oder alles ausgeben (je nachdem wie
      du die gewonnenen Informationen weiterverarbeitest)

Vielleicht hat Perl aber auch ein knuffiges Feature, wie es anders gehen kann, ich bin kein Perl-Entwickler.

Grüße Marco

danke. :)

das array hatte dann 2 millionen einträge, ich werd mir das durch den kopf gehen lassen - perl kenne ich nicht