Stefan Bion: Vornamens-Statistik

Beitrag lesen

Hi Stefan,

Damit wir was lernen - verraetst du uns noch, wie du zu diesen Ergebnissen gekommen bist?

Och, das ist nichts Besonderes; das habe ich eigentlich nur ganz "quick and dirty" auf der Win95-Shell mit sort und einem DOS-awk gemacht:

Zuerst mal habe ich eine Vielposter-Gesamtliste aufgerufen und das Ergebnis per Copy und Paste aus dem Browserfenster in einen Texteditor kopiert, alles außer den Namen gelöscht und als Datei "poster.txt" abgespeichert.

Dann mit folgender Sequenz alles in Kleinbuchstaben umgewandelt, sortiert, die Vornamen herausgefiltert und die Duplikate gezählt:

awk "{print(tolower($0))}" poster.txt sort awk -f count.awk >vornamen.txt

Das Script count.awk:

---- schnipp ----
BEGIN {
  OLDNAME="ZZZZ"
  COUNT=0
}
{
  NAME=$1
  if(NAME!=OLDNAME)
  {
    printf("%4d %s\n", COUNT, OLDNAME);
    COUNT=0;
  }
  OLDNAME=NAME;
  COUNT++;
}
---- schnapp ----

So ungefähr zumindest...

Gruß,
Stefan