molily: Linux-System friert ein

Hallo Leute,

Eine Off-Topic-Frage ohne Bezug zum Webauthoring - vielleicht weiß trotzdem jemand Rat:

Auf meinem Gentoo-Linux-Rechner kommt es immer mal wieder vor, dass irgendwelche Prozesse Amok laufen und 100% Rechenkapazität beanspruchen. Oder sie lassen den Speicher volllaufen lassen, sodass Teufelskreise entstehen: Es wird viel auf dem Swap operiert, was die ganze Sache durch den Disk-I/O noch langsamer werden lässt. Sehr oft muss ich das verhindern, indem ich sie, sobald ich merke, dass das System langsam wird, mit Strg+Alt+Escape kille.

Allerdings kommt es häufig vor, dass das System regelrecht einfriert und der X-Server überhaupt nicht mehr antwortet. Tastatur- und Mauseingaben werden erst nach Minuten verarbeitet. Ein Killen des Prozesses ist unmöglich. Meistens komme ich da nur heraus, indem ich einen harten Reset mache. Unschön, weil ich damit öfters das Dateisystem verletze und ab und zu »von außen« mit reiserfsck reparieren muss. Und weil dabei immer ungespeicherte Daten verloren gehen.

Jetzt frage ich mich, warum der Kernel es überhaupt zulässt, dass ein Prozess das ganze System lahmlegt und die anderen überhaupt keine Prozessorzeit mehr abbekommen. Unter Belastung wird das ganze System instabil und X unbedienbar. Ich habe mir bisher abgeholfen, alle möglichen Prozesse mit nice -19 auszuführen, aber das ist weder zuverlässig noch eine Dauerlösung.

Gibt es irgendeine Kerneleinstellung oder ein Kernelmodul, mit der sich diese »Prozess-Rechenzeit-Verwaltung« optimieren lässt? Sozusagen ein Modul, das z.B. einem Prozess, der z.B. 10 Sekunden lang aggressiv alle Ressourcen belegt und das System einfrieren lässt, einfach unschädlich macht, ihm alle Rechenzeit entzieht.

Bei Bedarf kann ich gerne die Kernel-Config verlinken.

Mathias

  1. Hallo molily!

    Auf meinem Gentoo-Linux-Rechner kommt es immer mal wieder vor, dass irgendwelche Prozesse Amok laufen und 100% Rechenkapazität beanspruchen. Oder sie lassen den Speicher volllaufen lassen, sodass Teufelskreise entstehen: Es wird viel auf dem Swap operiert, was die ganze Sache durch den Disk-I/O noch langsamer werden lässt. Sehr oft muss ich das verhindern, indem ich sie, sobald ich merke, dass das System langsam wird, mit Strg+Alt+Escape kille.

    Ich habe dasselbe Problem unter Windows XP (drei Jahre alte Installation). Ich habe meistens CyberLink Power Cinema (Fernsehen) laufen, was von vorne herein ca 22% CPU-Leistung benötigt, dazu noch eine Seite, die ich meistens mit Opera im Hintergrund laufen lassen, und alle paar Sekunden neue Infos aus dem Netz lädt. Mit beiden zusammen habe ich im Normalfall eine CPU-Auslastung von unter 30%.

    Die Probleme kommen, wenn ich zum Testen mehrere Browser oder Instanzen davon öffne oder ein speicherauwändiges Programm wie Inkscape oder Corel Draw. Da friert nach 'ner Weile dies und das tun zuerst die XP-Taskleiste ein und ist nicht mehr benutzbar, bis ich die explorer.exe per Taskmanager kille - und es oft mehrere Versuche bedarf, bis ich sie per »neuen Task« wieder zum Laufen bringe.

    Oft spinnt auch irgendein Programm (meistens EditPad, oder SmartFTP) ein, aber ich weiß, dass das Programm nicht schuld ist, sondern einzig und alleine die explorer.exe.

    Zu einer Neuinstallation wie zu Zeiten von Win 95-ME bin ich nicht bereit, weil in meinem Fall sehr zeitaufwändig (nicht die Neuinstallation des OS an sich, sondern das Ganze nachher) und irgendwie sehe ich das auch nicht ein.

    Meistens komme ich da nur heraus, indem ich einen harten Reset mache. Unschön, weil ich damit öfters das Dateisystem verletze und ab und zu »von außen« mit reiserfsck reparieren muss. Und weil dabei immer ungespeicherte Daten verloren gehen.

    Hier friert im schlimmsten Fall der Task Manager ein, so dass nur noch ein Rechner-Abschalten übrig bleibt (ein Herunterfahren über den kaputten Task Manager ist dann nicht möglich, wenn doch, dauert ewig).

    Jetzt frage ich mich, warum der Kernel es überhaupt zulässt, dass ein Prozess das ganze System lahmlegt und die anderen überhaupt keine Prozessorzeit mehr abbekommen. Unter Belastung wird das ganze System instabil und X unbedienbar. Ich habe mir bisher abgeholfen, alle möglichen Prozesse mit nice -19 auszuführen, aber das ist weder zuverlässig noch eine Dauerlösung.

    Bei Windows frage ich mich das nicht, aber es wundert mich, dass auch unter Linux solche Probleme auftreten ;)

    Über Ideen, das Problem ohne Neuinstallation zu lösen wäre ich sicher genau so dankbar wie Du - auch wenn wir nicht vom Selben reden. Ach ja, die Größe der Auslagerungsdatei habe ich bereits reduziert (von 1.5 auf 1 GB -> = ca. Arbeitspeicher) reduziert.

    Viele Grüße aus Frankfurt/Main,
    Patrick

    --
    _ - jenseits vom delirium - _

       Diblom   [link:hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash]
    Achtung Agentur! | Nichts ist unmöglich? Doch! | Heute schon gegökt?
    1. Bei Windows frage ich mich das nicht, aber es wundert mich, dass auch unter Linux solche Probleme auftreten ;)

      Lustigerweise habe ich mit meinem Vista-Rechner solche Probleme überhaupt nicht. Da kann zwar ein Programm Amok laufen, aber es kommt nie dazu, dass die GUI hängt oder ich nichtmal mehr den Taskmanager erreichen kann.

      Mathias

      1. Hallo molily,

        Lustigerweise habe ich mit meinem Vista-Rechner solche Probleme überhaupt nicht. Da kann zwar ein Programm Amok laufen, aber es kommt nie dazu, dass die GUI hängt oder ich nichtmal mehr den Taskmanager erreichen kann.

        Eventuell ist bei der Konfiguration oder beim Kompilieren der Programme etwas schief gelaufen? Eben weil ich solche Probleme nicht haben möchte verwende ich Kubuntu. Da muss man auch nicht so lange warten bis Updates installiert sind. ;-)

        Grüße

        Marc Reichelt || http://www.marcreichelt.de/

        --
        panic("Oh boy, that early out of memory?");
                linux-2.2.16/arch/mips/mm/init.c
        Selfcode: ie:{ fl:| br:> va:} ls:< fo:} rl:( n4:( ss:) de:> js:| ch:? sh:| mo:) zu:)
        1. Eventuell ist bei der Konfiguration oder beim Kompilieren der Programme etwas schief gelaufen?

          Naja, möglich, aber was genau sollte denn schief laufen?
          Es sind ja auch gerne vorkompilierte Pakete wie Firefox oder Binärpakete wie Opera und Sun Java, die das System einfrieren lassen.

          Mathias

        2. Hallo Marc

          Eben weil ich solche Probleme nicht haben möchte verwende ich Kubuntu.

          Ich verwende XP und Ubuntu, und Ubuntu friert mir manchmal vollständig ein.

          Auf Wiederlesen
          Detlef

          --
          - Wissen ist gut
          - Können ist besser
          - aber das Beste und Interessanteste ist der Weg dahin!
          1. Hallo Detlef,

            Ich verwende XP und Ubuntu, und Ubuntu friert mir manchmal vollständig ein.

            Das klingt sehr nach Kernel Panic. Oder aber Probleme mit ACPI, wodurch der Lüfter nicht korrekt angesteuert wird und dadurch das System wegen Überhitzung abgeschaltet wird. Hast du ein Notebook?

            Grüße

            Marc Reichelt || http://www.marcreichelt.de/

            --
            panic("Oh boy, that early out of memory?");
                    linux-2.2.16/arch/mips/mm/init.c
            Selfcode: ie:{ fl:| br:> va:} ls:< fo:} rl:( n4:( ss:) de:> js:| ch:? sh:| mo:) zu:)
            1. Hallo Marc

              Das klingt sehr nach Kernel Panic. Oder aber Probleme mit ACPI, wodurch der Lüfter nicht korrekt angesteuert wird und dadurch das System wegen Überhitzung abgeschaltet wird. Hast du ein Notebook?

              Woran es genau liegt, kann ich nicht sagen, Überhitzung ist es jedenfalls nicht. Es ist ein Desktop-PC, die Lüfter sind direkt mittels Temperatursensoren geregelt, fahren auch ähnliche Drehzahlen wie unter XP, Prozessor- und Gehäusetemperatur sind auch nicht erhöht.
              Das Problem ist wohl Firefox, nur wenn er eine Weile offen ist, mehrere Tabs, dann reagiert er nicht mehr, und kurze Zeit später auch sonst nichts mehr. Eine Konsole kann ich dann noch öffnen, zeigt auch an, was ich tippe, reagiert ansonsten aber auch nicht.

              Ich wollte auf dein Posting nur darauf hinweisen, dass man mit einer Distribution wie Ubuntu auch nicht sicher vor einfrierenden Rechnern sein muss.

              Auf Wiederlesen
              Detlef

              --
              - Wissen ist gut
              - Können ist besser
              - aber das Beste und Interessanteste ist der Weg dahin!
              1. Hellihello

                dass Ubuntu einfriert habe ich jetzt auch schon erlebt. Bei dem einen meine ich, hängt es mit der missglückten Netzwerkkonfiguration zusammen, beim anderen klappt der FF nicht mehr richtig (vergisst Seiten und Passwöter) und kann auch zum Einfrieren führen. Ich fragte mich aber, ob nicht Gnome mitschuld sein könnte. Auf zweiterem, der mit den FF Problemen, gab es mal ein missglücktes upgrade, dessen Folgen aber im Grunde beseitigt werden konnten. Bei ersterem geht die Konsole (strg-alt-backspace bzw. F1, F2 ...) in der Regel aber noch.

                Dank und Gruß,

                frankx

                --
                tryin to multitain  - Globus = Planet != Welt
      2. Hallo molily!

        Lustigerweise habe ich mit meinem Vista-Rechner solche Probleme überhaupt nicht. Da kann zwar ein Programm Amok laufen, aber es kommt nie dazu, dass die GUI hängt oder ich nichtmal mehr den Taskmanager erreichen kann.

        Auf dem Vista-Laptop habe ich bisher keine Probleme, was aber daher rühren kann, dass ich ihn im Grunde nur zum Mail-Abrufen benutze - und zum Testen mit Safari (der hier auf XP nur noch schwarz sieht).

        Auf XP schnellt, bei dem Problem, über das ich im Vorposting angesprochen habe, die CPU auf nahezu 100%, da weiß ich: Zeit, die explorer.exe zu killen, manchmal muss ich auch iexplore.exe (IE) mittels Task Manager ins Bett schicken, wenn ich Glück habe, ist für eine Weile Ruhe ;)

        Viele Grüße aus Frankfurt/Main,
        Patrick

        --
        _ - jenseits vom delirium - _

           Diblom   [link:hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash]
        Achtung Agentur! | Nichts ist unmöglich? Doch! | Heute schon gegökt?
  2. Hello,

    Allerdings kommt es häufig vor, dass das System regelrecht einfriert und der X-Server überhaupt nicht mehr antwortet. Tastatur- und Mauseingaben werden erst nach Minuten verarbeitet. Ein Killen des Prozesses ist unmöglich. Meistens komme ich da nur heraus, indem ich einen harten Reset mache. Unschön, weil ich damit öfters das Dateisystem verletze und ab und zu »von außen« mit reiserfsck reparieren muss. Und weil dabei immer ungespeicherte Daten verloren gehen.

    Jetzt frage ich mich, warum der Kernel es überhaupt zulässt, dass ein Prozess das ganze System lahmlegt und die anderen überhaupt keine Prozessorzeit mehr abbekommen. Unter Belastung wird das ganze System instabil und X unbedienbar. Ich habe mir bisher abgeholfen, alle möglichen Prozesse mit nice -19 auszuführen, aber das ist weder zuverlässig noch eine Dauerlösung.

    hast Du sie wirklich mit  "nice -19 <programmname>" ausgeführt, oder gar mit "nice --19 <programmname>" oder mit "nice -n 19 <programmname>"?

    Hier ist es z.B. mMn nicht richtig beschrieben: http://www.computerhope.com/unix/unice.htm

    Hast Du hinterher mal geschaut, mit welcher Priorität die Prozesse wirklich laufen?
    Wenn Du als User einen falschen Wert eingegeben hast, wird der einfach eventuell ignoriert.

    Du könntest einen weiteren Prozess installieren, der in regelmäßigen Abständen die Last überprüft, Prozesse anhält, die zuviel Rechenleistung beanspruchen und Dich warnt.

    Liebe Grüße aus Syburg bei Dortmund

    Tom vom Berg

    --
    Nur selber lernen macht schlau
    http://bergpost.annerschbarrich.de
    1. hast Du sie wirklich mit  "nice -19 <programmname>" ausgeführt, oder gar mit "nice --19 <programmname>" oder mit "nice -n 19 <programmname>"?

      Mit nice -19.

      Hast Du hinterher mal geschaut, mit welcher Priorität die Prozesse wirklich laufen?

      Mit 19. Bringen tut das aber nicht viel. BOINC läuft z.B. manchmal auf 19 im Hintergrund und ich merke, wenn ein anderes Programm Rechenzeit braucht, dass das System schon zäh läuft. Da muss irgendwas im Argen liegen. In einem solchen Fall hat der 19er-Prozess einfach keine Rechenzeit zu bekommen, sodass X zumindest den Mauszeiger bewegt.

      Du könntest einen weiteren Prozess installieren, der in regelmäßigen Abständen die Last überprüft, Prozesse anhält, die zuviel Rechenleistung beanspruchen und Dich warnt.

      Ja, so ein Programm suche ich. Ich kenne nur »Beenden unkontrollierbarer Prozesse« von KDE. Nur ist das genauso unwirksam wie Strg+Alt+Escape, wenn das System einfriert. Außerdem kuriere ich damit nur die Symptome. Genauso wie damit, ganz normalen Prozessen einen Nice-Wert zu geben...

      Mathias

  3. Hallo,

    Auf meinem Gentoo-Linux-Rechner kommt es immer mal wieder vor, dass irgendwelche Prozesse Amok laufen...

    Konntest Du bisher eingrenzen, welche Prozesse Amok laufen?

    Allerdings kommt es häufig vor, dass das System regelrecht einfriert und der X-Server überhaupt nicht mehr antwortet.

    Das macht die Diagnose natürlich nicht einfacher. Kannst Du evtl. etwas in /var/log/messages erkennen, was zu der Fehlerursache führen könnte?

    Jetzt frage ich mich, warum der Kernel es überhaupt zulässt, dass ein Prozess das ganze System lahmlegt und die anderen überhaupt keine Prozessorzeit mehr abbekommen.

    Normalerweise tut er das nicht, bzw. hat ein security-Modell, nach dem einzelne Prozesse bestimmte Resourcen durch den Scheduler zugewiesen bekommen. Dabei spielen aber mehrere Faktoren eine Rolle: 1. welchen Scheduler verwendest Du? 2. als root kann man u.a. per (re)nice Prozessen zusätzliche Priorität zuweisen.

    Gibt es irgendeine Kerneleinstellung oder ein Kernelmodul, mit der sich diese »Prozess-Rechenzeit-Verwaltung« optimieren lässt?

    Man kann im Kernel teilweise optimieren. Allerdings vermute ich eher, dass Du an anderer Stelle wesentlich mehr optimieren kannst: bspw. kannst Du schauen, welche Dienste, die von init gestartet werden, keinen Nutzen für Dich haben (viele Leute benötigen bspw. netmount idR nicht).

    Des weiteren spielt auch Deine Hardware und deren Treiber eine nicht untergeordnete Rolle - bei X kann insbesondere die Grafikkarte, die bei proprietären Treibern auf Kernel-Ebene angesprochen wird, große Probleme hervorrufen - besonders bei Shared-Memory.

    Bei Bedarf kann ich gerne die Kernel-Config verlinken.

    Ein paar zusätzliche Informationen über Dein System wären außerdem hilfreich, etwa die Ausgabe von "dmesg", Deine xorg.conf und vielleicht noch die Zeilen aus /var/log/messages, bei Denen Du Dir von der Zeit her sicher bist, dass die ungefähr mit einem Amoklauf/Absturz zusammenfallen.

    Gruß, LX

    --
    X-Self-Code: sh:( fo:) ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
    X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
    X-Will-Answer-Email: Unusual
    X-Please-Search-Archive-First: Absolutely Yes
    1. Konntest Du bisher eingrenzen, welche Prozesse Amok laufen?

      Ganz unterschiedlich. Häufig sind es die Firefox und Opera, gerne im Zusammenhang mit dem Flash-Plugin. Gestern war die Java-VM mit XMLMind. Java wurde dann irgendwann, nachdem der Rechner eine halbe Stunde auf Load 18 lief und der Speicher voll war, vom Kernel gekillt: http://pastebin.com/m19cfcf85
      Davor oder danach gabs keine entsprechenden Meldungen.

      Dabei spielen aber mehrere Faktoren eine Rolle: 1. welchen Scheduler verwendest Du?

      I/O Schedulers? »Deadline«.

      bspw. kannst Du schauen, welche Dienste, die von init gestartet werden, keinen Nutzen für Dich haben (viele Leute benötigen bspw. netmount idR nicht).

      Darüber habe ich eigentlich Kontrolle. Im Runlevel default habe ich nur local, boa (ein Webserver, der auf localhost lauscht), net.eth0, netmount, ntp-client, samba, spamd, syslog-ng, vixie-cron und xdm. netmount könnte ich tatsächlich rauswerfen, aber das ist soweit ich weiß bloß ein Init-Script, das keinen Daemon startet.

      Des weiteren spielt auch Deine Hardware und deren Treiber eine nicht untergeordnete Rolle - bei X kann insbesondere die Grafikkarte, die bei proprietären Treibern auf Kernel-Ebene angesprochen wird, große Probleme hervorrufen - besonders bei Shared-Memory.

      Ich habe hier irgendeine GeForce mit dem derzeit proprietären Nvidia-Treiber (x11-drivers/nvidia-drivers 173.14.09). Kein Shared Memory.

      Ein paar zusätzliche Informationen über Dein System wären außerdem hilfreich

      AMD AthlonXP 64 4000+ 2,4 GHz, 1 GB RAM
      Kernel-Ausgabe beim Start: http://pastebin.com/m39196a69
      Kernel-Config: http://pastebin.com/m6f5c69d5

      Mathias