CGI/Perl gegen PHP für MS SQL-Server von Philipp Hasenfratz, 09.05.2003 13:39

SELF-Forum

CGI/Perl gegen PHP für MS SQL-Server

Torsten.E 09.05.2003 09:09

datenbank

– Informationen zu den Bewertungsregeln

Wer hat Erfahrung mit PHP und Perl,
und kann mir sagen, mit was ich besser
für MS SQL-Server programmiere.

CGI/Perl oder PHP ???

Klar soll alles auf einer Linux-Maschine
laufen. (Nein nicht der MS SQL-Server, bin
ja nicht doof).

Ach ja, die Diskussion, warum MS SQL-Server
will ich hier nicht führen, wir wollen doch
alle sachlich bleiben, oder ;-)

Grüße

Torsten

Beitrag melden

– Informationen zu den Bewertungsregeln

CGI/Perl gegen PHP für MS SQL-Server
Philipp Hasenfratz Homepage des Autors 09.05.2003 09:55

datenbank
– Informationen zu den Bewertungsregeln
Halihallo Torsten

Ach ja, die Diskussion, warum MS SQL-Server
will ich hier nicht führen, wir wollen doch
alle sachlich bleiben, oder ;-)

Gerne. Du findest genügend sachliche Information zum Vergleich PHP vs Perl im Archiv.
Sinngemäss gilt alles auch für den Datenbankzugriff: Mach das, was du lieber magst, denn
es gibt keine allgemein akzeptierten Unterschiede.

Viele Grüsse

Philipp
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. CGI/Perl gegen PHP für MS SQL-Server
  
  Torsten.E 09.05.2003 10:07
  
  datenbank
  – Informationen zu den Bewertungsregeln
  Mir ist es halt wichtig herauszubekommen,
  auf welche Pferd ich setzen soll, nicht
  das ich die gleichen Fehler mach,
  die schon viele andere ebenfalls begangen
  haben.
  
  Trotzdem danke Hasenfratz :-)
  
  Torsten.E
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. CGI/Perl gegen PHP für MS SQL-Server
    
    Philipp Hasenfratz Homepage des Autors 09.05.2003 10:52
    
    datenbank
    
    – Informationen zu den Bewertungsregeln
    Halihallo Egeler
    
    Mir ist es halt wichtig herauszubekommen,
    auf welche Pferd ich setzen soll, nicht
    das ich die gleichen Fehler mach,
    die schon viele andere ebenfalls begangen
    haben.
    
    Die einzigen Fehler, die du und andere in diesem Zusammenhang machen können, sind die
    eigenen.
    
    Viele Grüsse
    
    Philipp
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
CGI/Perl gegen PHP für MS SQL-Server
Lude 09.05.2003 13:22

datenbank
– Informationen zu den Bewertungsregeln
Hi,

Wer hat Erfahrung mit PHP und Perl,
und kann mir sagen, mit was ich besser
für MS SQL-Server programmiere.

wir arbeiten mit dem Perlmodul "Win32::ODBC;" also per ODBC mit dem genannten Datenserver. - Die Performance ist m.E. nicht sehr ueberzeugend. - Vielleicht geht's mit PHP besser?

Gruss,
Lude
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. CGI/Perl gegen PHP für MS SQL-Server
  
  Philipp Hasenfratz Homepage des Autors 09.05.2003 13:39
  
  datenbank
  – Informationen zu den Bewertungsregeln
  Halihallo Lude
  
  Wer hat Erfahrung mit PHP und Perl,
  und kann mir sagen, mit was ich besser
  für MS SQL-Server programmiere.
  
  wir arbeiten mit dem Perlmodul "Win32::ODBC;" also per ODBC mit dem genannten Datenserver. - Die Performance ist m.E. nicht sehr ueberzeugend. - Vielleicht geht's mit PHP besser?
  
  Glaube ich kaum, denn das benutzt auch nur die ODBC-Funktionen, evtl. ist es etwas
  schneller implementiert, aber ich glaube nicht, dass man dies merken würde.
  Nun, vielleicht wäre noch ADO zu nennen, das ist evtl. schneller als der ODBC-Layer.
  Kann man sowohl über PHP als auch über Perl ansprechen (bei Perl z. B. über Win32::OLE).
  Wäre IMHO ein Versuch wert...
  
  Viele Grüsse
  
  Philipp
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. CGI/Perl gegen PHP für MS SQL-Server
    
    Andreas Korthaus 09.05.2003 14:42
    
    datenbank
    
    – Informationen zu den Bewertungsregeln
    Hi!
    
    Glaube ich kaum, denn das benutzt auch nur die ODBC-Funktionen, evtl. ist es etwas
    schneller implementiert, aber ich glaube nicht, dass man dies merken würde.
    
    Woher weißt Du das? Im Manual([link.http://www.php3.de/manual/de/ref.mssql.php]) steht nur was von einer "ntwdblib.dll" die man von der mssql-Server CD braucht, dass ODBC vorhanden sein muss sehe ich nirgends. Aber ich kenne MSSQL und dessen PHP-Schnittstelle auch nicht wirklich.
    Vielleicht würde ich in einer kompletten Windows-Umgebung lieber auf ASP setzen?
    
    Grüße
    Andreas
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
    1. CGI/Perl gegen PHP für MS SQL-Server
      
      Philipp Hasenfratz Homepage des Autors 09.05.2003 14:49
      
      datenbank
      
      – Informationen zu den Bewertungsregeln
      
      Halihallo Andreas
      
      Glaube ich kaum, denn das benutzt auch nur die ODBC-Funktionen, evtl. ist es etwas
      schneller implementiert, aber ich glaube nicht, dass man dies merken würde.
      
      Woher weißt Du das? Im Manual([link.http://www.php3.de/manual/de/ref.mssql.php]) steht nur was von einer "ntwdblib.dll" die man von der mssql-Server CD braucht, dass ODBC vorhanden sein muss sehe ich nirgends. Aber ich kenne MSSQL und dessen PHP-Schnittstelle auch nicht wirklich.
      
      Ich wollte lediglich aussagen, dass die Implementation des ODBC-Stubs in PHP wohl nicht
      grossartig schneller sei, als derjenige von Perl, denn beide Layers greifen wohl auf
      (fast) gleiche API's von Win zu. Ich stelle mir vor, dass die direkte Kommunikation mit
      von dir genannter Extension schneller werden könnte, aber ich habe mich nur auf ODBC,
      nicht auf MSSQL bezogen.
      
      Vielleicht würde ich in einer kompletten Windows-Umgebung lieber auf ASP setzen?
      
      Gut möglich dass hier an Performance etwas wett gemacht werden könnte. Schliesslich ist
      bei ASP der Zugriff auf Windows-Komponenten sozusagen implizit und direkt, bei Perl und
      PHP sind es lediglich Extensionen. LAMP vs Win32/IIS/MSSQL/ASP (WIMA?)...
      
      Viele Grüsse
      
      Philipp
      
      Beitrag melden
      
      –
      Informationen zu den Bewertungsregeln
      
      Übersicht
      
      alle Foren
      
      SELFHTML-Forum
      
      anmelden
      
      Benutzerkonto erstellen
      
      Beitrag im Thread-Baum
      1. CGI/Perl gegen PHP für MS SQL-Server
        
        Andreas Korthaus 09.05.2003 22:39
        
        datenbank
        
        – Informationen zu den Bewertungsregeln
        
        Hi!
        
        Naja, ich habe eigentlich auch keine Ahnung wollte es nur bemerkt haben ;-)
        
        Nochmal wegen meines Algorithmus-problems von vor kurzem, ich hatte das noch Stunden später weiter probiert zu optimieren, es ist aber eher schlechter als besser geworden, als ich dann auf einmal durch Umwandlung in INT dachte es geschafft zu haben, da auf einmal 10 mal so schnell, da merjte ich dann nachdem ich das lange Posting fast abgeschickt hätte, dass die Zahlen für INT zu lang waren und in wirklichkeit Negative Zahlen waren die immer sofort beim 1. Daatensatz vertig waren, naja, dann war ich so genervt dfass ich keine Lust mehr hatte, und dann war der Thread irgendwann weg, naja, ich weiß nicht, mit PHP scheint das irgendwie nicht möglich, was mich wundert, ich habe am Ende direkt mit den Pointern gearbeitet, aber das war halt noch langsamer, naja.
        
        $fp = fopen("php_IPs.csv","r");
        fseek ($fp,10);
        while (!feof($fp)) {
        if((float)fread($fp,10)=$dec_ip) {
            break;
        }
        fseek ($fp,14,SEEK_CUR);
        }
        fclose ($fp);
        
        (hatte die Datenstruktur noch stark optimiert:)
        32723878932747239874987DE
        32723878932747239874987US
        ...
        
        Und zum Index, ich _habe_ eine Index über beide IP-Spalten einzelnd, oder beide zusammen gelegt, es brachte nichts. Aber der Cache hat auch glaube ich mein Bild grob verfälscht, denn HEAP war nach langer Pause _erheblich_ schneller als MyISAM.
        
        Wollte es nur eben erklären ;-)
        
        Grüße
        Andreas
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum
        
        IP's von access_log in bestimmtem Zeitfenster extrahieren
        
        Philipp Hasenfratz Homepage des Autors 10.05.2003 14:40
        
        programmiertechnik
        
        – Informationen zu den Bewertungsregeln
        
        Halihallo Andreas
        
        Komme gleich zu dem von dir gesagten, aber ich nutze den Subthread gleich dazu eine
        aktuelle Problematik vorzustellen und hoffe auf etwas Input der Forumer:
        
        Ich habe eine Apache-Access-Log vorliegen, ca. 2GB gross. Nun gilt es aus dieser Datei
        eine neue Datei zu transformieren, welche die _unterschiedlichen_ (aus der Ur-
        sprungsdatei extrahierten) IP's abbildet. Erschwerend kommt hinzu, dass die zu
        IP's nur von einem bestimmten Zeitfenster extrahiert werden sollen. Programmiersprache
        vorzugsweise C (evtl. Perl).
        Frage gleich hier: Wie würdet ihr das möglichst performant umsetzen?
        
        Meine Gedanken:
        Die access-log ist per Definition schon nach der Zeit indiziert, nur sind die Datensätze
        nicht fixer Länge. Ich dachte mir, dass ich trotz dieses Umstandes die Datei als eine
        Datei fixer Datensatzlänge interpretiere und einen Buffer von 32kb anlege. Wenn es nun
        darum geht eine bestimmte Zeit zu selektieren, iteriere ich wie in einem B-Baum über
        die Datei, untersuche den aktuell eingelesenen Buffer auf Newlines und lese alles danach
        in die struct log_entry ein. Falls das extrahierte Datum kleiner als das zu suchende ist,
        wird die nächste Hälfte selektiert, die vorherige wenn das Datum grösser ist. So finde
        ich in dem access_log in etwa log(n)-Zeit das gewünschte Datum (nicht n/2, wenn ich alle
        Daten extrahieren würde). Wenn ich die Position des Start-Entries und des End-Entries
        gefunden habe iteriere ich über die eingeschlossenen log-Entries und extrahiere die IP's.
        Über ein Look-Back-Array von 10'000 IP's finde ich die unterschiedlichen[1] und
        speichere sie in der Ausgabedatei ab.
        
        Meine Frage:
        Habt Ihr mir vielleicht Anregungen? - Verbesserungsvorschläge? - Anmerkungen?
        
        [1] mit einigermassen kleiner Fehlerrate, die tolerabel ist. Alles kleiner 5% Fehler ist
            für die Aufgabenstellung akzeptabel. Die 5% Fehler bezihen sich auf die extrahierten
            IP's von einem Tag. Die 10'000 ist IMHO ausreichend, denn viel mehr werden in einem
            Tag gar nicht gespeichert. Mir ist bewusst, dass die IP's nicht staatisch zugewiesen
            werden, die IP's werden zu bestimmten Zeiten aufgelöst und somit macht es keinen
            Sinn, wenn man mehrmals die selbe IP auflöst, deshalb die Extraktion
            unterschiedlicher IP's.
        
        --- zu dir :-) ---
        
        Nochmal wegen meines Algorithmus-problems von vor kurzem, ich hatte das noch Stunden später weiter probiert zu optimieren, es ist aber eher schlechter als besser geworden, als ich dann auf einmal durch Umwandlung in INT dachte es geschafft zu haben, da auf einmal 10 mal so schnell, da merjte ich dann nachdem ich das lange Posting fast abgeschickt hätte, dass die Zahlen für INT zu lang waren und in wirklichkeit Negative Zahlen waren die immer sofort beim 1. Daatensatz vertig waren, naja, dann war ich so genervt dfass ich keine Lust mehr hatte, und dann war der Thread irgendwann weg, naja, ich weiß nicht, mit PHP scheint das irgendwie nicht möglich, was mich wundert, ich habe am Ende direkt mit den Pointern gearbeitet, aber das war halt noch langsamer, naja.
        
        Verflixte Angelegenheit, was? :-)
        Da ich seit dem 30.04 auch unter den C-Programmierer-Nebies verweile hatte ich mich
        gleich mal an eine Lösung über C gesetzt. Das Ergebnis: Durchschnittlich 0.233ms für
        das Durchsuchen des ganzen Datenbestandes (hatte einfach als Such-IP die letzte
        angegeben). Jedoch glaube ich nicht, dass das relevant ist, da ich 1000 mal iteriert
        habe und jedesmal die Datei geöffnet und geschlossen habe => wurde bestimmt auch
        gecached. Habe auch versuche nur einmal zu iterieren, da bin ich auf 0.3-0.4ms
        gekommen, aber da bin ich mir nicht sicher, wie genau diese Zeitangaben gemessen werden.
        
        (hatte die Datenstruktur noch stark optimiert:)
        32723878932747239874987DE
        32723878932747239874987US
        ...
        
        Hm. Habe als Input auch über Perl transformiert und eine Datei für den wahlfreien
        Zugriff mit fixer Record-Länge erstellt; vereinfacht das Leben mit C :-)
        
        Und zum Index, ich _habe_ eine Index über beide IP-Spalten einzelnd, oder beide zusammen gelegt, es brachte nichts. Aber der Cache hat auch glaube ich mein Bild grob verfälscht, denn HEAP war nach langer Pause _erheblich_ schneller als MyISAM.
        
        Ja, eigentlich mag ich das Caching vom OS nicht, das verhindert ein einfaches
        Benchmarking... :-((
        
        Viele Grüsse
        
        Philipp
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum
        
        IP's von access_log in bestimmtem Zeitfenster extrahieren
        
        Philipp Hasenfratz Homepage des Autors 10.05.2003 14:45
        
        programmiertechnik
        
        – Informationen zu den Bewertungsregeln
        
        Halihallo nochmals
        
        [...mein IP-Problemchen]
        Nur noch eine kleine, jedoch entscheidende Zugabe: Es muss auch der Request geparsed
        werden, da nur diejenigen IP's einer bestimmten URL interessieren. Oh, oh :-)
        
        Ich werde für die IP-Problematik ein neuer Thread aufmachen, bitte nicht hier antworten.
        
        Verflixte Angelegenheit, was? :-)
        Da ich seit dem 30.04 auch unter den C-Programmierer-Nebies verweile hatte ich mich
        gleich mal an eine Lösung über C gesetzt. Das Ergebnis: Durchschnittlich 0.233ms für
        das Durchsuchen des ganzen Datenbestandes (hatte einfach als Such-IP die letzte
        angegeben). Jedoch glaube ich nicht, dass das relevant ist, da ich 1000 mal iteriert
        habe und jedesmal die Datei geöffnet und geschlossen habe => wurde bestimmt auch
        gecached. Habe auch versuche nur einmal zu iterieren, da bin ich auf 0.3-0.4ms
        gekommen, aber da bin ich mir nicht sicher, wie genau diese Zeitangaben gemessen werden.
        
        Und alle von mir gemachten Zeitangaben mit 1000 dividieren. Es wären mü-sekunden, sorry.
        
        Viele Grüsse
        
        Philipp
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Torsten.E: CGI/Perl gegen PHP für MS SQL-Server

CGI/Perl gegen PHP für MS SQL-Server

IP's von access_log in bestimmtem Zeitfenster extrahieren

CGI/Perl gegen PHP für MS SQL-Server

CGI/Perl gegen PHP für MS SQL-Server

CGI/Perl gegen PHP für MS SQL-Server

CGI/Perl gegen PHP für MS SQL-Server

CGI/Perl gegen PHP für MS SQL-Server

CGI/Perl gegen PHP für MS SQL-Server

CGI/Perl gegen PHP für MS SQL-Server

CGI/Perl gegen PHP für MS SQL-Server

CGI/Perl gegen PHP für MS SQL-Server

IP's von access_log in bestimmtem Zeitfenster extrahieren

IP's von access_log in bestimmtem Zeitfenster extrahieren