Hallo, ich habe ein Problem beim Auslesen des HTML von "dasoertliche.de". Ich rufe in .Net die Seite mit der betr. Rufnummer auf und kann im Quellcode den Namen und die Adresse auslesen. Der Code sieht so aus:
doc.Load(client.OpenRead("https://www.dasoertliche.de/?form_name=search_inv&buc=674&page=5&context=4&action=43&ph=" & 03642553535), Encoding.UTF8)
Dim entry = doc.GetElementbyId($"entry_{i}
If entry Is Nothing Then Exit Sub
Dim divLeftOnHit = entry.ChildNodes.FirstOrDefault(Function(a) a.HasClass("oe_hit"))
Dim _Name As String = HttpUtility _
.HtmlDecode( _
divLeftOnHit.ChildNodes _
.FirstOrDefault(Function(a) a.Name = "a") _
.InnerText _
.Replace(CrLf, "") _
)
Dim _Adresse As String = divLeftOnHit _
.ChildNodes _
.FirstOrDefault(Function(a) a.Name = "address") _
.InnerText _
.Replace(CrLf, "") _
.Replace(Tab, "")
liste.Add(_Name & ";" & _Adresse.Replace(" ", "").Replace(",", " "))
Edit von Rolf B: Zeilenumbrüche in den Code gesetzt für Lesbarkeit. Syntaxkonform mit _ Zeichen
Das funktioniert in 90 % aller Fälle. Sind aber "Blumengrüsse" eingearbeitet, bekomme ich nicht mehr den Namen, sondern stattdessen die "Blumengrüsse".
Sorry - bekomme keine vernünftige Formatierung hin, deshalb als Bild. Von HTML verstehe ich absolut nichts. Nur von .Net Hab in mein Projekt Net.Http und HtmlAgilityPack eingebunden. Kann mir jemand helfen?
Grüße Norbert