HTMLTags aus javax.swing.text.html.HTMLDocument auslesen
Christine
- java
Hallo,
Ich habe ein HTMLDocument , das eine html- Seite enthällt.
Diese Seite enthällt verschiedene HTML- Tags (<h1>,<b>,...)
Ich möchte nun einen bestimmten Teil dieses HTMLDocuments bzw. der darin enthaltenen html- Seite highlighten (das mache ich durch einfügen eines span- Tags mit entsprechenden Attributen)
Wenn ich nun einen bestimmten Teil meines HTMLDocuments highlighten will (von offset - offset+length),so schneide ich zunächst den
zu highlightenden Inhalt mit
String content = htmlDocument.getText(offset,length);
aus. Leider bekomme ich damit, wie die Methode ja auch schon sagt nur den Text von der Stelle offset bis zur Stelle offset+length;
Ich möchte aber auch die HTML- Tags in diesem Bereich abfragen.
Das habe ich folgendermassen versucht:
int i;
for(i=0;i<=content.length();i++)
{
Element element = copy.getCharacterElement(i);
AttributeSet testAttr = element.getAttributes();
Enumeration testAttrNames =testAttr.getAttributeNames();
while(testAttrNames.hasMoreElements())
{
Object o = testAttrNames.nextElement();
String attrName = o.toString();
String attrValue = testAttr.getAttribute(o).toString();
System.out.println("attributName: "+ attrName);
System.out.println("wert des attributs: "+attrValue);
}
}
Allerdings liefert mir das ganze nicht das, was ich eigentlich haben wollte...
attrName ist immer: name
attrValu ist immmer: content
es spielt dabei keine rolle, ob im bereich offset bis offset+length nur text oder auch <u>,<b>,<i>,... vorkommt.
Mein Ziel ist aber, zu erkennen, wenn ein solches Tag vorkommt.
Gibt es eine Möglichkeit festzustellen, ob das eingelesene Elemente "nur Text" ist oder ein HTML- Tag?
Vielen Dank für deine Hilfe
Christine