Christine: HTMLTags aus javax.swing.text.html.HTMLDocument auslesen

Hallo,

Ich habe ein HTMLDocument , das eine html- Seite enthällt.
Diese Seite enthällt verschiedene HTML- Tags (<h1>,<b>,...)

Ich möchte nun einen bestimmten Teil dieses HTMLDocuments bzw. der darin enthaltenen html- Seite highlighten (das mache ich durch einfügen eines span- Tags mit entsprechenden Attributen)

Wenn ich nun einen bestimmten Teil meines HTMLDocuments highlighten will (von offset - offset+length),so schneide ich zunächst den
zu highlightenden Inhalt mit

String content = htmlDocument.getText(offset,length);

aus. Leider bekomme ich damit, wie die Methode ja auch schon sagt nur den Text von der Stelle offset bis zur Stelle offset+length;
Ich möchte aber auch die HTML- Tags in diesem Bereich abfragen.
Das habe ich folgendermassen versucht:

int i;
       for(i=0;i<=content.length();i++)
       {
         Element element = copy.getCharacterElement(i);
         AttributeSet testAttr = element.getAttributes();
         Enumeration testAttrNames =testAttr.getAttributeNames();
         while(testAttrNames.hasMoreElements())
         {
            Object o = testAttrNames.nextElement();
            String attrName = o.toString();
            String attrValue = testAttr.getAttribute(o).toString();
            System.out.println("attributName: "+ attrName);
            System.out.println("wert des attributs: "+attrValue);
        }
      }

Allerdings liefert mir das ganze nicht das, was ich eigentlich haben wollte...
attrName ist immer: name
attrValu ist immmer: content
es spielt dabei keine rolle, ob im bereich offset bis offset+length nur text oder auch <u>,<b>,<i>,... vorkommt.
Mein Ziel ist aber, zu erkennen, wenn ein solches Tag vorkommt.
Gibt es eine Möglichkeit festzustellen, ob das eingelesene Elemente "nur Text" ist oder ein HTML- Tag?

Vielen Dank für deine Hilfe

Christine