.NET regex innerer Text zwischen td, span, a Tag

Question

.NET regex innerer Text zwischen td, span, a Tag

Gefragt el 20 de Kann, 2010: Wann wurde die Frage gestellt
5509 Ansichten: Anzahl der Besuche der Frage
3 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

<table >
    <tr>
        <td colspan="2" style="height: 14px">
            tdtext1
            <a>hyperlinktext1<a/> 
        </td>
    </tr>
    <tr>
        <td>
            tdtext2
        </td>
        <td>
            <span>spantext1</span>
        </td>
    </tr>
</table>

Dies ist mein Beispieltext. Wie man einen regulären Ausdruck in C# schreibt, um die Treffer zu erhalten für den inneren Text für td , span , Hyperlinks.

Gefragt el 20 de Kann, 2010 von mushtaqck

Answer 1

3 Antworten

Answer 2

8voto

Josh Punkte 66190

Ich erschaudere jedes Mal, wenn ich die Worte Regex und HTML im selben Satz höre. Ich würde vorschlagen, dass Sie sich die HtmlAgilityPack auf CodePlex, einem sehr toleranten HTML-Parser, mit dem Sie XPath-Abfragen gegen das geparste Dokument verwenden können. Es ist viel sauberer und die Person, die Ihren Code erbt, wird es Ihnen danken!

EDITAR

Wie in den Kommentaren unten beschrieben, finden Sie hier einige Beispiele, wie Sie den InnerText dieser Tags erhalten können. Sehr einfach.

var doc = new HtmlDocument();
doc.LoadHtml("...your sample html...");

// all <td> tags in the document
foreach (HtmlNode td in doc.DocumentNode.SelectNodes("//td")) {
    Console.WriteLine(td.InnerText);
}

// all <span> tags in the document
foreach (HtmlNode span in doc.DocumentNode.SelectNodes("//span")) {
    Console.WriteLine(span.InnerText);
}

// all <a> tags in the document
foreach (HtmlNode a in doc.DocumentNode.SelectNodes("//a")) {
    Console.WriteLine(a.InnerText);
}

Beantwortet el 20 de Kann, 2010 von Josh (66190 Punkte )

Answer 3

1voto

MAG TOR Punkte 111

        static void Main(string[] args)
    {
        //...
       // using (WebClient client = new WebClient()) // WebClient class inherits IDisposable
       // {
        HtmlDocument doc = new HtmlWeb().Load("http://www.freeclup.com");

            foreach (HtmlNode span in doc.DocumentNode.SelectNodes("//span"))
            {
                Console.WriteLine(span.InnerText);
            }
            Console.ReadKey();

      //  }
    }

Beantwortet el 13 de Februar, 2013 von MAG TOR (111 Punkte )

Answer 4

0voto

Some User Punkte 27

Du könntest etwas verwenden wie:

        const string pattern = @"[a|span|td]>\s*?(?<text>\w+?)\s*?</\w+>";
        Regex regex = new Regex(pattern, RegexOptions.Singleline);
        MatchCollection m = regex.Matches(x);
        List<string> list = new List<string>();

        foreach (Match match in m)
        {
            list.Add(match.Groups["text"].Value);
        }

Beantwortet el 21 de Kann, 2010 von Some User (27 Punkte )

.NET regex innerer Text zwischen td, span, a Tag

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

.NET regex innerer Text zwischen td, span, a Tag

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: