Ich erschaudere jedes Mal, wenn ich die Worte Regex und HTML im selben Satz höre. Ich würde vorschlagen, dass Sie sich die HtmlAgilityPack auf CodePlex, einem sehr toleranten HTML-Parser, mit dem Sie XPath-Abfragen gegen das geparste Dokument verwenden können. Es ist viel sauberer und die Person, die Ihren Code erbt, wird es Ihnen danken!
EDITAR
Wie in den Kommentaren unten beschrieben, finden Sie hier einige Beispiele, wie Sie den InnerText dieser Tags erhalten können. Sehr einfach.
var doc = new HtmlDocument();
doc.LoadHtml("...your sample html...");
// all <td> tags in the document
foreach (HtmlNode td in doc.DocumentNode.SelectNodes("//td")) {
Console.WriteLine(td.InnerText);
}
// all <span> tags in the document
foreach (HtmlNode span in doc.DocumentNode.SelectNodes("//span")) {
Console.WriteLine(span.InnerText);
}
// all <a> tags in the document
foreach (HtmlNode a in doc.DocumentNode.SelectNodes("//a")) {
Console.WriteLine(a.InnerText);
}