c# 解析html

html源代码结构解析,以抽取特定节点内容:

方案一: 正则表达式

方案二: HtmlAgilityPack库 : HtmlAgilityPack是使用XPath语法,HtmlAgilityPack是一个开源的.NET类库,它的主页是http://htmlagilitypack.codeplex.com/,在这里可以下载到 最新版的类库及API手册,此外还可以下载到一个用于调试的辅助工具。

http://htmlagilitypack.codeplex.com/

方案三:Winista.Htmlparser.Net库 : 是.NET平台下解析Html的开源代码,网上有源码下载,百度一下就能搜到,这里就不提供了。并且有英文的帮助文档。

http://htmlparser.sourceforge.net/

方案四:Jumony是一个开源项目,已经有三年的历史了,在这三年中,秉承提供给.NET程序员完整的HTML掌控能力,Jumony历经无数次的改进,终于进入了一个新的阶段。Jumony Core 3是一个真正意义上的HTML引擎。

http://www.cnblogs.com/Ivony/p/3447536.html

https://github.com/Ivony/Jumony