C# html抽取所有文本内容的正则表达式_西西软件资讯

西西软件园多重安全检测下载网站、值得信赖的软件下载站！

软件: 软件; 文章

首页 → 编程开发 → C#.NET → C# html抽取所有文本内容的正则表达式

C# html抽取所有文本内容的正则表达式

相关软件相关文章发表评论来源：本站整理时间：2010/11/25 15:16:08字体大小：A-A+

作者：佚名点击：620次评论：0次标签：文本内容正则表达

2014年辛星HTML和CSS教程夏季版

类型：电子资料大小：3.9M语言：中文评分：10.0

标签：

立即下载

只抽取HTML中所有<P></p>之间的文本的正则表达式：(?is)<p[^>]*>(?><p[^>]*>(?<o>)|</p>(?<-o>)|(?:(?!</?p\b).)*)*(?(o)(?!))</p>

测试代码：
public static void Main(string[] args)
{
            string text="<p>sdfasdfsa</p>sxcvxc<Img src=><p>23424</p>";
            string regex=@"(?is)<p[^>]*>(?><p[^>]*>(?<o>)|</p>(?<-o>)|(?:(?!</?p\b).)*)*(?(o)(?!))</p>";
            GetListByHtml(text, regex);
            Console.ReadKey();
        }

public static void GetListByHtml(string text,string pat)
        {
            System.Text.RegularExpressions.Regex r = new System.Text.RegularExpressions.Regex(pat, System.Text.RegularExpressions.RegexOptions.IgnoreCase);
            System.Text.RegularExpressions.Match m = r.Match(text);
            //int matchCount = 0;
            while (m.Success)
            {
                Console.WriteLine(m.Value);
                m = m.NextMatch();
            }
        }

这是抽取herf的例子 string regexs = "href=[\\\"\\\'](http:\\/\\/|\\.\\/|\\/)?\\w+(\\.\\w+)*(\\/\\w+(\\.\\w+)?)*(\\/|\\?\\w*=\\w*(&\\w*=\\w*)*)?[\\\"\\\']";

相关文章

05-06菜鸟对AVA新连狙KnightsSR25冲锋狙改造方案
04-03c#window程序开发入门系列--自学笔记
03-20用C#实现多叉树的生成并转化为extjs（基于js脚本的ajax UI框架）
03-09关于 HTML5，开发者可以期待什么
03-09因HTTP的Header长度过长导致下载文件名出现乱码的问题
03-01关于用C#实现B/S与C/S平台之间功能通用性的设计思路
02-22Google Gears正式融合HTML5,浏览器完全支持
02-12不同程序语言之间的互动,IronPython 与C#交互
02-10HTC Legend真机新照再现 HTC Legend配置介绍
02-05如何用c#实现仿QQ会员右下角提示框

相关评论

阅读本文后您有什么感想? 已有23人给出评价!

8 喜欢

3 顶

1 难过

5 囧

3 围观

2 无聊

热门评论

最新评论

发表评论查看所有评论(0)

昵称:

表情:

字数: 0/500 (您的评论需要经过审核才能显示)

推荐文章

7月份 Tiobe 分布编程语言排行 C#位居第5位利用WPF自己做的全文翻译小工具

相关下载

名称大小下载

最新文章

联系我们 | 发展历程 | 版权声明 | 下载帮助(？) | 广告服务 | 软件提交 | 网站地图 | 意见反馈

声明：西西软件园为非赢利性网站不接受任何赞助和广告鄂ICP备11008782号-1