尊敬的客户您好,经我们多年的网站制作、网络营销经验,请建站和优化同时做,以达到最好的推广效果!----创赢网络 2012-06
加入收藏设为首页
  • [2013-8-7]洛阳贷款 洛阳小额贷款公司网站上线
  • [2013-8-4]洛阳开锁公司 洛阳开锁电话优化
  • [2013-5-25]洛阳聚鑫钢绳有限公司网站上线
  • [2013-5-20]吉利区图书馆网站备案通过上线开通
  • [2013-5-13]洛阳旭晋昇商贸有限公司 食品批发零售
  • [2013-4-14]洛阳市建投节能技术服务有限公司 新版上线
  • [2013-4-11]南阳顽石玉器工作室网站上线
  • ------专业网站设计制作、网站排名优化、建设一流品牌!
    新闻正文 ·您的位置:首页 > 新闻中心 > 技术中心 > 查看新闻

    去除网站中HTML标签的正则表达式

    作者:hi379  来源:hi379  发表时间:2009-8-11 8:10:41  点击:2877

    如何去除网站中HTML标签的正则表达式,在制作网站时,我们经常需要把一篇文章的部分片段展示出来,一般是截取文章前面的部分文字。但截取显示出的文字会把文章中的HTML代码显示出来,这样形成了乱码。

    去除网站中HTML标签,一般使用正则表达式。去除了网站中的HTML标签,才能把截取的文字正确的显示出来。去除文章中的HTML标签也可以在网站后台中去除,但这样一个个的去除不仅效率低下,而且经常会出错。.net网站中可以使用以下正则表达式来去除文章中的HTML标签,代码如下。


    string str = a.ToString();


    str = Regex.Replace(str, @"</?span[^>]*>", "", RegexOptions.IgnoreCase);
    str = Regex.Replace(str, @"&#[^>]*;", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?marquee[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?object[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?param[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?embed[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?table[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"&nbsp;","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?tr[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?th[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?p[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?a[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?img[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?tbody[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?li[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?span[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?div[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?th[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?td[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?script[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"(javascript|jscript|vbscript|vbs):", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"on(mouse|exit|error|click|key)", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"<\\?xml[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"<\/?[a-z]+:[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?font[^>]*>", "", RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?b[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?u[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?i[^>]*>","",RegexOptions.IgnoreCase);  
    str = Regex.Replace(str, @"</?strong[^>]*>","",RegexOptions.IgnoreCase);  

    以上代码能去除网站文章中常见的HTML代码,去除网站中HTML标签的正则表达式,这样才能使网站便捷的显示出我们需要的内容。

    您的需求

    联系我们

    正确的选择

    金亚洲安全吗