服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|JavaScript|易语言|

服务器之家 - 编程语言 - ASP教程 - asp中去除html中style,javascript,css代码

asp中去除html中style,javascript,css代码

2019-09-01 11:10asp之家 ASP教程

剔除页面中html中除文字以外的任何代码,刚才发布了php版这个是ASP中的版本。

html">asp函数代码 

复制代码代码如下:


<% 
Function RemoveHTML(str) 
Dim objRegExp, Match,strHTML 
if isnull(str) then 
str="" 
end if 
strHTML=str 
strHTML=replace(replace(replace(strHTML,vblf,""),vbcr,""),vbcrlf,"") 


Set objRegExp = New Regexp 
objRegExp.IgnoreCase = True 
objRegExp.Global = True 

objRegExp.Pattern = "<script[^>]*?>.*?</script>" 
strHTML = objRegExp.Replace(strHTML,"") 

objRegExp.Pattern = "<style[^>]*?>.*?</style>" 
strHTML = objRegExp.Replace(strHTML,"") 

objRegExp.Pattern = "<.+?>" 
strHTML = objRegExp.Replace(strHTML,"") 

Set objRegExp = Nothing 

RemoveHTML=strHTML 
End Function 
%> 


php中的代码

复制代码代码如下:


<?php 
$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript 
"'<style[^>]*?>.*?</style>'si", // 去掉 css 
"'<[/!]*?[^<>]*?>'si", // 去掉 HTML 标记 
"'<!--[/!]*?[^<>]*?>'si", // 去掉 注释标记 
"'([rn])[s]+'", // 去掉空白字符 
"'&(quot|#34);'i", // 替换 HTML 实体 
"'&(amp|#38);'i", 
"'&(lt|#60);'i", 
"'&(gt|#62);'i", 
"'&(nbsp|#160);'i", 
"'&(iexcl|#161);'i", 
"'&(cent|#162);'i", 
"'&(pound|#163);'i", 
"'&(copy|#169);'i", 
"'&#(d+);'e"); // 作为 PHP 代码运行 

$replace = array ("", 
"", 
"", 
"", 
"\1", 
"\"", 
"&", 
"<", 
">", 
" ", 
chr(161), 
chr(162), 
chr(163), 
chr(169), 
"chr(\1)"); 
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents('http://www.sina.com.cn'); 
$out = preg_replace($search, $replace, $document); 
echo $out; 
?> 


存为get.php即可。 

延伸 · 阅读

精彩推荐