- ·上一篇文章:网站静态页面生成方法
- ·下一篇文章:ASP用户登录代码
asp获取网页的html代码
有时候,需要获取网页的html代码,如新闻采集。采集之前,首页要得到被采集的页面的html代码,然后根据代码,分析出你想要得到的内容,最后将得到的内容保存到自己的数据库中
function.asp
<
%
Function 
getHTTPPage(url) 
On 
Error 
Resume 
Next
dim 
http 
set 
http=Server.createobject("
Microsoft.XMLHTTP"
) 
Http.open 
"
GET"
,url,false 
Http.send() 
if 
Http.readystate<
>
4 
then
exit 
function 
end 
if 
getHTTPPage=bytesToBSTR(Http.responseBody,"
GB2312"
)
set 
http=nothing
If 
Err.number<
>
0 
then 
Response.Write 
"
<
p 
align=&
#39
center&
#39
>
<
font 
color=&
#39
red&
#39
>
<
b>
服务器获取文件内容出错<
/b>
<
/font>
<
/p>
"
 
Err.Clear
End 
If 
 
End 
Function
Function 
BytesToBstr(body,Cset)
dim 
objstream
set 
objstream 
= 
Server.CreateObject("
adodb.stream"
)
objstream.Type 
= 
1
objstream.Mode 
=3
objstream.Open
objstream.Write 
body
objstream.Position 
= 
0
objstream.Type 
= 
2
objstream.Charset 
= 
Cset
BytesToBstr 
= 
objstream.ReadText 
objstream.Close
set 
objstream 
= 
nothing
End 
Function
%>
index.asp
<
!--
#include 
file="
function.asp"
-->
<
%
url="
http://www.google.cn"
response.write 
getHTTPPage(url)
%>
function.asp
<
%
Function 
getHTTPPage(url) 
On 
Error 
Resume 
Next
dim 
http 
set 
http=Server.createobject("
Microsoft.XMLHTTP"
) 
Http.open 
"
GET"
,url,false 
Http.send() 
if 
Http.readystate<
>
4 
then
exit 
function 
end 
if 
getHTTPPage=bytesToBSTR(Http.responseBody,"
GB2312"
)
set 
http=nothing
If 
Err.number<
>
0 
then 
Response.Write 
"
<
p 
align=&
#39
center&
#39
>
<
font 
color=&
#39
red&
#39
>
<
b>
服务器获取文件内容出错<
/b>
<
/font>
<
/p>
"
 
Err.Clear
End 
If 
 
End 
Function
Function 
BytesToBstr(body,Cset)
dim 
objstream
set 
objstream 
= 
Server.CreateObject("
adodb.stream"
)
objstream.Type 
= 
1
objstream.Mode 
=3
objstream.Open
objstream.Write 
body
objstream.Position 
= 
0
objstream.Type 
= 
2
objstream.Charset 
= 
Cset
BytesToBstr 
= 
objstream.ReadText 
objstream.Close
set 
objstream 
= 
nothing
End 
Function
%>
index.asp
<
!--
#include 
file="
function.asp"
-->
<
%
url="
http://www.google.cn"
response.write 
getHTTPPage(url)
%>
asp获取网页的html代码