石家庄信息工程职业学院社团,温馨的社团气氛,完善的硬件设备,过硬的技术标准。

浅谈利用C#获得网页上指定标记后的文字或者其他

2016-01-24 14:08 作者: 来源: 本站 浏览: 我要评论 字号:

摘要: 今天突发奇想 , 可不可以用我写的小程序获得指定网站上 , 指定的内容呢 ? 之后便进行尝试 , 接下来便总结下来以下方法: 1,获得指定标记或者指定字符 , 也许网站上不显示 , 但源代码中一定有内容; 2,获得指定网站的源代码; 3,遍历源代码,查找指定标...

今天突发奇想 , 可不可以用我写的小程序获得指定网站上 , 指定的内容呢 ?

之后便进行尝试 , 接下来便总结下来以下方法:

1,获得指定标记或者指定字符 , 也许网站上不显示 , 但源代码中一定有内容;

2,获得指定网站的源代码;

3,遍历源代码,查找指定标记,然后读取标记后的定长串;

4,输出获得的内容

下面上代码

//这是一个获取网页源代码的方法
public string GetPageHTML(string url)
{
try
{
HttpWebRequest wr = WebRequest.Create(url) as HttpWebRequest;
wr.Method = “get”;
wr.Accept = “*/*”;
wr.Headers.Add(“Accept-Language: zh-cn”);
wr.Headers.Add(“UA-CPU: x86”);
wr.Headers.Add(“Accept-Encoding: gzip, deflate”);
wr.UserAgent = “Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Embedded Web Browser from: http://goodalong.com/; InfoPath.2; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)”;
wr.KeepAlive = true;
wr.ServicePoint.Expect100Continue = false;
wr.AllowAutoRedirect = false;
HttpWebResponse wre = wr.GetResponse() as HttpWebResponse;
StreamReader sreader = new StreamReader(wre.GetResponseStream(), Encoding.GetEncoding(“UTF-8”));
string sHtml = sreader.ReadToEnd();
wre.Close();
return sHtml;
}
catch{ return “”;}
}
//这是应用
string cs = “”; //得到的结果
int ax = textBox2.Text.IndexOf(“mailto”); //在串中的位置 “mailto”:为标记
int bx = 23; //找ax之后23个元素
for (int i = 0; i <= bx; i++) { cs += textBox2.Text[ax-1]; //取结果 ax++; } MessageBox.Show(cs); //输出
好了 这样就可以得到我们的要的结果了

转载自:Along的博客

发表评论

你必须 登录后 才能评论!

会员登录关闭

记住我 忘记密码

注册会员关闭

小提示: 您的密码会通过填写的"电子邮箱"发送给您.