服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - C# - C#使用Selenium+PhantomJS抓取数据

C#使用Selenium+PhantomJS抓取数据

2021-12-27 14:38挖宝居士 C#

本文主要介绍了C#使用Selenium+PhantomJS抓取数据的方法步骤,具有很好的参考价值,下面跟着小编一起来看下吧

手头项目需要抓取一个用js渲染出来的网站中的数据。使用常用的httpclient抓回来的页面是没有数据。上网百度了一下,大家推荐的方案是使用phantomjs。phantomjs是一个没有界面的webkit浏览器,能够和浏览器效果一致的使用js渲染页面。selenium是一个web测试框架。使用selenium来操作phantomjs绝配。但是网上的例子多是python的。无奈,下载了python按照教程搞了一下,卡在了selenium的导入问题上。遂放弃,还是用自己惯用的c#吧,就不信c#上没有。经过半个小时的折腾,搞定(python折腾了一个小时)。记录下这篇博文,让我等搞c#的新手能用上phantomjs。

第一步:打开visual studio 2017 新建一个控制台项目,打开nuget包管理器。

C#使用Selenium+PhantomJS抓取数据

第二部:搜索selenium,安装selenium.webdriver。注意:如果要使用代理的话最好安装3.0.0版本。

C#使用Selenium+PhantomJS抓取数据

第三步:写下如下图所示的代码。但是执行的时候会报错。原因是找不到phantomjs.exe。这时候可以去下载一个,也可以继续看第四步。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
using openqa.selenium;
using openqa.selenium.phantomjs;
using system;
namespace consoleapp1
{
 class program
 {
 static void main(string[] args)
 {
  var url = "http://www.baidu.com";
  iwebdriver driver = new phantomjsdriver(getphantomjsdriverservice());
  driver.navigate().gotourl(url);
  console.writeline(driver.pagesource);
  console.read();
 }
 private static phantomjsdriverservice getphantomjsdriverservice()
 {
  phantomjsdriverservice pds = phantomjsdriverservice.createdefaultservice();
  //设置代理服务器地址
  //pds.proxy = $"{ip}:{port}";
  //设置代理服务器认证信息
  //pds.proxyauthentication = getproxyauthorization();
  return pds;
 }
 }
}

C#使用Selenium+PhantomJS抓取数据

第四步:打开nuget安装selenium.phantomjs.webdriver包。

C#使用Selenium+PhantomJS抓取数据

第五步:运行。可以看到phantomjs.exe被自动下载了。

C#使用Selenium+PhantomJS抓取数据

好了,这样就可以开始你的数据抓取大业了。

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持服务器之家!

原文链接:http://www.cnblogs.com/endlock/p/6423613.html

延伸 · 阅读

精彩推荐
  • C#C#微信公众号与订阅号接口开发示例代码

    C#微信公众号与订阅号接口开发示例代码

    这篇文章主要介绍了C#微信公众号与订阅号接口开发示例代码,结合实例形式简单分析了C#针对微信接口的调用与处理技巧,需要的朋友可以参考下...

    smartsmile20127762021-11-25
  • C#三十分钟快速掌握C# 6.0知识点

    三十分钟快速掌握C# 6.0知识点

    这篇文章主要介绍了C# 6.0的相关知识点,文中介绍的非常详细,通过这篇文字可以让大家在三十分钟内快速的掌握C# 6.0,需要的朋友可以参考借鉴,下面来...

    雨夜潇湘8272021-12-28
  • C#VS2012 程序打包部署图文详解

    VS2012 程序打包部署图文详解

    VS2012虽然没有集成打包工具,但它为我们提供了下载的端口,需要我们手动安装一个插件InstallShield。网上有很多第三方的打包工具,但为什么偏要使用微软...

    张信秀7712021-12-15
  • C#利用C#实现网络爬虫

    利用C#实现网络爬虫

    这篇文章主要介绍了利用C#实现网络爬虫,完整的介绍了C#实现网络爬虫详细过程,感兴趣的小伙伴们可以参考一下...

    C#教程网11852021-11-16
  • C#C#设计模式之Strategy策略模式解决007大破密码危机问题示例

    C#设计模式之Strategy策略模式解决007大破密码危机问题示例

    这篇文章主要介绍了C#设计模式之Strategy策略模式解决007大破密码危机问题,简单描述了策略模式的定义并结合加密解密算法实例分析了C#策略模式的具体使用...

    GhostRider10972022-01-21
  • C#SQLite在C#中的安装与操作技巧

    SQLite在C#中的安装与操作技巧

    SQLite,是一款轻型的数据库,用于本地的数据储存。其优点有很多,下面通过本文给大家介绍SQLite在C#中的安装与操作技巧,感兴趣的的朋友参考下吧...

    蓝曈魅11162022-01-20
  • C#如何使用C#将Tensorflow训练的.pb文件用在生产环境详解

    如何使用C#将Tensorflow训练的.pb文件用在生产环境详解

    这篇文章主要给大家介绍了关于如何使用C#将Tensorflow训练的.pb文件用在生产环境的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴...

    bbird201811792022-03-05
  • C#深入理解C#的数组

    深入理解C#的数组

    本篇文章主要介绍了C#的数组,数组是一种数据结构,详细的介绍了数组的声明和访问等,有兴趣的可以了解一下。...

    佳园9492021-12-10