在引入jar包之后,进行程序编写。
引入IE模拟器IEDriverServer.exe,配合上篇文章版本,参考下载地址下载,采用32位模拟器,可在64位电脑运行。
// 打开登陆页面
System.setProperty("webdriver.ie.driver", this.getClass().getResource("/").getPath()+"//IEDriverServer.exe");
//调用模拟器
WebDriver driver = new InternetExplorerDriver();
//打开网址
driver.get("http://10.*.*.*");
driver.manage().window().maximize();
接下来该取得登陆页面html控件。通过IE源代码读取,获取需要输入值得控件对象并赋值,点击登录
CharSequence[] csUser = new CharSequence[1];
csUser[0] = "*****";//用户名
//取得页面标签name=username的控件对象
WebElement txtboxUser = driver.findElement(By.name("username"));
//赋值
txtboxUser.sendKeys(csUser);
//程序休眠,是保证页面提交之前控件对象输入值,有可能进程过快导致输入值为空提交
Thread.sleep(2000);
//点击登录按钮
WebElement btnLogin = driver.findElement(By.xpath("//input[@value='登陆']"));
btnLogin.click();
运行到这,已实现页面登录,跳转到主界面。
进行主界面点击操作,确发现无法定位到插件,采用以下各种定位方式都获取不到
1、通过ID查找元素: By.id()
2、通过Name查找元素:By.name()
3、通过TagName查找元素: By.tagName()
4、通过ClassName 查找元素 By.className
5、通过LinkText查找元素 By.linkText();
6、通过PartialLinkText 查找元素 By.partialLinkText()
7、通过CSS选择器查找元素、
8、通过Xpath 查找元素
拦路虎2:页面frame出现,需要不断定位当前driver到主页面,定位到需要处理的frame页面上。
相关推荐
读取excel中关键字,利用webdriver对关键词进行搜索,将搜索到的百度百科词条保存到excel中。
所上传的资源是selenium+python爬取天猫商品,内含源代码+mysql数据库脚本+详细部署视频,另外还对过程中可能出现的问题进行了汇总,对于正在学习这方面的你是一个很好的选择,希望对你有所帮助。
主要介绍了Python selenium爬取微信公众号历史文章代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
用selenium模拟浏览器爬取租房信息-附件资源
此资源仅供学习用途,当前selenium都是基于无头模式的firefox或者chrome等浏览器进行爬虫抓取,天眼查的反爬技术算是很不错的,仅仅用于个人学习用,并不可以进行大数据的爬取 技术: python selenium 爬虫 模拟登陆 ...
python+selenium爬取地理空间数据云影像的元数据,地理空间数据云影像的元数据信息是动态获取的,所以要用到selenium实现动态点击,而且翻页也需要动态去做
在本章节中,我们将学习如何爬取动态加载数据,包括逆向分析请求页面、Selenium模拟浏览器和保存数据至数据库等内容。 爬取动态加载数据 爬取动态加载数据是数据挖掘和数据管理中非常重要的一步。由于许多网页的...
【作品名称】:基于Python+selenium实现的爬取京东评论的爬虫系统,无需登录 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【项目...
第一部分为获取每条微博具体的url(爬取微博数据),第二部分为根据url爬取微博相关内容及其评论(根据url爬取新闻内容)。 首先说明第一部分。 数据科学基础大作业-爬虫代码使用selenium编写,爬取的是网页版微博+源...
通过selenium模拟浏览器爬取有道翻译结果,此资源仅供学习用途,当前selenium都是基于无头模式的chrome浏览器进行爬虫抓取,
本文将深入探讨如何使用Python结合Selenium来爬取集团招聘网站的职位信息,并利用正则表达式进行数据过滤。 首先,Python是一种高级编程语言,以其简洁、易读的语法和丰富的库支持而闻名。在数据处理和网络爬虫领域...
Java 和 Selenium 是两种在 IT 领域广泛应用的技术,它们结合使用可以实现高效、自动化的网页数据抓取。本文将详细介绍如何使用 Java 和 Selenium 进行自动化爬虫的入门实践,帮助初学者快速掌握这一技能。 ...
python selenium 模拟淘宝账号密码拉动滑动块模拟登陆抓取商品数据,通过模拟打开浏览器,进入登录页,获取表单位置,输入账号密码,模拟滑动块拉动,点击登录,搜索关键词,搜索,提取商品信息。
本文实例为大家分享了selenium+PhantomJS...通过selenium 模拟浏览器请求的方法测试后发现,可利用 selenium 方法请求获取数据; #导入需要的模块 from selenium import webdriver import time from lxml import etr
selenium对动态加载数据的下拉爬取
总结来说,使用Python的Selenium框架爬取“考试宝典”题目涉及的主要技术点包括:启动浏览器、页面元素定位、动态内容获取、数据存储以及应对反爬策略。通过这种方式,我们可以灵活地获取和处理网站上的实时数据。
用selenium模拟浏览器爬取淘宝订单信息-附件资源