【Python爬虫】：使用「Selenium」+「Chromedriver」爬僵尸链接

任佳伟

以中国亚马逊卖家为中心,引导每一个卖家,运用互联网产品运营的思维去经营自己的店铺和产品,希望能把每一家在亚马逊上卖货的公司,变成一家互联网公司.让爆单成为每个卖家日常生活的一部分.

43533

2018-09-21 19:14

43533

任佳伟

使用「Selenium」+「Chromedriver」爬僵尸链接

在往期的文章中有读者朋友提问能否爬「僵尸链接」，肯定是可以的。只有你看不到，没有爬虫爬不了的。

使用本文今天将讲到的「Selenium」+「Chromedriver」就可以轻松完成。本文还是会从环境搭建、查找僵尸链接原理到代码编写一步步来实现这个需求。

Selenium原本是一套完整的web应用程序测试系统，现也用作爬虫。用户可以使用它驱动浏览器，使浏览器按照已编写完成的代码完成相应动作。

Selenium支持驱动Chrome、Firefox、IE等一系列浏览器，在这里我还是选用大家熟悉的Chrome浏览器。

环境搭建步骤：

一、安装Selenium：

在上一期已搭建Python环境的前提下打开CMD窗口，输入: 「pip install selenium」会自动安装selenium，如无报错，且提示安装成功，则成功安装selenium。

可以通过以下方式验证是否安装成功并且能正常使用：

在CMD窗口中输入python，再输入from selenium import webdriver，敲击回车。如果没有报错，则selenium成功安装且能正常使用。

二、下载Chromedriver：

首先从https://www.google.cn/chrome/下载最新版Chrome浏览器，再从http://chromedriver.storage.googleapis.com/index.htm 下载最新版的Chromedriver。

若你已经安装了Chrome浏览器，可根据已安装的Chrome浏览器版本下载对应的Chromedriver版本。附Chrome与Chromedriver的对应关系表：

在Chrome浏览器和Chromedriver都下载完成后，将Chrome浏览器安装好，将Chromedriver解压放在自己喜欢的地方待用。

查找原理：

在搜索引擎中使用「site」关键字，可以把搜索范围限定在特定站点中，如site：某某.com。“site:”后面跟的站点域名，不要带“http://”；site:后面带不带www结果可能是不一样的，因为有些域名还包括二级域名，如：site:www.某某.com和site:某某.com,搜索结果就不一样；另外，site:和站点名之间，不要带空格。

我们可以用「site：amazon.com」,只查找在亚马逊网站内的信息。

而一个僵尸链接必有下图特征：

那我们需要构建一个完整的搜索关键字使用Google就可以帮我们找出亚马逊中的僵尸链接。如我需要找「Nike」的僵尸链接，则使用「site：amazon.com Nike Currently unavailable.」使用Google搜索即可。

但其中某些搜索结果，并不是我们想要的僵尸链接。这就需要我们的爬虫去遍历每个搜索结果，并返回正确的僵尸链接。

代码编写：

打开Pycharm，新建项目：

从selenium导入webdriver：

from selenium import webdriver

准备好搜索链接：

url = 'https://www.google.com/search?q=site%EF%BC%9Aamazon.com+Nike+Currently+unavailable.'

driver = webdriver.Chrome('C:Program Files (x86)GoogleChromeApplicationchromedriver.exe')
 # 在webdriver.Chrome(中填入之前下载好的Chromedrive的路径)

driver.get(url)

将自动打开Chrome浏览器并访问：

https://www.google.com/search?q=site%EF%BC%9Aamazon.com+Nike+Currently+unavailable.

若浏览器出现「Chrome 正受到自动测试软件的控制。」则表示我们已成功使用selenium驱动Chrome并按照预设访问了Google。

分析Google搜索结果页面，在搜索结果页面按F12。通过分析网页源码，可以看出每个搜索结果都包含在一个class为rc的<div>标签内：

我们可以使用「XPath」来查看是否通过查找所有的class为rc的<div>标签即可找到所有搜索结果。首先下载Chrome插件「XPath Helper」：

在搜索结果页面打开「XPath Helper」，输入「//div[@class='rc']」，显示「RESULTS (20)」及表示有20个class为rc的<div>标签，这与页面中的20个搜索结果相符，这表示可以使用该XPath找出页面中共有多少个搜索结果。

再按照下图分别点击1、2定位某条搜索结果的标题：

在第三步上点击鼠标右键→「Copy」→「Copy XPath」

这里要科普一下，「XPath」是XML路径语言，它是一种用来确定XML（标准通用标记语言的子集）文档中某部分位置的语言。使用XPath我们可以准确定位页面中某个元素的位置。

多拷贝几个搜索结果的XPath，可以找出其中的规律：

可见只需将XPath略微修改即可准确定位每个搜索结果的标题，那我们就可以继续敲代码了。

首先查找所有的class为rc的<div>标签，并计算其长度。

all_rc = driver.find_elements_by_xpath("//div[@class='rc']") # 查找所有的class为rc的<div>标签
 len_all_rc = len(all_rc) # len()可计算其长度

根据所有的class为rc的<div>标签的长度，生成新的XPath并定位、点击，即跳转至亚马逊商品页面。

# for X in range () 是前开后闭，所以需要len_all_rc + 1 才能循环len_all_rc次。

for i in range(1, len_all_rc + 1):
     # 拼接新的XPath

xpath = "//*[@id='rso']/div/div/div["+str(i)+"]/div/div/h3/a"

# 根据XPath定位搜索结果的标题，并点击
     driver.find_element_by_xpath(xpath).click()

返回亚马逊商品页面源码。

pageSource = driver.page_source

如果“Currently unavailable.”在页面源码中，即可确定是为僵尸链接。则在控制台打印该商品链接。

if 'Currently unavailable.' in pageSource:
     print(driver.current_url)

完成一次循环后，需要退回到Google搜索界面，下次一循环才能正确进行。

driver.back()

完成一页搜索结果筛选后，需要点击搜索结果页面的下一页继续筛选，直到无新的搜索结果为止。

# 定位下一页的按钮

next_button = driver.find_element_by_xpath('//*[@id="pnnext"]/span[2]')

# 如果下一页按钮存在

if next_button:

     # 这定位下一页按钮并点击
     driver.find_element_by_xpath('//*[@id="pnnext"]/span[2]').click()

# 否则退出循环、结束程序。
 else:
     break

▲

以上便是使用「Selenium」+「Chromedriver」从环境搭建、查找链接原理到代码编写来实现爬取僵尸链接的全部过程。其完整代码为：

from selenium import webdriver
 
 url = 'https://www.google.com/search?q=site%EF%BC%9Aamazon.com+Nike+Currently+unavailable.'
 driver = webdriver.Chrome('C:Program Files (x86)GoogleChromeApplicationchromedriver.exe')
 driver.maximize_window()
 driver.get(url)
 while True:
     all_rc = driver.find_elements_by_xpath("//div[@class='rc']")
     len_all_rc = len(all_rc)
     for i in range(1, len_all_rc + 1):
         xpath = "//*[@id='rso']/div/div/div["+str(i)+"]/div/div/h3/a"
         driver.find_element_by_xpath(xpath).click()
         pageSource = driver.page_source
         if 'Currently unavailable.' in pageSource:
             print(driver.current_url)
         driver.back()
     next_button = driver.find_element_by_xpath('//*[@id="pnnext"]/span[2]')
     if next_button:
         driver.find_element_by_xpath('//*[@id="pnnext"]/span[2]').click()
     else:
         break

我的这篇文章只是简单的介绍了selenium + webdriver的使用，当然你也可以结合「Requests」+「bs4」爬取每个僵尸链接对应商品的Asin、标题、品牌、star、review等，并保存到文件中方便筛选你中意的僵尸。

如图：

往期链接：【Python爬虫】：使用「Requests」+「bs4」写亚马逊爬虫

更多好文，敬请关注。

免责声明

本文链接:

本文经作者许可发布在AMZ123跨境头条，如有疑问，请联系客服。

优仓海外仓

华人自营当天扫码出库，提供发货图片，专业负责，7*24小时对接

粤航通国际物流

致力于FBA专线，DHL/UPS特快，超大件跨境运输合理的价格，为您提供舒心的物流服务

嘉霖供应链

嘉霖供应链专注头程海运，海外仓清提派、VC中转、FBA中转、VC代发、TEMU代发、退货换标等个性化服务

宽联海外仓

美国自营海外仓和车队,提供从头程到送仓的全流程服务.

优仓海外仓

华人自营当天扫码出库，提供发货图片，专业负责，7*24小时对接

粤航通国际物流

致力于FBA专线，DHL/UPS特快，超大件跨境运输合理的价格，为您提供舒心的物流服务

嘉霖供应链

嘉霖供应链专注头程海运，海外仓清提派、VC中转、FBA中转、VC代发、TEMU代发、退货换标等个性化服务

宽联海外仓

美国自营海外仓和车队,提供从头程到送仓的全流程服务.

跨界实习生我的C位哇大家圣诞节这两天的销量怎么样？我一个星期前还是每天一万美金销售额就在今天只有一千五百美金了真的太离谱了已经生无可恋了……做亚马逊真的需要一颗强大的内心呀「精彩回帖」匿名用户赞同来自: Beneme 、 kaiguoguo666888 、 mysclw 、 Shealuck 、 Holshet平安夜和圣诞节都在忙宗教活动和家庭聚会，没空线上购物。这两天销量腰斩说的

日销量超6千单，可视电动洗耳神器跻身TikTok美区热销榜第二

o1.日销量超6千单，可视电动洗耳神器跻身TikTok美区热销榜第二据Shoplus超店有数数据，一款可视电动洗耳神器在12月25日销量达到6.2千单，凭借日销售额9.3万美金的成绩跻身当日的TikTok美区热销商品榜第二位。“Dustproof Ear Wax Removal Kit with Camera Light”是一款家用的耳垢清洁神器，该产品配备有360°广角镜头，能够提供耳道内详细实

月销超10万件！亚马逊最新美容个护十大热销产品推荐

AMZ123获悉，近期亚马逊上10款美容个护产品持续热销，受到消费者广泛欢迎和好评。1.Sally Hansen透明指甲强化剂这款指甲强化剂含有视黄醇，质地如指甲般坚硬，快速干燥，提供晶莹剔透、高光泽的保护性涂层，可锁住指甲颜色，有助于防止碎裂、脱落和褪色。亚马逊上，这款产品位居指甲强化剂畅销榜第3名，上月销量10000+，评论数达20370个，评分为4.6星，五星好评率为78%。2.Essenc

越南新法规将影响TikTok与FB，未验证账户无法直播

AMZ123获悉，近日，越南政府宣布，于12月26日起实施新的互联网法规“第147号法令”，要求在越南运营的社交媒体平台如Facebook和TikTok验证用户身份，并将相关数据交给政府。根据新法令，所有社交平台必须通过用户的电话号码或越南身份证号码验证用户账户，并与用户的全名和出生日期一同存储。社交平台公司需根据政府要求，提供用户数据，并在24小时内删除任何被视为“非法”的内容。此外，社交媒体平

澳大利亚圣诞购物支出将达24亿美元，家具用品成首选

AMZ123获悉，近日，澳大利亚零售商协会与Roy Morgan的最新研究报告显示，预计今年圣诞节期间，澳大利亚人的消费将大幅增长，达到13亿美元。而在12月最后几天，预计消费额将激增至24亿美元，整体消费较去年增长约2.7%。随着生活成本上升，越来越多的消费者选择通过黑色星期五、网络星期一等促销活动进行网购。这一趋势表明，虽然传统的实体店购物仍具吸引力，但电商平台已经成为越来越多消费者的首选渠道

2024.12.26亚马逊选品推荐（仅供参考）：小雏菊钥匙扣

2024.12.26亚马逊选品推荐（仅供参考）：小雏菊钥匙扣站点：北美站，加拿大产品名：小雏菊钥匙扣专利：未查询采购：国内1688工厂价3.42元售价：亚马逊北美售价16加币重量：约10G运费：FBM运费25人民币左右FBM净利润：40元左右FBA净利润：40-100元左右;模式：适合FBM和FBA，（所有价格都是建议参考价格）单量：在卖家精灵中显示上架时间是2021年04年11号，目前为止持

【物流服务】最新统一包装指南（危险品和大件、笨重、形状不规则品）！

商品分类概述危险品具有物理危险、易燃、腐蚀性、有毒、电池供电*或爆炸性的物品可被视为危险物品▪固体范例:刀具、切割工具、固体杀虫剂、电池，*带有电池或内置电池的物品▪液体范例：喷雾剂、液化石油气（注意：如果是液体，还需遵循易漏品包装指南）注意：所有由电池供电的物品，无论包裹内是否有电池，都被视为危险品。为了防止任何受伤，尖锐物体的末端/刀刃和带有尖端的物品（例如刀、刀片等）应该用坚固材料覆盖起

【物流服务】最新统一包装指南（危险品和大件、笨重、形状不规则品）！

亚马逊赚钱的底层逻辑

实不相瞒，最近我在跟几个老铁吃火锅的时候，大家聊起了亚马逊这几年的变化。有人感慨政策变得太快，有人说选品越来越难，还有人直呼跨境电商水太深、看不懂了。说实话，每次听到这些讨论，我都有种似曾相识的感觉。还记得我刚入局跨境电商时，租住在深圳城中村的老房子里，每天对着电脑研究亚马逊的规则和数据。从最初的懵懂，到现在能够从容应对市场变化，这一路走来，我深深体会到：方法在变，但底层逻辑永远不变。长期主义者的

亚马逊3月10号前尽快处理FBA索赔吧，不然要亏死！

最近，亚马逊美国站又放大招了！这次是FBA库存赔偿政策的更新，直接把不少卖家“整破防”。从2025年3月10日起，亚马逊明确表示，对于客户下单前丢失或损坏的库存，赔偿标准将从原来的按销售价格赔付变成了按制造成本赔付！两字之差，对卖家却是大不同！这里的“制造成本”指的是卖家购买商品的成本，包括从制造商、批发商或经销商处采购，或自行生产的成本，但不包括运费、手续费、关税等其他费用。新政策核心变化，卖家

没事别想不开去干亚马逊

昨天深夜刷抖音，被各种亚马逊爆单、暴利的视频刷屏了。作为一个从2017年就开始做亚马逊的老卖家，看着这些视频我真的忍不住要说几句。我创业的时候只带了5万块钱，那会儿确实好做，选个小众品类，做好基础listing优化，很快就能回本。但现在的市场环境，没个几十万真不敢建议你轻易入场。为啥这么说？且听我慢慢道来。前期投入大，很难快速盈利01现在的亚马逊市场和2017年已经完全不同了。以前一个关键词的点击

突发！5000万美金大账号被封

今天是圣诞节，海外社交媒体上却有卖家，为一位疑似账号被封的大卖呐喊。‍‍一位自称年销售额有5000万美金的亚马逊大卖在卖家论坛发帖，账号无故被封！被封号卖家认为，亚马逊封号后连提交的相关供应商证据都不进行审核，表达出强烈的不满和无奈。这位大卖提到，自己在亚马逊已经运营了8年，为美国top卖家之一。但是亚马逊以无法验证asin为由，冻结了店铺价值500万美元的库存。卖家认为亚马逊的处理方式是极度不公

疑亚马逊给大卖发警告信，安克下架所有Temu产品

2024年，随着越来越多平台的高速崛起，一场以卖家为中心的抢人大战进入了白热化阶段。其中尤以出海四小龙的动作最为声势浩大。据业内消息，自今年三月以来，Temu等平台陆续在全国多个城市召开招商大会，从半托管和全托管两大方向挖掘新卖家，覆盖上百个细分品类。亚马逊中国卖家以及国内产业带商家是这些平台的重点拓展对象。Marketplace Pulse研究显示，SHEIN和Temu上约20%的卖家，同时也在

一年半为公司创造将近600W利润，这样的战绩找新工作可以拿多少底薪? 现公司的作为让我心寒……

匿名用户我的C位2022年下半年到的这家公司，2023年拿到过大类目200名，小类BS，2023年全年销售额$350W+，全年日均单量300+, 全年为公司创造利润￥400W+；加上2022年下半年为公司创造的￥150W+的利润，一年半已经为公司创造￥500W+将近￥600W的利润了。这样的战绩找新工作可以拿多少底薪？来这个公司现在也快两年了，一开始底薪比较低的,因为一开始只有1年的经验，低点就低

阿里巴巴在摩洛哥启动首个非洲电商平台，开拓全球市场

AMZ123获悉，近日，阿里巴巴正式在摩洛哥启动了其首个非洲电商平台，这是阿里巴巴进军非洲市场的关键一步。该平台旨在帮助摩洛哥的制造和出口企业，拓展国际市场，特别是针对北美市场的需求。摩洛哥的战略位置、多元化的产业、高质量的产品、先进的基础设施、优越的地理位置（地中海最大的集装箱港口丹吉尔地中海港），是推动阿里巴巴决定在该国开展业务的关键因素。阿里巴巴进入摩洛哥市场旨在加强全球贸易联系，提高摩洛哥

万万没想到，这个品在Temu上卖了100万件！

经常有卖家跟芒果酱抱怨，铺货了也不出单，觉得跨境太难了，其实是没找到正确的选品姿势。今天我们就以全球第二大电商平台Temu为例，给大家盘一盘到底该如何铺货？一、选品思路01市场需求这个需求可以来自平台买手，也可以来自自己对国外地域文化的了解，这方面可以介绍一个小妙招，大家可以去刷目的地国家的影视作品。🤞据了解，Temu2025年的重点会加大除美区外的流量扶持力度，平台侧已经精细化运营，2025年“

《亚马逊全球消费趋势及选品报告5》PDF下载

消费者是企业的生命线，而他们的行为永远在变化。为了让企业真正了解消费者的需求，亚马逊每季度均会撰写及发布此趋势报告有助于企业发掘尚未被满足的消费需求，促进产品创新。

《2024亚马逊广告报告》PDF下载

2023年对电子商务来说是一个改变游戏规则的一年，开启了人工智能时代和新的社交媒体商务时代。新技术和销售平台的融合正在改变销售和购物体验，并让新的参与者- 从抖音到特木-与亚马逊竞争。

《2024年东南亚新能源应用产品电商行业市场洞察报告》PDF下载

东南亚是全球能源需求最旺盛的地区之一。根据国际能源署(IEA)预测，2050年东南亚地区的能源需求预计增加2倍。这主要是因为东南亚高度依赖化石燃料，未来可能面临价格波动和供应风险。因此，各国陆续出台了相关政策，鼓励与支持低碳能源转型。

《中国企业全球化运营白皮书》PDF下载

2024年，当我们谈起中国企业出海与全球化的时候，我们已经有和过去完全不同的语境:一方面，“不出海，就出局”，已经成为近期一些中国出海企业的信条，他们已将出海作为企业生存发展的长期主义选择;另一方面，政府也出台鼓励中国科技企业出海的政策，出海已经成为一种新的企业时尚，少数尝到出海红利的中国企业惊讶于时局变化之快，一些企业出海不足5年就已经获得快速的业务增长，出海真的可以遇到蓝海。

《2024Q1 美国站消费者趋势报告》PDF下载

大多数消费者(52%)表示他们在2024年第一季度的总体支出与去年第四季度大致相同。这与过去三年不同，因为报告第一季度支出与第四季度相似的消费者比例较低。这可能归因于2023年消费者报告通过提前购物、购买较少礼物以及采用其他节省资金的策略来减少节日支出。

《出口中东跨境电商行业洞察报告》PDF下载

2023 年，全球消费需求持续转向线上，中国出口跨境电商持续增长，海外电商机遇广阔。对于中国出海品牌和卖家来说，持续挖掘新增量，在全球市场解锁新蓝海，是大势所趋。

《2024年X中国品牌出海营销白皮书》PDF下载

“不出海，就出局”成为中国工商界最火的流行语之一。越来越多的中国新春伊始，企业将出海作为战略发展的重要组成部分，积极布局全球市场，寻求新的增长空间。

《政策鼓励下，看好跨境电商和海外仓发展前景》PDF下载

新兴电商平台 Temu、shein 纷纷布局“半托管”模式，有望提升家具线上渗透率及海外仓需求。24 年1月，速卖通开放半托管模式。24年3月，Temu 在美国上线半托管模式，半托管模式中，商家需要负责供货、物流仓储和广告、售卖等环节。

AMZ123跨境电商

专注跨境行业热点事件报道，每日坚持推送原创深度热文

AMZ123卖家导航

这个人很懒，还没有自我介绍