任佳伟：使用「Web Scraper」抓取商品信息

任佳伟

以中国亚马逊卖家为中心,引导每一个卖家,运用互联网产品运营的思维去经营自己的店铺和产品,希望能把每一家在亚马逊上卖货的公司,变成一家互联网公司.让爆单成为每个卖家日常生活的一部分.

44267

2018-09-21 19:14

44267

任佳伟

转载是一种动力分享是一种美德关注是一种收获

之前我们讲到用Chrome插件——Instant Data Scraper来爬取亚马逊的Review，许多小伙伴已经不再满足于爬Review了。怎么办？那就要学习更厉害的工具啦，当然更厉害的工具也会更复杂。

今天要为大家介绍的也是一个Chrome插件——Web Scraper。看看它在「Chrome应用商店」的评价吧，我相信它也会给你惊喜的！

有的小伙伴可能会说，你之前不说去你的「Web Scraper！」吗？

哎呀，我就那么一说嘛。毕竟我们连亚马逊都敢做，学习怎么用一个爬虫插件有难度？不存在的！那么就我开始学习使用「Web Scraper」吧！

一到底怎么添加Chrome插件？

方式1：

访问https://chrome.google.com/webstore

（需要科学上网），在页面搜索「Web Scraper」，搜索结果正第一个就是啦，点击按钮「添加至CHROME」。

方式2：

直接百度搜索「Chrome插件」找一些非Google官方的网站下载插件。点击按钮「添加至CHROME」。

方式3：

如果小主你实在找不到，私信我吧。

成功安装后你的浏览器右上角会显示

这个蜘蛛网图标。

二如何使用Web Scraper？

1、打开Web Scraper

装好插件后是不是迫不及待试试看它能帮我抓到什么数据？那我们就一起来爬亚马逊的商品吧。

这里我选择的爬美国站Best-Sellers中的Book，打开链接后按下F12或在网页空白处点击鼠标右键—>检查。什么鬼！浏览器出现了一堆看不懂的东西？不用担心，再点击↓

这就到「Web Scraper」的界面了。

2、创建爬虫

如图点击Create new sitemap → Create Sitemap

在Sitemap name中填入自己想要为这个爬虫取的名字，如：「book」。在Start URL中填写想要爬的网站链接，这里我们填入亚马逊Best Sellers in Books的链接：https://www.amazon.com/best-sellers-books-Amazon/zgbs/books/ref=pd_dp_ts_books_1，点击「Create Sitemap」就创建了一个名为「Book」的爬虫。

3、创建选择器

完成爬虫的创建后我们就需要创建选择器了，选择器我们可以认为它是你需要爬取的范围。点击「Add new selector」,将跳转至这个页面。

「id」（即给选择器命名）我们可以自由发挥，只要你自己知道这个「ID」代表的是这个选择器（爬取范围）就OK啦！这里我们先爬取商品的标题，所以命名为title。

「Type」选择的是类型，这里我们默认为「Text」类型。

三「Selector」

「Selector」就是这里的重点了！

1、我们首先点击Selector中的「Select」按钮，将鼠标移动到页面上。你会发现你的鼠标所到之处都会变成「原谅色」（绿色），这就对了。我们将鼠标移动到一本书的标题上，标题底色变红，就表示已经选取了这一本书的标题，如下图↓

别停再点旁边另一本书的名字。这样做的目的是为了让「Web Scraper」找到当前页面中所有相同属性的数据，一般情况下点击两个数据，该页面所有相同数据底色都会变红。

2、「Element preview」按钮可预览当前已选择的元素，点击后效果与上图一样。

3、「Data preview」按钮可预览当前已抓取到的数据。可我们完成上面步骤后点击「Data preview」却仅有一条数据是为啥？

看到「Multiple」没有？点一下，再按「Data preview」按钮就可以看到整页所有书籍的标题啦。

「Regex」意思是正则表达式，在这里我们默认不填。正则表达式是一个用来匹配字符串的一个模式，最简单的正则表达式就是一个简单的字符串，比如'python'这个可以用来匹配'python'这个词语。你可以用正则表达式在一串字符中来匹配一个你要查找的内容，或者替换他，或者将其分割成字符片段。对于正则表达式，以为IT大牛James Werner Zawinski曾经用“some people, when confronted with a problem, think, "I know, I'll use regular expressions." Now they have two problems.”这句话来形容正则的晦涩、难懂。

「Delay」表示每次访问中的延迟时间，这里我们设置为500。

「Parent Selectors」会罗列出各选择器的层级关系。

「Save Selector」点击该按钮可以保存选择器。

4、数据抓取和保存，在完成选择器编辑并预览数据无误后，我们就可以设置爬取参数并开始抓取数据了。

如图点击「Scrape」会转至爬取参数界面。

其中「Request interval」指每次请求间隔、「Page load delay」指每次页面加载延时。这两个参数都不建议设置过小，若过快页面会出现验证码，导致我们无法抓到想要的数据。完成参数填写后点击「Start scraping」就开始爬取数据啦！

在完成爬取后，点击「Export data as CSV」就可以把数据以CSV格式保存到本地啦。至此大功告成！

今天是「Web Scraper」最最最基础的教程，因为很多新手卖家反馈说复杂的看不太懂。大家有什么问题或者想看什么类型的干货都可以留言，这边会一一回复你们！

▼

往期精彩回顾

▼

【Python爬虫】：使用「Selenium」+「Chromedriver」爬僵尸链接

【Python爬虫】：使用「Requests」+「bs4」写亚马逊爬虫

任佳伟：如何利用Instant Data Scraper插件抓取亚马逊评论？

好文！必须点赞

免责声明

本文链接:

本文经作者许可发布在AMZ123跨境头条，如有疑问，请联系客服。

美通供应链

专注FBA运输、海外仓等一站式、一揽子、一条龙服务

马丁海外仓

自营欧美海外仓,专注中小件,价格优势,对接简单高效

捷胤知识产权

美国商标注册1000起美国公司注册 1000起美国外观最快4个月下证

积特知识产权

行业案例超5万+，合规申请，人工指导服务，终身售后

美通供应链

专注FBA运输、海外仓等一站式、一揽子、一条龙服务

马丁海外仓

自营欧美海外仓,专注中小件,价格优势,对接简单高效

捷胤知识产权

美国商标注册1000起美国公司注册 1000起美国外观最快4个月下证

积特知识产权

行业案例超5万+，合规申请，人工指导服务，终身售后

跨界实习生我的C位哇大家圣诞节这两天的销量怎么样？我一个星期前还是每天一万美金销售额就在今天只有一千五百美金了真的太离谱了已经生无可恋了……做亚马逊真的需要一颗强大的内心呀「精彩回帖」匿名用户赞同来自: Beneme 、 kaiguoguo666888 、 mysclw 、 Shealuck 、 Holshet平安夜和圣诞节都在忙宗教活动和家庭聚会，没空线上购物。这两天销量腰斩说的

日销量超6千单，可视电动洗耳神器跻身TikTok美区热销榜第二

o1.日销量超6千单，可视电动洗耳神器跻身TikTok美区热销榜第二据Shoplus超店有数数据，一款可视电动洗耳神器在12月25日销量达到6.2千单，凭借日销售额9.3万美金的成绩跻身当日的TikTok美区热销商品榜第二位。“Dustproof Ear Wax Removal Kit with Camera Light”是一款家用的耳垢清洁神器，该产品配备有360°广角镜头，能够提供耳道内详细实

月销超10万件！亚马逊最新美容个护十大热销产品推荐

AMZ123获悉，近期亚马逊上10款美容个护产品持续热销，受到消费者广泛欢迎和好评。1.Sally Hansen透明指甲强化剂这款指甲强化剂含有视黄醇，质地如指甲般坚硬，快速干燥，提供晶莹剔透、高光泽的保护性涂层，可锁住指甲颜色，有助于防止碎裂、脱落和褪色。亚马逊上，这款产品位居指甲强化剂畅销榜第3名，上月销量10000+，评论数达20370个，评分为4.6星，五星好评率为78%。2.Essenc

越南新法规将影响TikTok与FB，未验证账户无法直播

AMZ123获悉，近日，越南政府宣布，于12月26日起实施新的互联网法规“第147号法令”，要求在越南运营的社交媒体平台如Facebook和TikTok验证用户身份，并将相关数据交给政府。根据新法令，所有社交平台必须通过用户的电话号码或越南身份证号码验证用户账户，并与用户的全名和出生日期一同存储。社交平台公司需根据政府要求，提供用户数据，并在24小时内删除任何被视为“非法”的内容。此外，社交媒体平

澳大利亚圣诞购物支出将达24亿美元，家具用品成首选

AMZ123获悉，近日，澳大利亚零售商协会与Roy Morgan的最新研究报告显示，预计今年圣诞节期间，澳大利亚人的消费将大幅增长，达到13亿美元。而在12月最后几天，预计消费额将激增至24亿美元，整体消费较去年增长约2.7%。随着生活成本上升，越来越多的消费者选择通过黑色星期五、网络星期一等促销活动进行网购。这一趋势表明，虽然传统的实体店购物仍具吸引力，但电商平台已经成为越来越多消费者的首选渠道

2024.12.26亚马逊选品推荐（仅供参考）：小雏菊钥匙扣

2024.12.26亚马逊选品推荐（仅供参考）：小雏菊钥匙扣站点：北美站，加拿大产品名：小雏菊钥匙扣专利：未查询采购：国内1688工厂价3.42元售价：亚马逊北美售价16加币重量：约10G运费：FBM运费25人民币左右FBM净利润：40元左右FBA净利润：40-100元左右;模式：适合FBM和FBA，（所有价格都是建议参考价格）单量：在卖家精灵中显示上架时间是2021年04年11号，目前为止持

【物流服务】最新统一包装指南（危险品和大件、笨重、形状不规则品）！

商品分类概述危险品具有物理危险、易燃、腐蚀性、有毒、电池供电*或爆炸性的物品可被视为危险物品▪固体范例:刀具、切割工具、固体杀虫剂、电池，*带有电池或内置电池的物品▪液体范例：喷雾剂、液化石油气（注意：如果是液体，还需遵循易漏品包装指南）注意：所有由电池供电的物品，无论包裹内是否有电池，都被视为危险品。为了防止任何受伤，尖锐物体的末端/刀刃和带有尖端的物品（例如刀、刀片等）应该用坚固材料覆盖起

【物流服务】最新统一包装指南（危险品和大件、笨重、形状不规则品）！

亚马逊赚钱的底层逻辑

实不相瞒，最近我在跟几个老铁吃火锅的时候，大家聊起了亚马逊这几年的变化。有人感慨政策变得太快，有人说选品越来越难，还有人直呼跨境电商水太深、看不懂了。说实话，每次听到这些讨论，我都有种似曾相识的感觉。还记得我刚入局跨境电商时，租住在深圳城中村的老房子里，每天对着电脑研究亚马逊的规则和数据。从最初的懵懂，到现在能够从容应对市场变化，这一路走来，我深深体会到：方法在变，但底层逻辑永远不变。长期主义者的

亚马逊3月10号前尽快处理FBA索赔吧，不然要亏死！

最近，亚马逊美国站又放大招了！这次是FBA库存赔偿政策的更新，直接把不少卖家“整破防”。从2025年3月10日起，亚马逊明确表示，对于客户下单前丢失或损坏的库存，赔偿标准将从原来的按销售价格赔付变成了按制造成本赔付！两字之差，对卖家却是大不同！这里的“制造成本”指的是卖家购买商品的成本，包括从制造商、批发商或经销商处采购，或自行生产的成本，但不包括运费、手续费、关税等其他费用。新政策核心变化，卖家

没事别想不开去干亚马逊

昨天深夜刷抖音，被各种亚马逊爆单、暴利的视频刷屏了。作为一个从2017年就开始做亚马逊的老卖家，看着这些视频我真的忍不住要说几句。我创业的时候只带了5万块钱，那会儿确实好做，选个小众品类，做好基础listing优化，很快就能回本。但现在的市场环境，没个几十万真不敢建议你轻易入场。为啥这么说？且听我慢慢道来。前期投入大，很难快速盈利01现在的亚马逊市场和2017年已经完全不同了。以前一个关键词的点击

突发！5000万美金大账号被封

今天是圣诞节，海外社交媒体上却有卖家，为一位疑似账号被封的大卖呐喊。‍‍一位自称年销售额有5000万美金的亚马逊大卖在卖家论坛发帖，账号无故被封！被封号卖家认为，亚马逊封号后连提交的相关供应商证据都不进行审核，表达出强烈的不满和无奈。这位大卖提到，自己在亚马逊已经运营了8年，为美国top卖家之一。但是亚马逊以无法验证asin为由，冻结了店铺价值500万美元的库存。卖家认为亚马逊的处理方式是极度不公

疑亚马逊给大卖发警告信，安克下架所有Temu产品

2024年，随着越来越多平台的高速崛起，一场以卖家为中心的抢人大战进入了白热化阶段。其中尤以出海四小龙的动作最为声势浩大。据业内消息，自今年三月以来，Temu等平台陆续在全国多个城市召开招商大会，从半托管和全托管两大方向挖掘新卖家，覆盖上百个细分品类。亚马逊中国卖家以及国内产业带商家是这些平台的重点拓展对象。Marketplace Pulse研究显示，SHEIN和Temu上约20%的卖家，同时也在

一年半为公司创造将近600W利润，这样的战绩找新工作可以拿多少底薪? 现公司的作为让我心寒……

匿名用户我的C位2022年下半年到的这家公司，2023年拿到过大类目200名，小类BS，2023年全年销售额$350W+，全年日均单量300+, 全年为公司创造利润￥400W+；加上2022年下半年为公司创造的￥150W+的利润，一年半已经为公司创造￥500W+将近￥600W的利润了。这样的战绩找新工作可以拿多少底薪？来这个公司现在也快两年了，一开始底薪比较低的,因为一开始只有1年的经验，低点就低

阿里巴巴在摩洛哥启动首个非洲电商平台，开拓全球市场

AMZ123获悉，近日，阿里巴巴正式在摩洛哥启动了其首个非洲电商平台，这是阿里巴巴进军非洲市场的关键一步。该平台旨在帮助摩洛哥的制造和出口企业，拓展国际市场，特别是针对北美市场的需求。摩洛哥的战略位置、多元化的产业、高质量的产品、先进的基础设施、优越的地理位置（地中海最大的集装箱港口丹吉尔地中海港），是推动阿里巴巴决定在该国开展业务的关键因素。阿里巴巴进入摩洛哥市场旨在加强全球贸易联系，提高摩洛哥

万万没想到，这个品在Temu上卖了100万件！

经常有卖家跟芒果酱抱怨，铺货了也不出单，觉得跨境太难了，其实是没找到正确的选品姿势。今天我们就以全球第二大电商平台Temu为例，给大家盘一盘到底该如何铺货？一、选品思路01市场需求这个需求可以来自平台买手，也可以来自自己对国外地域文化的了解，这方面可以介绍一个小妙招，大家可以去刷目的地国家的影视作品。🤞据了解，Temu2025年的重点会加大除美区外的流量扶持力度，平台侧已经精细化运营，2025年“

《亚马逊全球消费趋势及选品报告5》PDF下载

消费者是企业的生命线，而他们的行为永远在变化。为了让企业真正了解消费者的需求，亚马逊每季度均会撰写及发布此趋势报告有助于企业发掘尚未被满足的消费需求，促进产品创新。

《2024亚马逊广告报告》PDF下载

2023年对电子商务来说是一个改变游戏规则的一年，开启了人工智能时代和新的社交媒体商务时代。新技术和销售平台的融合正在改变销售和购物体验，并让新的参与者- 从抖音到特木-与亚马逊竞争。

《2024年东南亚新能源应用产品电商行业市场洞察报告》PDF下载

东南亚是全球能源需求最旺盛的地区之一。根据国际能源署(IEA)预测，2050年东南亚地区的能源需求预计增加2倍。这主要是因为东南亚高度依赖化石燃料，未来可能面临价格波动和供应风险。因此，各国陆续出台了相关政策，鼓励与支持低碳能源转型。

《中国企业全球化运营白皮书》PDF下载

2024年，当我们谈起中国企业出海与全球化的时候，我们已经有和过去完全不同的语境:一方面，“不出海，就出局”，已经成为近期一些中国出海企业的信条，他们已将出海作为企业生存发展的长期主义选择;另一方面，政府也出台鼓励中国科技企业出海的政策，出海已经成为一种新的企业时尚，少数尝到出海红利的中国企业惊讶于时局变化之快，一些企业出海不足5年就已经获得快速的业务增长，出海真的可以遇到蓝海。

《2024Q1 美国站消费者趋势报告》PDF下载

大多数消费者(52%)表示他们在2024年第一季度的总体支出与去年第四季度大致相同。这与过去三年不同，因为报告第一季度支出与第四季度相似的消费者比例较低。这可能归因于2023年消费者报告通过提前购物、购买较少礼物以及采用其他节省资金的策略来减少节日支出。

《出口中东跨境电商行业洞察报告》PDF下载

2023 年，全球消费需求持续转向线上，中国出口跨境电商持续增长，海外电商机遇广阔。对于中国出海品牌和卖家来说，持续挖掘新增量，在全球市场解锁新蓝海，是大势所趋。

《2024年X中国品牌出海营销白皮书》PDF下载

“不出海，就出局”成为中国工商界最火的流行语之一。越来越多的中国新春伊始，企业将出海作为战略发展的重要组成部分，积极布局全球市场，寻求新的增长空间。

《政策鼓励下，看好跨境电商和海外仓发展前景》PDF下载

新兴电商平台 Temu、shein 纷纷布局“半托管”模式，有望提升家具线上渗透率及海外仓需求。24 年1月，速卖通开放半托管模式。24年3月，Temu 在美国上线半托管模式，半托管模式中，商家需要负责供货、物流仓储和广告、售卖等环节。

北美电商资讯

AMZ123旗下北美跨境电商新闻栏目，专注北美跨境电商热点资讯，为广大卖家提供北美跨境电商最新动态、最热新闻。

跨境电商赢商荟

跨境电商行业唯一一家一年365天不断更的媒体！