大家好,我是二哥呀!
今天再给大家推荐一家小而美的互联网公司——亮数据,成立于 2014 年,总部设在以色列,全球目前约有 500 名员工,但却有超过 2000 个专利申报和计数。
我在他们的官网看到这样一段介绍:更在乎工作质量,而不是小时数,也就是传说中的 955 work-life balance 啊,在乎工作和生活质量的小伙伴完全可以冲一波啊。
大家可能有这样的印象,觉得以色列的软件水平很牛,但好像离我们很远,平常在国内接触不到。
我也没想到,前段时间,亮数据中国市场部的一位小姐姐找到我,说他们的软件正在进入中国市场,想通过我向中国的程序员介绍一下他们的产品,可点击官网直接体验。
他们提供的服务主要有两块:网络数据采集和商用代理网络,不少世界 500 强的公司都和他们有合作,按照他们的说法就是,主要是互联网上公开可以访问的数据,他们都能搞定。
那不少小伙伴看到这可能就明白了,不就是“爬虫”嘛,但他们做到了顶级,大家可以看看,顶级的爬虫是什么样子。
01、数据集商城
他们提供现成的数据集,适合立即需要数据且不需要自定义数据流的企业,数据集对象包括很多知名的公司,比如说 LinkedIn、抖音国际版、Amazon、沃尔玛等等。
我们来看一下 TikTok 的,估计也是很多国内小伙伴关心的,数据集包括账户名、昵称、粉丝数、平均创作得分等等一些非常关键的信息。
数据导出的格式可以是 JSON、CSV,非常方便,并且数据量非常大,据说 TikTok 的数据集大小超过 1.5 亿条以上,免费获取数据集体验。
如果未来能和国内的电商平台数据打通,比如说淘宝啊、京东啊、拼多多啊,不知道会给国内做电商的淘宝客带来多大的冲击。反正我的一个同学做淘宝客,数据都是从淘宝的店小二那里买来的。
02、按需定制数据集
如果你想在他们的基础设施上,自己跑爬虫,亮数据也提供了他们的 Web Scraper IDE,包括代码模板和现成的功能以加快开发速度。
还是以 TikTok 为例,在控制台选择 Web Scraper IDE,使用 TikTok 的配置模板。
进入 Web 编辑器,可以看到基础的代码已经帮我们写好了,我们选择一个账户,点击预览,可以看到控制台已经开始工作了。
稍等片刻,就可以在右侧看到对应的结果了。
如果想查看其他的账户,只需要在配置项中添加输入参数即可,然后点击「完成编辑」,可以进入到统计数据页查看结果。
03、亮数据电商洞察
亮数据还可以基于人工智能,为品牌和零售商提供电商见解和市场份额数据情报,包括 SKU、销售、定价、活动和广告份额的跟踪和监控,非常适合做跨境电商链条上的所有用户。
点击每一条数据,还可以看到对应的价格走势,非常强大。
04、商用代理网络
除了我上面提到的网络数据服务,亮数据还是商用代理网络的领头羊,有覆盖全球 195 个国家超 7200万个 IP,并利用专利技术开发出了像“亮网络解锁器”、“亮数据爬虫浏览器”、“搜搜引擎采集SERP API"这些低代码的爬虫工具,让数据采集变得非常便捷。特别是企业用户,可以采集大批量、高速稳定的全球网络数据为自己家的产品服务。
如果你恰好有代理网络方面的需求,戳链接进行注册体验,公司用户可免费试用!