半点优化网 http://www.bdxc.net/
当前位置首页 > 网站技术问题> 正文

爬虫爬取某个网站进行个股分析时,源代码关键数字被屏蔽,是因为JavaScript的原因吗?要怎么破解?

2021-10-20 19:16:47 暂无评论 40 网站技术问题 爬虫   个股   源代码

蛮有意思的,搞得我很想去看看。关键数字被屏蔽了,可以看看渲染后的html是否为数字,还是一串unicode编码,也有可能是一串图片(很少有公司有实力做到这一步)。基本是下面几类:

1:字体库加密,在我的文章里有过一篇文章说的字体库加密的可以对照下。验证方式是点开源代码看看是不是一串unicode编码。

2:图片,使用图片拼接数学在百度的指数上面有应用,这个麻烦一点点。用f12看下样式就好。

3:Js动态控制css实现渲染。汽车之家的m站是这种,就是设置某个css样式背景是某个字符,也可以通过f12看看css就可以确定了。

至于反爬,感觉没点真功夫比较悬,我估计是第一种,毕竟简单。这里并不是不想教方法,因为内容有点多,我一下子说不完,后面想看的可以关注我。第一种我的文章已经写了。

猜你喜欢