火车头采集器采集搜狐文章的时候图片地址是加密的,使用搜狐号文章图片解密插件可以还原图片真实地址。
搞站的都应该采集过搜狐号文章,不过最近搜狐号文章图片加密了。当发送HTTP请求后或你使用采集软件时,想要直接截取搜狐号文章正文时,哐当发现搜狐号文章img图片路径加密了???
仔细看下搜狐号文章正文img标签路径都被加密,但是通过浏览器访问是正常的,盲猜js在作怪。
直接从裤裆掏出F12,断点调式。一眼看出是AES加密,知道加密方法了。直接调用CryptoJS库解密就可以了!
CryptoJS加密模块AES ECB pkcs7 key是www.sohu.com6666
js调用例子:需要引用CryptoJS加密库
-
var key = CryptoJS.enc.Utf8.parse("www.sohu.com6666");
-
function AES_Encrypt(word) {
-
var srcs = CryptoJS.enc.Utf8.parse(word);
-
var encrypted = CryptoJS.AES.encrypt(srcs, key, {
-
mode: CryptoJS.mode.ECB,
-
padding: CryptoJS.pad.Pkcs7
-
});
-
return encrypted.toString();
-
}
-
function AES_Decrypt(word) {
-
var srcs = word;
-
var decrypt = CryptoJS.AES.decrypt(srcs, key, {
-
mode: CryptoJS.mode.ECB,
-
padding: CryptoJS.pad.Pkcs7
-
});
-
return decrypt.toString(CryptoJS.enc.Utf8);
-
}
PHP调用例子:
-
$str='8MY9RGaCWaBsd6kkgG/pST3npzZkiPX4IvYa+fMD5xBnXzWJM1dhGDZrzNHYnjVAr9n23rf3YhtLGja+NUz0NsY2Ys5srh6/tMRWSaPtnSE=';
-
$encrypted = base64_decode($str);
-
$reslut= openssl_decrypt($encrypted, 'AES-128-ECB', 'www.sohu.com6666', OPENSSL_RAW_DATA);
-
echo $reslut;
以下是测试效果:
开启搜狐号文章图片解密插件之前可见图片地址是加密的
开启搜狐号文章图片解密插件之后可见图片已显示真实地址
以上是搜狐号文章图片解密插件的知识,和火车头采集搜狐号文章图片还原真实地址的测试效果,如有疑问可以看图片中红色的数字(q)。
参考文献:《搜狐号文章图片解密还原 含调用例子》
此文由 晨敏网 编辑,未经允许不得转载!:首页 > 奇·趣事 » 搜狐号文章图片解密插件, 火车头采集搜狐号文章图片还原真实地址