分类目录归档:Python

《Python网络数据采集》5.1节示例程序错误解决及re.sub用法

问题

学习《Python网络数据采集》5.1节时,作者给出了一个示例程序,试着运行了一下,发生以下错误

仔细研究,发现是src有问题,没有在代码中进行处理,这里第一个获取到的src的url是

实际文件应该是jquery.js,但是后面带了个版本号的小尾巴“?v=1.4.4”

所以在写入文件的时候出错。

解决方法及re.sub的用法

由于示例网站里面src的url不止一处带小尾巴,所以考虑用正则表达式进行替换。

网上随便搜到一个正则表达式替换字符串的示例:

详解Python中re.sub

所以本书示例代码可以修改如下:
首先导入re模块

然后在getDownloadPath函数中加入替换语句:

问题解决,修改后的代码运行结果如下: