分类 技术心得 下的文章

python调用浏览器批量打开网址

需求:网站有7000多个栏目,现在需要逐个打开检查页面显示是否异常

最笨的方法当然是人肉一个个栏目URL点击打开

python2.7脚本:

import webbrowser
import codecs
import time
with open('C:\\Users\\asus\\Desktop\\text.txt') as fp:
  for ebayno in fp:
    url = ebayno.strip()
    time.sleep(1)
    webbrowser.open(url)

注意2个问题:
1,上面txt文件是用utf-8保存的一行一个URL
2,txt文件的路劲要写对,linux和windows下路径写法肯定不一样。我第一次使用windows下调python,最开始写成C:UsersasusDesktoptext.txt,死活不对,经过群友提示,加成双斜杠就OK了。

用vs code实现正则表达式批量替换内容

我现在还不会正则表达式,所以根据搜索到的文章,看到别人的用法,然后依样画葫芦式地运用下。

替换前的内容:

static/cui.css
static/style.css
static/less.css

需要在static目录后面再加一个css目录

打开vs code,然后Ctrl+F,把搜索功能调出来,点击下查找框左边向下展开的箭头,把替换框也展现出来。

在查找框输入:static/(.*).css
在替换框输入:static/css/$1.css

点击查找框后面的第三个按钮,如下图,表示启用正则表达式匹配,你会看到文档中被成功匹配的内容被标色了,然后再点击批量替换就OK了。
5.png

从上面的代码可以看出,(.)表示了斜杠和标点之间所有的内容,$1代表了上面(.)匹配出的值。

现在有一个新需求,就是把一篇文章里的A标签全部删掉,但是要保留A标签里的关键词。整理下文章里所有A标签的案例,如下:

<a href="http://www.xxoo.com">关键词一</a>
<a href="http://www.xxoo.com" title="xxoo">关键词二</a>
<a href="http://www.xxoo.com" target="_blank">关键词三</a>

在查找框输入:<a href="(.*)>(.*)</a>
在替换框输入:$2

批量替换即可。从上面按钮可以看到,查找用了2个(.*)分别匹配2个值,然后替换时,$2表示保留第二个值。

有时候(.*)不能精确匹配出想要的结果,可能跟开启了贪婪模式有关,此时可以改用:([^\\]*)

破解开源CMS软件AKCMS的思路

很多免费开源CMS软件都会在自己的作品中加上自己的版权信息,比如ecms,dedecms,ecshop,discuz,会在你的网站中某个地方插入powered by xxoo这种字眼。AKCMS是怎么插入的呢?有2个地方:

1,他会在你每个网页底部强行插入powered by akcms的字体和链接,网友都看得到的。这种可以用<span style="display:none;">[powered]</span>方法,在网页上隐藏显示,但翻看HTML代码还是能看到版权信息。

2,他会在每个页面插入代码,网页上看不到什么效果,只有翻看HTML代码能看到:

阅读剩余部分