字段名 | 字段类型 | 解释 |
---|---|---|
id | bigint(20) unsigned | 信息ID |
classid | int(10) unsigned | 采集节点ID |
oldurl | varchar(200) | 采集页面地址 |
checked | tinyint(1) | 是否已入库,0为未入库,1为已入库 |
tmptime | datetime | 采集时间 |
userid | mediumint(8) unsigned | 采集者用户ID |
username | varchar(20) | 采集者用户名 |
truetime | int(10) unsigned | 真实发布时间 |
keyboard | varchar(100) | 关键字 |
title | varchar(100) | 标题字段 |
newstime | datetime | 发布时间字段 |
titlepic | varchar(120) | 标题图片字段 |
ftitle | varchar(120) | 副标题字段 |
smalltext | varchar(255) | 简介字段 |
writer | varchar(30) | 作者字段 |
befrom | varchar(60) | 信息来源字段 |
newstext | mediumtext | 内容字段 |
diggtop | int(11) | DIGG字段 |
phome_ecms_infoclass_news新闻系统模型-采集规则副表
字段名 | 字段类型 | 解释 |
---|---|---|
classid | int(10) unsigned | 采集节点ID |
zz_title | text | 标题字段正则 |
z_title | varchar(255) | 标题字段预定义值 |
qz_title | varchar(255) | 标题字段地址前缀 |
save_title | varchar(10) | 标题字段远程保存 |
zz_titlepic | text | |
z_titlepic | varchar(255) | |
qz_titlepic | varchar(255) | |
save_titlepic | varchar(10) | |
zz_newstime | text | |
z_newstime | varchar(255) | |
qz_newstime | varchar(255) | |
save_newstime | varchar(10) | |
zz_ftitle | text | |
z_ftitle | varchar(255) | |
qz_ftitle | varchar(255) | |
save_ftitle | varchar(10) | |
zz_smalltext | text | |
z_smalltext | varchar(255) | |
qz_smalltext | varchar(255) | |
save_smalltext | varchar(10) | |
zz_writer | text | |
z_writer | varchar(255) | |
qz_writer | varchar(255) | |
save_writer | varchar(10) | |
zz_befrom | text | |
z_befrom | varchar(255) | |
qz_befrom | varchar(255) | |
save_befrom | varchar(10) | |
zz_newstext | text | |
z_newstext | varchar(255) | |
qz_newstext | varchar(255) | |
save_newstext | varchar(10) | |
zz_diggtop | text | |
z_diggtop | varchar(255) | |
qz_diggtop | varchar(255) | |
save_diggtop | varchar(10) |
python批量查询网址是否被百度收录
一个栏目下的内容达到10万条,但百度站长工具显示该栏目只收录了四五千条,意味着大量的内容被百度视为重复或垃圾内容,这种内容要么就是网站做改造,做专题,吸引蜘蛛,争取让这些内容被收录,或者把他们删除掉。
如果要把这些未被收录的删除掉,同时保留那些已经被收录的,就需要批量查询这10万网址哪些已收录,哪些未收录。
python批量查询网址是否被百度收录代码如下:
python批量查询网页的HTTP状态码
最近业余时间在改版一个网站,改版之前频繁调整了一些栏目的属性,包括栏目的层级,这种最怕就是调整了栏目的从属关系,导致了栏目的URL地址改变,一旦改版就导致整个栏目及其下面的文章页地址变更,成为死链。而栏目有几千个,更加大意不得。
在栏目调整前,我把数据库和程序复制出去新建了一个镜像站,用镜像站里调整,然后把栏目地址数据导出来,然后前面批量加上线上域名,然后批量查询组装出来的地址是否能正常访问,能访问就说明没问题,返回404错误就说明调整后的栏目地址,是原来网站不存在的,就要排查错误。
jQuery实现右侧指定区块固定漂浮效果
<!DOCTYPE HTML>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>测试</title>
<script type="text/javascript" src="http://www.cqxinhao.com/image/jquery-1.4a2.min.js"></script>
<script type="text/javascript">
$(document).ready(function(e) {
t = $('.piaofu').offset().top;
mh = $('.left').height();
fh = $('.piaofu').height();
$(window).scroll(function(e){
s = $(document).scrollTop();
if(s > t - 10){
$('.piaofu').css('position','fixed');
if(s + fh > mh){
$('.piaofu').css('top',mh-s-fh+'px');
}
}else{
$('.piaofu').css('position','');
}
})
});
</script>
<style type="text/css">
*{ padding:0px; margin:0px;}
.box{ width:1000px; background:#ccc; margin:0 auto; overflow:hidden;}
.left{ width:770px;height:2000px; background:#000;float:left;}
.right{ width:220px; background:#FC6; float:right;}
.sub01{ width:220px; height:100px; background:#0CC; margin-bottom:10px;}
.piaofu{ width:220px; height:300px; background:#F66; font:normal 13px/30px \5FAE\8F6F\96C5\9ED1; text-align:center; top:10px;}
</style>
</head>
<body>
<div class="box">
<div class="left"></div>
<div class="right">
<div class="sub01"></div>
<div class="sub01"></div>
<div class="sub01"></div>
<div class="piaofu">我要固定漂浮</div>
</div>
</div>
</body>
</html>