phome_ecms_infotmp_news新闻系统模型-采集临时表

字段名 字段类型 解释
id bigint(20) unsigned 信息ID
classid int(10) unsigned 采集节点ID
oldurl varchar(200) 采集页面地址
checked tinyint(1) 是否已入库,0为未入库,1为已入库
tmptime datetime 采集时间
userid mediumint(8) unsigned 采集者用户ID
username varchar(20) 采集者用户名
truetime int(10) unsigned 真实发布时间
keyboard varchar(100) 关键字
title varchar(100) 标题字段
newstime datetime 发布时间字段
titlepic varchar(120) 标题图片字段
ftitle varchar(120) 副标题字段
smalltext varchar(255) 简介字段
writer varchar(30) 作者字段
befrom varchar(60) 信息来源字段
newstext mediumtext 内容字段
diggtop int(11) DIGG字段

阅读剩余部分

phome_ecms_infoclass_news新闻系统模型-采集规则副表

字段名 字段类型 解释
classid int(10) unsigned 采集节点ID
zz_title text 标题字段正则
z_title varchar(255) 标题字段预定义值
qz_title varchar(255) 标题字段地址前缀
save_title varchar(10) 标题字段远程保存
zz_titlepic text  
z_titlepic varchar(255)  
qz_titlepic varchar(255)  
save_titlepic varchar(10)  
zz_newstime text  
z_newstime varchar(255)  
qz_newstime varchar(255)  
save_newstime varchar(10)  
zz_ftitle text  
z_ftitle varchar(255)  
qz_ftitle varchar(255)  
save_ftitle varchar(10)  
zz_smalltext text  
z_smalltext varchar(255)  
qz_smalltext varchar(255)  
save_smalltext varchar(10)  
zz_writer text  
z_writer varchar(255)  
qz_writer varchar(255)  
save_writer varchar(10)  
zz_befrom text  
z_befrom varchar(255)  
qz_befrom varchar(255)  
save_befrom varchar(10)  
zz_newstext text  
z_newstext varchar(255)  
qz_newstext varchar(255)  
save_newstext varchar(10)  
zz_diggtop text  
z_diggtop varchar(255)  
qz_diggtop varchar(255)  
save_diggtop varchar(10)  

阅读剩余部分

python批量查询网址是否被百度收录

一个栏目下的内容达到10万条,但百度站长工具显示该栏目只收录了四五千条,意味着大量的内容被百度视为重复或垃圾内容,这种内容要么就是网站做改造,做专题,吸引蜘蛛,争取让这些内容被收录,或者把他们删除掉。

如果要把这些未被收录的删除掉,同时保留那些已经被收录的,就需要批量查询这10万网址哪些已收录,哪些未收录。

python批量查询网址是否被百度收录代码如下:

阅读剩余部分

python批量查询网页的HTTP状态码

最近业余时间在改版一个网站,改版之前频繁调整了一些栏目的属性,包括栏目的层级,这种最怕就是调整了栏目的从属关系,导致了栏目的URL地址改变,一旦改版就导致整个栏目及其下面的文章页地址变更,成为死链。而栏目有几千个,更加大意不得。

在栏目调整前,我把数据库和程序复制出去新建了一个镜像站,用镜像站里调整,然后把栏目地址数据导出来,然后前面批量加上线上域名,然后批量查询组装出来的地址是否能正常访问,能访问就说明没问题,返回404错误就说明调整后的栏目地址,是原来网站不存在的,就要排查错误。

阅读剩余部分

jQuery实现右侧指定区块固定漂浮效果

<!DOCTYPE HTML>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>测试</title>
<script type="text/javascript" src="http://www.cqxinhao.com/image/jquery-1.4a2.min.js"></script>
<script type="text/javascript">
    $(document).ready(function(e) {            
        t = $('.piaofu').offset().top;
        mh = $('.left').height();
        fh = $('.piaofu').height();
        $(window).scroll(function(e){
            s = $(document).scrollTop();    
            if(s > t - 10){
                $('.piaofu').css('position','fixed');
                if(s + fh > mh){
                    $('.piaofu').css('top',mh-s-fh+'px');    
                }                
            }else{
                $('.piaofu').css('position','');
            }
        })
    });
</script>
<style type="text/css">
    *{ padding:0px; margin:0px;}
    .box{ width:1000px; background:#ccc; margin:0 auto; overflow:hidden;}
    .left{ width:770px;height:2000px; background:#000;float:left;}
    .right{ width:220px; background:#FC6; float:right;}
    .sub01{ width:220px; height:100px; background:#0CC; margin-bottom:10px;}
    .piaofu{ width:220px; height:300px; background:#F66; font:normal 13px/30px \5FAE\8F6F\96C5\9ED1; text-align:center; top:10px;}
</style>
</head>
<body>
<div class="box">
    <div class="left"></div>
    <div class="right">
        <div class="sub01"></div>
        <div class="sub01"></div>
        <div class="sub01"></div>
        <div class="piaofu">我要固定漂浮</div>        
    </div>
</div>
</body>
</html>

阅读剩余部分