当前位置:网络资源中心文章中心网站运营建站心得 → 文章内容

DEDE采集图片加文字教程

减小字体 增大字体 作者:随缘  来源:本站  发布时间:2008-3-14 22:33:55

好多站长现在都用DEDECMS,有的站长想采集却没又不会采集,其实刚刚开始的时候我也不知道怎么采集,也是自己漫漫摸索来的,现在拿来让大家分享,于是我写了个采集教程方便大家。本采集教程是图片演示,简单易懂,大家有什么问题可以留言。
说一句很内行的话:用DEDE采集,要注意匹配区域的惟一性。

打开http://www.chinaacc.com/web/rs_ddgc/more.asp?page=1&ac=149,我要采集的是中华会计网校的“道德观察”栏目,而且要一次性将他的东西实行“拿来主义”。

分析一下翻页的链接,
http://www.chinaacc.com/web/rs_ddgc/more.asp?page=1&ac=149→这是第一页的链接地址
http://www.chinaacc.com/web/rs_ddgc/more.asp?page=2&ac=149→这是第二页的链接地址
我们可以找出其中的变量。

接下来,我们在众多链接中将文章链接筛选出来。

查看源代码,找到“4000万巨额贷款悄然消失的幕后……”(这一会儿功夫,已经更新了~~),在其前面找一个全文惟一的HTML代码!

同理,找“栽倒在审计面前的“能人””在其后面,找全文惟一的HTML代码,那么文章地址就可以被筛选出来了!


接着是筛选文章标题!

打开一个文章页面,查看源代码!和上面同道理,找到文章的标题,然后将文章前后的几个HTML代码作为标识。

文章内容亦如此!!!

这样,采集规则就算完成了!还有好多其它东西我都不管,主要我是不知道那些东西有什么用,如何用!设置完基本的东西就差不多了。

我们来测试一下。

呵呵,兄弟采集成功了。。。

接下来,采集,导入数据库并生成HTML。

OK了朋友们·就是这样采集文章的,在有什么不明的联系群:57904900