几个软件站采集规则(新云4.0系统测试通过)

霏凡软件站采集规则

列表 http://www.crsky.com/list/r_3_1.html
获取列表开始代码: <li><a class=”current” href=”#”><span>按时间排序</span></a></li>
获取列表结束代码:   <div class=”pagination”>
获取连接开始代码: <a href=”
获取连接结束代码: ”
获取标题开始代码: <span class=”xzdz”><a href=”#down”>跳到下载链接</a></span>
<span>
获取标题结束代码: </span>
获取内容开始代码: <div class=”section-content” id=”cText”>
获取内容结束代码: </div>
获取软件大小开始代码: 软件大小:</span>
获取软件大小结束代码: </li>
获取软件语言开始代码: 软件语言:</span>
获取软件语言结束代码:   </li>
获取运行环境开始代码:   运行环境:</span>
获取运行环境结束代码: </li>
获取授权方式开始代码:   授权方式:</span>
获取授权方式结束代码:   </li>

获取下载地址区域开始代码: <div class=”section appmirror”>
获取下载地址区域结束代码: </div></div></div>
获取下载地址开始代码: <script src=”
获取下载地址结束代码: ”
是否新窗口打开下载连接:   是
获取新窗口下载地址区域开始代码: 电信下载
获取下载地址区域结束代码: </li>
获取下载地址开始代码: down_url=
获取下载地址结束代码: &

 

天空下载站软件采集规则

列表 http://www.skycn.com/sort/sort010000_indate_DESC_1.html
获取列表开始代码: <img src=”../img/arrow.gif”></li>
</ul>
<div class=”boxBody”>
获取列表结束代码: <div class=”page”>
获取连接开始代码: <dt><a href=”
获取连接结束代码: ”
获取标题开始代码: <h2 class=”tit”>
获取标题结束代码: <p>
获取内容开始代码: <div id=”intro” class=”intro”>
获取内容结束代码:

获取软件大小开始代码:   <th width=”15%”>软件大小:</th><td width=”27%”>
获取软件大小结束代码: </td>
获取软件语言开始代码: 软件语言:</th><td>
获取软件语言结束代码:   </td>
获取软件类型开始代码: 软件类别:</th><td>
获取软件类型结束代码: /
获取授权方式开始代码: 软件性质:</th><td colspan=”3″>
获取授权方式结束代码:   </td>

获取下载地址区域开始代码:   迅雷用户专用下载
获取下载地址区域结束代码: 吉林白城网通下载
获取下载地址开始代码: <a href=”
获取下载地址结束代码: ”

myfiles软件站采集规则

列表 http://www.myfiles.com.cn/sort/23/
获取列表开始代码: <td width=”32%” class=”f12_white”>文件大小</td>
获取列表结束代码: <table width=”100%”>
获取连接开始代码: <a href=”
获取连接结束代码: ”
获取标题开始代码:   <h1>
获取标题结束代码:   </h1>
获取内容开始代码: <span class=”SoftDescription”>
获取内容结束代码:   </span>
获取软件大小开始代码:   <td width=”212″ height=”21″ class=”f12″ >
获取软件大小结束代码: </td>
获取软件语言开始代码: 软件语言:</span></td>
<td height=”21″ class=”f12″>
获取软件语言结束代码: </td>
获取运行环境开始代码: 运行环境:</span></td>
<td height=”21″ class=”f12″>
获取运行环境结束代码: </td>

获取下载地址区域开始代码:   <td><table border=’0′ cellspacing=’0′ cellpadding=’0′><tr><td width=’18’ height=’18’>
获取下载地址区域结束代码: </td></tr><tr></tr></table></td>
获取下载地址开始代码: href=’
获取下载地址结束代码: ‘

华军软件采集规则

列表 http://www.onlinedown.net/sort/38_1.htm
获取列表开始代码: <table width=550 border=0 cellspacing=0 cellpadding=0>
获取列表结束代码: </td> </tr> <tr> <td height=”34″ align=”center” valign=”middle”><table width=”550″ border=”0″ cellpadding=”0″ cellspacing=”0″ class=”pageback”>
获取连接开始代码: <h2><A href=”
获取连接结束代码: ”
获取标题开始代码: <h1>
获取标题结束代码: </h1>
获取内容开始代码: <td height=”100%” valign=”top” class=”border3″ style=”word-break:break-all”>
获取内容结束代码: <script
获取软件大小开始代码: 软件大小:</strong>
获取软件大小结束代码:   </td>
获取软件语言开始代码: 软件语言:</strong>
获取软件语言结束代码: </td>
获取运行环境开始代码:   运行环境:</strong>
获取运行环境结束代码: </td>
获取授权方式开始代码:   软件授权:</strong>
获取授权方式结束代码: </td>

获取下载地址区域开始代码: new Array(‘河北网通-企商在线IDC’,
获取下载地址区域结束代码: durl
获取下载地址开始代码: ‘
获取下载地址结束代码: ‘

打赏

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注