|
AutoPager使用手册(未完,待续)
(A
English Version is being worked on)
Table
of Contents
1
AutoPager 前世今生 1
2
AutoPager 基本使用 4
2.1
安装 4
2.2
首次使用 5
2.3
页选项 6
3
AutoPager 基本设置 7
3.1
基本菜单项 7
3.2
规则更新源 8
3.3
规则设置 9
3.4
一般选项 14
3.5
自动更新 14
4
AutoPager 高级设置 14
4.1
自定义规则 14
4.2
自定义更新站点 14
5
AutoPager原理 14
5.1
地址匹配 14
5.2
滚动监视 14
5.3
链接地址定位 14
5.4
页面内容定位 14
5.5
后台加载方式 14
6
联系作者 14
1AutoPager
前世今生
AutoPager是一个Mozilla系列浏览器的扩展。它支持在Firefox,Flock,Mozilla和SeeMonkey中自动追加下一页面到当前页。很多网站都是分页显示内容。在阅读完一页后要手动点下一页按钮跳转到下一页。网站这样做的好处是每一页可以加载的很快,但是用户就要付出相应的点击下一页链接并等待下一页加载的代价。那么有没有什么解决方案呢?要求所有网站都用一页显示所有数据?这不太现实。AutoPager的方案是在你接近读到页尾时在后台加载下一页,并将下一页中的有效内容附加到当前页。
这里有一些例子:
AutoPager使用手册(未完,待续)
(A
English Version is being worked on)
Table
of Contents
1
AutoPager 前世今生 1
2
AutoPager 基本使用 4
2.1
安装 4
2.2
首次使用 5
2.3
页选项 6
3
AutoPager 基本设置 7
3.1
基本菜单项 7
3.2
规则更新源 8
3.3
规则设置 9
3.4
一般选项 14
3.5
自动更新 14
4
AutoPager 高级设置 14
4.1
自定义规则 14
4.2
自定义更新站点 14
5
AutoPager原理 14
5.1
地址匹配 14
5.2
滚动监视 14
5.3
链接地址定位 14
5.4
页面内容定位 14
5.5
后台加载方式 14
6
联系作者 14
1AutoPager
前世今生
AutoPager是一个Mozilla系列浏览器的扩展。它支持在Firefox,Flock,Mozilla和SeeMonkey中
自动追加下一页面到当前页。很多网站都是分页显示内容。在阅读完一页后要手动点下一页按钮跳转到下一页。网站这样做的好处是每一页可以加载的很快,但是用
户就要付出相应的点击下一页链接并等待下一页加载的代价。那么有没有什么解决方案呢?要求所有网站都用一页显示所有数据?这不太现实。AutoPager的方案是在你接近读到页尾时在后台加载下一页,并将下一页中的有效内容附加到当前页。
这里有一些例子:
AutoPager
的创意来自于一个叫Google
AutoPager的GreaseMonkey脚本。它的作用是当你滚动到页面底部时自动追加下一页的搜索结果到当前页面。当我试用了Google
AutoPager之后立刻被它震撼了。有了它实在是方便了不少。在使用Google搜索时几乎不用点下一页的链接了。我很喜欢这个功能。当然了也有人对它不感冒。我的一个朋友是这么说的:一页显示10条结果刚刚好,再多了就超出我的极限了,我很享受点下一页,及下一页加载之前的这种停顿。如果你有同样的想法,那么AutoPager不适合你。
在autoPager之前我有一些Mozilla插件的开发经验。曾经做过一个Thunderbird过滤器的导入导出插件。再加上有很丰富的XPath经验。所以我不加思索立刻决定基于XPath做一个通用的插件。经过一年多的努力,AutoPager已经初具规模,相较于其他自动翻页的脚本或插件,AutoPager在某些方面也具有了一些优势。其间还专门开发了一个NetBeans插件来帮助开发Firefox插件。AutoPager的基本功能如下:
-
自动加载下一页并追加到当前页
-
只追加有意义的页面内容而不是整页
-
在线下载翻页配置
-
(**)翻页前提示用户确认,也可以总是允许,不提示
-
(**)自定义允许的最大翻页数
-
(***)自定义翻页配置
-
(****)翻页设置工作室
-
(****)自动识别,创建翻页配置
-
(***)在线共享翻页设置
-
(***)智能翻页,自动寻找下一链接搜索的字符串/控件编号/Html类/图片链接等
-
(***)完善的导入导出翻页配置功能
-
(***)支持多种翻页配置
AutoPager的,autopagerize的都可以支持。
-
(***)自定义配置更新站点
-
(*****)支持网页上特定容器内的自动翻页,例如有些站点有个带滚动条的容器,所有内容都在这个容器里。翻页都在这个容器里进行。例如http://www.cuil.com。AutoPager支持支监视这个容器的页面滚动并在这个容器内翻页。
-
(*****)支持需要JavaScript的翻页,或在通过点击按钮的翻页。
-
(*****)AJAX
页面。AutoPager现在也支持部分的AJAX页面的自动翻页。
其中带*号的是AutoPager特有的。*号越多表示功能越独特。
缺陷,或曾经的缺陷:
-
智能翻页尚不够智能,有些页面处理的不是太好。
-
自动识别链接尚不能识别出最好的翻页配置
-
和其他脚本及扩展的兼容性。有些扩展在新载入的页上不起作用。
0.1.6.0.34之后的版本缺省启用JavaScript,兼容性大大提高。
性能:
AutoPager的性能曾经广为诟病,不过经过一次又一次的优化,最新版已经性能很好了。现在的翻页代价是几十毫秒。相较于最初的一到两秒,在大多数的现在配置的机器上已经觉察不出来了。如果你还在使用AutoPager旧版,请从如下网址http://www.teesoft.info/content/blogcategory/14/49/下载最新版。
2AutoPager
基本使用
AutoPager是希望设计成安装即可使用的。但他同时兼顾一些高级设置。
2.1安装
AutoPager是一个Mozilla内核的浏览器的扩展。所有为了使用AutoPager你需要安装一个Mozilla内核的浏览器。可以是Firefox
, Flock, Mozilla 或seaMonkey。推荐使用Firefox。
安装之后使用新的浏览器打开http://www.teesoft.info/content/blogcategory/14/49/ 。点最新版的链接。浏览器的最上方会出现一个提示,点允许然后根据向导提示安装AutoPager扩展。安装之后要重启浏览器。

如果你点了之后出现文件保存选项,那就保存文件。再从文件菜单选择打开文件,同样也会弹出安装向导。
安装之后需要重启浏览器:
2.2首次使用
安装之后工具条和状态栏上会出现AutoPager的图标: ,左键点击状态栏AutoPager图标 启用/禁用
AutoPager,右键点击显示AutoPager菜单。工具条上AutoPager的图标 用于开启关闭翻页设置工作室,用户创建你的自定义规则。
AutoPager首次使用之前并不需要特殊的设置。
不过使用AutoPager在线翻页设置的先决条件是能上网。AutoPager需要下载一些网站的翻页设置。AutoPager现在可以使用自己的XML格式的配置,也可以使用Autopagerize
JSON格式和Pagerization的嵌在网页上的SITEINFO格式。还可以使用嵌在网页上的AutoPager的XML格式。
废话不说了。打开一个网页试试吧。AutoPager的在线配置支持了大量的搜索引擎和论坛。
第一次滚动到页面底部时会弹出页面选项。你可以点AE继续。下面我会详细解释其中的各个设置。
2.3页选项
有三种方式打开页选项。
在”遇到新站点时显示页提示”未被关闭的情况下首次使用某站点时。
右键点击状态栏上的AutoPager图标 ,点页选项。
点工具->自动翻页->页选项。
建议大家不要禁用新站点上的页选项。在有页选项出现时点一下“标出下一链接”和”标出页面内容”试试翻页配置是否正确。
点这两个链接后相应的内容会被选中,并有黄色的边框标出。如果选中的不是预期的内容,例如点标出下一链接时标出的链接不是下一链接,那么请不要点总是允许
翻页。你可以先允许本次或本会话试试。如果翻页失败你可以改一下翻页配置试试。或者到AutoPager的BBS
(http://www.teesoft.info/phpbb/viewforum.php?f=5)报告一下。下一版会内置一个报告错误配置的功能。敬请期待。
3AutoPager
基本设置
这一节将告诉你翻页配置的更多细节,并教你如何创建一些简单的翻页配置。
3.1基本菜单项
有两种方式访问AutoPager的菜单项,可以从工具菜单,
也可以从状态栏的AutoPager图标上点右键 :
菜单项中的基本功能包括:
-
自动翻页工作室 用于为你访问的网站创建自定义规则。
-
设置
基本设置和规则的详细设置。
-
在线更新
从所有的更新源手动更新规则。
-
从地址导入
从远端地址导入规则。这些规则是用下面的”导出设置”功能导出的规则。
-
从地址导入
从文件导入规则。
-
从剪贴板导入 如题
-
导出设置
导出所有你自定义的规则到一个文件。你也可以使用设置里的导出功能,它会比菜单中的这个功能多更多选项,例如只导出选定规则,或导出到剪贴板。
-
站点向导
基于向导模式创建站点规则,功能不如“自动翻页工作室”强。正准备基于“自动翻页工作室”重写这个功能。
-
创建XPath路径 提示你选择页面元素,并为你生成它对应的XPath
-
测试XPath 如题。允许你输入XPath并测试它在当前页面的效果。
-
你的姓名: 允许你输入你的姓名,所有你创建并共享的规则都会带有你的标识。
-
页选项 打开页选项。页选项会在首次访问一个匹配到AutoPager规则的网站时弹出。也可以以后通过这个菜单弹出。
-
启用 点击启用/禁用
AutoPager。打勾时表示已启用。
3.2规则更新源
AutoPager支持多个规则更新源,你也可以自定义规则。在规则设置界面里可以看到并设置他们。有三种方式打开规则设置界面,点击页选项的标题,点工具->自动翻页->设置,或右键点击状态栏上的AutoPager图标 ,再点设置。如下图,目前AutoPager内置8个在线更新源和一个本地自定义规则。AutoPager在使用这些更新源时是自上而下匹配的,如果再上面的源里找到匹配的规则就不会再往下匹配了。autopager.xml是你的自定义规则。它总是被优先处理的。AutoPager维护的是autopagerTee.xml和autopagerBeta.xml。AutopagerTee.xml是主要的规则集。autopagerBeta.xml包含那些网友提交的尚未被确认的规则。你可以选中你的自定义规则,点”发布”按钮共享你的自定义规则到AutoPager的官方规则库(你需要使用Firefox
3才能正确提交)。
对于规则更新源,你可以执行的操作包括启用/禁用和改变更新配置。例如autopagerBeta更新源缺省的就是禁用的,如果你喜欢尝鲜,希望尽早体验网友提交的规则,你可以启用它。
更新设置包含如下选项:使用全局配置,每次启用,每天,每周,每月,已经从不更新。全局配置在设置界面的自动更新标签下。
3.3规则设置
有三种方式打开规则设置界面,点击页选项的标题,点工具->自动翻页->设置,或右键点击状态栏上的AutoPager图标 ,再点设置。
设置界面会必定选定第一个匹配当前页的翻页规则:
上图显示选中了一个处理来自于autopagerTee.xml的规则。该配置由Wind
Li创建。因为该配置不是你的自定义规则,所以你不能修改它。因为你的修改可能被下次更新所覆盖。AutoPager提供的方法是你可以复制这个规则到你的自定义规则库,然后修改它。因为AutoPager的规则优先顺序是从上到下,也就是你的自动义规则总是会由于在线规则被匹配到。你可以点击上面”编辑克隆版”的红色按钮来编辑它。例如:
列表中的颜色含义:绿色->新添加,
蓝色->已修改,灰色->已禁用。
对于自定义规则你可以执行更多的操作。对于左侧自定义规则中选定的自定义规则,你可以执行如下操作,见中间的按钮:
-
删除 删除规则。
-
发布 共享你的规则。
-
导出 导出你选中的规则到文件或剪贴板。这样你可以按自己的方式共享这些规则。你也可以将你的规则文件放到网上供人导入。
-
上移 规
则是自上而下匹配的,你可以使用上移使一个规则被优先匹配。你可以,例如给某个这站点设个特例。比如它的大部分页面都适用一个规则,但是有一两个页面不适
用,那么你可以创建一个站点的通用规则,再创建一个特例规则只匹配特定页面,将特例规则放到通用规则前面就可以了。你也可以将特例禁用。
-
下移 降低一个规则的优先级。
注意:AutoPager的每一个规则在创建时都有一个唯一的GUID,也就是唯一编号,导入导出时同样编号的规则会作为同一个规则处理,你创建或被你改过的规则是不会被覆盖的。所有导入结果如图,会告诉你多少新规则被导入,多少被更新,多少被跳过。
对于一个特定的规则你可以更改的选项有:
-
启用 不选中就是禁用,禁用的规则会以灰色标出。
-
地址通配符 AutoPager支持两种通配符,缺省是简单匹配,类似DOS下的文件名匹配,使用*表示任意字符,?表示任意单个字符。另一种是用正则表达式,它能提供更多的灵活性。例如thread.php\?fid\=|thread\-htm\-fid\-|read\-htm\-tid\-|read.php\?tid\=,它使用
'|' 表示或,
'.'表示任意字符,'*'表示任意个重复,例如'.*'
表示任意个'.'的重复出现,也就是表示任意长度的任意字符,'+'与'*'类似,区别是'*'可以匹配零次,'+'匹配一次以上例如'(abc)+'可以匹配1到多个abc的重复出现,例如abcabc。'\d'比啊是数字。正则表达式中的一些特殊字符需要用'\'转义。更多正则表达式的信息请参考JavaScript的相关文档。
-
剩余xx页时翻页
翻页的条件。缺省是2,对于页面较长或加载较慢的页你可以设大点,以便更早的开始翻页。
-
加载下一页时启用JavaScript。启用和不启用JavaScript会导致AutoPager使用两种截然不同的加载下一页的方式,推荐启用JavaScript,这样基本上其他扩展也会作用于自动加载的下一页。事实上0.2.0开始”一般”标签下有一个总是启用JavaScript的选项。
-
Ajax站点
Ajax站点因为不会重新载入页面,所以好多扩展在Ajax页面上无效。AutoPager使用了一些技巧部分解决了这个问题。你可以选中这个选项告诉AutoPager要对匹配的页面使用Ajax特有的处理。
-
快速加载 某种程度上能加快第一次加载下一页时的延迟。但是不是总有效,你可以自己试一下。
-
取消页面溢出控制
有些页面有溢出控制(overflow或overflow-y),其结果是页面上有些东西,例如一个包含下一页链接的导航条,总是会显示在页面底部同一位置,自动追加的下一页就显示的乱七八糟。这时你可以试着选中此选项。不过推荐你先试试下面的容器XPath是不是能满足你的需要,他是用于处理类似的情况的。另外在总是启用JavaScript选中之后,如果当前规则没有启用JavaScript,那么选中该选项意味着在根据本规则加载下一页时JavaScript是禁用的。
-
下一页XPath 用于选中下一页的链接,这可以是个链接,也可以是个按钮。只要点击它跳转到下一页就可以。这是AutoPager和其他类似扩展或脚本的一个巨大区别。他们通常只能处理链接。下面会有专门的章节告诉你如何生成这些XPath。对于XPath标准本身请你参考相关文档,例如:
http://www.w3schools.com/xpath/
或http://www.zvon.org/xxl/XPathTutorial/General_chi/examples.html.
其中第二个网站是多语言的,有中文.
-
容器XPath 有些页面上是有个溢出控制的。这样的结果是页面的主体内容在一个有滚动条的容器内。AutoPager支持支监视这个容器的页面滚动并在这个容器内翻页。http://www.cuil.com/是一个比较典型的例子。它的主要内容都在//div[@id='bdy']所对应的div内。
-
内容选择XPath 加载下一页时将什么内容插入到当前页。
-
过滤XPath 从插入的内容中删除哪部分。插入下一页内容时,你可能希望移除某些部分,例如广告,或其他和第一页重复的内容。对于某些页面你可以通过改写内容选择XPath达到这样的目的,但是也有些页面你没法做到这样。这里你可以通过设置这个过滤XPath从内容选择XPath已经匹配到的内容中做进一步筛选,移除一部分内容。
-
描述 配置描述。建议你保留创建此规则时所参照的页面,这样当你共享此配置,autopagerTee更新源的维护者可以测试该配置对原始的页面是否同样有效。别人在更改此规则时也可以做同样测试。
3.4一般选项
3.5自动更新
4AutoPager
高级设置
4.1自定义规则
4.2自定义更新站点
5AutoPager原理
5.1地址匹配
5.2滚动监视
5.3链接地址定位
5.4页面内容定位
5.5后台加载方式
6联系作者
|