--下面以代码加中文注释介绍怎样通过正文前后两个关键词,提取网页正文。通过循环自动运行,并且用正则表达式去除多余部分,免去复制完一页还要点击下一页的步骤,连续复制网页正文的方法
require "import"
import "com.androlua.Ticker"
--导入所需的库
if ti then
ti.stop()
service.speak("停止")
ti=nil
return true
end
--如果ti这个变量存在,则停止运行
local s=""
--初始化s变量,并赋值空字符串,以后用在记录上次复制,如有相同内容则跳过
ti=Ticker()
--把等于号右面函数赋值给左边变量ti
ti.Period=3000
--设置计时器循环周期为3000毫秒,这个可以根据你网速情况进行修改
ti.onTick=function()
--设置计时器回调函数
local txt=tostring(service.getWebAllTextList())
--把获取所有网页内容函数转换为字符窜并赋值给txt变量
if txt~="[]"
--判断网页是否为空,因为网页无内容则返回方括号
txt=txt:match(".+正文开始(.-)返回目录")
--通过正则表达式把正文前后紧邻两个关键词匹配,获取正文内容,这个可以根据不同网页进行修改
if txt~=s
--判断s不等于上次复制的内容
service.appendCopy(txt)
--用追加复制函数把剪切好的正文追加复制
service.speak("已追加")
--用语音告诉已追加
end
s=txt
service.click({{
"下一页"
}})
--自动点击下一页,可根据不同网页进行修改
end
end
ti.start()
--启动计时器
service.speak("开始")
service.copy("")
--用复制函数复制一个空字符串
return true