2025年12月4日
星期四
|
欢迎来到三亚市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
刘秋水
作品数:
3
被引量:8
H指数:2
供职机构:
大连理工大学电子科学与技术学院计算机科学与工程系
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
孟军
大连理工大学电子科学与技术学院...
王秀坤
大连理工大学电子科学与技术学院...
姜军晓
大连理工大学国家示范性软件学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
1篇
会议论文
领域
3篇
自动化与计算...
主题
2篇
信息抽取
2篇
抽取
1篇
段落
1篇
段落结构
1篇
信息提取
1篇
信息熵
1篇
语义距离
1篇
数据流
1篇
频繁模式挖掘
1篇
频繁模式挖掘...
1篇
前缀
1篇
前缀树
1篇
网页
1篇
网页正文
1篇
流数据
1篇
模式挖掘算法
1篇
WEB信息
1篇
WEB信息抽...
1篇
DOM树
机构
3篇
大连理工大学
作者
3篇
刘秋水
2篇
孟军
1篇
姜军晓
1篇
王秀坤
传媒
1篇
计算机工程与...
年份
1篇
2009
1篇
2008
1篇
2007
共
3
条 记 录,以下是 1-3
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
节点频度和语义距离相结合的网页正文信息抽取
被引量:6
2009年
提出了一种带有节点频度的扩展DOM树模型—BF-DOM树模型(Block node Frequency-Document Object Module),并基于此模型进行网页正文信息的抽取。该方法通过向DOM树的某些节点上添加频度和相关度属性来构造文中新的模型,再结合语义距离抽取网页正文信息。方法主要基于以下三点考虑:在同源的网页集合内噪音节点的频度值很高;正文信息一般由非链接文字组成;与正文相关的链接和文章标题有较近的语义距离。针对8个网站的实验表明,该方法能有效地抽取正文信息,召回率和准确率都在96%以上,优于基于信息熵的抽取方法。
孟军
刘秋水
王秀坤
关键词:
信息提取
语义距离
基于滑动窗口的流数据频繁模式挖掘算法
本文采用一种基于滑动窗口的流数据频繁模式算法 DSFP-SW(Data Stream Frequent Pattern based-on Sliding Window)进行批处理式挖掘。该算法将滑动窗口划分为几个基本的窗...
孟军
姜军晓
刘秋水
关键词:
数据流
前缀树
文献传递
Web信息抽取与网页摘要的研究与应用
准确地提取出网页的主题内容并生成文档摘要已经成为一个非常重要而有意义的研究方向。随着万维网的飞速发展,在Internet上形成了不计其数的以HTML网页形式存在的信息源,但是Web页面通常含有很多用户并不关心的信息,如广...
刘秋水
关键词:
DOM树
信息抽取
信息熵
段落结构
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张