公共文化服务平台

2025年12月4日星期四

|

欢迎来到三亚市图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

刘秋水: 作品数：3 被引量：8H指数：2; 供职机构：大连理工大学电子科学与技术学院计算机科学与工程系更多>>; 发文基金：国家自然科学基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

孟军大连理工大学电子科学与技术学院...
王秀坤大连理工大学电子科学与技术学院...
姜军晓大连理工大学国家示范性软件学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

1篇期刊文章
1篇学位论文
1篇会议论文

领域

3篇自动化与计算...

主题

2篇信息抽取
2篇抽取
1篇段落
1篇段落结构
1篇信息提取
1篇信息熵
1篇语义距离
1篇数据流
1篇频繁模式挖掘
1篇频繁模式挖掘...
1篇前缀
1篇前缀树
1篇网页
1篇网页正文
1篇流数据
1篇模式挖掘算法
1篇WEB信息
1篇WEB信息抽...
1篇DOM树

机构

3篇大连理工大学

作者

3篇刘秋水
2篇孟军
1篇姜军晓
1篇王秀坤

传媒

1篇计算机工程与...

年份

1篇2009
1篇2008
1篇2007

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

节点频度和语义距离相结合的网页正文信息抽取被引量：6: 2009年; 提出了一种带有节点频度的扩展DOM树模型—BF-DOM树模型(Block node Frequency-Document Object Module),并基于此模型进行网页正文信息的抽取。该方法通过向DOM树的某些节点上添加频度和相关度属性来构造文中新的模型,再结合语义距离抽取网页正文信息。方法主要基于以下三点考虑:在同源的网页集合内噪音节点的频度值很高;正文信息一般由非链接文字组成;与正文相关的链接和文章标题有较近的语义距离。针对8个网站的实验表明,该方法能有效地抽取正文信息,召回率和准确率都在96%以上,优于基于信息熵的抽取方法。; 孟军刘秋水王秀坤; 关键词：信息提取语义距离

基于滑动窗口的流数据频繁模式挖掘算法: 本文采用一种基于滑动窗口的流数据频繁模式算法 DSFP-SW(Data Stream Frequent Pattern based-on Sliding Window)进行批处理式挖掘。该算法将滑动窗口划分为几个基本的窗...; 孟军姜军晓刘秋水; 关键词：数据流前缀树; 文献传递

Web信息抽取与网页摘要的研究与应用: 准确地提取出网页的主题内容并生成文档摘要已经成为一个非常重要而有意义的研究方向。随着万维网的飞速发展,在Internet上形成了不计其数的以HTML网页形式存在的信息源,但是Web页面通常含有很多用户并不关心的信息,如广...; 刘秋水; 关键词：DOM树信息抽取信息熵段落结构; 文献传递

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张