图书介绍
中文新闻网页处理与舆情分析【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

- 钱爱兵著(南京中医药大学经贸管理学院) 著
- 出版社: 南京:南京大学出版社
- ISBN:9787305110467
- 出版时间:2012
- 标注页数:152页
- 文件大小:34MB
- 文件页数:164页
- 主题词:互联网络-新闻-舆论-分析
PDF下载
下载说明
中文新闻网页处理与舆情分析PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
1.1研究背景1
1.2研究对象1
1.3研究现状2
1.4研究内容6
1.5全书内容安排8
参考文献9
第2章 中文新闻网页正文抽取15
2.1概述15
2.2文本密度判别法16
2.2.1相关定义及假设16
2.2.2统计分析17
2.2.3密度区分阈值21
2.3方法实现25
2.3.1转换HTML为DOM树25
2.3.2获取文本结点25
2.3.3计算文本密度26
2.3.4判别分析26
2.4实验结果及分析27
2.4.1实验数据27
2.4.2评价指标27
2.4.3实验步骤及结果27
2.4.4结果分析29
2.5本章小结29
参考文献29
第3章 中文新闻重复网页识别31
3.1概述31
3.2算法设计32
3.2.1重复网页的界定32
3.2.2算法思想32
3.2.3后缀树33
3.2.4 Ukkonen算法33
3.2.5 Matching Statistics算法35
3.2.6相似度计算36
3.3算法实现38
3.3.1改进的Ukkonen算法38
3.3.2改进的Matching Statistics算法40
3.3.3中文新闻重复网页识别算法42
3.4实验结果及分析43
3.4.1实验说明43
3.4.2评价标准43
3.4.3实验结果与分析44
3.5本章小结45
参考文献46
第4章 中文新闻网页关键词抽取48
4.1概述48
4.2网页内容及关键词构成分析50
4.2.1网页内容分析50
4.2.2关键词特征分析51
4.3关键词抽取56
4.3.1网页正文抽取56
4.3.2新闻文本分词56
4.3.3综合加权57
4.3.4候选关键词组配59
4.4实验结果与分析61
4.4.1实验数据61
4.4.2评价标准62
4.4.3实验结果与分析63
4.5本章小结65
参考文献65
第5章 中文新闻网页自动分类67
5.1概述67
5.2新闻网页预处理68
5.2.1创建新闻分类标注语料库68
5.2.2抽取新闻网页正文70
5.2.3正文文本分词及创建索引70
5.3基于标题的自动分类方法71
5.3.1词长加权法71
5.3.2简单类目加权法73
5.3.3经典类目加权法74
5.3.4改进的类目加权法75
5.4实验结果与分析78
5.4.1性能评价指标78
5.4.2实验结果79
5.4.3结果分析80
5.5本章小结84
参考文献85
第6章 中文新闻网页主题聚合87
6.1概述87
6.2模型设计87
6.2.1系统模型88
6.2.2系统流程89
6.3系统关键技术90
6.3.1主题选择模块90
6.3.2 RSS Feed初始集合选择模块92
6.3.3 RSS聚合模块92
6.3.4 RSS Feed分析模块93
6.3.5 RSS Item分析过滤模块93
6.3.6超链接自动提取模块97
6.3.7 RSS Feed自动发现模块97
6.4系统的实现98
6.4.1测试硬件配置98
6.4.2测试集的选择98
6.4.3系统测试98
6.5本章小结99
参考文献100
第7章 基于主题的网络舆情分析101
7.1概述101
7.2模型设计102
7.3基于主题的网络舆情分析102
7.3.1舆情主题规划102
7.3.2舆情信息采集103
7.3.3舆情信息分析105
7.3.4舆情预警处理108
7.4模型实现108
7.4.1实现环境108
7.4.2技术支撑108
7.4.3实现流程109
7.4.4测试集的选择111
7.4.5测试结果分析111
7.5本章小结115
参考文献115
第8章 结束语117
8.1总结117
8.2进一步的研究工作119
附录A 关键词抽取对照数据表120
附录B 新闻语料库来源网站140
附录C 江苏法院网络舆情分析系统144
后记150
热门推荐
- 1644659.html
- 3875552.html
- 2992973.html
- 1932072.html
- 2983679.html
- 904397.html
- 3062129.html
- 1038397.html
- 702060.html
- 1372174.html
- http://www.ickdjs.cc/book_1642489.html
- http://www.ickdjs.cc/book_3116981.html
- http://www.ickdjs.cc/book_684927.html
- http://www.ickdjs.cc/book_1357377.html
- http://www.ickdjs.cc/book_2111746.html
- http://www.ickdjs.cc/book_2835814.html
- http://www.ickdjs.cc/book_1586936.html
- http://www.ickdjs.cc/book_2065082.html
- http://www.ickdjs.cc/book_1770940.html
- http://www.ickdjs.cc/book_512150.html