设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 数据 创业者 手机
当前位置: 首页 > 大数据 > 正文

互联网金融之量化投资深度文本挖掘——附源码文档(3)

发布时间:2021-02-04 03:27 所属栏目:125 来源:网络整理
导读:运行结果: 2) 检索模块 路径:? D:\TotalCode\LuceneCode\Index_Search\IndexFiles_pylucene.py 功能: 增量建立索引 输入参数:数据目录 索引目录 开始日期 结束日期 运行举例: python IndexFiles_pylucene.py

运行结果:

互联网金融之量化投资深度文本挖掘——附源码文档



2) 检索模块
路径:?D:\TotalCode\LuceneCode\Index_Search\IndexFiles_pylucene.py
功能: 增量建立索引
输入参数:<数据目录> <索引目录> <开始日期> <结束日期>
运行举例:python IndexFiles_pylucene.py D:\DATA\text D:\DATA\Index\text
20120715 20120820

运行过程实例:

互联网金融之量化投资深度文本挖掘——附源码文档


运行结果:

互联网金融之量化投资深度文本挖掘——附源码文档



路径:?D:\TotalCode\LuceneCode\Index_Search\SearchFiles_pylucene.py
功能: 关键词全文检索
输入参数:<索引目录> <关键词> <输出文件>
运行举例:python SearchFiles_pylucene.py D:\DATA\Index\text "页岩气 "

D:\TotalCode\LuceneCode\Index_Search\Output_pylucene.txt

运行过程实例:

互联网金融之量化投资深度文本挖掘——附源码文档



互联网金融之量化投资深度文本挖掘——附源码文档


3)统计模块举例1个,其余不再呈现
路径:?D:\TotalCode\LuceneCode\ICTCLAS_Cal/IDFCal.py
功能: 计算关键词所在文档数
输入参数:<数据源> <开始日期> <结束日期>
运行举例:python IDFCal.py 股票论坛 20120715 20120820

运行过程实例:

互联网金融之量化投资深度文本挖掘——附源码文档


运行结果:

互联网金融之量化投资深度文本挖掘——附源码文档


4)关键词词频模块举例1个,其余不再呈现
路径:?D:\TotalCode\LuceneCode\ICTCLAS_ IDF/ sigWordSeq.py
功能:?关键词词频时间序列
输入参数:<数据源> <关键词> <股票代码> <开始日期> <结束日期> <是否搜索标识>
运行举例:python sigWordSeq.py 股票论坛 "物联网" 000001 20100601?20120820 1

运行过程实例:

互联网金融之量化投资深度文本挖掘——附源码文档


运行结果:

互联网金融之量化投资深度文本挖掘——附源码文档



路径:D:\TotalCode\LuceneCode\ICTCLAS_ IDF/ WordNet.py
功能:?完整关键词网络图
输入参数:<数据源> <关键词> <开始日期> <结束日期>
运行举例:python WordNet.py 研究报告 "页岩气" 20120601 20120817
运行过程实例:

互联网金融之量化投资深度文本挖掘——附源码文档


(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读