谈“关键词”挖掘隐条件

谈“关键词”挖掘隐条件

一、浅谈用“关键词语”挖掘隐含条件(论文文献综述)

周彪[1](2021)在《小微企业互联网融资信用评价研究》文中研究指明我国正处于经济结构、产业结构调整优化的重要阶段,小微企业由于产业类型多样、覆盖范围广、市场反应敏感等特征,对促进我国产业结构的调整和社会经济的持续、平稳运行,发挥着关键的作用。然而,小微企业的融资难题,特别是传统融资的困境限制了小微企业的发展,转向民间信贷融资又使得小微企业面临融资贵的风险,并加剧了市场动荡。信息不对称是小微企业融资困境产生的关键原因,在“互联网+”背景下,加快我国金融供给侧改革、推动互联网金融的发展,既为小微企业融资渠道的拓展提供条件,又为小微企业融资信用水平相关信息的获取提供重要手段。大数据背景下的小微企业互联网融资,成为解决小微企业融资困境的有力方式;基于大数据技术、对小微企业互联网融资信用评价问题展开深入而细致的研究,是该方式发挥作用的关键。本文研究的关键科学问题包括:(1)评价机理分析。研究国外小微企业特征及信贷服务实践的成功经验,分析小微企业互联网融资信用数据来源、剖析小微企业传统渠道与互联网渠道下融资信用评价的异同点等,分析大数据背景下小微企业互联网融资信用评价机理。(2)评价体系构建。加快适用于小微企业互联网融资信用评价体系的针对性研究,强化小微企业互联网融资信用评价的有效性,成为银行等金融机构服务小微企业互联网融资、防控小微企业互联网融资风险的重要举措;(3)数据模型构建。借助互联网技术、大数据技术对海量、多元信息的获取能力,利用数据挖掘及机器学习技术如何改进小微企业融资信用评价模型及模型精确度;(4)评价结果及应用。研究信用评价对金融机构与小微企互联网融资信任关系形成的作用机理,是需要深入分析和研究的重点问题。文章在基本理论模型分析的基础上,通过对四大类问题的研究,产生如下的研究成果:(1)基于大数据的小微企业互联网融资评价机理模型。针对小微企业互联网金融产品、服务及融资流程不明晰、不系统的现状,对小微企业互联网融资途径及大数据信用评价机理展开分析。我国小微企业是国民经济发展的重要力量,从国外小微企业特征及信贷服务实践的分析入手,实现我国小微企业特征的详细统计分析和对比分析,我国小微企地域分布和行业分布等总体情况、金融行为、竞争力、社会关联性以及还款能力和还款意愿上,表现出显着差异性特征。基于案例提出小微企业互联网融资模式共包含传统融资业务的互联网化、基于互联网平台的融资模式、“互联网+”金融的全新模式以及上市融资四种类型。提出信息不对称风险、财务风险、关联关系复杂性风险、脆弱性风险四类小微企业互联网融资信用的风险来源,剖析小微企业传统渠道与互联网渠道下融资信用评价的异同点,界定小微企业互联网融资信用评价的四维概念模型。研讨大数据技术小微企业互联网融资信用评价中的应用机理,提出评价的基本框架。(2)“互联网+”的小微企业互联网融资评价体系模型。充分利用“互联网+”下小微企业融资渠道拓宽所带来的海量信息获取优势,分析影响小微企业互联网融资信用水平的相关因素,构建针对小微企业互联网融资信用评价的专门指标框架,形成具体、细致的评价指标储备。界定反映小微企业互联网融资信用水平的硬信息、软信息,从双重维度提炼81项影响小微企业互联网融资信用水平的具体因素。继而,从经营活动信息、金融行为信息、企业基本信息、企业竞争力信息、企业关联关系信息系和企业融资申请陈述信息等六个维度提炼、储备90个具体评价指标,构建小微企业互联网融资信用评价指标体系的总体框架,明确各评价指标的指标类型、评分方法及数据的标准化方法。构建融合熵值法、CRITIC方法、方差齐性检验的小微企业互联网融资信用评价指标组合赋权方法,强化指标体系区分小微企业互联网融资信用履约客户和违约客户的能力。(3)基于主题挖掘的小微企业互联网融资数据获取模型。信息量暴增、数据结构多元化,是大数据背景下小微企业互联网融资评价的鲜明特征,小微企业互联网融资信用评价研究需围绕硬信息、软信息多元结构的融合展开。基于小微企业互联网融资信用指标框架中的部分软信息变量,构建小微企业互联网融资信用相关软信息LDA主题挖掘模型,获取17个主题变量及各主题对应每条样本的概率分布,实现小微企业互联网融资信用软信息的量化挖掘。(4)基于神经网络的小微企业互联网融资评价模型。针对小微企业互联网融资信用评价的二分类问题,构建基于BP神经网络的小微企业互联网融资信用评价模型。选取同花顺行情中心新三板作为数据来源开展案例分析,分别将硬信息、软信息、硬信息+软信息纳入BP神经网络模型,形成三组对比实验。结果发现硬信息能够更直观地反映小微企业互联网融资的偿债能力、偿债意愿,相对于单独使用软信息进行小微企业互联网融资信用评价而言,单独使用硬信息进行评价的精确度更高;融入软信息的小微企业互联网融资信用评价精确度高于仅使用软信息或硬信息进行评价的精确度,因而将软信息、硬信息同时纳入小微企业互联网融资信用评价模型,是提升银行等金融机构信贷风险评估准确性的重要方式。(5)小微企业互联网融资发展政策建议。以多元数据的合理化运用为脉络,研究大数据背景下信用评价对金融机构与小微企业信任关系形成的作用机理,给出促进小微企业与金融机构互联网融资信任体系良性发展的策略和管理建议。明确了不同阶段银行等金融机构对多元信息的处理范式,分析小微企业多元信息发挥作用的方式。将小微企业的互联网融资行为和银行等金融机构的放贷行为,抽象为小微企业与金融机构之间互联网融资信任关系形成的博弈问题,构建演化博弈模型,分析二者互联网融资信任关系形成过程中的策略选择,逆向推理信用评价中的相关因素对二者策略选择的影响,进而为银行等金融机构提供相应的管理建议。本文产生的创新点可能包括:(1)基于大数据的小微企业互联网融资信用评价体系总体框架。从我国小微企业的概念和范围界定入手,具体考虑我国小微企业特征,提出大数据背景下、针对小微企业互联网融资信用评价的指标体系总体框架,为后续相关研究提供范式参考。小微企业融资过程中存在大量财务管理数据等结构性硬信息获取不足的问题,致使银行等经融机构难以作出准确的风险评估,造成严重的“信息不对称风险”,进而加剧小微企业互联网融资难度。非结构性文本信息等软信息暴增、数据结构多元化,是大数据背景下小微企业互联网融资评价的鲜明特征,小微企业互联网融资信用评价研究需围绕硬信息、软信息多元结构的融合展开。针对我国小微企业特征,综合考虑小微企业经营过程中产生硬信息、软信息的双重维度,提炼影响小微企业互联网融资信用水平的多项因素,构建针对小微企业互联网融资信用评价的指标体系总体框架,确定具体评价指标及指标类型、标准化方法。大数据技术能够大大提升不同类型、不同来源数据的可得性,因而该数据集合在大数据技术的辅助下,获取更多数据成为可能,这也为其他相关研究提供借鉴。(2)基于多元信息融合的小微企业互联网融资信用评价模型的构建方法。研究大数据技术下非结构性软信息的获取方式、使用方式。软信息暴增、数据结构多元化,是大数据背景下小微企业互联网融资评价的鲜明特征。基于文本挖掘技术,提出大数据背景下小微企业互联网融资信用评价非结构性软信息的量化方法,实现大数据背景下小微企业互联网融资信用评价结构性硬信息和非结构性软信息的量化融合。基于机器学习方法、神经网络模型,构建大数据背景下的小微企业互联网融资信用评价模型。利用网络爬虫技术,研究针对我国小微企业互联网融资信用评价的多元数据获取方法。案例分析设计三重实验,分别采用硬信息数据集、软信息数据集、硬信息+软信息数据集,将三类数据集合分别纳入评价模型中,发现不同数据类型的使用对模型精度具有显着影响。硬信息能够更直观地反映小微企业互联网融资的偿债能力、偿债意愿,相对于单独使用软信息进行小微企业互联网融资信用评价而言,单独使用硬信息进行评价的精确度更高;融入软信息的小微企业互联网融资信用评价精确度高于仅使用软信息或硬信息进行评价的精确度。(3)基于演化博弈的金融机构与小微企业互联网融资信任的关系模型。针对我国小微企业与银行等金融机构之间相互信任不足的特征,构建金融机构与小微企业互联网融资信任关系的演化博弈模型,分析如何通过大数据技术下互联网融资信用评价不同策略选择,实现信用评价的改进、促进小微企业与金融机构互联网融资互利互信共赢的最终目标。围绕多元数据的合理化运用脉络,将小微企业的互联网融资行为和金融机构的放贷行为,抽象为小微企业与金融机构之间互联网融资信任关系形成的博弈问题,构建演化博弈模型。通过演化博弈均衡的分析及影响因素分析,模拟二者互联网融资信任关系形成过程中的策略选择,发现金融机构在小微企业互联网融资中的潜在损益、体现小微企业信用水平的结构性软信息潜在损益以及对软信息硬化边界、机器评价与人际沟通关系的掌握,是影响二者策略选择和良好信任关系形成的重要因素。基于此,为银行等金融机构提供相应的管理建议,以期在大数据背景下实现小微企业互联网融资信用评价效果的提升。图58幅,表27个,参考文献204篇。

张敏[2](2021)在《面向文物领域的知识图谱构建技术研究》文中指出博物馆作为文物保护与传承的载体,承载着人类数千年的文明。在蓬勃发展的物联网和人工智能等技术的驱动下,智慧化建设成为博物馆界关注的热点。然而,由于文物资源种类多数量大,以及互联网相关文物数据的多源异构性,使得博物馆智慧化建设中对文物信息资源管理与利用存在以下两个问题:文物信息资源缺乏有效组织和文物数据之间缺乏有效联系。文物知识图谱挖掘文物事实,利用文物间潜在的联系形成三元组,构建文物知识库,实现文物的有效组织,为文物资源的融合与共享提供基础。同时,文物知识图谱对延展文物知识,丰富文物展陈方式,促进智能问答、语义搜索和智慧导览项目的开发,提升博物馆智慧化服务具有重要意义,其研究吸引了大量研究者关注。文物知识图谱的构建虽已涌现出诸多相关研究,但仍面临以下挑战:(1)文物实体抽取任务中,有监督的方法需要大量标注数据,但构建大规模文物标注数据费时耗力,另外,中文文物实体数据构词具特殊性。(2)文物关系抽取任务中,文物数据存在多重关系,同时文物领域文本关键词具稀疏性。(3)文物实体对齐任务中,百科类网站文物数据具多源异构性,现有的仅从单一的字符或词语层面获取实体相似度的实体对齐方法精确率相对较低。(4)文物知识图谱补全任务中,文物实体间存在隐含关系,以及文物领域具隐含关系的标注三元组相对缺乏。本文针对以上挑战,开展了面向文物领域的知识图谱构建技术研究,主要探讨了文物实体抽取、关系抽取、实体对齐、知识图谱补全等问题,为文物知识图谱构建提供理论和技术支持。本文主要工作和贡献如下:(1)提出一种基于自训练算法的半监督文物实体抽取方法。首先,为解决文物文本构词特殊性问题,使用ELMo语言模型生成词表示,动态提取实体上下文特征;其次,为实现全局最优的标签序列预测,利用Bi LSTM和CRF模型实现特征提取和实体标注;最后,为提高模型的性能,设计一种基于双重标注样本选择策略的自训练算法,通过双重标注选取高置信度的样本。实验结果表明,本文提出的方法利用50%的标注数据在文物实体抽取任务上取得了较好的效果。(2)提出一种基于词注意力机制的胶囊网络文物关系抽取方法。首先,为同时获取语义和语序信息,融合字、词嵌入以及词性和词语位置信息作为模型的输入,以有效捕获语义和语序特征;其次,为解决文物文本关键词稀疏性的问题,设计一种基于词注意力机制的动态路由算法,赋予信息词较高权重,迭代修正连接强度来解决关键词稀疏问题;最后,为解决实体间多重关系问题,利用转换矩阵对胶囊实例化参数预测。实验结果表明,本文提出的方法有效实现了文物领域多重关系的提取。(3)提出一种基于多特征相似度的文物实体对齐方法。首先,针对百科网站文物数据的多源异构性,提取实体属性、实体摘要和实体全文特征,并计算其相似度,分别从字符、词语和句子层面获取实体特征;其次,为了提高实体对齐的精确率,融合实体属性、实体摘要和实体全文特征相似度构建文物实体对齐模型;最后,通过阈值判断两个实体是否对齐。实验结果表明,本文提出的方法在三类文物实体的对齐任务中的精确率分别提高了2.11%,4.98%和4.18%。(4)提出一种融合实体类型的BERT文物知识图谱补全方法。首先,为有效获取实体丰富的语义信息,融合实体类型这一外部知识,使模型消除违反类型约束的反例,实现文本语义增强表示;其次,为有效识别隐含关系,解决关系稀疏性问题,使用多头注意力机制获取文本特征;最后,使用大量无标注数据预训练BERT模型,少量标注文物三元组对模型微调,解决文物领域标注三元组缺乏问题。实验表明,本文提出的方法使用35%标注数据在文物知识图谱补全任务中取得的结果优于对比方法。

李新超[3](2021)在《面向领域的指标挖掘方法研究与系统实现》文中研究指明随着世界创新驱动的发展,科技技术受到前所未有的关注。尤其近年来,随着专利申请数量的增多,互联网平台涌现大量的非结构化专利文本数据。这些数据中蕴含很多科技技术发展关键指标,如何从专利文本数据中有效地挖掘指标,为专利对比评估和企业技术评估提供参考依据是本文研究的重点。因此,本文提出面向领域的指标挖掘方法研究与系统实现,具体工作如下:通过调研国内外专利文本数据研究和文本指标词挖掘研究现状,结合其他学者对专利文本内容挖掘和文本指标词挖掘研究属性特点,总结了面向领域专利文本指标词挖掘的特征选取形式,利用文本挖掘的基础特征以及专利文本指标词的位置信息和周围修饰词特点,构建以N-gram、词性、动词+名词、动词+形容词+名词、动词+副词+名词、动词+形容词+副词+名词、动词+形容词+数量词+名词等七个属性特征作为专利文本指标词挖掘研究特征,结合现有的依存句法分析技术和Word2Vector进行特征工程处理。面向领域指标挖掘方法模型选择。在基于BP神经网络的指标挖掘方法模型中,利用BP神经网络的非线性映射能力和自适应能力进行指标词预测,根据经验公式计算隐含层神经元个数范围,训练模型寻找MSE最小时神经元个数,调整不同的学习率进行模型优化。在基于贝叶斯神经网络模型的指标挖掘方法研究中,利用贝叶斯神经网络模型的良好的鲁棒性和网络权重是随机分布不易陷入过拟合的优势进行指标词预测,根据经验进行网络层数确定,利用公式得出隐含层神经元个数范围,寻找MSE最小时隐含层神经元个数优化模型。接下来将两个模型的实验结果进行对比分析,结果证明本文提出的研究方法有效。最后将本文提出的研究方法应用到实践,利用Java语言搭建面向领域的指标挖掘系统,辅助专利科研人员对专利技术和企业技术评估提供依据。

赵彦霞[4](2021)在《基于水印和区块链技术的数字图像交易管理研究》文中指出社会许多领域对数字图像的大量需求,使得国内外出现了大量的数字图像交易网站。但目前的数字图像交易网站一般存在一些不足。例如,为用户提供的数字图像版权保护和版权认证服务不足,为用户提供的有法律效力的交易存证服务不足,为用户提供的个性化服务不足和提供的业务种类少等不足。在数字图像交易管理理论研究方面,也存在对数字图像交易管理的系统性研究、对数字图像进行版权保护和内容认证研究、对区块链中交易使用的智能合约管理研究以及专门针对数字图像的个性化推荐研究不足等问题。本文针对这些存在的问题进行了研究。在理论研究方面,本文对数字图像交易前、交易中和交易后管理上存在的一些问题进行了研究。提出了利用数字水印技术对交易前的数字图像进行版权保护和内容认证的多功能零水印算法;对数字图像交易过程中产生的交易信息写入区块链中进行存证,对区块链智能合约分类算法进行了研究;依据数字图像交易后存储的用户历史数据,研究了利用智能推荐技术的个性化数字图像推荐算法。在实践研究方面,设计了数字图像交易管理系统。将本文提出的算法应用于该系统,并设计了相应的管理模型,以解决数字图像交易网站提供的业务种类少等问题。本文的创新点如下:(1)提出了两种基于奇异值分解和深度学习的数字图像多功能零水印算法。在数字图像交易前,对数字图像进行版权保护和内容认证的研究不足。针对这一问题,本文对数字图像版权保护和内容认证进行了研究。变换域算法比空域算法中水印的鲁棒性更强,离散小波变换(DWT)能够克服离散傅里叶变换和离散余弦变换的一些缺点,奇异值分解(SVD)所得的奇异值可以表示图像内在的代数特征,稳定性好,深度神经网络能够获取图像关键特征。因此,将DWT、SVD分别和深度卷积神经网络(DCNN)和深度置信网络(DBN)相结合,提出了基于SVD和DCNN的数字图像多功能零水印算法以及基于SVD和DBN的数字图像多功能零水印算法。两种零水印算法都构造了零鲁棒水印图像和零半脆弱水印图像。仿真实验验证了两种算法的鲁棒水印对多种强度大的攻击有较好的抵抗性,提取出的半脆弱水印图像也能对原始图像的篡改位置进行定位。(2)提出了两种智能合约分类算法。针对许多数字图像交易网站存在的交易存证法律效力不足的问题,把区块链技术引入数字图像交易过程管理中。在区块链上进行交易的过程中需要使用智能合约,因此本文研究了智能合约分类算法,以便对智能合约进行有效管理。智能合约属于文本信息,因为智能合约不同类别数量相差较大,所以智能合约分类属于非均衡文本分类。智能合约分类的第一步工作是将智能合约转换成能够被计算机识别的数据。由于目前没有针对智能合约的语料库,因此首先利用Word2Vec建立智能合约语料库。然后,利用Word2Vec和智能合约语料库将所有智能合约都转化成等长的数字化向量。智能合约分类的第二步工作是研究如何对数字化的智能合约进行分类。由于智能合约分类属于非均衡的文本分类,所以本文提出了随机权学习机和加权交叉熵函数来克服传统分类方法的缺陷,并分别利用自编码器能降低数据维度的特点和双向长短期记忆神经网络(Bi LSTM)对上下文有记忆的功能,提出了基于自编码随机权ELM网络的智能合约分类算法与基于加权交叉熵损失函数的长短记忆智能合约分类算法。实验验证了两种算法对智能合约的分类是有效的。(3)提出了一种加权TextRank和自组织特征映射神经网络(SOM)的个性化数字图像智能推荐算法。针对数字图像交易完成后的管理中,对用户提供的个性化推荐服务研究不足的问题,本文进行了个性化数字图像推荐研究。通过两种来源获取用户感兴趣的图像。第一种来源是当前用户的相似用户订单中的图像。第二种来源是从数据库中查找的与当前用户最后放入订单中图像同类型的图像。从相似用户和数据库两种来源得到的候选图像集中选择用户感兴趣的部分图像推荐给当前用户。由于用户最后在网站的搜索词、不同时间加入订单和加入购物车的图像,以及用户历史数据中能体现图像类型的关键词语反映用户对图像的兴趣度的作用程度不同,所以,利用TextRank算法适合提取短文本关键词的特点,设计了加权TextRank算法来提取用户历史数据的关键词。因为SOM能够通过竞争对数据进行聚类,所以利用SOM去发现当前用户的相似用户。仿真实验结果验证了提出的算法能够有效地发现当前用户的相似用户,能为当前用户推荐用户感兴趣的数字图像。(4)设计了数字图像交易管理系统。针对许多数字图像交易网站没有提供数字图像处理、数字图像版权保护、数字图像认证、交易存证、个性化推荐服务和智能合约分类等情况,设计了数字交易管理系统。设计了数字交易管理系统的架构和功能,设计了应用于数字图像交易管理系统中的数字图像交易管理、数据安全保护管理、版权保护管理、智能合约管理和个性化推荐管理模型。以上研究成果,能够在一定程度上解决现有许多数字图像交易网站对数字图像版权保护和版权认证,交易的有法律效力存证,区块链技术应用中的智能合约分类,网站业务种类少等问题。将数字水印、区块链和智能推荐等技术应用到数字图像交易管理的研究方法,可以为管理科学的研究提供一些思路和方法。研究成果被应用后,业务种类的增加和对用户的个性化数字图像推荐能够吸引更多的用户消费,从而增加商家的利润。

牛俊文[5](2021)在《基于微博文本的兰州公交公众评价分析》文中研究表明公众参与已经成为交通规划和相关政策制定的重要组成部分,但是由于项目周期和成本限制,采用传统方法进行公众观点的大规模收集和分析将面临巨大的挑战。目前,在交通规划设计中,需要大力提高公众参与度,更重要的是加快数据的采集和处理速度,以弥补传统规划的不足。近年来,随着互联网技术的发展,微博用户的数量不断增加,新浪微博已成为公众发布信息的重要平台,微博评论中蕴含的丰富信息有待发掘。本文以兰州公交为对象,以公众微博评论为依据,开展了以下主要研究工作。首先,利用Python编写了爬虫程序,获取了微博评论文本数据并对其进行了预处理,包括字符清洗、中文分词、语义情感分析等。其次,构造了SVM分类模型对文本数据进行分类,本文将文本分为交通评价类、信息汇报类、交通需求类、无关数据类等四种类型;构造了LDA主题分析模型,挖掘得到了兰州公交出行、道路情况、线路调整、上学出行、疫情安全、交通安全等6种主题;在此基础上,深入分析了公众对兰州公交的关注角度和热点关注内容。最后,利用上述模型挖掘所得文本数据的隐含信息,分析研究了公众对兰州公交热点关注问题的时间与空间分布特性。通过对六个主题时空分布特征的分析,得到了公众对兰州公交热点关注问题的时间变化趋势,并针对不同的主题提出了相应的改进意见和建议。结果表明:(1)受疫情的影响,主题1和主题5中的口罩、发热和隔离等话题成为公众关注的新的热点问题;佩戴口罩也是目前公众乘坐公交须满足的基本条件。(2)主题2、主题3、主题4和主题6中的交通拥堵、线路调整、出行方式和交通安全等话题,公众关注的热度一直居高不下,其中交通拥堵是公众长期关注的热点话题,从空间分布来看,兰州公众对大型商圈、学校及交通枢纽等区域的公交拥堵情况关注较高;从时间分布来看,工作日公众的主要关注点在于城市主城区繁华路段的线路和交叉口等,而非工作日时,休闲娱乐的场所及景点,如中山桥站和白塔山公园等,公交站点交通状况成为公众关注的热点话题。

张树涛[6](2021)在《面向智力服务的文本挖掘研究》文中认为智力资源是一个国家和民族最宝贵的资源,智力服务的主体是企业和人才,其贯穿于企业生产发展的全过程中,旨在为企业的发展提供技术支撑。近年来,伴随着中小微企业蓬勃的发展,高端智力服务供需之间缺少对接平台的问题日益严重。同时随着企业招聘信息化的不断发展,互联网中存在着丰富的企业信息和人才信息,这些文本信息中蕴含着巨大的科学价值和应用价值。因此,如何利用大量的互联网文本资源,为企业和人才建立精准匹配,具有重大的研究意义。本文以面向智力服务的文本挖掘技术为研究对象,对其中的文本采集和文本匹配方法展开研究。主要研究内容如下:1)基于分布式的文本数据采集方法研究。针对分布式网络爬虫技术存在的负载均衡问题,研究了一种高效的负载均衡策略,将负载均衡问题转化为带约束条件的目标函数求解问题。首先构建基于多影响因素的非线性分布式网络爬虫节点运行时间模型,以该模型预测的各节点运行时间的最小方差为负载均衡策略的目标函数。然后利用最优化算法求解目标函数,确定负载均衡的任务分配方案。基于确定的最优解分配采集任务,降低分布式网络爬虫系统的总体运行时间。2)基于语义转换的文本匹配方法研究。针对文本匹配中的语义鸿沟问题,研究了一种基于语义转换的文本匹配方法。首先采用生成对抗网络构建一个双向语义转换模型以实现两种语义域间的转换,然后对转换后的目标域文本进行语义匹配。这种方法能够实现相似域和不同域文本的语义转换,提升文本数据集之间的域适应,提高文本匹配的准确度。3)基于文本挖掘的智力服务平台构建。设计基于文本挖掘的智力服务平台,采用研究的分布式网络爬虫系统采集互联网招聘网站和学术网站中的企业和人才数据,采用研究的基于语义转换的文本匹配方法实现企业和人才文本跨域语义精准匹配,为企业推送更精准的智力服务,实现智力资源的最大化挖掘利用。

皮婧文[7](2020)在《乡村旅游网络评论的应用研究》文中进行了进一步梳理近年来,为了通过加快发展都市近郊的乡村旅游项目来提高农村发展水平,各种农业和旅游业融合发展的活动相继展开,但这些项目在发展过程中出现了同质化的现象,千篇一律,缺乏吸引力。随着“互联网+农业”发展模式的迅速推进,目前互联网上也出现了大量游客上传的与古村落和古镇相关的点评评论。这些古村落和古镇的发展已经初具规模,积累了一定的知名度,在地理定位上又与乡村一致,因此可以借鉴这类古村落和古镇在不同季节的经营方式,来改善出现同质化现象的乡村旅游项目的品质。本文选取8个全国具有代表性的古村落和古镇作为研究对象,采用爬虫技术采集了相关平台上与古村镇相关的游客评论,通过分析游客评论为同质化严重的乡村旅游的发展提供决策支持。首先,由于农业易受季节变化影响,以基础农业为依托的乡村旅游的经营也会受到季节变化的影响,本文提出采用加入时间标签的Labeled LDA模型分析这类文本信息。但现有的模型在进行主题分类时,尚不能区分季节性主题词和常规性主题词,据此本文提出通过引入方差来改进Labeled LDA模型中特征词权重的计算方法。实验结果表明,该模型能解决常规性主题词干扰主题分类的问题,相较于传统模型具有更强的分类能力。然后,为了分析评论中主题与情感间的关系,加入先验知识构建情感词典,与JST模型结合使用。实验结果表明加入先验知识的情感分类的准确率要高于没有加入先验知识的。最后分析实验提取出来的主题情感词,针对乡村旅游的发展提出以下两点建议:(1)根据季节变化,将当地不同季节的农业生产、生态农业以及与农业生产相关的民俗文化与旅游业结合发展,重点打造“农业-生态-文化-旅游”有机结合的发展新模式;(2)去“唯商业化”,维持乡村原有古朴特色的同时可以采用现代化技术为游客提供方便快捷的服务,但要避免过度开发。

王小健[8](2020)在《石化企业多源知识发现与管理方法研究》文中进行了进一步梳理企业知识管理,即企业灵活运用先进的现代技术,对企业的显性和隐性知识进行有效地识别、融合和利用的活动。在知识管理过程中合理利用知识挖掘方法,能够帮助石化企业更好地做出指标预测、风险分析和企业决策,提高企业客户的忠诚度和服务体验度,进而从根本上提升我国石化企业的核心竞争力。然而,如果没有有效的多源信息处理手段,企业的知识管理系统只能处理单一来源的数据,将不可避免地局限了石化企业的发展空间。因此,本文探索建立一套高效的知识管理系统,通过深入研究网络行为建模和多源数据融合的方法,从而建立一套合理有效的体制机制对企业员工的性格、偏好、行为模式等方面进行全面深入地分析,更好地帮助石化企业提升其知识管理水平。本文的主要贡献是:第一,提出了一种基于多源信息融合的信息表示和行为建模方法;第二,提出了一种基于多源信息融合的指标相关性建模方法;第三,提出了一种基于多源信息融合的员工社群分析方法;第四,通过大数据分析技术和自然语言处理技术,提出一种基于多源信息融合的石化企业客户指标相关性分析方法和基于层次化聚类的石化企业垂直分类方法。基于上述方法,本文对石化企业知识管理的效果进行了分组实验和对比评估。实验结果表明,在利用了本文所提出的基于多源异构大数据融合分析的知识管理新方法的情况下,企业知识管理水平有了较为显着的提升。本文的研究成果为未来的企业知识管理方法研究提供了一条可行之道。

史璇[9](2020)在《基于科技文献的燃料电池汽车企业技术机会研究》文中认为当今全球范围内新一轮技术与产业革命正蓬勃兴起,各国都在加大科技创新力度,积极加强以科技创新为核心的全面战略部署,试图在新材料、新能源、信息、生物等新兴技术领域抢占未来发展制高点。而企业作为科技创新活动的主体,面对日趋激烈的市场竞争环境,只有具备宏观把握技术发展方向、识别技术创新机会、评估与预测技术商业化前景、并拥有制定最优技术发展策略的能力,才能适时地顺应快速发展的技术趋势,在科技创新与应用中占得先机。因此,如何能够更好地把握战略性新兴产业的发展脉搏与技术创新机会,成为当前企业和科研人员共同关注的焦点,也成为研究者愈发关注的关键问题,这对制定企业未来技术发展战略、实现自主技术创新、提升企业核心竞争力发挥着至关重要的作用。本文以“企业技术创新”为研究目标,燃料电池汽车企业为研究对象,以期刊文献和专利文献为数据基础,将文本挖掘、网络分析、文献计量和专利分析相关方法与技术机会研究相结合,以“理论框架和方法基础?核心技术研发方向识别?技术创新方案识别?技术商业化机会分析”为文章主线,提出了一套系统的基于科技文献的燃料电池汽车企业技术机会研究模型,主要创新成果总结如下:(1)本文提出了一个识别燃料电池汽车企业核心技术研发方向的方法模型。该模型创造性地将隐含狄利克雷分布引入到核心技术识别的框架当中,基于自然语言处理技术提取文本特征词并识别领域中的关键核心技术组件;其次,通过分析企业各项核心技术的发展水平,以及评估各个核心技术领域的未来潜力与发展优先级,为企业推荐适合自身发展的技术方向;最后,运用异常因子检测算法识别各个核心技术领域中的创新专利,预测了未来可能引领企业技术方向的创新发展点。实证研究部分以通用汽车公司为研究对象,分析企业的核心技术能力,评估技术发展潜力与优先级,识别了能够提升企业创新效率的核心技术研发方向。(2)本文有效地建立了一个识别燃料电池汽车企业技术创新方案的方法模型。本文从网络分析的角度入手,基于改进的特征词共现网络来描述领域中的技术创新活动,并提出了网络结构链的思想,将识别技术创新方案视为预测技术网络的未来链路变化和潜在关联;其次,分析与识别现有技术方案的专利开发状态,并基于文献和专利数据特征及专家意见构建技术评价指标体系;最后,借助回归分析方法实现技术创新方案的评价与预测。实证研究部分,以燃料电池汽车储氢技术为例开展实证分析,识别了该领域中的技术创新方案,并为企业推荐了适合未来不同阶段发展的技术机会。(3)本文构建了一个燃料电池汽车企业技术商业化机会分析模型。在以知识为导向的全球化经济中,技术创新成果成功的商业化应用是企业生存的关键。因此,本文重点强调对企业技术的潜在商业化机会的发掘,并以燃料电池汽车储氢技术为例开展实证分析。本文所提出的研究模型共分为三个层次。首先,利用协同过滤的方法获得市场竞争对手企业的技术发展策略,得到对目标企业有用的关键信息来识别具有商业潜力的、适合其发展的技术领域;其次,基于技术与行业映射关系识别竞争对手企业所具体涉足的行业,结合目标企业实际需求,分析和识别适合其拓展的行业领域;最后,通过建立专利增长趋势和跨领域应用趋势分析指标,评估已识别的行业领域的未来价值,进而为企业推荐了最具潜力的商业化拓展机会。

陈静[10](2020)在《面向MOOCs的学习行为与情感分析》文中提出今春突发的新冠肺炎疫情是对我国在线教育的一次重大考验,在疫情防控期间各类学校开展各种形式的在线教学工作,实现了“停课不停学”的目标,这表明进一步推进在线教育发展的必要性和重要性。大规模开放在线课程(Massive Open Online Courses,MOOCs)作为在线教育的一种形式,以其不受时空限制等诸多优势,近年来吸引了大量学习者,发展迅速。然而,由于宽松的学习环境,目前面向MOOCs的学习存在以下两个问题:课程辍学率较高和学习者学习效果较差。研究表明,学习行为和情感是影响辍学和学习效果的重要因素。面向MOOCs的学习行为和情感分析是新型教育环境下降低辍学率、改善学习效果的突破口,迅速成为当前研究热点。虽然已经涌现出诸多相关研究,面向MOOCs的学习行为和情感分析在实际应用中,仍然面临以下挑战:第一,在辍学行为预测方面,采用不同的学习行为特征预测结果不同,可能导致预测结果波动较大,识别准确率较低。第二,在学习行为和学习效果分析方面,目前大多研究重点关注学习行为和学习效果的相关关系分析,缺乏因果关系分析,导致分析的结论不可靠,无法提供有效的决策支持。第三,在情感分析方面,有监督的方法依赖大量的标注数据,而对这些数据进行标注费时费力,成本较高,且存在大量无标注数据并未充分利用。本文针对学习行为和情感分析研究工作面临的挑战,从建立准确高效的预测和分析模型出发,研究了面向MOOCs的学习行为和情感分析,以准确识别风险学习者及其情感,为降低辍学率和改善学习效果提供支持。本文主要工作和贡献如下:(1)提出一种基于网络日志的辍学行为预测方法。该方法在从网络日志数据中提取学习行为特征的基础上,提出一种基于决策树和极限学习机的辍学行为预测混合模型。该模型的核心是将决策树树形结构映射到极限学习机的网络结构,以同时实现特征选择、快速训练、辍学行为预测功能。实验结果表明,本文提出的方法在辍学行为预测准确率和F1值上优于多数现有方法,且不需要迭代训练。(2)提出一种学习行为和学习效果因果分析方法。该方法首先利用专家知识构建初始因果网络,在此基础上,利用结构学习从数据中学习并构建最终的因果贝叶斯网络。其次基于构建的因果贝叶斯网络进行推理,发现导致学习效果优异和较差的学习行为模式。实验结果表明,构建的因果贝叶斯网络可以较为准确地预测学习效果,进一步在该网络上进行学习行为和学习效果因果分析,根据较差的学习行为模式提出五类干预建议。(3)提出一种基于半监督协同学习的课程评论情感倾向识别模型。该模型从基于字符和单词的视图分别提取文本特征,以同时利用基于大规模语料库训练生成的静态词向量和基于领域语料库训练生成的动态词向量的优势。为选择置信度较高的样本,设计了一种双策略样本选择方法;为解决类别不平衡问题并提高分类准确率,设计了一种适用于半监督学习的混合损失函数,以同时操控标分布不平衡的标注数据和未标注数据的损失。实验结果表明,本文提出的方法在使用少量标注数据的情况下,提高了课程评论情感倾向识别的准确率和F1值,且稳定性更好。(4)提出一种基于无监督规则的课程评论方面和观点提取方法。该方法在词性标注和依存句法分析的基础上,根据词语之间存在的词性标记模式和依存关系,提出一系列方面和观点提取规则,进一步对使用规则生成的方面和观点候选集进行过滤,并识别观点的情感倾向,从细粒度层面分析评论为积极和消极的原因。实验结果表明,本文提出的方法在不使用标注数据的情况下,提高了课程评论方面和观点提取的精确率和召回率,并从教学水平、课程资源和学习平台三个角度进行了分析。

二、浅谈用“关键词语”挖掘隐含条件(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、浅谈用“关键词语”挖掘隐含条件(论文提纲范文)

(1)小微企业互联网融资信用评价研究(论文提纲范文)

致谢
摘要
ABSTRACT
1 绪论
    1.1 研究背景
    1.2 研究问题
    1.3 研究意义
        1.3.1 理论意义
        1.3.2 现实意义
    1.4 研究内容、研究方法与技术路线
        1.4.1 研究内容与研究方法
        1.4.2 技术路线
    1.5 研究创新点
2 文献与基础理论综述
    2.1 小微企业的概念及范围界定
        2.1.1 小微企业的概念
        2.1.2 小微企业的范围
    2.2 小微企业的融资困境及互联网融资
        2.2.1 小微企业融资难题
        2.2.2 小微企业的互联网融资
    2.3 小微企业融资信用评价影响因素及评价指标体系
        2.3.1 硬信息对小微企业互联网融资信用的影响
        2.3.2 软信息对小微企业互联网融资信用的影响
    2.4 小微企业互联网融资信用评价模型及方法
        2.4.1 传统信用评价技术
        2.4.2 大数据技术下的企业融资信用评价方法
    2.5 文献述评
    2.6 本章小结
3 小微企业互联网融资信用评价机理分析
    3.1 国外小微企业特征及信贷服务实践
        3.1.1 国外小微企业发展模式及传统渠道融资特征
        3.1.2 国外小微企业互联网融资模式的发展
    3.2 我国小微企业特征
        3.2.1 小微企业的总体特征
        3.2.2 小微企业的经营活动特征
        3.2.3 小微企业的金融行为特征
        3.2.4 小微企业的竞争力特征
        3.2.5 小微企业的社会关联性特征
        3.2.6 小微企业的还款能力及还款意愿特征
    3.3 我国小微企业互联网融资模式及途径
        3.3.1 小微企业互联网融资模式
        3.3.2 小微企业互联网融资途径
    3.4 小微企业互联网融资信用分析
        3.4.1 小微企业互联网融资信用数据的来源
        3.4.2 小微企业传统与互联网渠道融资信用评价的异同
        3.4.3 小微企业互联网融资信用评价的四维概念模型与要素
    3.5 大数据背景下小微企业互联网融资信用评价机理
        3.5.1 大数据背景下小微企业互联网融资信用评价的目的
        3.5.2 大数据背景下小微企业互联网融资审核流程分析
        3.5.3 大数据技术在小微企业互联网融资信用评价中的应用
    3.6 本章小结
4 小微企业互联网融资信用评价指标体系构建
    4.1 小微企业互联网融资信用指标构建
        4.1.1 小微企业互联网融资信用硬信息与软信息界定
        4.1.2 影响小微企业互联网融资信用水平的硬信息
        4.1.3 影响小微企业互联网融资信用水平的软信息
    4.2 小微企业互联网融资信用评价指标界定与预处理
        4.2.1 小微企业互联网融资信用评价指标框架
        4.2.2 小微企业互联网融资信用评价指标类型及标准化方法
    4.3 小微企业互联网融资信用评价指标组合赋权
        4.3.1 小微企业互联网融资信用评价指标单一客观赋权方法
        4.3.2 小微企业互联网融资信用评价指标组合赋权方法
        4.3.3 小微企业互联网融资信用熵评价模型
    4.4 本章小结
5 小微企业互联网融资信用数据获取模型
    5.1 软信息对小微企业互联网融资信用评价的作用方式
        5.1.1 软信息对小微企业互联网融资信用评价的直接作用
        5.1.2 软信息文本特征对小微企业互联网融资信用评价的间接作用
        5.1.3 软信息主题特征对小微企业互联网融资信用评价的间接作用
    5.2 融合多元信息的小微企业互联网融资信用数据获取
        5.2.1 小微企业互联网融资信用软信息分类
        5.2.2 小微企业互联网融资信用软信息量化方法
        5.2.3 小微企业互联网融资信用评价软硬信息变量选取
    5.3 小微企业互联网融资信用数据模型
        5.3.1 小微企业互联网融资信用评价数据来源
        5.3.2 小微企业互联网融资信用信息量化处理
    5.4 本章小结
6 小微企业互联网融资信用评价模型与案例分析
    6.1 基于博弈的评价主体关系分析
        6.1.1 评价主体的互联网融资信任博弈模型假设
        6.1.2 评价主体的互联网融资信任博弈模型构建
        6.1.3 评价主体的互联网融资信任博弈演化均衡的稳定性分析
    6.2 基于演化的小微企业互联网融资信用评价模型
        6.2.1 评价主体的互联网融资信用特征
        6.2.2 基于神经网络和物元可拓的评价方法
        6.2.3 模型精确度测量
    6.3 小微企业互联网融资信用评价结果分析
        6.3.1 小微企业互联网融资信用评价数据来源
        6.3.2 小微企业互联网融资信用评价实验设计
        6.3.3 小微企业互联网融资信用评价实验结果及分析
    6.4 本章小结
7 小微企业互联网融资信用评价总结与政策建议
    7.1 大数据背景下小微企业互联网融资信用内涵总结
        7.1.1 大数据背景下小微企业互联网融资
        7.1.2 大数据背景下小微企业互联网融资信用优势
    7.2 小微企业互联网融资信用评价要素
        7.2.1 传统融资过程中的信用评价与信任关系
        7.2.2 互联网融资过程中的信用评价与信任关系
    7.3 小微企业互联网融资信用评价的管理建议
        7.3.1 基于激励政策执行力的信用评价技术研究
        7.3.2 基于互联网金融信用评价的风险防控
        7.3.3 基于大数据来平衡评价技术与人际沟通的关系
    7.4 本章小结
8 研究结论与展望
    8.1 研究结论
    8.2 研究展望
参考文献
附录 A 词云图代码
附录 B LDA模型代码
附录 C BP神经网络代码
作者简历及攻读博士学位期间取得的研究成果
学位论文数据集

(2)面向文物领域的知识图谱构建技术研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状及存在的问题
        1.2.1 文物领域知识图谱研究现状
        1.2.2 知识图谱构建技术研究现状
        1.2.3 存在的问题
    1.3 本文的研究内容
        1.3.1 基于自训练算法的半监督文物实体抽取
        1.3.2 基于词注意力机制的胶囊网络文物关系抽取
        1.3.3 基于多特征相似度的文物实体对齐
        1.3.4 融合实体类型的BERT文物知识图谱补全
    1.4 本文的创新点
    1.5 本文的组织结构
第二章 基于自训练算法的半监督文物实体抽取
    2.1 引言
    2.2 文物实体抽取方法
        2.2.1 文物实体形式化描述
        2.2.2 文物实体抽取模型
    2.3 基于ELMo的词表示
    2.4 基于Bi LSTM和 CRF的特征提取和实体预测
        2.4.1 基于Bi LSTM的特征提取
        2.4.2 基于CRF的实体预测
    2.5 基于双重标注的高置信度样本选择
        2.5.1 双重标注样本选择策略
        2.5.2 基于双重标注样本选择策略的自训练算法
    2.6 实验与结果分析
        2.6.1 数据集及预处理
        2.6.2 实验设置
        2.6.3 文物实体抽取的实验结果
        2.6.4 初始标注样本比例对模型性能的影响
        2.6.5 不同词表示对模型性能的影响
        2.6.6 样本选择策略对模型性能的影响
    2.7 本章小结
第三章 基于词注意力机制的胶囊网络文物关系抽取
    3.1 引言
    3.2 文物关系抽取方法
        3.2.1 文物关系形式化描述
        3.2.2 文物关系抽取模型
    3.3 融合词性和位置信息的文本表示
        3.3.1 基于字和词的联合词表示
        3.3.2 融合词性和位置信息的文本表示
    3.4 基于双向Bi LSTM的低层特征提取
    3.5 基于词注意力机制胶囊网络的特征聚类
        3.5.1 基于胶囊网络的丰富特征提取
        3.5.2 基于词注意力机制的动态路由算法
    3.6 多重关系预测
    3.7 实验与结果分析
        3.7.1 数据集及预处理
        3.7.2 实验设置
        3.7.3 文物关系抽取的实验结果
        3.7.4 词表征对模型性能的影响
        3.7.5 词注意力机制对模型性能的影响
    3.8 本章小结
第四章 基于多特征相似度的文物实体对齐
    4.1 引言
    4.2 文物实体对齐方法
        4.2.1 文物实体特征形式化描述
        4.2.2 文物实体对齐流程
    4.3 基于动态规划的LCS实体属性相似度
        4.3.1 动态规划最长公共子序列查找算法
        4.3.2 实体属性相似度计算
    4.4 基于TF-IDF和余弦相似度的实体摘要相似度
        4.4.1 基于TF-IDF的特征向量获取
        4.4.2 实体摘要相似度计算
    4.5 基于LDA主题模型的实体全文相似度
        4.5.1 基于LDA模型的主题建模
        4.5.2 实体全文主题特征生成
        4.5.3 实体全文相似度计算
    4.6 文物实体对齐模型及算法
        4.6.1 文物实体对齐模型
        4.6.2 文物实体对齐算法
    4.7 实验与结果分析
        4.7.1 数据集及预处理
        4.7.2 实验设置
        4.7.3 文物实体对齐的实验结果
        4.7.4 主题个数对文物实体对齐结果的影响
        4.7.5 阈值对文物实体对齐结果的影响
        4.7.6 实体特征对文物实体对齐结果的影响
    4.8 本章小结
第五章 融合实体类型的BERT文物知识图谱补全
    5.1 引言
    5.2 文物知识图谱补全方法
        5.2.1 知识图谱补全问题描述
        5.2.2 文物知识图谱补全模型
    5.3 融合外部知识的文物文本语义增强表示
    5.4 基于多头注意力机制的特征提取与序列编码
        5.4.1 基于多头自注意力机制的特征获取
        5.4.2 基于Transformer编码器的序列编码
    5.5 BERT模型的预训练和微调
        5.5.1 基于无监督的BERT模型预训练
        5.5.2 基于预训练模型的参数微调
    5.6 文物知识图谱补全模型的输出
    5.7 实验与结果分析
        5.7.1 数据集及预处理
        5.7.2 实验设置
        5.7.3 三元组分类的实验结果
        5.7.4 链接预测的实验结果
        5.7.5 关系预测的实验结果
        5.7.6 训练数据比例对模型性能的影响
    5.8 本章小结
第六章 总结与展望
    6.1 全文总结
    6.2 工作展望
参考文献
攻读博士学位期间取得的科研成果
致谢
作者简介

(3)面向领域的指标挖掘方法研究与系统实现(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景及意义
    1.2 研究内容及创新点
        1.2.1 研究内容
        1.2.2 创新点
    1.3 组织结构与研究框架图
        1.3.1 组织结构
        1.3.2 研究框架图
    1.4 本章小结
第二章 相关研究及技术概述
    2.1 研究现状
        2.1.1 专利文本挖掘研究
        2.1.2 文本指标挖掘研究
    2.2 相关技术介绍
        2.2.1 词向量
        2.2.2 依存句法分析
        2.2.3 BP神经网络模型
        2.2.4 贝叶斯神经网络模型
    2.3 本章小结
第三章 面向领域的指标挖掘方法
    3.1 问题提出
    3.2 基本概念
    3.3 基于BP神经网络模型指标挖掘方法
        3.3.1 BP模型的指标挖掘理论依据
        3.3.2 BP模型的指标挖掘结构设计
        3.3.3 BP模型的指标挖掘实现步骤
        3.3.4 BP模型的指标挖掘应用算法流程
    3.4 基于贝叶斯神经网络模型领域指标挖掘方法
        3.4.1 BNN模型的指标挖掘理论依据
        3.4.2 BNN模型的指标挖掘结构设计
        3.4.3 BNN模型的指标挖掘实现步骤
        3.4.4 BNN模型的指标挖掘应用算法流程
    3.5 本章小节
第四章 实验设计与结果可视化分析
    4.1 实验准备
        4.1.1 实验数据描述
        4.1.2 特征工程处理
        4.1.3 模型评价指标
    4.2 基于BP神经网络模型的指标挖掘实验
        4.2.1 参数选取
        4.2.2 实验结果分析
    4.3 基于贝叶斯神经网络模型的指标挖掘实验
        4.3.1 参数选取
        4.3.2 实验结果分析
    4.4 模型实验结果对比分析
    4.5 本章小结
第五章 面向领域的指标挖掘系统实现
    5.1 系统开发环境
    5.2 系统设计
        5.2.1 系统总体框架设计
        5.2.2 系统功能模块设计
    5.3 系统实现
        5.3.1 系统管理模块实现
        5.3.2 文件上传模块实现
        5.3.3 指标展示模块实现
    5.4 本章小结
第六章 总结与展望
    6.1 工作总结
    6.2 研究不足与未来展望
参考文献
致谢

(4)基于水印和区块链技术的数字图像交易管理研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 研究目的与意义
    1.3 国内外研究现状
        1.3.1 数字图像交易管理国内外研究现状
        1.3.2 数字水印技术国内外研究现状
        1.3.3 区块链技术国内外研究现状
        1.3.4 智能推荐技术国内外研究现状
    1.4 研究思路与方法
    1.5 研究内容及创新点
    1.6 论文的组织结构
第二章 预备知识
    2.1 数字水印技术
        2.1.1 数字水印概述
        2.1.2 数字图像水印技术
    2.2 区块链技术
        2.2.1 区块链概述
        2.2.2 区块链架构模型
        2.2.3 区块链区块结构
        2.2.4 区块链的运行过程
        2.2.5 智能合约
    2.3 智能推荐技术
        2.3.1 智能推荐技术概述
        2.3.2 常用的推荐算法
    2.4 本章小结
第三章 基于SVD与深度学习的数字图像多功能零水印算法研究
    3.1 理论基础
        3.1.1 离散小波变换
        3.1.2 奇异值分解
        3.1.3 深度学习技术
        3.1.4 深度卷积神经网络
        3.1.5 深度置信网络
    3.2 基于SVD和 DCNN的数字图像多功能零水印算法
        3.2.1 算法设计思想
        3.2.2 基于SVD和 DCNN的数字图像多功能构造零水印算法
        3.2.3 基于SVD和 DCNN的数字图像多功能提取零水印算法
        3.2.4 仿真实验和分析
    3.3 基于SVD和 DBN的数字图像多功能零水印算法
        3.3.1 算法设计思想
        3.3.2 基于SVD和 DBN的数字图像多功能构造零水印算法
        3.3.3 基于SVD和 DBN的数字图像多功能提取零水印算法
        3.3.4 仿真实验和分析
    3.4 本章小结
第四章 数字图像交易管理中智能合约分类算法研究
    4.1 理论知识
        4.1.1 智能合约分类的难点
        4.1.2 智能合约分类相关研究
        4.1.3 Word2Vec
        4.1.4 堆叠自编码器
        4.1.5 随机权极速学习机
        4.1.6 双向长短期记忆神经网络
        4.1.7 加权交叉熵损失函数
    4.2 基于自编码随机权ELM网络的智能合约分类算法
        4.2.1 算法设计思想
        4.2.2 基于自编码随机权ELM网络的智能合约分类模型
        4.2.3 基于自编码随机权ELM网络的智能合约分类算法描述
        4.2.4 仿真实验与分析
    4.3 基于加权交叉熵损失函数的长短记忆智能合约分类算法
        4.3.1 算法设计思想
        4.3.2 基于加权交叉熵损失函数的长短记忆智能合约分类模型
        4.3.3 基于加权交叉熵损失函数的长短记忆智能合约分类算法描述
        4.3.4 仿真实验与分析
    4.4 智能合约分类算法在数字图像交易管理中的应用
        4.4.1 自编码随机权ELM网络分类算法在数字图像交易智能合约分类中的应用
        4.4.2 加权交叉熵损失函数Bi LSTM分类算法在数字图像交易智能合约分类中的应用
    4.5 本章小结
第五章 数字图像交易管理中个性化智能推荐算法研究
    5.1 理论知识
        5.1.1 Text Rank算法
        5.1.2 加权Text Rank算法
        5.1.3 自组织特征映射神经网络
    5.2 基于加权Text Rank和 SOM的个性化数字图像智能推荐算法
        5.2.1 算法设计思想
        5.2.2 基于加权Text Rank和 SOM的个性化数字图像智能推荐模型
        5.2.3 基于加权Text Rank和 SOM的个性化数字图像智能推荐算法描述
        5.2.4 仿真实验和分析
    5.3 本章小结
第六章 数字图像交易管理系统
    6.1 数字图像交易管理系统架构
        6.1.1 数字图像交易管理系统整体架构
        6.1.2 数字图像交易管理Web服务子系统架构
        6.1.3 区块链数字图像交易管理子系统架构
    6.2 基于水印和区块链技术的数字图像交易管理系统设计
        6.2.1 数字图像交易管理Web服务子系统功能设计
        6.2.2 区块链数字图像交易管理子系统功能设计
    6.3 数字图像交易管理系统的主要管理模型
        6.3.1 数据图像交易管理系统的数字图像交易管理模型
        6.3.2 数字图像交易管理系统的数据安全保护管理模型
        6.3.3 数字图像交易管理系统的版权保护管理模型
        6.3.4 数字图像交易管理系统的智能合约管理模型
        6.3.5 数字图像交易管理系统中个性化推荐管理模型
    6.5 本章小结
第七章 结论与展望
    7.1 主要结论和创新
    7.2 研究展望
参考文献
致谢
个人简介及攻读学位期间取得的研究成果

(5)基于微博文本的兰州公交公众评价分析(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 国内外研究现状
        1.3.1 国内研究现状
        1.3.2 国外研究现状
    1.4 主要研究内容
2 相关理论和技术介绍
    2.1 文本数据获取与预处理
        2.1.1 基于网络爬虫技术的文本数据获取
        2.1.2 数据预处理
    2.2 文本分类和表示方法
        2.2.1 文本分类方法
        2.2.2 文本表示方法
    2.3 文本的预测分布模型
    2.4 LDA模型
        2.4.1 LDA模型
        2.4.2 样本采样和LDA模型中吉布斯采样
        2.4.3 LDA模型训练设置
    2.5 本章小结
3 基于LDA模型的兰州公交评价分析
    3.1 兰州公交评价获取
    3.2 数据预处理
        3.2.1 降噪处理
        3.2.2 中文分词
        3.2.3 语义情感分析
    3.3 文本分类
    3.4 LDA主题模型分析
    3.5 本章小结
4 兰州公交评价文本挖掘分析及交通优化措施
    4.1 公众热点关注问题的时间分布
    4.2 公众热点关注的交通拥堵的空间分布
    4.3 公交线路优化和服务改善
        4.3.1 公交线路优化措施
        4.3.2 公交服务改善措施
    4.4 本章小结
结论与展望
致谢
参考文献
附录 A 爬虫代码

(6)面向智力服务的文本挖掘研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 智力服务研究现状
        1.2.2 文本挖掘研究现状
        1.2.3 文本挖掘在智力服务领域的研究现状
    1.3 研究内容
    1.4 组织结构
第2章 文本挖掘相关技术
    2.1 引言
    2.2 分布式网络爬虫技术概述
        2.2.1 分布式系统
        2.2.2 网络爬虫框架
        2.2.3 负载均衡
    2.3 文本匹配技术概述
        2.3.1 文本预处理
        2.3.2 文本语义表示
        2.3.3 文本匹配模型
    2.4 本章小结
第3章 基于分布式的文本采集方法
    3.1 引言
    3.2 分布式网络爬虫系统
        3.2.1 系统整体结构
        3.2.2 信息提取
        3.2.3 规避反爬虫策略
    3.3 负载均衡策略
        3.3.1 负载影响参数
        3.3.2 运行时间预测模型
        3.3.3 目标函数
        3.3.4 粒子群算法参数计算
        3.3.5 近似梯度下降算法参数计算
    3.4 实验与分析
        3.4.1 实验环境配置
        3.4.2 节点负载参数测试
        3.4.3 负载均衡算法测试
        3.4.4 实验结果分析
    3.5 本章小结
第4章 基于语义转换的文本匹配方法
    4.1 引言
    4.2 文本语义转换
        4.2.1 语义转换模型
        4.2.2 损失函数
        4.2.3 模型训练
    4.3 文本匹配
    4.4 实验与分析
        4.4.1 实验环境和参数配置
        4.4.2 相似域文本匹配实验
        4.4.3 跨域文本匹配实验
        4.4.4 实验结果分析
    4.5 本章小结
第5章 基于文本挖掘的智力服务平台
    5.1 引言
    5.2 智力服务平台
        5.2.1 平台环境配置
        5.2.2 平台整体结构
    5.3 基于分布式网络爬虫的文本数据库构建
        5.3.1 企业和人才文本采集
        5.3.2 数据库设计
        5.3.3 文本采集结果
    5.4 基于语义转换的企业和人才匹配
        5.4.1 企业和人才文本匹配
        5.4.2 文本匹配结果
    5.5 本章小结
第6章 总结与展望
    6.1 论文总结
    6.2 不足之处及展望
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果

(7)乡村旅游网络评论的应用研究(论文提纲范文)

摘要
abstract
1 绪论
    1.1 研究背景
    1.2 研究目的与意义
    1.3 国内外研究现状
        1.3.1 网络评论的相关研究
        1.3.2 主题模型相关研究
        1.3.3 特征词提取相关研究
        1.3.4 联合情感/主题模型相关研究
        1.3.5 国内外研究小结
    1.4 研究内容与技术路线
    1.5 主要创新点
2 理论基础和关键技术
    2.1 主题模型
        2.1.1 LDA模型
        2.1.2 Labeled LDA模型
    2.2 TF-IDF特征提取方法
    2.3 JST模型简介
3 基于方差加权的Labeled LDA模型的主题分类
    3.1 改进Labeled LDA主题模型
        3.1.1 传统TF-IDF的不足
        3.1.2 方差加权
        3.1.3 方差加权的Labeled LDA模型
    3.2 实验过程
        3.2.1 实验数据
        3.2.2 对比实验
        3.2.3 评价指标
    3.4 结果分析
    3.5 本章小结
4 基于联合情感/主题模型的情感分类
    4.1 结合先验知识的JST模型
    4.2 实验设计
        4.2.1 实验数据
        4.2.2 实验参数和评价指标的设置
    4.3 实验结果对比
    4.4 实验结果分析
    4.5 本章小结
5 结论与展望
    5.1 结论
    5.2 展望
参考文献
个人简介
导师简介
获得成果目录
致谢

(8)石化企业多源知识发现与管理方法研究(论文提纲范文)

致谢
摘要
ABSTRACT
1 引言
    1.1 研究背景
        1.1.1 知识管理的必要性
        1.1.2 知识管理的经济价值
        1.1.3 石化企业的知识管理
    1.2 研究意义
        1.2.1 理论价值
        1.2.2 现实意义
    1.3 研究内容与结构安排
        1.3.1 研究内容
        1.3.2 结构安排
    1.4 主要贡献和创新点
2 理论与方法综述
    2.1 企业知识管理理论与方法
        2.1.1 背景介绍
        2.1.2 企业知识管理相关概念
        2.1.3 国外主流知识管理思想
        2.1.4 利用知识挖掘提高组织资本和企业竞争力
    2.2 国内石化企业知识管理研究现状
        2.2.1 石化企业知识管理的进展
        2.2.2 基于多源知识发现实施石化企业知识管理的必要性
    2.3 基于大数据分析的知识管理方法
        2.3.1 多特征融合统计学习方法
        2.3.2 多源异构数据知识发现方法
        2.3.3 基于大数据分析的社会化管理方法
    2.4 文本语料分析基本方法
        2.4.1 技术挑战
        2.4.2 文档处理和分词
        2.4.3 数据降维及语义分析
        2.4.4 文本语料分类和聚类
    2.5 小结
3 石化企业知识管理的影响因素分析
    3.1 石化企业知识管理的要求与方法
        3.1.1 石化企业创新发展要求与创新要素
        3.1.2 提升石化企业知识管理水平的方法
    3.2 石化企业知识管理的影响因素
        3.2.1 企业知识管理的影响因素
        3.2.2 石化企业知识管理方法的基本要素
    3.3 基于多源信息的石化企业知识管理实施框架与检验方法
        3.3.1 知识管理方法实施框架
        3.3.2 研究维度、效度及其检验方法
    3.4 小结
4 基于多源信息融合的石化企业员工行为建模
    4.1 网络社会化行为建模面临的挑战
    4.2 网络社会化行为的特点与数据维度
    4.3 问题研究的准备工作和总体思路
        4.3.1 词汇范畴分析
        4.3.2 数据收集
        4.3.3 总体框架
    4.4 员工行为建模方法
        4.4.1 员工属性信息建模
        4.4.2 工作行为建模
        4.4.3 网络行为建模
    4.5 指标相关性预测模型与知识管理
        4.5.1 指标相关性预测模型和求解
        4.5.2 指标分析和知识管理
        4.5.3 指标相关性预测模型研究小结
    4.6 企业员工的社群分析
        4.6.1 企业员工社群分析的研究背景
        4.6.2 企业员工行为的时间分布建模
        4.6.3 社群发现
        4.6.4 相似度学习及特征权重学习
        4.6.5 企业员工社群分析研究小结
5 基于多源大数据分析的企业客户关系管理
    5.1 客户关系管理(CRM)
    5.2 石化企业客户管理的必要性和基本管理思路
    5.3 指标相关性建模方法
    5.4 基于商业行为分析的企业客户分类方法
    5.5 小结
6 实验研究与算例分析
    6.1 多源信息融合实验
    6.2 员工社群发现
    6.3 员工社群类型的知识发现及讨论
    6.4 企业客户信息搜集和指标相关性建模
    6.5 企业分类实验评测
    6.6 知识管理效果评估-以企业员工管理为例
    6.7 实验讨论和小结
7 研究结论与讨论
    7.1 基本结论
    7.2 研究展望
参考文献
作者简历及攻读博士学位期间取得的研究成果
学位论文数据集

(9)基于科技文献的燃料电池汽车企业技术机会研究(论文提纲范文)

中文摘要
ABSTRACT
第一章 绪论
    1.1 研究背景
        1.1.1 选题背景
        1.1.2 当前研究与存在的问题
    1.2 研究问题的提出与研究方案
        1.2.1 研究问题的提出
        1.2.2 理论研究构架
    1.3 研究内容与框架
        1.3.1 研究内容
        1.3.2 研究框架
    1.4 研究意义
    1.5 主要创新点
第二章 理论方法和文献综述
    2.1 技术机会分析相关理论
        2.1.1 技术预测与技术机会分析
        2.1.2 技术机会的含义
        2.1.3 技术机会分析方法与工具
    2.2 文本挖掘在技术机会分析中的应用
        2.2.1 文本分割与句法分析
        2.2.2 关键词提取
        2.2.3 文本聚类
    2.3 网络分析在技术机会分析中的应用
        2.3.1 关系提取
        2.3.2 特征与结构分析
    2.4 文献计量与专利分析在技术机会分析中的应用
        2.4.1 趋势分析
        2.4.2 计量指标
    2.5 本章小结
第三章 燃料电池汽车企业核心技术研发方向识别研究
    3.1 问题的提出
    3.2 核心技术领域识别及发展水平分析
        3.2.1 基于文本挖掘的核心技术组件萃取
        3.2.2 企业的技术组合向量构建
        3.2.3 基于技术组合向量的技术发展水平分析
    3.3 核心技术领域潜力评估及发展优先级分析
        3.3.1 技术竞争强度评估
        3.3.2 技术生命周期评估
        3.3.3 技术市场潜力评估
    3.4 核心技术领域的创新发展点识别
        3.4.1 专利关系映射
        3.4.2 创新专利识别
    3.5 实证研究——以通用公司为例识别企业核心技术研发方向
        3.5.1 案例研究背景
        3.5.2 数据采集与处理
        3.5.3 通用公司核心技术领域识别及发展水平分析
        3.5.4 通用公司核心技术领域潜力评估与发展优先级分析
        3.5.5 通用公司核心技术领域中的创新专利识别
    3.6 本章小结
第四章 燃料电池汽车企业技术创新方案识别研究
    4.1 问题的提出
    4.2 燃料电池汽车领域技术网络描述
        4.2.1 燃料电池汽车领域技术网络构建方法
        4.2.2 技术网络特征描述
    4.3 基于多元链路结构的技术方案识别
        4.3.1 基于文献数据的技术方案识别
        4.3.2 基于专利数据的技术方案识别
    4.4 基于回归分析的技术创新方案评价与预测模型
        4.4.1 技术创新方案综合评价指标体系构建
        4.4.2 基于回归分析构建技术创新方案预测模型
    4.5 实证研究——以“储氢技术”为例开展企业技术创新方案识别研究
        4.5.1 储氢技术网络特征描述
        4.5.2 基于多元链路结构的储氢技术方案识别
        4.5.3 构建基于回归分析的储氢技术方案评价模型
        4.5.4 预测储氢技术领域未来技术创新方案并进行结果验证
    4.6 本章小结
第五章 燃料电池汽车企业技术商业化机会分析
    5.1 问题的提出
    5.2 技术商业化机会分析框架
        5.2.1 技术商业化机会分析思路及方法
        5.2.2 技术商业化机会分析步骤
    5.3 面向技术的商业化机会分析
        5.3.1 基于专利分析的竞争对手企业初选
        5.3.2 基于协同过滤的竞争对手企业识别
        5.3.3 技术领域潜在商业化机会分析
    5.4 面向行业的商业化机会分析
        5.4.1 技术与行业映射关系
        5.4.2 基于技术与行业映射关系的商业化机会分析
        5.4.3 行业未来发展潜力评价
    5.5 实证研究——以“储氢技术”为例开展企业的技术商业化机会分析
        5.5.1 数据收集
        5.5.2 面向技术的商业化机会分析
        5.5.3 面向行业的商业化机会分析
    5.6 本章小结
第六章 总结与展望
    6.1 本研究的主要工作与结论
    6.2 研究的局限性
    6.3 后续研究建议
附录 A
附录 B
附录 C
参考文献
攻读学位期间取得的研究成果
致谢
个人简介及联系方式

(10)面向MOOCs的学习行为与情感分析(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 背景及意义
    1.2 研究现状及主要问题
        1.2.1 在线学习行为分析研究现状
        1.2.2 文本情感分析研究现状
        1.2.3 主要问题
    1.3 研究内容及关键技术
        1.3.1 面向网络日志的辍学行为预测
        1.3.2 学习行为和学习效果因果分析
        1.3.3 课程评论的情感倾向识别
        1.3.4 课程评论的方面和观点提取
    1.4 本文创新
    1.5 章节安排
第二章 面向网络日志的辍学行为预测
    2.1 引言
    2.2 面向网络日志的辍学行为预测方法
        2.2.1 问题描述
        2.2.2 实现步骤
    2.3 学习行为特征提取
        2.3.1 影响辍学的学习行为
        2.3.2 学习行为特征提取算法
    2.4 基于决策树和极限学习机的辍学行为预测混合模型
        2.4.1 基于信息增益比的特征选择和决策树生成
        2.4.2 基于决策树树形结构的特征增强
        2.4.3 树形结构到极限学习机网络结构的映射
        2.4.4 基于改进结构的极限学习机
    2.5 实验及分析
        2.5.1 数据集及预处理
        2.5.2 实验设置
        2.5.3 辍学行为预测的实验结果
        2.5.4 特征选择对模型性能的影响
        2.5.5 特征增强和连接初始化对模型性能的影响
        2.5.6 训练集大小对模型性能的影响
        2.5.7 不同方法的对比
        2.5.8 不同学习行为对辍学的影响
    2.6 本章小结
第三章 学习行为和学习效果因果分析
    3.1 引言
    3.2 学习行为和学习效果因果分析方法
        3.2.1 影响学习效果的学习行为因素
        3.2.2 实现步骤
    3.3 基于专家知识和结构学习的因果贝叶斯网络构建
        3.3.1 因果贝叶斯网络及构建过程
        3.3.2 基于专家知识的初始网络构建
        3.3.3 基于初始网络的结构学习
        3.3.4 网络参数学习
    3.4 学习行为和学习效果因果分析
        3.4.1 影响学习效果的重要因素选择
        3.4.2 基于因果推理的学习效果预测
        3.4.3 基于重要因素和推理的因果分析
    3.5 实验及分析
        3.5.1 数据集及预处理
        3.5.2 基于专家知识的初始网络构建结果
        3.5.3 基于初始网络的结构学习结果
        3.5.4 网络参数学习结果
        3.5.5 学习效果预测结果
        3.5.6 重要因素选择结果
        3.5.7 学习行为和学习效果因果分析
        3.5.8 基于因果分析的干预应用
    3.6 本章小结
第四章 课程评论的情感倾向识别
    4.1 引言
    4.2 基于半监督协同学习的课程评论情感倾向识别模型
    4.3 基于双视图的课程评论词嵌入方法
        4.3.1 基于单词视图的词嵌入方法
        4.3.2 基于字符视图的词嵌入方法
    4.4 情感倾向识别卷积神经网络
    4.5 双策略样本选择方法
    4.6 半监督学习中的混合损失函数
        4.6.1 监督学习中的焦点损失函数
        4.6.2 无监督学习中的最小熵损失函数
        4.6.3 结合焦点损失和最小熵的半监督混合损失函数
    4.7 实验及分析
        4.7.1 数据集及预处理
        4.7.2 实验设置
        4.7.3 课程评论情感倾向识别的实验结果
        4.7.4 视图对模型性能的影响
        4.7.5 样本选择策略对模型性能的影响
        4.7.6 混合损失函数对模型性能的影响
    4.8 本章小结
第五章 课程评论的方面和观点提取
    5.1 引言
    5.2 课程评论的方面和观点提取方法
    5.3 依存句法及依存关系分析
        5.3.1 词性标注与依存句法分析
        5.3.2 适用于方面和观点提取的依存关系分析
    5.4 基于依存关系规则的方面和观点提取
        5.4.1 方面和观点提取规则
        5.4.2 方面和观点提取算法
        5.4.3 方面和观点的过滤
        5.4.4 观点的情感倾向识别
    5.5 实验及分析
        5.5.1 数据集及预处理
        5.5.2 实验设置
        5.5.3 方面和观点提取的实验结果
        5.5.4 面向教学水平的方面和观点分析
        5.5.5 面向课程资源的方面和观点分析
        5.5.6 面向学习平台的方面的观点分析
    5.6 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
攻读博士学位期间取得的科研成果
作者简介

四、浅谈用“关键词语”挖掘隐含条件(论文参考文献)

  • [1]小微企业互联网融资信用评价研究[D]. 周彪. 北京交通大学, 2021(02)
  • [2]面向文物领域的知识图谱构建技术研究[D]. 张敏. 西北大学, 2021(10)
  • [3]面向领域的指标挖掘方法研究与系统实现[D]. 李新超. 内蒙古大学, 2021(12)
  • [4]基于水印和区块链技术的数字图像交易管理研究[D]. 赵彦霞. 河北大学, 2021
  • [5]基于微博文本的兰州公交公众评价分析[D]. 牛俊文. 兰州交通大学, 2021(02)
  • [6]面向智力服务的文本挖掘研究[D]. 张树涛. 中国科学技术大学, 2021(08)
  • [7]乡村旅游网络评论的应用研究[D]. 皮婧文. 北京林业大学, 2020(02)
  • [8]石化企业多源知识发现与管理方法研究[D]. 王小健. 北京交通大学, 2020(03)
  • [9]基于科技文献的燃料电池汽车企业技术机会研究[D]. 史璇. 山西大学, 2020(12)
  • [10]面向MOOCs的学习行为与情感分析[D]. 陈静. 西北大学, 2020(01)

标签:;  ;  ;  ;  ;  

谈“关键词”挖掘隐条件
下载Doc文档

猜你喜欢