召回率和准确率，关键词算法的评价讨论 - Meister_Xu - ITeye博客

`

icenows

浏览: 58447 次
性别:
来自: 上海

最近访客更多访客>>

xueyue521q

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

lovewendy： ...
Google的语音搜索应用

召回率和准确率，关键词算法的评价讨论

博客分类：

自然语言处理NLP

算法搜索引擎

阅读更多

关于如何评价关键词算法的效率，师姐建议采用借用搜索引擎的召回率和准确率来统计，——人工选择N个关键词，再自动抽取N个关键词进行比较。但是在最后的实现过程中发现，这种N：N的方法是不太恰当的，最明显的结果是召回率＝准确率。

另一方面，手动关键词的选取也值得商榷，限定提取N个关键词的办法似乎不是很好，问题在于究竟应该选取一个多大的N？——我在做测试集的时候就有这一困惑，有的新闻实在提取不出10个关键词，有的似乎还不止这个数目。

基于此，我想对这种方法作一些调整。通过调整相关参数，最终的目的是要在召回率和准确率之间获得一个比较好的结果。

一方面，手工提取关键词的过程中，可以自由选择关键词的数量。就是说，我们只是把这篇文章的所有关键词提取出来，具体提取多少个并不限定。不同的人提取的结果可能会有出入，包括哪些是关键词，有多少个词可以作为关键词。这之间的分歧可以一起讨论，这也是测试集的完善过程。

另一方面，应该适度的调整自动生成关键词的数量。既然是候选关键词，那么适度的放大候选的范围还是可以接受的。通过调节自动关键词的数量，可以确定，在当前算法下，究竟应该提供多少个候选关键词才是最合适的。这里面存在着一个问题，什么才是最合适的，召回率和准确率扮演着多大的权重。

最后，一并感谢所有icaer的帮助。

分享到：

AI顶级会议列表 | 需求文档标准－IEEE/ANSI 830-1998

2009-05-05 11:35
浏览 4134
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

基于精确率和召回率的GBDT调参指南: 只考虑Accuracy和AUC的调参方式是错误的；尤其是在不均衡样本时候，必须考虑精确率和召回率，本文采用基于遗传算法思想的调参方式，大概率来获得全局最优解

Caffe-ssd输出准确率和召回率: Caffe-SSD的solver.cpp修改后的源码，可输出准确率、召回率和PR曲线值

图像分割度量标准--matlab代码: F1分数是准确率和召回率的调和平均数，其公式为2 * (Precision * Recall) / (Precision + Recall)，它同时考虑了准确率和召回率，提供了一个均衡的评估标准。 MATLAB代码实现这些度量标准时，通常会涉及以下步骤： ...

Matlab分类准确率代码: 除了准确率，还有其他一些评价分类模型性能的指标，如精确率(Precision)、召回率(Recall)、F1分数(F1-Score)和查准率(Precision)查全率(Recall)的调和平均数等。在某些场景下，这些指标比准确率更能反映模型的表现，...

机器学习在提升性能测试准确性和召回率的应用和思考—杨硕1: 该文章讨论了性能测试的准确性和召回率问题，并探索了机器学习技术在解决这些问题中的应用和思考。性能测试准确性和召回率问题性能测试的准确性和召回率是衡量测试结果的两个重要指标。准确性是指测试结果与真实...

基于烟花算法FWA的SVM参数优化及性能评估：准确率、精准率、召回率与特异率综合分析-附详细代码注释与混淆矩阵解读,基于烟花算法FWA的SVM超参数寻优研究：误差指标与混淆矩阵的详细分析与代码注释: 在本文中，研究者通过采用烟花算法FWA对SVM的惩罚系数和核函数参数进行寻优，综合分析了准确率、精准率、召回率和特异率等误差指标，以及提供了混淆矩阵以评价模型性能。准确率描述了模型正确预测的比例，而精准率...

改进的用户协同过滤推荐算法的对比与实现（55页23171字数）.doc: 推荐效果的评估指标包括召回率、准确率、覆盖率和流行度，这些指标综合反映了推荐的全面性和准确性。【未来展望】尽管本文着重于推荐算法的理论研究，但其改进的算法需要进一步实现在标准数据集和真实电商数据上...

Python计算准确率的KNN算法.zip: 在这种情况下，其他性能指标如精确率、召回率和F1分数等，可能更能够反映模型的分类性能。本次分享的代码片段虽然是一个简化的KNN实现，但它涵盖了KNN算法的核心思想，并且为我们提供了实现自定义KNN分类器的基础...

Python-神策杯2018高校算法大师赛中文关键词提取第二名代码方案: 评估指标可能包括精确率、召回率、F1分数，以及可能的业务需求定制的评估标准。 6. **项目结构与版本控制**：Keyword_Extraction-master这个文件夹名暗示了项目采用的是模块化结构，便于管理和维护。同时，很可能...

三、基于YOLOv5的无人机视角检测系统 1.带标签数据集，visdrone公开数据集，包含人，车辆共计十个类别 2.含模型训练权重和可视化指标，包括混淆矩阵，F1，准确率，召回率，mAP，损失曲: 2.含模型训练权重和可视化指标，包括混淆矩阵，F1，准确率，召回率，mAP，损失曲线等。 3.pyqt5设计的界面，包括登录界面，注册界面和运行主界面。 4.提供详细的环境部署说明和算法原理介绍。 ,基于YOLOv5的...

图形识别算法性能评价的一般性规则: "dagstuhl_pe.rtf"文件可能是会议或研讨会的报告，其中可能包含了与图形识别算法性能评价相关的讨论和观点。总的来说，图形识别算法性能评价的研究旨在提供一种科学的、全面的方法，帮助开发者和研究人员了解算法...

K-modes聚类算法: - Ex_evaluation.m：包含聚类评价指标的计算，如F1-measures、准确率和纯度。 - purity.m、accuracy.m：分别计算聚类纯度和准确率的函数。 - main.m：主程序，可能包含了数据加载、聚类算法执行、结果评估等流程。 -...

模型算法综合评价方法文档含代码: 这可能表明文档中将介绍评价算法时需要用到的一些算法，包括但不限于机器学习算法评价指标（准确率、召回率、F1分数等），以及可能涉及到的统计学和数学算法。 4. 标签“范文/模板/素材”表明这份文档可以作为一个...

关键词提取TF-IDF算法综述: TF-IDF因其简单性和高准确率、召回率而受到研究人员和应用领域的青睐。文章还回顾了IDF概念的提出历史，指出IDF概念最早是由文献[1]提出的，其核心思想是通过考察一个特征项在文档集合中的分布来为其赋予权重。其...

数学建模模型算法综合评价方法: 而对于分类模型，比如支持向量机或决策树，我们可以使用混淆矩阵、精确度、召回率、F1分数和ROC曲线等指标来进行评价。除了上述的统计指标外，算法的效率和鲁棒性也是评价的重要方面。效率通常指的是算法的计算...

基于冠豪猪CPO优化核极限学习机KELM分类算法的深度研究：包含迭代优化与评价指标分析,基于冠豪猪CPO与KELM融合优化的分类算法及多维度效果分析报告,基于冠豪猪CPO优化核极限学习机KELM的分类: 包含有分类效果图，迭代优化图，混淆矩阵图以及准确率、精确率、召回率、调和平均数等各项评价指标。注释详细替数据就可以用。 ,基于冠豪猪CPO;KELM分类;优化算法;迭代优化图;分类效果图;混淆矩阵图;评价指标...

语义分割评价指标代码实现-Python: 应用python代码语义分割评价指标总结及代码实现包含'准确率'、'精确率'、'召回率'、'F1值'、'Iou值'

基于SVM支持向量机的乳腺癌识别算法的MATLAB仿真,SVM使用libsvm工具箱,包含数据库,含仿真操作录像: 使用混淆矩阵评价性能，输出识别率,召回率以及F1 %数据输入 svm_models = svmtrain(Ttrain,Ptrain,cmd); [y,error1] = svmpredict(Ttest,Ptest,svm_models); [A,~]= confusionmat(Ttest,y); 4.注意事项：注意...

acc.m.zip_ACC图像分割_F1-score_Score!_acc.m_图像召回率: 综上所述，这个压缩包包含了一个MATLAB脚本，用于执行图像分割并计算相关的性能指标，特别是F1-score和召回率。这些指标对于评估和优化图像分割算法至关重要，可以帮助研究人员理解算法在检测和分类图像区域方面的...

关于商品推荐推荐算法: 竞赛的评估标准是通过计算预测的（用户数-品牌数）对的准确率和召回率来得到算法成绩F1-SCORE。准确率是指预测正确的用户-品牌对在所有预测中的比例，召回率是指预测正确的用户-品牌对在实际所有购买品牌对中的比例...

Global site tag (gtag.js) - Google Analytics