狗狗训练
关键词挖掘:如何通过阿里巴巴国际站数据去挖掘用户搜索关键词背后的意图? 关键词挖掘爱站网
编辑:sqxzgg时间:2021-11-21来源:人人爱宠物网

关键词挖掘:如何通过阿里巴巴国际站数据去挖掘用户搜索关键词背后的意图? 关键词挖掘爱站网

有点没看懂题目关键词挖掘,这里我就把大概的几个数据所代表的意图列一下吧,以下情况不考虑产品优化问题,仅从关键词的角度考虑:

关键词挖掘:如何通过阿里巴巴国际站数据去挖掘用户搜索关键词背后的意图? 关键词挖掘爱站网

1 曝光率高关键词挖掘,点击率低:关键词与产品不符;根据行业经验和同行选品更改产品选择,

2 点击率高关键词挖掘,反馈率低:用户不已购买为目的,是在参考或是找资料;这样的词内容类要多放一些相关推荐产品,多放几个CTA,尽量引起客户联系。

3 数据区域性明显关键词挖掘:代表这个关键词是某个特定区域的产品词;应增加关键词数量

其他具体情况可与我谈论,5年运营经验老电商关键词挖掘。

速卖通,长尾关键词查找途径?

直通车中的长尾词的定义:一般有3个以上属性词组成的词组,会被称为长尾词,特点搜索流量小,但是比较精准。可以理解为“男性红色速干短袖”这种属于长尾

分享一些我司操作途径

1. 通过速卖通后台 数据纵横->搜索词分析,找关键词,这里发掘热门关键词比较强大,但是要发掘长尾关键词就比较少了;

2. 用热门的关键词放在速卖通的搜索框里,然后下拉框自动就会出现长尾词了;

3. 通过关键词组合工具,即想3个词,然后通过A B C排列组合方式,产生关键词;

4. 搜索框 依次输入法。如果你还是有疑虑,可以私聊把你店铺的具体信息告诉我,我们私下交流。

————裹媒跨境 速卖通官方代运营服务商

文本挖掘的方法主要有哪些?

常见的文本挖掘和应用包括文本聚类、文本分类、非结构化信息提取、文本纠错、相关文本推荐、文档相似度判别、情感分析等。

文本聚类

文本聚类就是要找到一堆文档中,哪些文档具有较高的相似性,然后可以针对这些相似性文档的聚合进行类别划分。

文本聚类应用场景:提供大规模文档集进行类别划分并提取公共内容的概括和总览;找到潜在的各个文档间的相似度以进行相似度判别、类别修正,以减少浏览相似文档和信息的时间和精力。

文本聚类常用方法:层次聚类法、平面划分法、简单贝叶斯聚类法、分级聚类法、基于概念的文本聚类、混合模型聚类、光谱聚类、潜在语义标引聚类(LSI)等。

文本分类

文本分类也是将文本划分为不同的类别,与文本聚类的区别在于文本聚类没有Label可用于训练,因此它是一种非监督式的学习;而文本分类有特定的Label可供学习和训练,这是一种监督式的学习方法。从实际应用角度,聚类提供的是在没有任何经验或先前知识的前提下,对大规模文本进行类别自动划分;分类提供的是基于已有的训练模式和Label属性,预测其类别所属。

文本分类应用场景:信息的类别划分,例如将网页的资讯自动划分为影视、音乐、健康、财经、汽车、政治等类别,将根据邮件内容进行垃圾邮件过滤,针对论坛、博客等社会化媒体中恶意帖子的识别和过滤等。

文本分类常用方法:朴素贝叶斯、矩阵变换法、K-近邻、支持向量机、神经网络等。

非结构化信息抽取

非结构化信息抽取指的是从文本提取特定非结构化信息,包括摘要、关键字等。非结构化信息抽取能生成简短的关于文档内容的指示性信息,将文档的主要内容或核心关键字呈现给用户,以决定是否要阅读文档的原文,这样能够节省大量的浏览时间并提高信息关键信息的展示能力。

非结构化信息抽取应用场景:帖子、新闻、资讯、评论、问答等。

非结构化信息抽取常用方法:通过词频统计获得文本的主要关键字,而摘要提取方法包括自动摘录、基于理解的自动文摘、信息抽取和基于结构的自动文摘等。

文本纠错

文本纠错能够实现对文本的自动纠错功能,这是一种辅助输入的功能。文本纠错包含字词级别的短文本纠错、语法搭配纠错和长句子的语义纠错,目前主要的文本纠错侧重于短文本纠错。

文本纠错应用场景:文本编辑器纠错、搜索引擎输入内容纠错、输入法的输入纠错、书籍和稿件校正等。

文本纠错常用方法:基于机器学习算法的纠错算法是较为广泛且精确的自动纠错方法,包括SVM、贝叶斯、神经网络、逻辑回归、决策树等,除此之外也有通过特定模式和规则的泛化匹配、N-gram模型判断文本中的错误字词。

相关文本推荐

用户在某些文本之间可能存在频繁的关联查阅关系,而这些关键之间会蕴藏用户的潜在意图,这可以通过相关文本推荐来实现。例如,当用户在搜索引擎搜索“热度分析”一词时,相关的搜索词可能包括: 空间热度分析、关键词热度分析、音频热度分析、热词分析、关键词热度分析十法、关键词热度分析是指、网络游戏热度排行榜等。

相关文本推荐应用场景:新闻资讯推荐、博文帖子推荐、活动推荐、搜索内容推荐等。

相关文本推荐常用方法:Apriori、FP-growth等关联模型。

文档相似度判别

文档相似度是对不同文档间相似程度的判别,某些场景下应用非常广泛,尤其在文档、著作、报告、论文等科学研究和理论著作的原创性知识领域较为广泛,因此文档相似度识别是一个常用的场景。

文本相似度判别常用方法:余弦计算、隐形语义引标、基于语义相似度的文本相似度算法、基于拼音相似度的汉语模糊搜索算法、最长公共子序列、最小编辑距离算法等。

情感分析

情感分析是对情感倾向的分析,是用于分析特定对象对相关属性的观点、态度、情绪、立场以及其他主观感情的技术,通常分析的情感结果会属于正向,中性或负向。

情感分析应用场景:主要应用于竞争情报、舆情监测、客户正负向、话题监督、口碑分析等。

情感分析常用方法:除了非负矩阵分解、基于遗传算法的情感分析之外,使用的最多的还是监督学习算法,例如朴素贝叶斯、K近邻、最大熵和支持向量机等。

其他应用

除此以外,文本分析还广泛应用于简繁转换、自动注音、语音识别后处理、自动校对、机器翻译、基于句子的汉字键盘输入、用户兴趣模式识别等。