头条班第四节课课程学习笔记
头条班学习的第四讲由塔娜老师带来的《新媒体运营实务》系列课程——算法分发原理解读。分为上下两讲。
其中上讲有四点:系统概览、用户建模和分析、内容建模和分析、推荐算法。
从用户和内容的关系来看,内容是决定算法的,而用户可以根据数据进行反馈优化算法,内容的多样性分发主要体现在文本编辑,推荐系统本质上解决的主要内容是用户、环境、内容,根据各自的不同特点推荐系统可以由此进行精准推荐。
对于用户建模方面,可以根据用户画像的特点对用户进行标签化,可以对用户进行精准营销、用户统计、数据挖掘、效果评估、服务的私人定制的服务,而用户画像的构建流程分为三个步骤:基础数据收集、行为建模、构建画像,对各种标签的总结,算法分发会更加高效,如果对标签进行体系总结,又可分为兴趣不同特征,身份不同特征和行为的不同特征可以进行权重分析,对分发起到作用。
在新用户画像的建模上,可以通过微博或微信获取更多信息,当然用户的环境特征、手机类别也是其中的因素。在设置标签的过程也有不同策略,如过滤噪声、惩罚热点、时间时间衰减、惩罚展现,主要是通过用户对内容的动作特征进行分析或降权,达到提高标签准确性的效果。
在下讲中,老师进行文本的内容分析,可以通过文本的不同特征进行信息的挖掘和检索,通过统计分词和词频的统计,和将文本的词语结构化成可处理的形式,对文章进行分成若干个词向量,计算各种词向量的相似度,对用户建模提供信息。其中文本分析在推荐系统中可以有助于用户兴趣建模、优化内容组织、帮助内容推荐,而文本的特征可以从类别和关键词、话题等方面进行分析,而推荐系统可以根据文本特征的语义标签、隐式语义、文本相似度、时空特征、质量相关特征,进行统计。
在推荐系统中有不同的推荐法,协同过滤算法中有基于用户兴趣相似度的推荐,将兴趣大致相同的用户进行协同分析,进行类似推荐,还有物品的被喜爱相似度进行分析,将用户归类推荐。两种协同分析方法都有各自的优势和弊端,只有将二者融合使用,才能有可观的效果。
在基于用户兴趣的标签,可以通通典型召唤策略进行兴趣标签的结合,将取回的内容进行优化。
可以总结出,推荐算法的进行是根据文本内容和用户的标签进行数据总和分析,将二者结合,提供更好的算法推荐。