如何利用自然语言处理构建基于内容的电影推荐系统?

新农商网 全部 1011

如何利用自然语言处理构建基于内容的电影推荐系统?

回复

共1条回复 我来回复
  • 算法小智
    算法小智
    这个人很懒,什么都没有留下~
    评论

    你好楼主,我刚好做过这个系统。严格来说,这个系统比较复杂,所涉及领域比较多。流程上来看,要有可以持续运行的实时爬虫爬取足够新的内容,这样这个系统才具备可实用性。有了内容以后,要把内容交给自然语言处理pipeline去进行预处理。1. 分词经过爬虫对内容进行分词,这个分词需要事先经过电影语料训练,能够针对电影名,演员名等做优化。2. 实体识别

    电影内容需要做实体的识别,例如,电影名,经典台词,角色名,演员名的识别都很重要。

    3.降噪电影内容上有很多噪音,例如语气词,违禁词,停用词或者无意义符号,要对文本做预处理。4. 关键内容识别基于内容的推荐,需要我们事先给内容打上合理和比较贴合的标签。这一步需要利用前两个的信息特征做文本的生成,改写或者语义搜索等。产生的标签打在电影文档上。5. 电影内容分类我们需要对电影有一个准确分类,来降低推荐难度和文本处理的难度,这一步其实比较容易,大多数电影都是有准确类目的定位的。对于没有分类的电影,我们可以基于NLP搭建一个分类器,让我们的程序自动对内容进行分类。6. 关于推进在内容推荐算法中,我们可以用的信息有很多,1.基于标签的内容推荐,上面提到给电影打上多标签,此时我们在推荐过程中就可以简单的基于该标签推荐语义接近的作品了。2.基于电影类目的推荐,这一种推荐方式也不难,根据类目下共同的电影再结合标签距离来推荐也容易实现。7. 评论倾向性等除了上面的方法,我们还可以做一个情感分析器,通过对挖掘的电影评论给电影打正负面评分,或者精彩评分。然后结合标签,类目,推荐来进一步提高推荐精度和用户体验。

    2019-10-01 14:44:46 0条评论