您的位置: 首页 >资讯 >

分析Goodreads上的书籍阅读行为以预测亚马逊畅销书

2019-06-10 16:07:02 编辑: 来源:
导读 西北大学,微软印度研究院和印度理工学院Kharagpur的研究人员最近开发了一个模型,用于预测一本书在出版后的15天内是否会成为亚马逊的畅销

西北大学,微软印度研究院和印度理工学院Kharagpur的研究人员最近开发了一个模型,用于预测一本书在出版后的15天内是否会成为亚马逊的畅销书。他们的模型在arXiv预先发表的一项研究中概述,通过分析在线平台Goodreads上的阅读行为来实现。

“我们一直致力于分析各种社交媒体实体的流行动态,例如Twitter中的主题标签,Quora中的主题等。” 进行这项研究的研究人员之一Animesh Mukherjee告诉TechXplore。“我们认为可以采用类似的方法来分析书籍的受欢迎程度,我们发现Goodreads非常适合这项调查。”

书籍的受欢迎程度取决于多种因素,可以使用多个参数进行衡量。在他们的研究中,研究人员专注于书籍阅读特征如何影响其受欢迎程度。他们对Goodreads实体进行了跨平台分析,并试图将这些与亚马逊书籍的销售量联系起来。

“我们遵循直觉,书籍的受欢迎程度主要是由读者驱动,因此提取书籍阅读行为的动机,以了解书籍的未来普及,”慕克吉说。“量化图书受欢迎程度的最佳方法之一是查看其销售记录。因此,我们试图根据亚马逊畅销书量化受欢迎程度的概念。”

首先,研究人员分析了Goodreads上用户的集体阅读行为。然后,他们量化了Goodreads实体的不同特征,这些特征可用于识别亚马逊畅销书和其他畅销书籍之间的差异。最后,他们开发了一种基于机器学习的模型,该模型使用这些特征来预测一本书在出版后15天是否会成为畅销书。

“我们使用最先进的机器学习模型来执行我们的预测,”Mukherjee解释说。“我们观察到,一本关于Goodreads的书所收到的评级和评论在预测畅销书方面并不像用户的阅读状态那样有效。例如,在Goodreads中,读者可以发布该书的阅读量,他/她所在的页面,可以评论该书等。我们发现这些功能非常有效地预测该书是否将成为未来的畅销书。“

他们的模型在预测出版后几周成为亚马逊畅销书的书籍时,平均准确率达到了88.72%。他们的方法基于来自用户帖子和类型相关属性的特征,与仅使用传统受欢迎因素(如书籍评级或评论)的基线方法相比,获得了16.4%的改进。

“我们从这项研究中获得的最重要的见解之一是,亚马逊畅销书可能不一定符合读者的高质量评论文本或大量评级,”Mukherjee说。“相比之下,他们中的绝大多数都有读者状态的帖子模式,这些模式强烈地将他们与其他书籍区分开来。”

研究人员还评估了他们的方法如何能够预测另外两种类型的书籍:获得大量评论但不是畅销书(HRHR)的高评价书籍,以及不是畅销书的Goodreads Choice Award提名(GCAN)书籍。他们的GCAN平均准确率高达87.1%,HRHR书籍的平均准确率高达86.22%。

“我们相信这项工作是对当前文献的重要贡献,因为它不仅通过严格的测量研究展现了社交书籍阅读平台的集体阅读行为,而且在两个正交渠道之间建立了强有力的联系--Goodreads和Amazon, “慕克吉说。

由Mukherjee及其同事开发的模型可以促进通过新的跨平台策略设计桥接亚马逊和Goodreads的工具的开发。他们认为这种互动可能是亚马逊在2013年3月收购Goodreads背后的原因之一。研究人员现在正在寻求通过进一步分析用户的阅读行为来扩展他们的研究。

“我们计划在未来探索几个方向,”慕克吉说。“一个是考察不同类型的普及书籍,比如,什么是跨越不同流派的状态后图案的书?另一个是学习风格与读者人口统计学的相互动态。例如,如何做阅读的行为男性与女性不同,或者它们在各大洲的差异如何?“


免责声明:本文由用户上传,如有侵权请联系删除!

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。