投稿问答最小化  关闭

万维书刊APP下载

哪些因素影响你网课付费?在线课堂中的行为研究 | Mars论文解析

2022/5/19 8:37:01  阅读:262 发布者:

导语

在疫情反复和非结构化多媒体数据兴起的当今,网课受到消费者群体的青睐。据统计,数百万用户在mooc、可汗学院和YouTube等软件上通过教育视频进行学习;此外,新冠疫情影响了190多个国家的近16亿学习者,大大增加了视频教学的采用,在线视频消费也随之呈指数级增长。网络视频消费的快速增长为营销高管和研究人员分析消费者行为带来了新的机遇与思考:影响消费的在线视频的主要特征是什么? 平台如何使用可测量和自动化的方法来量化视频功能? 在线教学视频的特点如何预测客户行为?为解决上述挑战,本文作者提出了一种基于机器学习和计算机视觉技术的新型视频特征框架,帮助营销人员从基于内容的角度预测和理解在线视频的消费。

本文是针对Consumer Behavior in the Online  Classroom: Using Video Analytics  and Machine Learning to Understand the Consumption of Video Courseware. 的论文解析。该论文于202111月发表于Journal of Marketing Research上,作者包括Zhou M, Chen GH, Ferreira P, Smith MD

研究过程与发现

研究人员首先分析masterclass. com数据集上个人层面的消费情况(masterclass.com 是一个商业平台,消费者可以在该平台上购买设计、新闻和编剧等各个领域的专家预先录制的教学视频);其次,研究人员分析YouTube 频道上的速成课程的视频总消费(内容包括人工智能、哲学、统计学、世界史等多种学科),并使用跨学科的方法分析,整合了来自教育、传播和营销文献的概念,定义可能预测消费者行为的在线视频的可解释的基本特征,最后提出了一个基于预测的框架来分析不同视频特征对在线教育视频消费的影响。研究结果表明,该框架在预测个人层面的消费者行为发挥重要作用,如:观看者是否会观看完整视频,是否会观看视频合集中的下一个视频,以及通过点赞数等衡量指标来量化视频人气总和等。

研究人员提出的基于预测的视频特性框架具有以下四个关键贡献:

1.开发了一个新的可以解决分析非结构化数据时出现的挑战的视频特征框架

2. 利用masterclass.com的一个独特数据集,证明了研究人员提出的框架在预测个人层面的消费者行为方面的可行性和价值。

3. 利用另一个基于视频的在线学习平台crashcourse.com的独特数据集,论证了研究人员所提出的框架在预测在线教育视频总体流行度方面的可行性和价值。

4. 在制作有效的在线教育视频时,研究结果提供了关于哪些视频元素需要特别注意的可解释的见解。这些见解可以作为起点,为数字媒体产品实施个性化内容和个性化级别的建议。它们也可以作为指导人员和开发人员编写脚本和拍摄视频的起点。

视频特性框架

研究人员提出的基于预测的视频特性框架主要包含以下三个特征:基本的视频属性、教师的情感和身体特征及视觉审美特征:

1. 基本的视频属性

研究人员主要从视频的长度、演讲者的语速、视频的平均场景长度和视频情感分析四个方面分析视频的基本属性。视频长度指以分钟为单位的视频长度;Guo, KimRubin(2014)发现较短的视频往往更吸引人;且与传统的面授课程(通常所有的线下课程都有相同的长度)相比,在线课程往往表现出很大的差异:数据显示,即使在同一门在线课程中,每节课的长度也有显著的变化。

来源:Zhou M, Chen GH, Ferreira P, Smith MD. Consumer Behavior in the Online  Classroom: Using Video Analytics  and Machine Learning to Understand the Consumption of Video Courseware. Journal of Marketing Research. 2021;58(6):1079-1100. doi:10.1177/00222437211042013

语速是根据每分钟的口语数量计算的;GuoKimRubin(2014)发现,语速越快,用户参与度越高;

平均场景长度是指场景切换间隔的时间;视觉转换既可以增加观众的参与度,也可能制造干扰。Kim等人(2014)指出,突然的视频过渡可能无法给观众足够的时间来理解所呈现的内容。研究人员应用了一种名为PySceneDetect4的最先进的计算机视觉技术,使用智能场景切割检测算法来量化平均场景长度。使用一种图像相似性度量,计算两个相邻帧之间的像素差异,以量化视频中的视觉变化。

情感分析是通过对文本主体性的计算处理来分析人们的态度。该分析方法对于教育内容十分重要,因为它可以影响用户的看法和他们对材料的理解。研究人员使用基于规则的模型(HuttoGilbert 2014)来计算情感,以确定视频文件中每个句子的情感,该过程主要通过测量每个视频中字幕的极性分数实现。极性分数表示情绪范围从-110是中性(正面情绪分数为正,负面情绪分数为负)。下图显示了MasterClass数据集中每个视频的字幕的情感分布的箱线图。

2. 教师的情感和身体特征

有关教师情绪方面的文献表明,情绪可以影响学生的认知、动机和行为;而面部表情是情绪交流的主要方式,特定的面部表情(如微笑、皱眉)与不同种类的情绪(如快乐、愤怒)相关联,观众经常会对与情绪相关的瞬间面部变化做出反应。因此,教师的面部表情对学生的参与度有很大的影响。研究人员对视频中教师的情绪进行分类;对每一张脸进行情绪测量,得出视频中讲师的情绪分数。

同时,有研究表明,一些与教学质量无关的因素,如性别、年龄和教师的外貌可能会使学生对教学质量的评价产生偏见

3. 视觉审美特征

研究人员将视频的视觉审美特征分为运动特征和颜色特征两个维度:

· 视频的动态特征直接关系到观众对视频生动性的感知,研究人员通过捕捉和分析视频的动态特征发现:与动态视频相比,用户可能会觉得静态视频更无聊。

· 颜色被认为会影响观众的情绪唤起水平,研究人员捕捉可以影响观众的兴奋程度的色彩的三个维度——色相、饱和度(色度)和亮度(清晰度)并通过研究发现:暖色调(如黄色、红色)可以引发观众更高水平的兴奋;更饱和的图像,反映了更高的色彩强度(例如,更丰富的色彩),与观众的积极情绪相关;高亮度(清晰度)的图像受到观众的青睐,因为清晰度提高了视觉信息的传递。

来源:Zhou M, Chen GH, Ferreira P, Smith MD. Consumer Behavior in the Online  Classroom: Using Video Analytics  and Machine Learning to Understand the Consumption of Video Courseware. Journal of Marketing Research. 2021;58(6):1079-1100. doi:10.1177/00222437211042013

实证策略和结果

·机器学习模型和解释方法

本文采用梯度推进算法(gradient boosting machine(Friedman 2001)对数据进行分析。为解释机器学习模型呈现的结果,文章使用了特征置换法(feature permutation strategy)和SHAP (Shapley Additive explanations) framework两种方法实现机器学习模型的可解释性。

特征置换法,顾名思义,它指的是在保持其他数据不变的情况下,选择一个特征,并在数据集上对该特征的所有值进行随机排列,计算新的预测结果,比较这个结果与原始数据的结果的差异,差异越大,特征重要性越强。文中的计算方法如下图:

SHAP framework对每一个特征在不同特征组合下对模型预测结果的边际贡献进行计算并加总,得到该特征的总体边际贡献。边际贡献越大,说明特征重要性越强。具体的计算方法如下图:

来源:https://blog.csdn.net/u011984148/article/details/105803720

·类别层面特征

category-level feature

类别层面特征包括前文提及的视频分析框架的三大类别:基本视频属性、教师的情绪和身体特征及视觉审美特征。文章先将每一类别中所包含的特征组合起来,形成类别层面特征,采用了特征置换法分析类别层面特征的重要性,随机排列了与每个视频特征类别相关的所有特征,结果显示:

1. 消费者的平均过去视频观看完成率对于预测消费者是否完成当前视频和是否观看下一个视频非常重要。

2. 三个视频特征的特征重要性与消费者过去视频观看完成率差距不大,说明这三个视频特征在预测消费者的视频观看行为中发挥着重要作用,这显示了文章提出的视频分析框架在消费者观看视频行为方面的强大解释力。

此外,作者还进行了5倍交叉验证,测试了在添加不同特征时机器学习模型的预测准确性,结果显示在加入视频特征之后,机器学习模型的预测准确性最优,达到了92.15%

· 个体层面特征

individual-level feature

个体层面特征指的是前文提及的所有视频特征(包括视频长度、色调、教师不同的面部表情等)。文章分别计算了这些特征的Shapley value,并得到了如下结论:

· 对于视频观看完成率:

1. 消费者在过去的平均视频观看完成率与视频观看完成率存在显著的正相关关系

2. 视频长度越长,完成率越高

3. 教师情绪对因变量的影响可能取决于其他因素,如背景和主题

4. 教师的外貌特征对预测结果的影响不大(可能是由于同一系列的课程视频均是由一个教师负责)

· 对于是否观看下一个视频:

1. 消费者在过去的平均视频观看完成率越高,越有可能观看下一个视频

2. 章节越是往后,消费者越不可能继续往下观看

3. 语速越快,消费者观看下一个视频的可能性越低(认知负荷:语速快对消费者的认知带来了负担)

4. 更加激烈的情绪与观看下一个视频的可能性正相关

5. 亮度和清晰度较低的视频会降低消费者观看下一个视频的可能性

· 稳健性检验

数据样本:一个在YouTube上拥有1200万订阅的教育频道——Crash Course。从中选取了39个课程的总共1127个视频

因变量:视频的受欢迎程度(用视频的赞数/浏览量来衡量)。将此前运用于MasterClass的研究方法以及各种变量在这个新样本中再一次使用,达到了85%的预测准确度(precision = 0.84, recall = 0.88

结论与局限性

学术方面,本文基于教育、传播和营销文献中的概念开发了一个视频分析框架。该框架应用机器学习算法和计算机视觉技术,用自动化的方式提取在线教育视频的基本特征。此外,本文将机器学习算法与可解释性方法相结合,很好地展现了视频特征在机器学习预测模型中扮演的重要角色。除了教育和培训市场之外,文章中的分析框架还可以用于预测其他环境下的消费者行为,为视频的量化分析提供了一个现成的分析框架,对营销研究提供了极大的便利(视频营销、视频广告等)。

现实意义方面,为在线教育平台提供了重要的营销洞见,可以帮助营销经理通过提高视频亮度、清晰度、鼓励讲师语速放慢、展示更加激烈的情绪等方法提高消费者对在线课程的参与度。此外,视频分析框架还可以帮助视频制作者根据消费者的需求和行为开发定制化的课程内容,并更好地完善他们的个性化建议。例如,可以根据消费者完成视频的可能性优化针对他们的视频推荐。

当然,文章所进行的研究只是观察性的研究,无法反映视频特征与消费者行为之间的因果关系,也许未来可以通过实验设计对此进行改进。另外,因变量的选取可能存在问题(例如:上课摸鱼,虽然播放完了视频但其实没有在看),或许采用眼球追踪等技术可以更好地识别观看行为。

参考文献:

Zhou M, Chen GH, Ferreira P, Smith MD. Consumer Behavior in the Online  Classroom: Using Video Analytics  and Machine Learning to Understand the Consumption of Video Courseware. Journal of Marketing Research. 2021;58(6):1079-1100. doi:10.1177/00222437211042013

转自:Mars新视界

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com