原文信息:
Hsu, David H. and Tambe, Prasanna, Startup Labor Markets and Remote Work: Evidence from Job Applications (July 27, 2021).
Available at SSRN:
https://ssrn.com/abstract=3894404 or http://dx.doi.org/10.2139/ssrn.3894404
01
背景介绍
远程工作(working-from-home,简称WFH)并不是新冠疫情以后才有的新现象。2010年美国人口普查报告称,大约10%的美国劳动力,每周至少有一天从事远程工作,约5%的劳动力专门从事远程工作。在2020-2021年期间,由于新冠疫情造成的社会隔离,许多企业不得不将原来的现场工作改为远程工作,导致全世界有更大比例的人参加了远程工作。而在远程工作的安排上,不同公司的处理方法不同。Twitter和Slack等公司宣布全体员工直接远程工作,无需到班。Netflix、WeWork和摩根大通等公司希望员工在接种疫苗后尽快回到办公室。Facebook和谷歌等公司,则采取了混合方式,允许部分员工远程工作,灵活地将远程工作与现场工作结合起来。
提供远程工作是否能让初创公司吸引更多有经验和多样化的人才?对于初创企业,特别是科技公司,采取怎样的远程工作策略对他们有利?当雇主将一份工作指定为“远程工作”时,他们是否会吸引到更有经验、更多样化(性别和种族)的人才?这是本文关注的核心问题。
数据
02
本文的数据来自Angel List Talent,这是一家初创企业劳动力匹配平台。初创公司可以在其中发布职位需求,信息包括远程工作职位以及所需的技能。求职者可以在平台上,上传个人资料,搜索感兴趣的工作。AngelList Talent上的大部分职位都是针对技术或技术相关职位的职位,如机器学习工程师、数据科学家或产品经理,以及相关的管理和销售/营销职位。
在AngelList Talent平台上发布招聘信息的约62000家机构中,约63%的机构员工人数少于501人,19%的机构员工人数超过50人但少于201人。其余37%的组织样本的员工人数超过500人,其中大部分(近22%)公司员工人数在1000人到5001人之间。值得注意的是,自2011年以来,旧金山、纽约和伦敦这三个城市的招聘信息占AngelList Talent平台总招聘信息的一半以上。这可能是因为,风险资本支持的初创企业活动地主要集中在这几个城市,而且AngelList总部位于旧金山,无形中带来了区位的倾向性,但这对本文结果的科学性影响较小。
AngelList Talent 数据涵盖了该平台自2011年成立以来的所有发布的职位,由于作者对该网站的访问时间为2020年2月5日至6月18日,因此作者使用这个时间窗口进行分析,并使用疫情前发布的职位来“训练”预测模型。
作者首先进行了描述性分析,发现:规模较小、融资周期较早的公司是平台上招聘最积极的公司,它们也是发布远程工作职位比例最高的公司(图1)。
注:左图横坐标为公司雇员规模。右图横坐标为公司融资周期。红色为远程工作发布数量。蓝色为现场工作发布数量。
而从数据的描述性统计表(表1)中可以发现:现场工作岗位和远程工作岗位之间的差异,随着公司员工人数和融资轮数的增加而增加。
当观察远程工作在疫情发生前后的变化(图2),作者发现:疫情造成企业无法现场办公前后,远程工作比例有明显的提高。在疫情出现之前,远程工作占所有工作职位申请的比例基本持平且稳定,约为50%。疫情发生后,远程工作的比例随着时间而不断攀升,并在观察窗口结束时达到约90%。
注:此图表说明了远程工作申请在所有工作申请比例的变化。x轴表示自2020年3月13日因COVID-19企业取消线下办公以来的周数。y 轴是远程工作申请占所有职位申请的比例。
以上分析都说明,疫情事件窗口前后,初创公司(规模较小、融资周期较早的公司)的远程工作比例存在较大的变化。因此,关注远程工作对于初创公司的影响具有现实的指导意义。
03
结果
为了检验提供远程工作是否能让初创公司吸引更多经验丰富的多元化人才。首先,作者利用OLS方法,检验了疫情发生前,申请人特征与职位的相关性,结果如表3所示。在每个分类中,作者都加入了星期、职位名称、位置和周的固定效应。作者主要区分了四种申请人特征,分别是申请者人数、申请者经验、女性申请者数量和非洲裔申请者数量,我们看到远程工作与所有申请人特征呈正相关,并且高度显著。
由于远程工作可能受公司和职位本身特征的影响,因此必须使用准实验方法把应聘者特征、公司特征和职业本身特征联系起来。为了解决这一问题,作者基于疫情发生前的数据,将工作分为远程工作和现场工作,使用随机森林算法,将疫情前的70%的工作样本作为训练集,识别出那些原本是现场,而因疫情被迫改为远程的工作。该模型的训练精度为96.3%,训练样本时,65.4%的样本被归类为现场工作,30.9%的样本被归类为远程工作。
紧接着,作者使用疫情发生前,剩余的30%的样本测试模型的精度,发现随机森林算法的精度有所下降,大约9%的工作在被列为远程工作时被错误地归类为现场工作。最后,作者使用基于疫情前样本训练的预测模型,对2020年疫情发生后的工作进行预测,发现疫情发生后,有38.3%的现场工作被迫改为远程工作(表4)。
基于以上结果,作者对表3的结果进行重新回归,结果如表5所示。作者将工作样本分为四组:(1)预测疫情后为远程工作,实际也是远程工作。(2)预测疫情后为远程工作,实际上是现场工作。(3)预测疫情后是现场工作,实际上是现场工作。(4)预测疫情后是现场工作,实际上是远程工作。并将第四组作为处理组,即主要解释变量,其他组为控制组(第2组由于样本数量不足未列入回归),即控制变量。表5的结果表明,原来是现场工作,由于疫情被迫改为远程工作的职位,对申请者数量、申请者经验、女性申请者数量和非洲裔申请者数量都有显著的积极影响。相比于表格3,当一份工作符合第四组(预测疫情后是现场工作,实际上是远程工作)的特征时,会拥有更多的女性申请者和非洲裔申请者。表5的第二列表明,一份预测疫情后是远程且实际也是远程的工作,会要求申请者有更丰富的工作经验。
结论和启示
04
这篇文章主要是研究新冠疫情下,提供远程工作是否能让初创公司吸引更多经验丰富的多元化人才。对于这个问题,作者使用了Angel List Talent的数据集,该数据集涵盖了初创劳动力市场的双方信息,经过研究,作者发现,对于初创公司来说,提供符合条件的远程工作会吸引更多有经验和多样化的求职者。这篇论文有助于引导我们利用机器学习算法改进现有模型或测试以前的研究结果。例如,在研究工作场所距离与工作效率之间的关系时,以往的研究都存在一定的局限性。新冠肺炎为我们提供了一个特殊的工作场所场景来检验之前的研究成果。
推文作者
林泽腾,香港科技大学数据科学分析学域
转自:“香樟经济学术圈”微信公众号
如有侵权,请联系本站删除!