投稿问答最小化  关闭

万维书刊APP下载

【香樟推文3043】机器直接访问信息下的市场效率

2023/12/18 15:56:35  阅读:35 发布者:

原文信息:

Barbopoulos, Leonidas G. and Dai, Rui and Putnins, Talis J. and Saunders, Anthony, Market Efficiency When Machines Access Information (February 17, 2023). NYU Stern School of Business Forthcoming, Available at SSRN: https://ssrn.com/abstract=3783221

(曾用题目:Market efficiency in the age of machine learning)

01

引言

随着机器逐步替代人类,资本市场的信息效率是否因此改变?存在两种对立的可能性:一方面,机器处理的信息量更大,速度更快,能够减少人类认知偏差,强化价格发现功能,进而提高信息效率。另一方面,机器可能会丢失部分只有人类能够解释的“软信息”,从而减少价格中的信息含量。作者认为机器和人类在解释信息时各有优势,也都可能犯错,由此提出了一个实证问题:哪种效应占主导地位?这对理解机器如何影响金融市场功能和资源/风险分配具有 重要意义。

以往的研究主要关注机器自动化交易对价格发现的影响,本文则聚焦到颗粒度更细的信息获取场景,即云端机器访问和人类访问,探究两种信息获取渠道及随后的交易行为如何影响价格对信息发布的反应效率。本文利用一个独特的数据集对此展开研究。具体而言,作者获取了美国证券交易委员会(SEC)系统的服务器日志文件,该文件记录了8-K文件的访问者情况。8-K文件是美国上市公司必须向美国证券交易委员会提交的报告,用于披露公司重大事项,如重大协议的变更、财务信息、并购活动以及被认为对股东重要的其他事件。通过分辨访问者下载8-K文件的行为差异可以识别出其为机器或者人类,进一步地通过IP地址追踪可以对访问者的计算设备等级进行分类。

研究表明机器和人类行为存在如下异同:(1)无论是机器还是人类都更关注及时且复杂的信息。(2)人类更关注大公司和价值型公司,这与人类认知能力有限导致的注意力分配行为相一致。(3)机器对市场不同细分领域的各种类型信息的访问频率基本一致,没有表现出对公司类型的明显偏好,这与其更强的信息处理能力一致。(4)在周五,人类访问8-K的次数显著减少,而机器的访问量则不受影响,这与现有研究指出人类在周五注意力有限的发现一致。

文章使用8-K文件发布后10天和20天内绝对价格漂移(或逆转)的幅度(PI,该值越小则价格效率更高)衡量价格效率,研究发现云端机器访问的增加显著提高价格信息效率,而人类访问的增加则会增加PI。为了识别其中的因果关系,文章运用工具变量法和双重差分法进行检验。其中,(1)使用云服务中断的外生事件作为机器访问的工具变量,(2)将投资者情绪和宏观经济新闻用作人类访问的工具变量,(3)将公司纳入标准普尔500指数作为一种准自然实验。所有识别策略的结果都支持云计算机器访问提高信息效率的观点。同时,作者也发现,在处理重复信息和软信息方面人类更具优势。

02

数据和主要变量

文章以20031月至201612月间美国CRSPCompustat数据库中的公司作为研究样本。8-K文件的访问数据来自于美国证券交易委员会的EDGAR服务器,包含近40亿条访问数据。每条数据提供部分匿名化的IP地址、时间戳、HTTP状态代码(例如,200代表成功传送)和爬虫标记等信息。同时,作者从WRDS SEC Analytics Suite中获取了大约120万份8-K文件。在IP地址匹配方面,文章使用MaxMind的数据集,通过IP地址中的前三个八位字节,将IP地址与所属组织进行匹配,并将匹配上的组织分为“机构投资者”、“审计和律师事务所”、“云计算服务”、“媒体和数据供应商”、“教育和监管机构”、“互联网服务提供商”和“其他”。

文章通过两种方式区分机器访问者和人类访问者:(1)参照Drake et al.2015)的做法,将每分钟下载量超过5次的IP地址或每天下载量超过1000次的IP 地址的访问定义为机器访问;(2)根据Dechow et al.2015)的做法,将每分钟下载次数超过25次、或每分钟下载CIK次数超过3次、或一天内下载次数超过500次的IP地址的访问量定义为机器访问。

文章构建价格信息效率变量(PI)的方法如下所示。首先计算8-K文件中事件披露(作者仅保留事件发生日和8-K文件披露日相同的样本)后0-T天的累计异常收益率(CAR:

然后取0-T天的累计异常收益率和更短窗口期(0,1)累计异常收益率的差值的绝对值:

最后进行标准化处理:

出于稳健性考虑,文章还使用了另一种衡量价格信息效率的方法:Brogaard et al.2022)的噪声回报方差。主要变量的描述性统计如表1所示。

03

机器和人类访问哪些信息

1刻画了机器和人类访问8-K文件次数的时间变化趋势。自2007年以来,8-K文件的机器访问次数快速增长,相较之下人类的访问量一直保持在相对较低的水平。

2检验了机器和人类访问行为受哪些因素驱动。其中被解释变量是事件披露后8-K文件的访问量,左侧DLR部分是按Drake et al.2015)的方法做机器和人类的区分,右侧DRT则使用了Dechow et al.2015)的方法。结果表明,在文本特征层面,消极情绪内容(FinNeg)、文件字数(#Words)越多、条目数量(#Items)越多,访问量越高。其中消极情绪内容(FinNeg)更多作用于人类访问者。事件发生时间与8-K公告时间的间隔(Gap)越长,访问量越低。在公司层面,人类访问者更关注企业规模(SIZE)和市值账面比(BM)更大、机构投资者持股比例(InstOwn)较低的公司。

04

机器访问信息对市场效率的影响

文章构建如下模型检验机器访问信息和人类访问信息对市场效率的影响

其中,PI衡量信息效率(值越大,效率越低),V为机器或人类的访问量,控制变量详见文章附录表A,模型还控制了企业固定效应和年度固定效应。

机器访问不一定都来自于投资者,作者基于现有文献和数据特征分析认为IP地址追溯为“云计算服务商”的机器访问最有可能与具有前瞻性、将机器算法引入投资策略的投资者相关。因此,后续的分析会重点关注云服务IP的机器访问。回归结果如表5所示,人类访问量的提高会增加PI,降低价格信息效率;CloudMachine的系数则在1%的统计水平上显著为负,提高信息效率。在更换信息效率的衡量方法后结果依然稳健,见文中表5

05

内生性问题的解决

(一)  云服务中断的外源性冲击

云服务意外中断无疑会降低基于云的机器访问,作者选择了最有可能影响自动化交易投资者的几大主要云服务供应商(如亚马逊网络服务)的云服务中断事件。文章使用两阶段最小二乘法进行检验,回归结果如表7所示。列(1-3)为第一阶段回归结果,可知云服务中断显著降低了机器访问的数量,而对人类访问无影响。仅列(2)的F值为13.157,通过了弱工具变量检验。第二阶段回归结果中列(5)显示,基于云的机器访问能够提高价格反应的效率。

(二)  公司被纳入S&P500的影响

作者进一步将公司被纳入S&P500视为准自然实验(虚拟变量InIndex,企业被纳入S&P5001,否则取0),运用双重差分法加以分析。由于人类的注意力有限,投资者会选择性地分配注意力,现有研究表明股票被纳入标准普尔500指数会吸引投资者的注意力。机器不受此限制,因此预期该事件不对机器访问的作用产生影响。回归结果如表8所示,列(3)和列(6)中,交互项Human×InIndex的系数显著为负,表明股票被纳入标准普尔500指数后人类访问量的提高更有可能提高价格信息效率。与此相反,机器访问的作用不受事件的影响。

(三)  其他工具变量

文章同时使用投资者情绪(Baker and Wurgler, 2006)和宏观经济新闻公告(Peng and Xiong, 2006; Kacperczyk et al, 2016)作为人类访问的工具变量,结果依然稳健。详见附录F.

06

机制分析

本部分进一步回答机器访问如何提高价格的信息效率。一种可能机制是,机器获取信息后对信息进行处理并纳入其投资/交易决策中,推动了机器交易,而交易会使信息更及时更准确地反映到价格当中。如果该推测正确,那么可以预期机器访问会增加知情交易。进一步地,文章也检验了机器访问信息的作用是否完全基于高频交易。

(一)机器访问是否增加知情交易

知情交易概率(Probability of Informed TradingPIN)被广泛用于衡量金融市场中的时变信息不对称,篇幅所限,不再赘述。回归结果如表9所示,机器访问显著增加了知情交易。

(二)高频交易的影响

以往研究表明高频交易(一种基于机器算法的自动化交易)能够增强日内价格发现功能(Carrion, 2013; Brogaard et al, 2014)。本部分进一步探究机器访问信息所产生的影响是否由高频交易(HFT)驱动,或是一种独立的信息作用渠道。为此作者将两个常见的高频交易变量加入控制变量,撤销-交易比率(Cancel-to-Trade ratio)和交易-订单比率(Trade-to-Order ratio),后者是高频交易的反向指标。其基本逻辑在于高频交易者倾向于每笔交易提交更多订单和取消订单,因其在限价订单簿中动态管理订单方面具有速度优势。回归结果如表10所示,在控制知情交易后,基于云的机器访问仍对价格信息效率产生正向影响。

07

比较优势分析

本部分作者对根据8-K文件的内容对信息进行了分类,包括(1)按机器可读性,如数字占比等,将信息划分为软信息和硬信息;(2)负面情绪内容;(3)增量信息和重复信息。结果表明,机器在处理硬信息和包含负面情绪的信息方面更具优势,而人类则能更好地利用重复信息。

08

结论

技术的进步正在迅速改变投资者获取和使用公司特定信息的方式。这篇文章通过独特的数据集,揭示了机器访问信息对股票价格信息效率的提升作用。为进一步理解智能技术在资本市场扮演的角色提供启发。

推文作者:廖江珊,对外经济贸易大学金融学院博士研究生

电子邮箱:13683266711@163.com

 Abstract

As machines replace humans in financial markets, how is informational efficiency impacted? We shed light on this issue using a unique dataset that allows us to separately identify when machines and humans access company information (8-K filings). We find that increased information access by cloud computing services significantly improves informational efficiency, reducing price drift (or reversal) and noise return variance following information events. We address identification through exogenous cloud outages, a quasi-natural experiment, and instrumental variables. We show that machines are better at handling numerical information, are less biased by negative sentiment, and are less capacity constrained. Conversely, humans can better handle sequential and soft information.

声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。

转自:“香樟经济学术圈”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com