迁移学习：有关苹果和梨的故事

2023/7/4 9:29:40　阅读：157　发布者：

文章来源：因果推断

迁移学习主要将某个域（domain）、研究（study）、环境（environments）或者人群（populations）中上学习到的知识或模式应用到不同但相关的问题中。从相关领域中迁移标注数据或者知识结构、完成或改进目标领域或任务的学习效果。例如，我们可能会发现学习识别苹果可能有助于识别梨，或者学习弹奏电子琴可能有助于学习钢琴。找到目标问题的相似性，迁移学习任务就是从相似性出发，将旧领域(domain)学习过的模型应用在新领域上。目前，迁移学习（Transfer Learning）主要用于计算机和因果推断领域。主要针对从一个人群或者任务中学习的模型如何迁移到新的目标人群或者场景中。

在计算机领域迁移学习(Transfer Learning)是一种机器学习方法，就是把为任务A开发的模型作为初始点，重新使用在为任务B开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务，虽然大多数机器学习算法都是为了解决单个任务而设计的，但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。有时，实验中观察的协变量往往要少于观察的目标人群中的协变量数目，此时上述方法的应用就存在明显的局限性。在计算机领域，迁移学习里有两个非常重要的概念域（Domain）和任务（Task）。域可以理解为某个时刻的某个特定领域，比如书本评论和电视剧评论可以看作是两个不同的domain，任务就是要做的事情，比如情感分析和实体识别就是两个不同的task。研究可以用哪些知识在不同的领域或者任务中进行迁移学习，即不同领域之间有哪些共有知识可以迁移。研究在找到了迁移对象之后，针对具体问题所采用哪种迁移学习的特定算法，即如何设计出合适的算法来提取和迁移共有知识。研究什么情况下适合迁移，迁移技巧是否适合具体应用，其中涉及到负迁移的问题。当领域间的概率分布差异很大时，上述假设通常难以成立，这会导致严重的负迁移问题。负迁移是旧知识对新知识学习的阻碍作用，比如学习了三轮车之后对骑自行车的影响，和学习汉语拼音对学英文字母的影响研究。如何利用正迁移，避免负迁移。

迁移学习主要包括三方面：

（1）基于实例的迁移。基于实例的迁移学习研究的是，如何从源领域中挑选出，对目标领域的训练有用的实例，比如对源领域的有标记数据实例进行有效的权重分配，让源域实例分布接近目标域的实例分布，从而在目标领域中建立一个分类精度较高的、可靠地学习模型。因为，迁移学习中源领域与目标领域的数据分布是不一致，所以源领域中所有有标记的数据实例不一定都对目标领域有用。戴文渊等人提出的TrAdaBoost算法就是典型的基于实例的迁移。

（2）基于特征的迁移。基于特征映射的迁移学习算法，关注的是如何将源领域和目标领域的数据从原始特征空间映射到新的特征空间中去。这样，在该空间中，源领域数据与的目标领域的数据分布相同，从而可以在新的空间中，更好地利用源领域已有的有标记数据样本进行分类训练，最终对目标领域的数据进行分类测试。

（3）基于共享参数的迁移。基于共享参数的迁移研究的是如何找到源数据和目标数据的空间模型之间的共同参数或者先验分布，从而可以通过进一步处理，达到知识迁移的目的，假设前提是，学习任务中的的每个相关模型会共享一些相同的参数或者先验分布。计算机中的迁移学习往往是基于预测和判别分析的角度在不同的域之间迁移，缺乏实际的医学背景和临床意义，同时缺乏模型的可解释性。预测和判别往往只是关联层面的研究，无法获得目标人群的特定因果效应。

在因果推断领域，传递性主要关注如何将实验得到的结果应用于不同于实验条件的人群中。众所周知，随机对照实验是因果推断的金标准，具有非常强的内部有效性，但缺乏将研究结果外推到真实世界人群或者目标人群的能力（外部有效性）。例如，我们在地区A做了一个关于X对结局Y的随机临床实验，可以估计各个年龄段的X对Y的平均因果作用。如果我们想把研究结果迁移到地区B，但是该地区的年龄分布普遍高于地区A，那么该如何估计地区B的因果作用呢。如果我们假设年龄别的因果效应在地区间是不变的，即。那么地区B的平均因果效应是。这个传递公式综合了地区A的研究结果以及地区B中年龄的分布。目前，提出了很多将临床试验的处理效应估计（SATE）迁移到一个目标人群中，从而获得目标人群中的治疗效应（TATE）。使用实验数据估计SATE时，往往需要假设影响治疗效应的协变量在试验样本和目标人群中都可以被观察到。Pearl和Bareinboim提出了选择图（selection diagram）以及传递性可识别性问题。Trang提出了关于处理的效应修饰变量只在试验人群观察到，但在目标人群无法观察的敏感性分析方法[1]。Stuart等人提出了非随机研究（NRSs）来评估基于RCT的估计能否应用于新的目标人群。Diomand采用了一种自动匹配的方法（遗传匹配）的方法来对RCT的样本进行匹配分层，然后根据观测的协变量来加权RCT个体（逆倾向性得分加权或最大熵加权），最终目的是对RCT个体进行重加权从而使得RCT中观察特征的分布和目标人群一致。

从一个包含充分混杂变量的观察人群得到的因果效应如何迁移到另一个观察人群中。当治疗效果修饰因子影响个体是否参与随机试验时，在随机试验中获得的群体平均治疗效应与其他人群中的是不同的，这也就意味着，随机试验的结果不能够被简单的迁移到具备其他特征的人群中，而这些受条件限制无法进行试验研究的人群中的治疗效应往往是研究者更为关心的问题。这种将随机试验的结果拓展到所感兴趣的特征人群中的研究即为迁移学习。随机临床实验的研究无法真正用到真实世界人群中。随机试验往往存在志愿者偏倚，即选择性偏倚。例如，儿童用药的迁移学习，成人用药的剂量通过医生经验减量用到儿童，而且无法做随机临床试验，只能借助迁移学习。

转自：“量化研究方法”微信公众号

如有侵权，请联系本站删除！

上一篇： 23种常用的资料分析方式汇总
下一篇： 关于“因果推断”（Causal Inference）

投稿问答最小化 关闭

迁移学习：有关苹果和梨的故事

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

迁移学习：有关苹果和梨的故事

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭