投稿问答最小化  关闭

万维书刊APP下载

作者性别限定工具为女性作家研究和数字人文带来新的契机

2022/3/1 10:41:21  阅读:250 发布者:chichi77

原文作者:Rachel Holt

                 Gale女性研究档案策划编辑

原文发表于:Gale Review Blog

女性写作研究是所有文学或历史课程(以及其他很多学科)的重要基石,而Gale正在尝试通过聚焦女性作家来支持这一重要的学术研究领域。我们实现这一目标的方式有两种,首先是发布了曾多次获奖的“女性研究档案”(Womens Studies Archive)系列的第三个部分“美国古文物学会珍本,1820-1922年”(Rare Titles from the American Antiquarian Society, 1820-1922),它收录了5,700多部由2,000多位女性作者创作的作品。其次是在“女性研究档案”系列中引入了一个独特的全新检索功能——作者性别限定选项。这个新增的产品功能为女性历史、性别研究等领域的本科生学习和学术研究打开了各种可能性。

 “美国古文物学会珍本”是什么?

这套新发布的数字化档案让研究者能够前所未有地访问到一百多万页女性创作的作品,包括各类小说和非小说作品。其中包含很多来自美国古文物学会(American Antiquarian Society)的珍本(有些甚至是孤本)图书,将有助于从女性主义的视角开展新的学术研究,发现之前被忽视但对女性历史、性别研究、美国和加拿大历史、社会学、政治、新闻学等领域研究至关重要的作品。

Greenaway, Kate. The proud girl and other pictures & rhymes for children: after Kate Greenaway. McLoughlin Bros. New-York, [188-?]. Womens Studies Archive, https://link.gale.com/apps/doc/OHRCJR651867392/WMNS?u=webdemo&sid=bookmark-WMNS&xid=de51d54e&pg=1

 

“作者性别限定选项”是什么?

正如这项工具的名称所表明的,作者性别限定选项将你的检索范围限定在由特定性别的作者所著的图书中。

该系列中目前提供的四个限定选项是:

·

女性 [ Female ]

·

·

男性 [ Male ]

·

·

未知(别名) [ Unknown (Alias) ]

·

·

未知 [ Unknown ]

·

实现这项功能所需元数据的最初创建过程是将作者姓名导入到软件中,根据他们的姓名和/或别名识别出作者是女性、男性或未知。这是一种高效率的收集数据的方法,生成一个初步的清单,但这个过程显然会导致一些不正确的数据匹配。例如很著名的一些笔名,比如乔治·艾略特(George Eliot),常常会被软件错误识别。因此,Gale人工检查了这些数据并核实了所有的异常情况。所有姓名与我们内部的术语数据库进行了比对,也进行了额外的网络搜索,以确保数据在被收录入档案库前尽可能的准确。

“未知(别名)”类别的解释

在目前这个阶段,我们加上了一个额外的类别“未知(别名)”。这个类别是用于表明,我们认为作者很有可能是当代出版商人为制造出来的。与通常用来掩饰作者身份的笔名(例如乔治·艾略特)不同,“未知(别名)”用于人为地将一部作品归属于一位作家或一组作家,通常假定一种性别或角色。说明这种情况的一个很好的例子是知心大姐(Agony Aunt)专栏,标题中的“大姐“用于表示安慰式的女性视角,同样的名字可能由多位作者持续使用——实际上成为了一个品牌名称,基本上是一个别名。一个现代的例子是Slate杂志的”Dear Prudence“专栏,其中Prudence这个人物覆盖了多位不同性别作家的作品。我们认为他们本身构成了一个有趣的子集,让他们能够轻松被找到将会帮助到研究者,特别是那些从事数字人文研究的研究者。

目前,这一作者性别限定选项仅适用于“女性研究档案:声音与愿景“(Womens Studies Archive: Voice and Vision)和”女性研究档案:美国古文物学会珍本,1820-1922年“(Rare Titles from the American Antiquarian Society, 1820-1922)这两个模块的专著(Monograph),但未来我们希望能将这个功能延伸到其他Gale数字化档案库的资源和内容类型上。

“作者性别限定选项”

如何解决性别认同的多元化?

Gale知道目前的性别限定选项仅显示出两类社会性别。Gale支持社会的多元化,也始终努力做到包容性。然而,在多次讨论之后,我们决定采用二元性别是因为它完全反映出这些文献资料本身的特性,无论是我们能够分辨出的,还是作者自己标识出的亦或是历史赋予的,根据现有的信息,作者性别目前仅包含这两种性别中的一种。为了避免无效的检索,我们目前没有将非二元社会性别选项包括在内。我们认为包含没有检索结果的选项将会对用户造成误导。在Gale产品中,只要是提供了性别限定选项的地方,我们都会积极检查这些选项,确保他们包含了所有在文献中可识别出的作者性别。

如果你注意到某位作者根据现有的信息划分在错误的类别中,请一定要告诉我们!我们努力使“女性研究档案“成为准确且包容的资源,乐于对元数据和限定选项做出修改,以保持它的高质量。

一套档案中缺失的部分本身可能就是有意义的

但认识到一点很重要,那就是档案中的沉默本身也是有意义的,可以暗示出隐藏的历史叙述。例如性别不符自远古时期就存在于全世界各地的文化中,但并不总是能够以非二元性别的身份或与一个人出生时被赋予的性别不同的性别表达/身份而公开存在。“女性研究档案”主要关注十八世纪、十九世纪和二十世纪的文献,大部分来自西方社会,在这些地方性别不符可能导致嘲笑、暴力或监禁。非二元性别的个体很可能存在于这套档案中,但他们并未被发现或被单独分出来。

定义非二元性别人士的术语也可能是相当现代的,很多词语都在20世纪80年代以后才出现,因此二元性别的认定可能因为当时不恰当的词汇而发生偏差。我们可以想到,非二元性别的作者会受到歧视,他们的作品不会通过传统的渠道被出版或收藏。这些是否是“女性研究档案”中非二元性别作者缺失的原因,我们很难确定,但重要的是要强调出他们为什么没有被体现出来。缺少对少数群体的呈现是很多(甚至是大部分)档案典藏的问题,但我们需要认识到为什么会出现这种空白,以便学者、教师和学生能够发起对这些问题的更广泛讨论。

“作者性别限定选项”为什么对本科生的学习、研究生的学术研究和教学如此重要?

决定构建作者性别限定选项的驱动力是图书馆员和导师们多次向Gale的编辑团队提出希望我们的资源平台能够具备识别作者性别的功能。在女性历史和性别研究领域对这项功能有着明确的研究需求,能够推动更深入的学习和研究。

“女性研究档案”的主要目标之一是呈现历史上被忽视的女性故事。由于父权社会中女性被认为地位低下,因此女性写作的传统往往被忽视。至今仍很常见的一个现象是,在全世界各地高等教育机构中教学课程所用的文集,通常女性作者数量远远少于男性作者,甚至有时完全没有女性作者。

用户能够在“女性研究档案”中利用一个或多个关键词同时限定作者性别进行检索,由此获得对特定主题的性别化观点。例如,关注女性和第一次世界大战的用户可以利用关键词“war”(战争)进行一次基本检索,然后通过日期范围1914728日到19181111日以及作者性别筛选检索结果,最终仅有女性作家出现在检索结果中。尽管这可能会出现一些不相关的结果(例如女性作家创作的关于古代战争的作品,或使用“战争”一词描写她们支持的运动等),但这仍然可以为用户提供一组一次文献,呈现女性对第一次世界大战的看法。

为什么从女性视角探讨一个主题如此重要?因为女性历史也是人类的历史。如果割裂了一半世界人口的经历、观点和贡献,我们将无法理解我们的过去。对于大部分的历史,很多历史学家都没有将女性包括在他们对过去的讲述中。几个世纪以来,历史仅从男性视角被记录、讲述和传授,而女性在其中的作用往往被轻视、忽略或为符合男性议程而被改写。一次文献提供了一个通向过去的窗口,让我们看到个体或群体如何经历了他们所处的那个时代,这就是能够找到女性作家作品的重要意义所在。提升对女性作家作品的访问和发现,将打开历史的新视角。

Sanford, D. P. Pussy tip-toesfamily: a story for our little girls and boys: By Mrs. D. P. Sanford author of The Rose Dale books,etc., etc. E. P. Dutton and Company, Publishers 713 Broadway, 1876. Womens Studies Archive, https://link.gale.com/apps/doc/EJGNPM706058635/WMNS?u=webdemo&sid=bookmark-WMNS&xid=66e15f85&pg=1

Winnie. Lotties orange: By Aunt Winnie. Published by the American Tract Society, 28 Cornhill, Boston, [ca.1876?]. Womens Studies Archive, https://link.gale.com/apps/doc/YCSAZC908495059/WMNS?u=webdemo&sid=bookmark-WMNS&xid=d0fc662e&pg=1

 

它对数字人文有什么意义?

数字人文是将计算机技术应用于人文学科的学术研究领域。对于研究者而言,数字人文研究正在推动以新的方式探讨内容、分析见解、输出发现。作者性别限定选项提供了更多激动人心的机会,特别是对女性主义数字人文的发展。

能够创建特定时间范围内或围绕特定主题的女性作家作品的数据集,将为以全新方式探索女性写作创造更多的机会。同时,提供对特定事件(战争、技术进步、政府等)、时期或主题(教育、健康和医药)的女性观点,这样的数据集将支持对女性语言和思想发展的追溯。

它可能并不像你最初想象的那样难用或遥不可及。本科生或刚刚起步的研究人士可以轻松使用Gale原始档案(Gale Primary Sources)平台内置的工具深入探讨数据。研究者可以使用术语检索频率(Term Frequency)工具查看一组内容中检索词出现的频率,由此出发找出中心主题并评价个人、事件和思想如何随时间互动和发展。例如,关注女性在废奴运动中作用的用户可以在“女性研究档案”中检索“slave”(奴隶)一词,使用作者性别限定选项限定仅检索女性作家作品,然后应用术语检索频率工具。

“女性研究档案”中检索关键词“slave”(奴隶)并利用作者性别限定选项限定检索结果为女性作者,最终得到的术语检索频率图形。

这个工具不仅显示出女性也在探讨奴隶制,而且生成一副可视化图形,呈现出什么时候这种讨论最热烈和最平淡,以及它持续了多长时间。例如,在1876年“slavery”(奴隶制)一词在女性作品中出现最多,因此正在撰写论文的学生或正在进行深入分析的研究者都可以聚焦于这些文献资料。他们也可以思考在那时还发生了什么事件使得文献资料的数量达到了顶峰,因为1876年不仅仅发生了一次总统选举,而且在南卡罗莱纳州发生了一次夏季种族骚乱。

为一篇论文或文章寻求新的视角的用户可以利用主题查找器(Topic Finder)工具。通过将常常出现的主题组合在一起,这个工具揭示出检索词之间隐藏的关联——通过整合不同内容与相关信息,帮助打造研究项目。如果我们再次用“slave”(奴隶)一词进行同样的检索,限定检索结果为仅女性作家的作品,然后应用主题查找器工具,用户将会看到多个相关主题。

“女性研究档案”中检索关键词“slave”(奴隶)并利用作者性别限定选项限定检索结果为女性作家作品,然后应用主题查找器工具,最终生成的主题聚类图形。

例如,womens rights”(女性权利)、“suffrage”(女性投票权)和“womans worth”(女性价值)都与“奴隶”相关,因此本科生可以考虑撰写一篇有关废奴运动和女性权利运动之间关系的论文或文章。

        Gale数字学术实验室中使用

“美国古文物学会珍本,1820-1922年”

数字人文学者如果想要让他们的研究更加深入,通过复制在Gale数字学术实验室(Gale Digital Scholar Lab)中利用作者性别限定选项创建的数据集就可以做到,这个数据集将帮助用户做出更多的发现。或者,因为“美国古文物学会珍本,1820-1922年”专注于女性写作,从事女性主义人文研究的学者将拥有一套(几乎)现成的、从一开始就仅由女性文学构成的数据集,仅需要在Gale数字学术实验室中使用“美国古文物学会珍本,1820-1922年”即可。通过Gale数字学术实验室中的高级检索功能,用户可以选择“女性研究档案”,然后限定模块,构建一个完全来自“美国古文物学会珍本,1820-1922年”的内容集。

用户可以在Gale数字学术实验室中检索他们的检索词,使用高级检索筛选选项选择特定的档案……

……然后利用档案系列选项选择特定的模块,在这个例子中选择模块“女性研究档案:美国古文物学会珍本”。这将为他们的研究主题提供一个(几乎完全)由女性创作的作品集合。

它的好处是用户几乎立刻就拥有了一个特定主题的数据集。例如,如果用户在“美国古文物学会珍本,1820-1922年”中检索关键词“war”(战争),他们将会得到一组有关战争的女性文学作品。你会想到其中可能会有一些存在偏差的结果,但它对任何研究者而言都是一个很好的起点。更进一步,如果用户按日期限定他们的检索结果,他们将能够聚焦于特定的军事冲突,例如美国南北战争或两次世界大战。

简单来说,Gale数字学术实验室为用户提供了六种工具:

·

命名实体识别(Named Entity Recognition

·

从文献中提取命名实体

·

·

N元语法(Ngrams

·

构建词语固定搭配

·

·

词性标注(Parts of Speech

·

创建内容集的词汇索引或词典

·

·

情感分析(Sentiment Analysis

·

通过定量评分系统指示出正面、中性或负面感觉的程度

·

·

聚类(Clustering

·

根据共同特性找出文献分组

·

·

主题建模(Topic Modelling

·

帮助用户分辨出规律

·

想象一下这些工具将如何帮助分析有关战争的女性文学语料库!例如,通过使用情感分析工具,用户可以回答的问题:在过去的百年间女性作品中对于“战争”一词的情感是怎样的?女性大部分是支持还是反对战争的,以及情感是如何随时间或在重大军事事件后发生变化的?

数字人文学者使用“美国古文物学会珍本,1820-1922年”的另一种可能方式是找出女性作品。找到遗落的女性作者是许多女性历史领域学者的共同目标。更多的女性比男性在历史上匿名或用笔名写作。有人提出研究特定时期已知女性作者的语言规律可能能够帮助研究者分辨出一位匿名作家是否可能是女性,甚至识别出是某位特定的女性作家。

女性的影响力或社会贡献通常被视为次于男性,但其中多大程度上是因为历史主要是从男性视角讲述的呢?数字人文将帮助重新评价公认的历史并回顾女性在历史上的作用和重要性。

结论

对女性写作和作家身份的研究无疑是重要的,而Gale也正在构建旨在支持和推动这类学术研究的资源。

对女性文学的分析帮助我们研究被历史边缘化的人群,通过他们的作品探索他们在各自的文化中占据的独特社会-政治空间。十九世纪女性作家的兴起并非偶然。这种增长离不开女性教育的进步、女性投票权运动以及女性在公共而非私人或家庭领域内获得了全新的作者身份这一不争的事实。在弗吉尼亚·伍尔夫(Virginia Woolf)著名的女性主义评论中,她认为在男性主导的文学传统中,女性既需要有一个真实的空间,也需要有一个象征的空间:

A woman must have money and a room of her own if she is to write fiction.

(如果一名女性想要开始写小说,她必须有钱和属于自己的空间。)

Woolf, V. (1929). A Room of Ones Own. New York, Harcourt, Brace and Company.

本文对“女性研究档案”系列中“作者性别限定选项”的介绍以及对“美国古文物学会珍本,1820-1922年”中女性作者的展示,旨在让研究者和学生了解他们需要哪些工具来探讨女性写了什么以及什么时候、在哪里、为什么以及如何写作。

 


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com