普利茅斯

注册

 

发新话题 回复该主题

当大数据遇上名作家从纳博科夫最喜欢的词, [复制链接]

1#
治疗白癜风最好的方法 http://m.39.net/baidianfeng/a_4197040.html

No.1文如其人:从文字的指纹,识别作者的风格

在大洋彼岸的美国,如果要说有哪一部著作的重要性能与华盛顿所发表的那部《美国独立宣言》相媲美的话,那恐怕就只有美国宪法了。

年5月,为了对原本的联邦条例进行修订,根据美国联邦国会的邀请,在乔治·华盛顿的主持下,在费城举行了全国代表会议。经过了近三个月的秘密讨论以后,与会者并没有修订条例,而是制定了一部全新的宪法,因此,这次会议也就成了美国历史上著名的制宪会议。

按照规定,新宪法通过之后,要由联邦十三个州的特别会议分别进行批准,其中至少有九个州同意,这部新宪法才能生效。然而,在各州的批准过程中,各州对这部新宪法产生了拥护和反对这两种截然相反的意见,于是就引发了美国历史上一场最激烈的论战。

为推动新宪法能够尽快获批实施,美国的三位开国元勋,亚历山大·汉密尔顿、约翰·杰伊、和詹姆斯·麦迪逊,共同以“普布利乌斯”作为笔名,在纽约的主要报刊上发表的一系列的论文,这些论文后来被汇总为《联邦*人文集》。

可以说,《联邦*人文集》为美国走向民主打下了坚实的基础,是美国*治领域汇总最重要的著作之一。但是,其中有12篇文章的作者,究竟是汉密尔顿和麦迪逊这两位开国元勋当中的哪一位,长久以来一直是个悬案,历史学家们对此充满好奇,他们孜孜不倦地试图找到答案,但最终还是无功而返。

这个问题的最终答案,直到两百多年后的年才被揭晓,而揭开谜团的两位教授,其身份并非历史学家,而是统计学家!

来自哈佛大学的莫斯特勒教授和来自芝加哥大学的华莱士教授,希望用概率方程来解决这个困扰史学界一百多年的难题——这听起来很异想天开,但他们将词频和概率结合起来分析,真的找出了问题的答案。

抛开那些“阶乘”、“指数”、“对数”、“T分布”等让人头大的统计学术语,这两位教授所用的核心方法其实很简单:

他们将那些确定是汉密尔顿或麦迪逊所写的文章找出来,分别统计其中某些常用词出现的频率,接着,分析那12篇不能确定作者的文章中,这些常用词出现的频率——两相比较之后,他们最终确定,这12篇文章的作者正是麦迪逊!

说穿了其实很简单,我们常说“文如其人”,实际上,就像我们每个人都有独一无二的指纹一样,每个人在写作时,也会有他独一无二的“文字指纹”,或者说,是“文风”。

就拿汉密尔顿和麦迪逊的文章来说吧,在汉密尔顿的文章中,他经常会使用“while”这个单词,但他从来不用“whilst”这个词,而麦迪逊则恰恰相反。另外,麦迪逊使用“also”这个单词的频率是汉密尔顿的两倍之多,而汉密尔顿则更多地使用“according”这个单词。

这就是文字指纹的魔力,它向我们揭示出:每位作家都会有自己的文字风格,并且这种风格是可以进行预测的!

那么问题来了——男性作家和女性作家在写作方式上会有所不同吗?作家们自己会遵循他们给别人提出的那些写作建议吗?从纳博科夫到E.L.詹姆斯,这些著名作家在文章中最喜欢用的字眼是什么?我们能仅从文字风格当中,把英国作家和美国作家区分出来吗?

要回答这些问题,就需要借助“文字指纹”的力量。

美国专栏作家本·布拉特对大数据非常感兴趣,他曾经用大数据分析方法“计算”了自己经历过的一段疯狂棒球公路之旅——不搭乘飞机、在30天内造访30座棒球场、观赏30场棒球比赛、全程2万英里!

在《纳博科夫最喜欢的词》这本书中,布拉特用充满趣味性的语言,向我们揭示了:当那些最经典的文学作品遇到大数据,会发生哪些奇妙的化学反应?又会带给我们哪些全新的发现和体验?

可以肯定地说:在大数据的慧眼之下,过去深埋于文字之下的一切,从此都将无所遁形!

No.2英美文化探幽:本是同根生,文化大不同

萧伯纳曾经说过这样一句话:“英国和美国是被同一门语言分开的两个国家。”

年,一艘名为“五月花号”的船只,载有包括男、女及儿童在内的名清教徒,由英国普利茅斯出发,最终抵达北美,并在那里建立了第一块英属殖民地,而这件事也被视为是美国历史的开端。

很多人总以为,既然英国和美国系出同门,那在文化、风俗上应当非常接近才对,但事实上,这两个国家之间的差异之处,远多过相似之处!

如果我们要分析国家之间的文化差异,那语言就是一道绕不过去的关口。美国著名翻译家奈达曾说过这样一句话:“语言永远是文化的一个组成部分,任何文章所表达的意思,都直接或间接地与所属文化相关联。归根结底,离开了相关文化,词汇就失去了意义。文化的不同自然意味着语言的不同。”

由此可见,语言差异是文化差异当中非常重要的一部分。

英式英语和美式英语当然并不是两种独立的语言,毕竟美式英语也是被那些乘坐五月花号移民美国的英国人带去的。但在英国和美国之间,隔着广阔的大西洋,于是,在几百年的漫长时间里,英式英语和美式英语各自独立发展,最终形成了很多肉眼可见的显著差异,而这些差异主要体现在发音、拼写、词汇等方面。

中国有一句老话叫“十里不同音、百里不同俗”,正如每个地方都有自己独特的方言一样,英美两国地理位置相距甚远,其发音规律也各不相同,因此,我们往往把英语的发音方式分为英音和美音两类。

英式发音非常正统,所以才会有“英国皇家英音”这样的说法,也就是ReceivedPronunciation,也有人管这种很有腔调的口音叫做“牛津口音”或“女皇口音”。另外,英国人说话的时候,语速普遍较快,整体的风格听起来非常高冷、性感。

而美式发音就更加趋向于多元化了,毕竟美音是由很多不同的语言汇集形成的,更加自由、包容和开放。另外,很多情况下美国人讲话的发音会稍显夸张一点,这也体现出他们爱好自由、不拘小节的特征。

除了语言上的差异之外,无论是处事态度还是生活习惯,英美文化之间也有着很大的不同。从很多的生活小细节中,你也能一眼区分出高冷的英国人,和不拘小节的美国人。

例如,在需要进行沟通交流的场合中,英国人往往表现得比较高冷和含蓄,对自己的想法更为保守一些。他们不喜欢让人际关系快速升温,更喜欢慢慢地建立人际关系,另外,英国人在交流中很少采用开门见山的方式,而是委婉地试探别人——不得不说,在这一点上,英国人和中国人倒是很像,难怪有人把英国人叫做“欧洲的中国人”呢。

而美国人就直爽多了,他们在沟通交流的时候,喜欢直截了当地把自己的立场和目标说清楚,如果他们觉得,没必要再跟你继续沟通下去,他们也会明确地表示出来,而很少顾忌到对方的感受。

英美文化之间的差异,取决于民族的精神内核。

作为传统的老牌发达资本主义国家,英国从工业革命时期,就在世界历史上占据了非常重要的地位,维多利亚时期,站在巅峰的大不列颠帝国,被世界尊称为“日不落帝国”。因为有过光辉的历史,所以对于自己的文化,英国人有着很强烈的自我优越感。

简而言之,在英国人身上所秉承的,是源于维多利亚时代那传统的、贵族的、优雅的文化。

而美国的发展历程则大不相同。数百年前,当那些穷苦的英国清教徒乘坐着五月花号来到这片土地上定居时,呈现在他们眼前的,只有大片大片的荒野,所有生存所必需的一切,都是靠着那些饥寒交迫的清教徒们辛勤劳作,才一点一滴积攒起来的。

正是这样的历史特性,才造就了美国人“自己动手、丰衣足食”的民族精神。因此在美国文化当中,很少宣扬那些依靠家族世袭的贵族们,而更加尊重那些靠自己辛苦努力而取得成功的人。

换言之,美国文化所提倡的,是强烈的进取心和竞争意识,是“付出就能有回报”的乐观主义精神!

分享 转发
TOP
发新话题 回复该主题