伴随系统提示音落下,一股关于文本分析的庞大信息流,便径直涌入沈庭的脑海。
文本分析的核心框架与技法,大致分为三个部分:
首先是书面语言分析,聚焦于“用语习惯”。
每个人的用词遣句,都有着自身的独特性。
这与地域、职业、教育背景、文化熏陶乃至时代特征息息相关。
分析文本中反复出现的特色词汇、非常规搭配、特定领域的术语或黑话,甚至语法结构的偏好,就能逆向推断出书写者的成长环境、可能籍贯、从事的职业或长期沉浸的亚文化圈。
比如,频繁使用“俺”、“咱”自称,可能指向北方某些方言区。
习惯用“啥”代替“什么”,也有其地域倾向。
某些特殊的儿化音运用,如“这人儿”,同样可以成为线索。
而文本中,如果出现了“账户对冲”、“杠杆比率”、“量化宽松”等术语,那么书写者很可能从事金融或相关行业。
若满是计算机代码缩写或网络黑客俚语,背景自然指向计算机领域。
其次,是文字布局与格式分析,也称为“空间表达”。
研究表明,字迹在纸张上的整体排布方式,包括页边距的宽窄、行间距的疏密、字与字之间的拥挤或松散程度,以及每行字迹基线的整体走向,是平直、上翘还是下滑……
这些宏观特征,往往与书写者当下的情绪状态、长期性格倾向、甚至潜意识的心理活动有关。
比如,如果通篇留白极多、字距稀疏,可能暗示书写者性格孤僻、喜欢保持距离感;
反之,字距拥挤、紧贴行线,可能反映其内心焦虑、或性格较为吝啬保守。
如果一行字明显向上倾斜,常与情绪乐观、亢奋或野心相关;
而整体向下倾斜,则可能暗示沮丧、疲累或消极情绪。
最后,也是文本分析中技术性最强、在司法领域应用最广的部分:笔迹鉴定。
这关乎书写的“动力学特征”,具有高度的个体特异性。
每个人的执笔姿势、运笔力度、笔画间的连笔方式、起笔收笔的锋芒、转折处的角度、甚至是一些细微的颤动习惯,都如同指纹一般难以完全模仿。
在法庭上,经过严格比对的笔迹鉴定结论,是证明文件真伪、关联特定人员的强力证据之一。
分析笔迹,不仅能做同一认定,有时也能推断书写时的身体状态,如是否受伤、醉酒,或情绪波动。
沈庭快速掌握了文本分析的相关知识,他再次看向炸弹狂人留下的那些挑衅信,看向最终落款的“BFE”,也看向信中的每一个单词、每一处笔迹细节。
这一次,他看到的不再单纯是文字。
原本被忽略的,隐藏在字里行间的地域特征、职业痕迹、情绪变化等等,似乎都有迹可循。
只要深入研究,沈庭有种直觉,必定能有所发现。
“开始吧!”
沈庭低声自语,将炸弹狂人留下的所有文字资料,全部调取出来,开始研究……