2022年9月19日14时至15时30分,澳门十大娱乐信誉网址2021级强基班“大数据史学”课程专题讲座暨史学名家系列讲座《环境史学数据库建设尝试》以线上腾讯会议的方式举行。本次讲座由北京工业大学王丽敏老师主讲,本院陈林博老师主持。21级历史强基班、21级其他专业学生及部分外校师生参加了本次讲座。
王老师的讲座分为三个部分:一是探讨数据库建设的目的,二是数据库信息的获取,三是数据库的具体建设工作。
首先,王老师说明了环境史数据库建设的由来。该数据库,由清华大学历史系梅雪芹教授主持、设计和策划,旨在借助数据技术,整合基本数据,促进信息共享,利于学术研究。王老师阐发了环境史研究的两个核心问题:如何认识环境史研究的创新,及其对环境史研究总体创新的理解。王老师介绍了梅雪芹教授团队如何参照国内历史学科分类,结合环境史数据库的建库可行性,将环境史成果重新分类。具体可以划分为:新史学理论史学史、新通史、新区域国别史、新专门史、新专题史,分门别类并收集数据。她援引梅雪芹教授的观点,阐明了环境史数据库建设工作的意义:此项工作,可以为项目研究提供比较全面厚实的文献基础,为认识环境史学的创新提供一种指南,为思考研究如何创新提供一种参照。王老师还从历史题材、历史动力观、史学方法论、历史评价观、史学目的观、历史作用观六者的变革阐释了环境史创新的内涵。
其次,王老师论述了如何获取环境史数据库信息。获取信息的第一阶段是搜集大量论文、著作;第二阶段是整理、精确核对、筛选论文信息,明确文献整理和信息提取的原则,并将信息汇入数据库。在此,老师向我们讲述了梅雪芹研究团队与清华大学统计研究中心对接的经历,并指出他们最终通过数据库机器下载和人工下载相结合的方式来获取环境史资源。
然后,王老师介绍了数据库的具体建设工作。这一工作需要检测数据之间的关联,建立窗体,最终完善、测试、展示数据库。从人与自然的关系史出发,环境史数据库建设可分为社会—生态系统两大部分。数据库团队通盘考虑并依据社会—生态系统内容,对所提取的关键词分类、分级。王老师向我们展示了数据库信息提取模板和论著主题词提取实例,并说明只要数据库的构建起来,后续论著主题词提取之后,数据库新增内容可以由任何人在窗体添加。她还演示了环境史数据库运行的具体步骤。
最后,王老师谦逊地表示,环境史学数据库系清华大学梅雪芹教授主持的国家社科重大项目成果的一部分,由该项目组集体建设,自己只是其中成员之一。团队内的张宏宇、刘黛军、陈林博等非常多的参与者,对数据库建设均有贡献。数据库的成果,也是集体智慧的结晶。王老师衷心希望,会有越来越多的同学积极与梅雪芹研究团队保持密切沟通,积极投身于环境史和大数据史学的学习与研究之中,共同把大数据史学研究推向崭新的高度。
此外,王老师提醒我们要区分真实信息、虚假信息和冗余信息,在利用数据库的基本功能外也要重视其汇总信息和具象化功能对研究的作用。接着,她从虚假信息、搭建成本、有限收益、史学书写特性掩盖四个方面总结了数据库建设存在的问题。最后,王老师推荐了中国历代人物传记资料库(CBDB)和中国历史地理信息系统(CHGIS)两个网站。
讲座过程中,陈林博老师不时跟王老师进行互动交流。下课之前,陈老师展望了网赌网址的数据库建设工作,对王老师的讲座给予了高度评价并表达了由衷感谢。本次讲座圆满结束。