上海交通大学图书馆针对近年来收集的地方历史文献开展了数字化加工工作。如何有效地提取文献蕴含的地理信息并使其标准化,最终实现数字化的展示、利用与分析是工作的难点之一。地理信息经由人工获取,根据研究需求按照分段揭示的原则著录到地域相关的元数据字段中。基于可统计的文献来源,分布集中的文献优先编写代码转换规则,可机读代码避免了语义识别等程序的繁冗。鉴于明清时期行政区划的特点,代码采用"省-县-都-图-村"五级格式,遵照标准化、兼容性、求同性与扩展性的编制原则,以期实现文献关联聚类、信息自动获取与空间可视化等数据化效果,还原地域视角下的历史原貌。