ArcGis或MapGis中浏览数据乱码问题

常见问题4年前 (2021-05-07)6046

工作中经常需要使用ArcGis或MapGis的数据,但经常会出现收集来的数据或者汇交的数据是乱码,通常我们会认为可能是软件在不同格式转换过程中因为不兼容等问题导致的,但经过长时间的实践发现,数据本身没有问题的情况也是很普遍的。

 



  这种情况有一个比较明显的特点就是,在有的电脑上是乱码,但在另外的电脑上就没有乱码,一般都是将数据拿到其他的电脑上进行处理,所以我们推测产生这种问题的原因应该是同软件的版本或者软件的运行环境有关。经过多次调试,发现此问题应是ArcGis和MapGis的默认编码不同造成的。其中MapGIS,默认使用CP936(GBK)编码存储,无论是你使用何种系统,系统的默认语言都是使用GBK编码;而ArcGis的编码系统则根据安装软件时发生变化,当你安装的系统的原始版本并不是简体中文,那么这个就会发生变化(尤其是盗版系统,经常可能是英文版或者俄文版改写的),所以ArcGis的默认编码就会相对比较多。同时如果收集的资料来源并非国内,这样出现乱码的可能性就会更大了。


  所以,这个问题的根本原因就是读取文件使用的编码类型和文件实际存储的编码类型不一致。


  Shapefile文件的头文件(dBase Header)中,一般会包含shapefile使用的编码类型的信息,这个信息成为 LDID ( Language Driver ID),这样在使用应用程序打开 shapefile 的时候,应用程序就知道用何种编码类型去正确读取它,而不会发生乱码。 在 ArcGIS Desktop 生产的 shapefile 数据中通常会包含这项信息。在Shapefile的子文件中,有时我们还会发现同名 *.cpg 文件,文件中也存储了编码信息,用记事本打开,看到例如 utf-8。


  二者被ArcGIS 识别的优先顺序是,LDID 优先于 CPG文件。也就是如果头文件中没有约定读shapefile的编码类型时,如果这时刚好有个CPG文件,那么ArcGIS就会使用这里的编码类型读取。


  我们知道 shapefile 是个开放格式,只要你了解了数据规范,完全可以脱离ArcGIS自己生产出来。在Windows中文语言设置下,假设你自己写代码或者使用第三方的程序生产了shapefile。如果是 ArcGIS 10.2 和之前的版本,那么在本机上读取一般是没问题,ArcGIS 默认编码是按照本机默认编码,没有乱码。


  可是拿到 ArcGIS 10.2.1 以后的版本中发现乱!码!了!在缺失 LDID 和 CPG时,这几个版本默认使用 UTF-8 来读取 shapefile,这样必然乱码了。

 



  解决方法就是使用记事本工具打开,修改同名的CPG文件,文本内容oem或者936,如果部分第三方软件没有该文件,只需要新建同名的CPG文件,文本内容同上。


  此外,我们需要了解的是中文系统一般采用GBK的编码方式,因此中文系统下,生成的shapefile文件都是以GBK来编码其中的字段属性的,如果dbf不是GBK编码就会出现乱码问题。此外常用的编码类型如下,这种问题同我们下载的字幕出现乱码的原理是一样的。



相关文章

Q2_非系统文件错误

Q2_非系统文件错误

Q2:原文件错误-非系统文件错误    问题说明:文件本身严重损坏,无法识别处理措施:请用MapGIS软件确认是否能正确打开;如能打开,用MapGIS软件压缩存...

Q10_属性结构定义错误

Q10_属性结构定义错误

Q10:原文件错误-属性结构定义错误    问题说明:文件的属性结构定义出现错误,无法正确识别MapGIS文件处理措施:请用MapGIS软件确认是否能正确打开;...

INFO4_属性字段类型不支持

INFO4_属性字段类型不支持

INFO4:第N个属性字段类型SHAPE格式不支持    说明:SHAPE文件属性字段仅支持布尔、整数、浮点数、文本等基本类型,当MapGIS文件属性中存在SH...

文件转换完成后在ArcGIS中打开为何缩成一个点

文件转换完成后在ArcGIS中打开为何缩成一个点

有的用户使用Map2Shp进行转换后,在ArcGIS中打开窗口缩成一个点,如图所示首先利用Map2Shp软件提供的日志和信息提示功能,对转换结果做逐一检查。输出信息包含有详细提示,具体每条信息的含义及...

使用Map2Shp转换时能保证属性百分之百转换吗?

使用Map2Shp转换时能保证属性百分之百转换吗?

由于MapGIS平台与ESRI shapefile文件格式间存在巨大差别,并不是所有的属性全部被转换。主要存在以下几种差别:字符串长度超限当字符串类型的字段长度超过255时,转换后变为长度为...

什么是多部件(MultiPatch)要素?Shp2Map不支持多部件要素怎么处理?

什么是多部件(MultiPatch)要素?Shp2Map不支持多部件要素怎么处理?

什么是多部件(MultiPatch)要素?有时,您需要创建由多个物理部分组成但只引用数据库中的一组属性的要素。对于点,这些要素被称为多点,而对于线和面要素,这些要素被称为多部分。一组岛屿可以通过多部分...