〈 帮助
ZIP 压缩包中的 Unicode 文件名
UTF-8是用于存储Unicode的标准字符编码方法,其被开发用于显示各种语言。
由于 Unicode 和 UTF-8 是在20世纪90年代之后开发的,因此ZIP格式的初始版本(在20世纪80年代制造)不支持UTF-8。 由于ZIP格式成为标准档案格式并且需要支持Unicode,因此,已经引入了几种方法来处理ZIP文件上的UTF-8字符串。
Bandizip支持其中两种;一种方法是将文件名转换为UTF-8,另一种方法是将额外的UTF-8文件名存储在额外的头字段中,同时将原始文件存储在MBCS中。
在 Zip 文件中使用 Unicode 文件名(UTF-8)
Bandizip 将文件名存储在 ZIP 文件中,并将其转换为 UTF-8。 它是由APPNOTE定义的标准文件名存储方法,但是一些压缩程序偶尔无法识别ZIP文件或错误处理它们将导致文件名损坏。 APPNOTE
将Unicode文件名存储在Zip文件的额外头字段中(UTF-8)
Bandizip将附加UTF-8文件名存储在ZIP格式的额外头字段中,同时将原始文件存储在MBCS中。 此方法也由APPNOTE定义为“Info-ZIP Unicode Path Extra Field(ZIP信息U码路径额外字段)”。 因为它使用额外字段来存储UTF-8文件名,所以文件大小将比前者大几十字节。 但是,原始文件名存储在MBCS中,因此文件更安全,更兼容。
由于大多数压缩程序(如 7-Zip,WinRAR 和 WinZIP)都支持此功能,因此可以防止文件名在使用不同系统语言的操作系统中被破坏。
下图显示了在将韩国操作系统上压缩的ZIP文件发送到日语操作系统时使用该功能与不使用该功能之间的区别。
在 tar/tgz 文件中使用 Unicode 文件名(UTF-8)
TAR和TGZ格式是主要在Unix上使用的档案格式(使用UTF-8文件名)。此功能使您可以在Unix上提取TAR / TGZ文件而不会出现文件名问题。
注意:Windows的某些程序可能无法正确识别TAR/TGZ格式的UTF-8代码页。