python解压zip包中文乱码解决方式

时间:2020-07-22 16:01:31   收藏:0   阅读:92

 

乱码得原因:

由于ZipFile模块导出遇到中文解码不对,windows上会出现,linux是否会出现不知道没测试过。

 

解决方式:

1. 搞个文件名引射表(不太方便,少量文件夹套用时候还可以)

2. 修改源码解码格式(不太方便,自己搞了一下,之后报其他错误)

3. 自己写入文件,自己创建文件夹(推荐)

 

自己创建的写法:

        with zipfile.ZipFile(file=zip_save_path, mode=r) as zf:
            # 解压到指定目录,首先创建一个解压目录
            os.mkdir(unzip_dir_path)
            for old_name in zf.namelist():
                # 获取文件大小,目的是区分文件夹还是文件,如果是空文件应该不好用。
                file_size = zf.getinfo(old_name).file_size
                # 由于源码遇到中文是cp437方式,所以解码成gbk,windows即可正常
                new_name = old_name.encode(cp437).decode(gbk)
                # 拼接文件的保存路径
                new_path = os.path.join(unzip_dir_path, new_name)
                # 判断文件是文件夹还是文件
                if file_size > 0:
                   # 是文件,通过open创建文件,写入数据
                    with open(file=new_path, mode=wb) as f:
                        # zf.read 是读取压缩包里的文件内容
                        f.write(zf.read(old_name))
                else:
                    # 是文件夹,就创建
                    os.mkdir(new_path)

结果正常:

技术图片

 

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!