python保存csv时出现中文乱码

1.问题描述

在pycharm中用下面代码保存成csv格式时候,结果出现中文乱码

  open('数据.csv',mode='a',encoding='utf-8',newline='')

2.问题解决

在网上搜索找到一个办法可以有效解决

将encoding=‘utf-8’ 改为 encoding=‘utf-8-sig’

3. 问题产生原因

以前没有遇到过这种解决的方法,对两者区别产生了好奇,又进行了搜索,整理如下:(反正我是看不懂orz)

1、”utf-8“ 是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,因此它不需要BOM,所以当用"utf-8"编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理, 也就会发生类似上边的错误。

2、“utf-8-sig"中sig全拼为 signature 也就是"带有签名的utf-8”, 因此"utf-8-sig"读取带有BOM的"utf-8文件时"会把BOM单独处理,与文本内容隔离开,也是我们期望的结果。

参考链接来源:https://blog.csdn.net/qq_40258748/article/details/96306878
https://blog.csdn.net/qq_39248703/article/details/80175976