JAVA高级面试进阶训练营视频教程

admin · 发表于 2021-6-11 00:37:20

之前遇到此异常UnicodeEncodeError: 'ascii' codec can't encode characters...，都是用这种方式解决：sys.setdefaultencoding('utf-8')

今天看到如下文章，阐述了此方式的弊端：

http://blog.ernest.me/post/python-setdefaultencoding-unicode-bytes

但此文章只考虑了未使用第三方库的情况下的解决办法，而第三方库里如果也有print的话，就束手无策了，总不能把第三方的所有print都加上encode吧。

另外此文中说的修改编码为utf8的隐患，其实都是因为没有使用unicode字符串或两种字符串混用而已，如果项目中规定只可使用u'unicode字符串'，上述隐患即可基本避免。归根结底最大的风险就是第三方库的不可控，print编码和unicode字符串都不可控，所以不能使用setdefaultencoding。

我这次是在用Java启动python时，print中文，就会报ascii的异常，我发现此种情况下sys.stdout.encoding其实为None，而Ubuntu中普通命令行时此变量则是UTF-8。

那如何修改sys.stdout.encoding呢？（直接修改会报错TypeError: readonly attribute）

所以最终找到http://www.macfreek.nl/memory/Encoding_of_Python_stdout

python2修改方式（python3略不同，原文中也有写）

1 if sys.stdout.encoding != 'UTF-8':
2     sys.stdout = codecs.getwriter('utf-8')(sys.stdout, 'strict')
3 if sys.stderr.encoding != 'UTF-8':
4     sys.stderr = codecs.getwriter('utf-8')(sys.stderr, 'strict')

这样就完美解决输出中文时的ascii编码异常了，而且也不用重新设置sys的默认编码。

后记：

理想很丰满，现实很骨感，有的时候还是要用setdefaultencoding的。。。

比如不仅是print，还涉及到遍历文件，并且要写结果文件时，在shell下运行正常，可能用java启动的python就会报编码问题，如果不改java那边，可能就要选择setdefaultencoding了，因为如果兼容了java，可能shell下又会报编码问题了，按下葫芦浮起瓢。当然如果把相关几个涉及编码的地方包个函数，在里面根据情况来切换也行，如果时间允许也可以考虑。

		自动登录	找回密码
密码			立即注册

JAVA高级面试进阶训练营视频教程	Java架构师系统进阶VIP课程	分布式高可用全栈开发微服务教程	Go语言视频零基础入门到精通	Java架构师3期(课件+源码)
Java开发全终端实战租房项目视频教程	SpringBoot2.X入门到高级使用教程	大数据培训第六期全套视频教程	深度学习（CNN RNN GAN）算法原理	Java亿级流量电商系统视频教程
互联网架构师视频教程	年薪50万Spark2.0从入门到精通	年薪50万！人工智能学习路线教程	年薪50万大数据入门到精通学习路线	年薪50万机器学习入门到精通教程
仿小米商城类app和小程序视频教程	深度学习数据分析基础到实战	最新黑马javaEE2.1就业课程	从 0到JVM实战高手教程	MySQL入门到精通教程

JAVA高级面试进阶训练营视频教程

Java架构师系统进阶VIP课程

Python print报ascii编码异常的靠谱解决办法