Java自学者论坛

 找回密码
 立即注册

手机号码,快捷登录

恭喜Java自学者论坛(https://www.javazxz.com)已经为数万Java学习者服务超过8年了!积累会员资料超过10000G+
成为本站VIP会员,下载本站10000G+会员资源,会员资料板块,购买链接:点击进入购买VIP会员

JAVA高级面试进阶训练营视频教程

Java架构师系统进阶VIP课程

分布式高可用全栈开发微服务教程Go语言视频零基础入门到精通Java架构师3期(课件+源码)
Java开发全终端实战租房项目视频教程SpringBoot2.X入门到高级使用教程大数据培训第六期全套视频教程深度学习(CNN RNN GAN)算法原理Java亿级流量电商系统视频教程
互联网架构师视频教程年薪50万Spark2.0从入门到精通年薪50万!人工智能学习路线教程年薪50万大数据入门到精通学习路线年薪50万机器学习入门到精通教程
仿小米商城类app和小程序视频教程深度学习数据分析基础到实战最新黑马javaEE2.1就业课程从 0到JVM实战高手教程MySQL入门到精通教程
查看: 326|回复: 0

Python 3 与 Javascript escape 传输确保数据正确方法和中文乱码解决方案

[复制链接]
  • TA的每日心情
    奋斗
    1 小时前
  • 签到天数: 780 天

    [LV.10]以坛为家III

    2047

    主题

    2105

    帖子

    71万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    715808
    发表于 2021-7-10 11:59:47 | 显示全部楼层 |阅读模式

    注意:现在已不推荐 escape 函数,推荐使用  encodeURIComponent 函数,其中方法更简单,只需进行URL解码即可。

    当然了,如下文章解决方案一样可行。

    前几天用Python的Bottle框架写个小web程序,在进行Ajax交互之时,前端则先用 JSON.stringify 来将类序列化,然后用escape() 函数将其编码,确保传输正确。

    再基本上配合上Jquery的$.ajax应该就可以了,可能是经验不足,即使编码之后的数据依然在 Python 中难以处理。

    后来慢慢思考出一种方式,在网上也发现了类似的方式,于是将其实现。

     

    基本思路如下:

    escape('你好世界ABC'); //返回 "%u4F60%u597D%u4E16%u754CABC"

    这串字符串提交到Bottle后,我利用Python 的 urllib 进行解码,结果发现一个问题。。

    >>> urllib.parse.unquote('%u4F60%u597D%u4E16%u754CABC') '%u4F60%u597D%u4E16%u754CABC'
    >>> 

    这个字符串该是什么样子还是什么样子,于是研究了片刻,然后傻逼的发现,这个压根就已经不是URL编码的字符了,不能用 unquote解了。。

    我们应该用 decode('UTF-8')!

     

    %uXXXX 是Javascript转成 Unicode 的样子。所以我们必须要使它变成 \uXXXX 的Unicode的标准形式

    而且Python中 unquote 只能对str进行URL解码,所以这个是对Unicode编码的中文字符是无法解开的,那么我就必须使用 decode('UTF-8');

    但是收到的字符又是str,不存在什么decode,只有encode。后来查了下手册找到了个 urllib.parse.unquote_to_bytes 函数,可对Str进行URL解码,并且返回 byte。

    对的,要的就是这个,然后依据返回的byte,就可以对其使用 decode 。

    于是我就写了一个:

    def load_json(value): value = value.replace('%u','\\u') #将%uxxxx 替换换 \uxxxx 这才可以进行utf-8解码
            byts = urllib.parse.unquote_to_bytes(value) #返回的 byte byts = byts.decode('UTF-8') # decode UTF-8 解码只能解开 \uXXXX 的Unicode 标准形式 return json.loads(byts)

     并且做以下测试:

    escape('{"value":[123,"你好世界ABC"]}') //"%7B%22value%22%3A%5B123%2C%22%u4F60%u597D%u4E16%u754CABC%22%5D%7D"

     Python Shell:

    >>> load_json('%7B%22value%22%3A%5B123%2C%22%u4F60%u597D%u4E16%u754CABC%22%5D%7D') {'value': [123, '你好世界ABC']}

     恭喜测试成功,看起来已经成功了。

    总结:

    这样的话,纵使再如何的字符,都会被Unicode编码。Javascript采用 escape(其他也行)来对字符进行UTF-8编码,虽然得到的是%uXXXX,但是你可以传化为 \uXXXX 的标准形式。

    而且就算某些特别任性浏览器不会变成 %uXXXX,我们也只是 替换的%u,并不会影响实际的字符。

    过程:

    Javascript Object -> JSON.stringify(obj) -> escape(json_str) -> 浏览器的自动URL编码(任性除外) -> Python urllib URL decode -> %uXXXX 替换 \uXXXX -> decode('UTF-8') -> json.load();

     

     

    这只是一点经验之谈,如果有任何错误或更好之处,欢迎指正,向其学习,定当谢过。

     

    哎...今天够累的,签到来了1...
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|小黑屋|Java自学者论坛 ( 声明:本站文章及资料整理自互联网,用于Java自学者交流学习使用,对资料版权不负任何法律责任,若有侵权请及时联系客服屏蔽删除 )

    GMT+8, 2024-8-20 14:40 , Processed in 0.060880 second(s), 29 queries .

    Powered by Discuz! X3.4

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表