搜索
    Hi~登录注册
    查看: 83|回复: 2
    收起左侧

    小白自学python之路----URL编码问题

    [复制链接]

    19

    主题

    0

    精华

    124 小时

    在线时间

    新手上路

    Rank: 1

    积分
    45
    发表于 2019-7-7 10:07:41 | 显示全部楼层 |阅读模式
    查阅资料发现需要quote、unquote模块喜欢简洁的代码,其他模块本人平时不太用,那干脆就只导入这两个模块得了



    先看看编码、解码效果:
    1562464420(1).jpg

    随便点击下编码看能否正常访问:
    1562464590(1).jpg


    直接上代码:
    [Python] 纯文本查看 复制代码
    import requests
    from urllib.request import quote, unquote
    
    # 'utf-8'编码,指定安全字符
    url_zh = 'https://www.baidu.com/s?wd=你好,极安中国'
    url_utf = quote(url_zh, safe=";/?:@&=+$,", encoding='utf-8')
    print('UTF-8:' + url_utf)
    print(requests.get(url=url_utf))
    # 'GBK'编码
    url_gbk = quote(url_zh, safe=";/?:@&=+$,", encoding='gbk')
    print('GBK:' + url_gbk)
    print(requests.get(url=url_gbk))
    
    
    # 'utf-8' 解码
    url_zh_utf = unquote(url_utf, encoding='utf-8')
    print(url_zh_utf)
    # 'gbk' 解码
    url_zh_gbk = unquote(url_gbk, encoding='gbk')
    print(url_zh_gbk)
    



    本人感觉编码已经简洁的了,完整好像是这一长串 urllib.parse.quote('.....')
    平时解析网页都是request xpath
    所以感觉只导入需要的模块感觉清爽多了





    上一篇:去爱奇艺视频中的广告
    下一篇:Web安全微专业—正式篇(白帽黑客)
    回复

    使用道具 举报

    0

    主题

    0

    精华

    0 小时

    在线时间

    新手上路

    Rank: 1

    积分
    0
    发表于 2019-7-7 23:36:45 | 显示全部楼层
    请问你的代码没太看懂要干什么。能否详细解释一下编码的目的?
    回复 支持 反对

    使用道具 举报

    19

    主题

    0

    精华

    124 小时

    在线时间

    新手上路

    Rank: 1

    积分
    45
     楼主| 发表于 2019-7-8 08:41:47 | 显示全部楼层
    ps310pa 发表于 2019-7-7 11:36 PM
    请问你的代码没太看懂要干什么。能否详细解释一下编码的目的?

    url中不能出现中文,把带中文的部分进行编码。就可以正常访问了。
    回复 支持 反对

    使用道具 举报

    游客
    回复
    您需要登录后才可以回帖 登录 | 获取账号

    快速回复 返回顶部 返回列表