博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python基础-资料整理_已迁移
阅读量:6322 次
发布时间:2019-06-22

本文共 971 字,大约阅读时间需要 3 分钟。

  hot3.png

python

模块安装  python -m pip install chardet

基本语法

字符串连接(如果是整型就会做加法)  +  

函数

字符串处理

'abc'.upper() # 就字母转成大写isinstance(x,str) #判断是否为字符串type(str)         #获取变量类型

   HTML实体转换

抓网页数据经常遇到例如>或者 这种HTML转义符,抓到字符串里很是烦人。比方说一个从网页中抓到的字符串html = '<abc>'用Python可以这样处理:import HTMLParserhtml_parser = HTMLParser.HTMLParser()txt = html_parser.unescape(html) #这样就得到了txt = '
'如果还想转回去,可以这样:import cgihtml = cgi.escape(txt) # 这样又回到了 html = '<abc>'

    

    把字符转成url编码

urllib.quote("这是中文")

字符编码处理

import sys       #引用sys模块进来,并不是进行sys的第一次加载reload(sys)      #重新加载syssys.setdefaultencoding('utf8')  #调用setdefaultencoding函数print sys.getdefaultencoding()  #获取系统默认编码

    通过模块方式来获取字符编码 

import chardetchardet.detect(str)

    编码的判断

isinstance(s, unicode) #用来判断是否为unicode

    通过函数转换编码

chardet.detect(article[0]).get('encoding','utf-8')

数学函数-模块

range(1,100) #生成之间数  注意: range(1, 100, 2) 可以生成list [1, 3, 5, 7, 9,...]

    math模块

math.sqrt #开方

列表函数-list

L.append(x * x) #向列表里增加元素

词典函数-dict

 

转载于:https://my.oschina.net/Majw/blog/600199

你可能感兴趣的文章
高德定位和融云IM之间的集成冲突
查看>>
Prettier your project
查看>>
Git本地服务搭建(持续更新)
查看>>
撸一个小程序前置授权组件
查看>>
MYSQL统计行数时到底应该怎么COUNT
查看>>
环形链表 II 转载 https://blog.csdn.net/forever______/article/details/85103234#_1
查看>>
06-码蚁JavaWeb之Servlet
查看>>
小程序云开发之踩到狗尾巴
查看>>
Vue页面级缓存解决方案feb-alive (上)
查看>>
CSS之flex
查看>>
CSS3中linear-gradient实现百分比进度条
查看>>
Java设计模式精讲
查看>>
数据库索引为什么用B+树实现?
查看>>
async,await与forEach引发的血案
查看>>
Gensim训练维基百科语料库
查看>>
红宝书总结-this,length,apply,call
查看>>
到底多大才算高并发?
查看>>
JS中的for循环——你可能不知道的点。
查看>>
js获取鼠标坐标
查看>>
散乱点随记
查看>>