正则表达式
程序员 —— 基本
爬虫方向必须牢固
介绍爬虫的基础
Re模块和正则表达式的关系
正则表达式本身是一种客观存在的规则,re模块是python提供的操作正则表达式的工具
正则表达式就是匹配字符串的一种规则
字符集 [ ]
量词:
1. 每一个量词只控制前一个字符的出现次数
2. 这个量词的匹配为贪婪匹配模式
3. 非贪婪匹配就是量词后面家问号
R取消python里 \ 的转义功能
re模块 返回值的区别
re.findall(’正则表达式’,’你要匹配的字符串’)直接返回匹配的列表,找不到为空列表
re.search()匹配找到的第一个结果,必须要print(.group)
re.match()自动加^重头开始匹配
在调用的角度上 本身没有区别:
接受两个参数按照位置传 正则表达式的字符串和待匹配的字符串
分组:
1.对多个字符进行整体的量词约束
2. 对于一条匹配的正则,只对其中我需要的内容进行分组