正则表达式

1 概述

  • 学习动机

  1. 文本数据处理已经成为常见的编程工作之一

  2. 对文本内容的搜索,定位,提取是逻辑比较复杂的工作

  3. 为了快速方便的解决上述问题,产生了正则表达式技术

  • 定义

即文本的高级匹配模式,其本质是由一系列字符和特殊符号构成的字串,这个字串即正则表达式。

  • 原理

通过普通字符和有特定含义的字符,来组成字符串,用以描述一定的字符串规则,比如:重复,位置等,来表达某类特定的字符串,进而匹配。

  • 学习目标

  1. 熟练掌握正则表达式元字符

  2. 能够读懂常用正则表达式,编辑简单的正则规则

  3. 能够熟练使用re模块操作正则表达式