List/Python
정규표현식 정리
LF0827
2015. 3. 19. 06:40
출처 : https://wikidocs.net/1642
[*] 간단하게 문자열에서 16진수값을 얻는 정규표현식
[*] 자주 사용되는 표기법
\d
- 숫자와 매치,[0-9]
와 동일한 표현식이다.\D
- 숫자가 아닌것과 매치,[^0-9]
와 동일한 표현식이다.\s
- whitespace 문자와 매치,[ \t\n\r\f\v]
와 동일한 표현식이다. 맨 앞의 빈칸은 공백문자(space)를 의미한다.\S
- whitespace 문자가 아닌것과 매치,[^ \t\n\r\f\v]
와 동일한 표현식이다.\w
- 문자+숫자(alphanumeric)와 매치,[a-zA-Z0-9]
와 동일한 표현식이다.\W
- alphanumeric이 아닌 문자와 매치,[^a-zA-Z0-9]
와 동일한 표현식이다.
[*] 반복
- '*' : 바로 이전의 문자가 0번 이상 반복 == {0, }
- '+' : 바로 이전의 문자가 1번 이상 반복 == {1, }
- {m, n} : m번 이상 n번 이하 반복
example) ap{2}le -> p가 반드시 두 번 반복
[*] '?'
ap?le : 물음표 자리는 있어도 되고 없어도 됨 {0, 1}과 같은 의미
[*] 정규식 검색
이제 컴파일 된 패턴 객체를 이용하여 검색을 수행 해 보자.
컴파일 된 패턴 객체는 다음과 같은 4가지 메쏘드를 제공한다.
Method | 목적 |
---|---|
match() | 문자열의 처음부터 정규식과 매치되는지 조사한다. |
search() | 문자열 전체를 검색하여 정규식과 매치되는지 조사한다. |
findall() | 정규식과 매치되는 모든 문자열(substring)을 리스트로 리턴한다 |
finditer() | 정규식과 매치되는 모든 문자열(substring)을 iterator 객체로 리턴한다 |