본문 바로가기

List/Python

정규표현식 정리

출처 : https://wikidocs.net/1642



[*] 간단하게 문자열에서 16진수값을 얻는 정규표현식



[*] 자주 사용되는 표기법

    • \d - 숫자와 매치, [0-9]와 동일한 표현식이다.
    • \D - 숫자가 아닌것과 매치, [^0-9]와 동일한 표현식이다.
    • \s - whitespace 문자와 매치, [ \t\n\r\f\v]와 동일한 표현식이다. 맨 앞의 빈칸은 공백문자(space)를 의미한다.
    • \S - whitespace 문자가 아닌것과 매치, [^ \t\n\r\f\v]와 동일한 표현식이다.
    • \w - 문자+숫자(alphanumeric)와 매치, [a-zA-Z0-9]와 동일한 표현식이다.
    • \W - alphanumeric이 아닌 문자와 매치, [^a-zA-Z0-9]와 동일한 표현식이다.


[*] 반복 

    • '*' : 바로 이전의 문자가 0번 이상 반복  == {0, }
    • '+' : 바로 이전의 문자가 1번 이상 반복  == {1, }
    • {m, n} : m번 이상 n번 이하 반복
      example) ap{2}le -> p가 반드시 두 번 반복


[*] '?'

ap?le : 물음표 자리는 있어도 되고 없어도 됨 {0, 1}과 같은 의미



[*] 정규식 검색

이제 컴파일 된 패턴 객체를 이용하여 검색을 수행 해 보자.

컴파일 된 패턴 객체는 다음과 같은 4가지 메쏘드를 제공한다.

Method목적
match()문자열의 처음부터 정규식과 매치되는지 조사한다.
search()문자열 전체를 검색하여 정규식과 매치되는지 조사한다.
findall()정규식과 매치되는 모든 문자열(substring)을 리스트로 리턴한다
finditer()정규식과 매치되는 모든 문자열(substring)을 iterator 객체로 리턴한다


'List > Python' 카테고리의 다른 글

import random  (0) 2015.06.17
lsm.py  (0) 2015.06.09
Mail 보내기  (0) 2015.04.30
pattern생성 및 offset 확인  (0) 2015.03.31
string 모듈  (0) 2015.03.20