Mostrando postagens com marcador regex. Mostrar todas as postagens
Mostrando postagens com marcador regex. Mostrar todas as postagens

terça-feira, 7 de setembro de 2010

localizar o indice inicial e o indice final de uma palavra em uma string.

texto = 'eu estou fazendo um teste'

pattern = 'fazendo'

for match in re.finditer(pattern, texto):
    ini = match.start()
    fin = match.end()
    print 'a palavra "%s" se encontra entre o indice inicial [%d]  e indice final [%d]' \
          % (texto[ini:fin], ini, fin)


a palavra "fazendo" se encontra entre o indice inicial [9]  e indice final [16]

domingo, 22 de agosto de 2010

dividir uma string a partir de letras maiúsculas.

>>> re.findall('[A-Z][^A-Z]*', 'EuEstouFazendoUmTeste')

9: ['Eu', 'Estou', 'Fazendo', 'Um', 'Teste']

quarta-feira, 11 de agosto de 2010

python - regex - todas as não palavras são delimitadores exceto o ponto.

>>> import re
>>> a = "o-famoso google.com"
>>> re.findall(r'[\w:.]+',a)

23: ['o', 'famoso', 'google.com']

segunda-feira, 9 de agosto de 2010

python - regex - localizar palavras que iniciam com determinada letra

re.findall(r'\bp[a-z]*', 'eu estou procurando por uma palavra')

['procurando', 'por', 'palavra']

domingo, 8 de agosto de 2010

pyrhon - regex - dividir o que contiver entre um delimitador

s = "estou fazendo um (teste) com o (re.split)"
s = re.split('[()]', s);

['estou fazendo um ', 'teste', ' com o ', 're.split', '']

sexta-feira, 6 de agosto de 2010

python - regex - remover palavras duplicadas de uma string

re.sub(r'(\b[a-z]+) \1', r'\1', 'vou vou remover palavras \
                                        duplicadas duplicadas')

'vou remover palavras duplicadas'

segunda-feira, 26 de julho de 2010

python - regex - separar números e letras de uma string

separar números e letras de uma string
a = 'abcd123 asdf13333 fdd00000 asdff111'


 re.split('(\d+)', a)

['abcd', '123', ' asdf', '13333', ' fdd', '00000', ' asdff', '111', '']

domingo, 27 de junho de 2010

python - regex - remover caracteres exceto números.

Removendo caracteres execeto números.

>>>> import re
>>> re.sub("\D", "", "sdfasdfasdf111sdfasdfasdfs")
'111'
\D qualquer caractere que não seja numero sera subistituido por "".