Python 练习册，每天一个小程序 :-)

大神能否指点一下，我昨天刚入门
正则截取内容不会
下面这个例子我需要截取"啊啊啊"这个内容出来怎么获取不到呢

import re
html = 'www啊啊啊，呵呵，哈哈，嘿嘿'
counts = re.findall(r'"www(.*)，呵呵，哈哈，嘿嘿', html)

print counts[1]

raw_input()

realityone

2014-12-16 19:28:02 +08:00

@jookr 刚入门哪有这么跳内容的。。
counts = re.findall(r'www(.*)', html)
正则入门吧。。

jookr

2014-12-16 19:30:35 +08:00

中文的逗号匹配结尾会提示错误怎么办

jookr

2014-12-16 19:40:30 +08:00

@realityone 谢谢
但是你的代码会获取整个www后面的内容，不能只截取出"啊啊啊"

import re
html = 'www啊啊啊，呵呵，哈哈，嘿嘿'
#counts = re.findall(r'"www(.*),呵呵，哈哈，嘿嘿', html)
counts = re.findall(r'www(.*)', html)
get_content = counts[0]

print get_content.decode('utf-8').encode('cp936')

jookr

2014-12-16 19:50:52 +08:00

自己解决了

# -*- coding: utf-8 -*-

import re
html = 'www啊啊啊，呵呵，哈哈，嘿嘿'
#counts = re.findall(r'"www(.*),呵呵，哈哈，嘿嘿', html)
counts = re.findall(r'www(.*?)，(.*?)，(.*?)，', html)
get_content = counts[0]

#print get_content

for i in get_content:
print i.decode('utf-8').encode('cp936')