|  |      1jookr      2014-12-16 19:14:29 +08:00 大神 能否指点一下,我昨天刚入门 正则截取内容不会 下面这个例子 我需要截取"啊啊啊"这个内容出来怎么获取不到呢 import re html = 'www啊啊啊,呵呵,哈哈,嘿嘿' counts = re.findall(r'"www(.*),呵呵,哈哈,嘿嘿', html) print counts[1] raw_input() | 
|  |      2realityone      2014-12-16 19:28:02 +08:00  1 | 
|  |      3jookr      2014-12-16 19:30:35 +08:00 中文的逗号匹配结尾会提示错误怎么办 | 
|  |      4jookr      2014-12-16 19:40:30 +08:00 @realityone 谢谢 但是你的代码会获取整个www后面的内容,不能只截取出"啊啊啊" import re html = 'www啊啊啊,呵呵,哈哈,嘿嘿' #counts = re.findall(r'"www(.*),呵呵,哈哈,嘿嘿', html) counts = re.findall(r'www(.*)', html) get_content = counts[0] print get_content.decode('utf-8').encode('cp936') | 
|  |      5jookr      2014-12-16 19:50:52 +08:00 自己解决了 # -*- coding: utf-8 -*- import re html = 'www啊啊啊,呵呵,哈哈,嘿嘿' #counts = re.findall(r'"www(.*),呵呵,哈哈,嘿嘿', html) counts = re.findall(r'www(.*?),(.*?),(.*?),', html) get_content = counts[0] #print get_content for i in get_content: print i.decode('utf-8').encode('cp936') | 
|      6Bitex      2014-12-16 19:58:10 +08:00 | 
|      7Bitex      2014-12-16 20:03:07 +08:00 | 
|      80x5e      2014-12-16 21:52:42 +08:00 @realityone 哟西,好巧:-) | 
|  |      9R4rvZ6agNVWr56V0      2014-12-17 02:11:21 +08:00 fun | 
|  |      104everLoveU      2014-12-19 11:12:56 +08:00 好东西,不错,支持一下! | 
|      11mingyun      2015-01-11 20:28:59 +08:00 star |