1
meteor2013 2014-01-14 10:15:00 +08:00
是不是要回复好几个贴才会出现标签?
只有主题就不会出现? |
2
Livid MOD OP @meteor2013 主题第二次 load 的时候就会有标签。
|
5
meteor2013 2014-01-14 10:16:59 +08:00
jieba是中文分词,有没有英文的分词的打标签的东东?
|
6
Livid MOD OP 一个副作用就是,由于初始化过程比较慢,每次我们部署完新代码之后,你可能会看到大概 5 秒的 Bad Gateway 500。
|
7
meteor2013 2014-01-14 10:19:28 +08:00
@Livid 第二次load已经看到标签了,但是这个标签要是可以根据大家的回复,还有回复内容的频率改变就牛逼了。
|
10
est 2014-01-14 10:21:57 +08:00
@Livid 不如可以针对用户 id 打标签。我觉得很有意思啊。。哈哈。比如某某谁吹过牛,招过人,创过页,做过什么东西,看tag一下子就知道了。
|
12
gotounix 2014-01-14 10:22:38 +08:00
很赞的功能啊!大爱!!!
|
13
Livid MOD OP |
14
Livid MOD OP 接下来还可以有的几件好玩的事情:
* 构建一个所有单词的标准拼写库,比如 v2ex -> V2EX,ssl -> SSL,simcity -> SimCity * 挖掘一下数据量更大的回复数据 |
15
westy 2014-01-14 10:31:10 +08:00
标签位置很奇怪,会让人觉得是评论的标签。
|
19
botao1 2014-01-14 10:43:54 +08:00 1
|
20
mkeith 2014-01-14 10:44:48 +08:00
标签和主题放到一起吧,和回复在一起怪怪的啊。
|
21
xiaojay 2014-01-14 10:45:04 +08:00
分词 然后用 TF-IDF ?
|
24
nemoliu 2014-01-14 10:49:26 +08:00
能介绍一下计算的过程么?对标题分词然后根据tf-idf做关键词提取?
|
25
Livid MOD OP |
26
FarBox 2014-01-14 11:04:51 +08:00 1
中文词典应该都是接近的。如果有更好的,同求。 :)
我们原来有尝试用jieba+mongodb做全文检索,但试了下,性能很糟糕,没有办法用在生产环境。 最后选择用ElasticSearch作为纯粹的分词+索引的中间库,也算一种奇葩的用法;不过效果还挺不错的。 |
27
dorentus 2014-01-14 11:07:26 +08:00 2
|
28
mopig 2014-01-14 11:07:45 +08:00 1
http://v2ex.com/tag/tooyoung
不存在的 tag 会报错~ |
29
Superoutman 2014-01-14 11:09:18 +08:00
非常赞同19楼 @botao1 的提议。
|
30
ryon 2014-01-14 11:12:01 +08:00
tag和节点会不会有一定的重复?我们在设计的过程中也考虑过类似的问题,后来最终考虑还是采用节点,相比之下自动计算出来的tag可能很多情况下利用率不高。
|
33
ayukun 2014-01-14 11:26:54 +08:00
和27楼想到一块了,放那里就挺好,还容易看见 ,刚刚找这个主题的表情费了好一会。可以考虑加淡彩
|
34
meteor2013 2014-01-14 11:27:32 +08:00 via iPhone
目前在iPhone 上看不到标签
|
35
dorentus 2014-01-14 11:32:42 +08:00
|
36
Livid MOD OP @dorentus 对,在一个主题刚发布的前 300 秒,那里会有 MOVE 和 EDIT 按钮。1800 秒之后,会有 APPEND 按钮。
|
38
xiaop 2014-01-14 11:47:33 +08:00
tag这个功能非常棒!如果能对tag做归类就更棒了
|
39
ayang23 2014-01-14 11:48:12 +08:00
jieba启动慢,费内存,貌似要在每个django线程里加载一份词典,简单的不如用mmseg
|
40
Mihuwa 2014-01-14 11:55:48 +08:00
很赞的功能。
|
41
SkyTodInfi 2014-01-14 11:55:49 +08:00
@livid 可以考虑有一个特定的标签库,毕竟tf-idf算出来的词比较杂乱,甚至一些是没有意义的
或者选定一些topic,包含一些特定的词语,文本只用jieba分词,打标签使用文本和topic之间的向量空间模型. |
42
wwqgtxx 2014-01-14 12:04:39 +08:00 via Android
移动平台呢?
|
43
cbsw 2014-01-14 12:29:36 +08:00
需要对一些特殊情况专门处理吧,比如 http://www.v2ex.com/t/96764#reply12 这里内容几乎就是代码, tag 分析出来的只有 print,outer,local 这些没啥意义的词(PS:V2EX 内部链接是怎么写的来着?)
|
44
Sunya 2014-01-14 13:48:11 +08:00
放 点击 收藏 那个 topic_buttons 区域会好点, 这样看起来会更让人觉得跟主题相关.
标签用自定义+分词相结合的会不会更好一点. 有些词未必已经收录了. |
45
xiaop 2014-01-14 13:51:53 +08:00 via iPad
@SkyTodInfi 赞同
|
46
gihnius 2014-01-14 14:02:54 +08:00
觉得对主题内容做 tag 已经没有什么意义,因为可以 google.
而且, 打开 tag 之后你会看到很多看过的内容. 最好能对用户做 tag, 当然也是基于用户的内容, 这样其它用户可以根据某个用户的 tag 决定是否关注这个用户的内容. |
47
mozii 2014-01-14 14:06:36 +08:00
@Livid dorentus 赞设计师的直觉。补充个理由:需要变迁基本会是在看完这篇帖子之后,所以出现在末尾是恰当的,标签相当于对该帖子的延伸、补充、互动(这岂不就是回复的实质?),从此点来看,放在回复的这个卡片里,在人们需要的时候进入视野,是好的设计。
|
48
mozii 2014-01-14 14:25:52 +08:00
变迁 == 标签
|
49
ipconfiger 2014-01-14 15:11:30 +08:00
@Livid
-------------------------- 一个副作用就是,由于初始化过程比较慢,每次我们部署完新代码之后,你可能会看到大概 5 秒的 Bad Gateway 500。 -------------------------- 这个应该是可以避免的吧 |
50
runninghack 2014-01-14 15:15:45 +08:00
可以分享一下词库和停词表吗?
|
51
rwx 2014-01-14 15:20:53 +08:00
类似首页的「最热节点」一样,放在屏幕的右侧,比如用户数据的下面,做成标签云
还能防止某个主题标签过多把样式撑破 |
52
sobigfish 2014-01-14 15:24:48 +08:00
会提供关注某些tag的功能么?
/tag/iOS |
53
isaced 2014-01-14 15:31:38 +08:00
赞同27楼的换个位置~
|
54
xdata 2014-01-14 16:24:41 +08:00
标签能显示与该标签相关联的标签,按数量或拼写排序,并多重过滤么?
|
55
mimzy 2014-01-14 16:43:35 +08:00
没有回复的主题标签样式不太一样:
|
56
mopig 2014-01-14 17:24:53 +08:00
分词有硬伤啊~
|
57
xiaojay 2014-01-14 17:38:08 +08:00 via iPhone
期待根据tag来block
|
58
sobigfish 2014-01-14 17:38:45 +08:00
|
59
Seita 2014-01-14 17:46:06 +08:00
tag 页 不分页?
|
60
xiaoyustudio 2014-01-14 19:43:06 +08:00
传完图发现跟 27 楼想到一块去了...
|
61
Perry 2014-01-14 19:49:51 +08:00
我不得不说这个功能真的好给力!
|
62
Tianpu 2014-01-14 21:52:42 +08:00
觉得自动分的标签一点不好 还不如不分 虽然没有更好的思路
相信用户 让用户自己输入标签呢? |
63
geeklian 2014-01-14 21:55:16 +08:00
建议取消二手市场的tag...
我关注ipad,关注kindle,结果看到的都是二手的... |
64
faceair 2014-01-14 21:55:29 +08:00
|
65
jiangrongyong 2014-01-15 00:32:15 +08:00
根据之前的理解,Topic和Tag应该是多对一的关系吧?现在是多对多么?
|
66
caomu 2014-01-15 00:35:32 +08:00
关于用户来打标签,可以扣财富值来打。
具体点,lz可以花100铜换掉一个已有的tag。然后,自动生成tag时,如果算出的关联度不高,就不要默认3个了(有时候就会出现不太对应的),这时候,如果tag没有满,那么其他会员可以用500铜打上个新tag。 |
67
ong 2014-01-15 01:47:13 +08:00
非常酷!Great Job!
|
68
xdata 2014-01-15 18:10:36 +08:00
话说 macbook air 与 ipad air 都被打上了air ...
|
71
blakefan 2014-03-04 10:46:38 +08:00
这个功能主要就为新手设置的,觉得很好!
|