V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  mrfox  ›  全部回复第 8 页 / 共 16 页
回复总数  317
1  2  3  4  5  6  7  8  9  10 ... 16  
今天有个新想法,关于生成词库界面:
是否可以考虑过滤区筛选单词处二分窗格,左侧为待筛选的单词,五个一行(这样比较好定位和计算数量)
右边初始时是空的,在左边 X 掉的单词放到右边窗格,这样的话不管怎么分(大部分认识挑生词或是反过来)
都可以将词汇分成两部分,这两个窗格各有一个保存按钮即可,保存完了自己再去合并
而且即使有的单词挑错了,等到光标浮上去的时候确认是挑的问题的话,还可以在右边窗格点 X 恢复回左边
供参考
@async10 明白了
尝试处理这个字幕,没有提取到词汇
https://subhd.tv/a/538897
其中的英文 srt
@async10 不是这样的,词库合并已经在用
初期因为这个熟词库得循序渐进地搞,想用软件中的光标浮上去显示词义确认(这个很好用,赞)
比如现在弄了个 2k 的基础,之后从某个字幕生成,可能一次出来几百个单词,这几百个单词
里有少部分是不认识的,需要挑出来;理想方式是
在过滤结果的窗口:( BTW 这个窗口无法最大化,显示内容也不能用翻页键或上下键只能鼠标滚动不方便定位
最好是能一页显示多少,比如 4x5 共 20 个,当前处理的有 x 掉的单词也不刷新即不补新单词进来,之后用翻页键
翻到下一个 20 个继续处理直到完成)
看一遍单词,不确认的就浮动上去,确为生词就 x 掉(追加生),剩下的就可以追加到熟词库了
就是你说的合并词库的功能,之后再对相同字幕用追加完成的生成一次,出来的就是纯生词了
后续等个人熟词库基本完成后,再过滤生成时就是 x 掉熟词(追加熟)
说得有点啰嗦,其实就是想把一次筛选的结果生熟两部分都能保存下来
如果有一个选项,指定本次筛选将 x 掉的单词追加到哪个词库最佳
如果不能的话,优化一下筛选界面会更好用
总结:
1. 过滤词库那里加一个当前处理去掉的单词追加到“选择词库”的功能
2. 优化过滤单词翻页刷新方便定位和键盘处理
可否增加将词库转换为单词文本的功能,目前已经生成了一个熟词库,用它来过滤新字幕
出来的单词还有不少熟词,所以希望(在增加保存本次 x 掉的单词追加到熟词库的功能前)
加一个保存当前过滤结果至 txt 单词列表的功能,比如在现在的从字幕生成词库窗口的保存
按钮左侧加一个保存为 txt 的按钮?
@async10 lz 神速!
下载了个字幕尝试,格式如下:
62
00:05:01,445 --> 00:05:03,851
No, no, no, no.
It's not like that.
从字幕生成词库一直在转圈,试了两台( windows )均如些
@async10 感谢回复,期待下一次更新;嗯,实验时已经用熟悉的词生成了一词库进行过滤,点的那几十下是想把 x 掉的词留下来,方便下次过滤(有些停止词什么的没放到熟词里,x 掉时也很快也记不住有哪些词),因为目的是找出生词学习,所以要是逐篇重复标记的话有些费时间,建议 x 掉的词能单独保存或追加
总之,很赞的功能,非常棒!
测试了下从文档生成词库,选中一个 txt ,点开始,出现了一堆单词,好像说点 x 是去掉熟词对吧,于是乎,点掉了,但是它们去哪了,点一下词形还原又出现了全部的词,岂不是白点了几十下? x 掉的不是应该也能保存(或追加)到一个词库以备下次过滤吗?还是每次都要重来?
疑惑中
很感兴趣但不太会用

从文档生成词库里有 选择词库,打开窗口格式是 词库

可这个词库格式是什么

比如我有一个已认识单词的列表的 txt ,能用吗
2019-11-28 17:01:43 +08:00
回复了 uTools 创建的主题 分享创造 一年过去了,那个叫 uTools 的怎么样了
两个问题求教:
1. 插件的字体大小能不能自定义
2. 双屏的时候能不能强制在扩展屏幕打开 utools
2019-11-26 20:11:55 +08:00
回复了 senghoo 创建的主题 分享创造 [开源] 我是如何使用自然语言处理背单词的。
@senghoo 谢谢回复

请问用的现成软件是爱英阅还是啥,感觉都大多不能很好地控制词表
2019-11-26 16:22:41 +08:00
回复了 senghoo 创建的主题 分享创造 [开源] 我是如何使用自然语言处理背单词的。
赞!
我有个建议不知 LZ 愿不愿意实现下,非常同意单词要在语境中学
已经实现用--自然语言处理的分词、词性分析、词性还原--这步是难点啊
所以能否扩展个功能:
对一篇英语文章,提取出所有单词,然后自己维护一个熟词表,程序输出所有生词?
即:
1、提取文章中的生词(这步我理解 LZ 已实现)
2、对照一个 TXT 熟词表(每行一个单词)提取出生词写到另一个 TXT 里


想到的可能会难但可先略过的问题也提及一下:
词组理论上也可以作为单词处理,不知对比的时候有没有增加很多难度
目前我找到的程序主要是单词还原上有问题,比如 don't aren't,自然语言处理不知有没有成熟的解决办法
另一个就是原文中两个单词中间有可能少了个空格连在一起被识别为一个词了,可能需要 AI 解决?
2019-09-11 21:33:39 +08:00
回复了 mrfox 创建的主题 OpenWrt 可以充电宝供电,能外接 USB 存储的 openwrt 路由该选啥
不会换节点,或许应该发到问与答?
2019-09-11 15:45:50 +08:00
回复了 mrfox 创建的主题 OpenWrt 可以充电宝供电,能外接 USB 存储的 openwrt 路由该选啥
专家们,请出手吧
2019-08-21 03:27:07 +08:00
回复了 kaler 创建的主题 分享创造 写了一个类似 vimium 的玩具程序
2019-08-16 23:54:24 +08:00
回复了 fabsnail 创建的主题 分享创造 袋鼠存储 v1.2 正式支持独立组网
@fabsnail 是的,主要是没有任何提示,希望有个进度或报错,没 QQ 等有 TG 群再进,谢谢了
2019-08-15 16:39:47 +08:00
回复了 fabsnail 创建的主题 分享创造 袋鼠存储 v1.2 正式支持独立组网
试用了下,选择下载后没有任何提示,也无文件传下来,一个小小的 TXT 测试文件
2019-08-13 03:26:29 +08:00
回复了 mrfox 创建的主题 问与答 两台 PC 同步少量数据,什么方案方便(最好 firefox 相关)
@Sasasu 谢谢,这个需要邮件等方式通知对方吧,既然已经发邮件啥的,那。。。
2019-08-09 20:41:18 +08:00
回复了 mrfox 创建的主题 问与答 两台 PC 同步少量数据,什么方案方便(最好 firefox 相关)
去 pushbullet 官网,卡在安装 FF 插件上了,点击后就一直图标左右晃不进行下去了
1  2  3  4  5  6  7  8  9  10 ... 16  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2694 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 14:59 · PVG 22:59 · LAX 07:59 · JFK 10:59
Developed with CodeLauncher
♥ Do have faith in what you're doing.