跨站点 通用 自定义屏蔽词插件的思路征集:有没有人做过/在维护?
这里想抛个砖引玉,讨论一个“提升信息密度”的小需求:跨站点的自定义屏蔽词/无意义回复过滤。
背景是我最近在 论坛/社交平台(X、B 站等)的评论区刷信息,经常会遇到一些“看起来很积极但信息量很低”的短回复,比如:
“干得漂亮”
“字数补丁”
(类似的:纯情绪/纯口号/纯复读,不带问题、不带细节、不带上下文)
这些内容本身不违规,但它们会把真正有价值的讨论“冲稀”,尤其是长帖/技术帖里想快速定位有效信息时很痛苦。
我自己在做一个本地过滤脚本(按关键词隐藏/折叠),但立刻遇到一个现实问题:每个站点 DOM 结构不一样,要做“精准隐藏评论块”就得为不同站点写不同的选择器/适配规则。于是我想问问大家:
1)有没有已经存在的成熟插件/方案?
能覆盖多种站点(Discourse、常见论坛、X、B 站评论等)
支持自定义关键词/正则
最好还能“识别评论容器”,尽量减少误伤、性能也别太差
我现在看到的要么是“单站点专用增强”,要么是“通用过滤但适配不稳定”,还没见到适用性很强、可长期维护的。
2)有没有人维护过 常用站点适配规则 + 屏蔽词 这种同步列表?
我设想的是类似:
一份可同步的“屏蔽词词库”(我个人维护/社区共建)
再配套一个“站点适配映射”(每个站点定义:评论块选择器、正文选择器、忽略引用/代码规则等)
插件定期拉取更新,做到“词库一次维护,多站点生效”
想请教:
这种东西社区里有人做过吗?有没有现成仓库/项目可参考?
如果要做成可共建的规则库,你们觉得规则怎么组织更合理?(按站点、按模块、按平台类型、还是按“评论系统类型”归类)
有没有更聪明的做法:比如通过可视化选取评论容器来生成规则、或用轻量启发式自动识别评论块结构,从而减少适配成本?
3)关于“信息质量”提升的边界
我不想一刀切把短评都干掉(比如有人一句话指出 bug 点其实很有价值)。你们会怎么设计“默认策略”?
只过滤明显模板化短语?
或者对短内容做折叠而不是删除?
允许每个站点单独调参(阈值、白名单关键词、只在技术区启用等)?
欢迎大家分享:
你们平时是怎么“净化信息流/评论区”的?
有无推荐的插件/脚本/规则集?
如果没有现成的,你们觉得做一个“常用站点适配+词库同步”的项目,最大难点会在哪?
先谢过各位,期待思路/链接/经验 如果大家有兴趣,我也可以把我目前的原型 整理出来供参考



这和我之前做灌水分析处理有些联系,但你这是从已有内容上处理的。关键词完全匹配可以是一点,若采用 AI 或接口的方式就会延长评论的加载时间,所以没有特别好的办法,能实现但总会有一些体验损失。
能提醒到我的是,我应该将评论的分析存到表上,往后若能提供评论的分数过滤显示可能是个不错的主意。