刚发现ismth能高亮敏感词了,过于强大。我刚开始自行搜集敏感词没几天,创业未半,中道崩殂,惨惨惨!
这几天正愁没坑挖,索性多说点。虽然目前ismth这功能还不完善,但是肉眼可见不久的将来敏感词将不再是个多大的困扰。在一个历史时期即将消亡的时候,简单分享一下我对贵站敏感词的研究,以作祭奠。
在我刚来灌水时,便小心的发帖询问我很有兴趣,可否收集整理一下敏感词。版大说你这个想法很危险,删帖了事。现在想来,版大可能过于小心了,收集整理敏感词,让大家得以规避,提高发帖效率,优化发帖感受,不是应该提倡的吗。
首先据我观察,贵站敏感词分为两类,一类是通用固定型,对所有人都一样;另一类是随机调整型,不同的人、不同的时刻,都有所不同。另外前几天我还发现,有些词m版发不出去的,用ismth就能发出去,这也属于随机调整型。而通用固定型也是会更新的,典型的比如躺平。
随机调整型不用多说,只提一种可能性是频繁大量发帖,或多次触发敏感词,会加严考核。比如我一向属于随机调整型极少的,但是清明前几天发帖过多,明显触发机率急剧增加。
通用固定型我将其分为以下几类。需要说明的是,以下提到的敏感词仅凭印象,未严格试验,可能不准确。
1.zz敏感。这个不用多说,包括某些主义、阶级等,最常见的应该是d.d。这里说一下部分敏感词连拼音都无法回避,这也是我为什么写d.d,不写全拼的原因。比较奇怪的是,司ma不行,但是司徒、司空可以。
2.zong教相关。这也是重灾区,比如佛是没问题的,但是fo教、基du教不行,fo祖好像也不行,不太确定。
3.负面情绪。包括不限于脏话、人身攻击等,这个因为说的少,不太好举例。为什说负面情绪,是因为懒得分太细,zi sha、qiang jian这些也被我归到这里面来。jian人我不知道可不可以,放在这里,是因为jian仁见智想不出为啥是敏感词,只能认为是谐音梗。对,部分敏感词还考虑了谐音梗。
4.se情。一度我看到满页面大熊、果体,感到很违和,觉得又要讨论又遮遮掩掩,后来才知道是因为敏感词。前一阵我发迪士尼的帖子,发现连小凶wei.ni(这个词我又试了七八遍,结果还和上次不一样)也不行,感觉过分了,不过不知道这个是不是我的随机敏感词。另外这部分还考虑了引申,比如shen入浅出也不行,应该还有类似的词汇。
总之,贵站敏感词虽说有些掩耳盗铃,也可以理解,通过简单cu暴的方式意图达到减少某类话题的目的,确实也想不到什么更好的方法。最好的当然是大家通过敏感词,体会到站方的良苦用心,共同打造安全、文明的交流环境。
--
修改:justff0 FROM 139.207.168.*
FROM 139.207.168.*