分类 大数据、算法与AI 下的文章

我们经常有这样的需求:用户发送的消息是不是垃圾信息,某张图片是不是猫、狗等等。对于文本我们可以通过字符串匹配4:AC自动机 敏感词判断,使用杂:位图与布隆过滤器 布隆过滤器来检查。但是对于图片,我们通常需要训练一个分类模型来检测该图片是否是敏感图片。

- 阅读剩余部分 -

我们经常有这样的需求:判断一个订单是否存在,判断一个URL路径是否访问过。常规情况下我们可以将存在的订单ID或者已经访问过的URL做成集合,然后通过判断是否在集合中来确认是否存在或者是否访问过。那么我们也同样的可以想到通过hash算法将已存在的订单ID或者已经访问过的URL做映射到一个array的index上,通过检查对于index的值是否为true来判断是否存在。

- 阅读剩余部分 -