什么时候选择异常检测?
正样本 ( y = 1 ) 的数量非常少
负样本 ( y = 0 ) 的数量非常多
有很多不同的异常,现有的算法不能从正样本中得知什么是异常,或未来可能出现完全没见过的异常情况。
例如金融欺诈,隔几个月或几年就有新的方式出现。
什么时候选择监督学习?
当正样本和负样本的数量非常多时。
有足够的正样本让算法学习到正样本什么样,且未来出现的正样本会和以前的类似。
例如垃圾邮件,大概率和从前的垃圾邮件类似。
各自的应用
异常检测
欺诈检测
制造业:发现从前没有的缺陷
控制数据中心的设备,黑客总会使用全新的方式入侵
监督学习
垃圾邮件分类
制造业:发现已知的,从前出现过的缺陷
天气预测
疾病分类