关联规则标签 Associator
关联标签页的界面就更简单了,算法也少,其中最有名的算法就是Apriori算法。可以通过点击算法的选择框来配置Apriori算法查找的规则的 最小支持度和最小置信度。查找的规则如下形式:
1. outlook=overcast 4 ==> play=yes 4 conf:(1)第一个数字4表示符合条件的实例数目,第二个数字4表示对应的关联规则也为真的数目,4÷4=1,所以上面这条规则的置信度为1即 conf:(1)。
属性选择标签 Select Attributes
很多时候我们获取的样本中并不是每个属性都对分类或预测起作用。比如预测机票的价格,航程、舱位和季节都是很重要的属性,而机票的经销商是谁则对价格的影响很小。为了避免我们的算法被无关的属性影响,找出对结果影响最大的属性而过滤掉对结果没影响的属性是很必要的。属性选择标签就是用来挑选出那些重要属性的。其中最著名的算法当属1R算法了。1R算法根据单个属性的规则进行预测,使误差值最小,并且根据误差值排序。
视图标签 Visualize
Visualize面板可以帮助用户可视化一个数据集,它显示的是每对属性的一个二维散点图,可以放大显示。