インテル® DAAL プログラミング・ガイド
ライブラリーは、相関ルールマイニング用の Apriori アルゴリズム [Agrawal94] を提供します。
I = {i1, i2, …, im} をアイテムのセット (積)、サブセット T⊂I はアイテムセット I と関連付けられたトランザクションとします。相関ルールは X⇒Y になります。ここで、X⊂I、Y⊂I、X と Y の交差領域は空です: X∩Y=Ø。左辺のアイテムセット (itemset) X はルールの antecedent と呼ばれ、右辺のアイテムセット Y はルールの consequent と呼ばれます。
D = {T1, T2, …, Tn} を、それぞれアイテムセット I と関連付けられたトランザクションのセットとします。D のトランザクションの s パーセントが X を含む場合、アイテムサブセット X⊂I はトランザクション・セット D の支持度 s を含みます。
X を含む D のトランザクションの c パーセントが Y も含む場合、トランザクション・セット D の相関ルール X⇒Y の信頼度は c になります。ルールの信頼度は次の条件付き確率で表すことができます。
confidence(X⇒Y) = support (X∪Y)/support(X)
トランザクションのセット D = {T1, T2, …, Tn} で、最小支持度 s および最小信頼度 c で s よりも大きな支持度のすべてのアイテムセット X を発見し、c よりも大きな信頼性のすべての相関ルール X⇒Y を生成します。
そのため、相関ルールの発見は、マイニング (訓練) と発見 (予測) の 2 つの段階に分かれます。マイニング段階には、ラージ・アイテム・セットの生成、つまり指定されたパラメーターよりも大きな支持度を含むセットの生成が含まれます。発見段階で、アルゴリズムは、マイニング段階で識別したラージ・アイテム・セットを使用して相関ルールを生成します。