インテル® DAAL プログラミング・ガイド

詳細

ライブラリーは、相関ルールマイニング用の Apriori アルゴリズム [Agrawal94] を提供します。

I = {i1, i2, …, im} をアイテムのセット (積)、サブセット TI はアイテムセット I と関連付けられたトランザクションとします。相関ルールは XY になります。ここで、XIYIXY の交差領域は空です: XY=Ø。左辺のアイテムセット (itemset) X はルールの antecedent と呼ばれ、右辺のアイテムセット Y はルールの consequent と呼ばれます。

D = {T1, T2, …, Tn} を、それぞれアイテムセット I と関連付けられたトランザクションのセットとします。D のトランザクションの s パーセントが X を含む場合、アイテムサブセット XI はトランザクション・セット D の支持度 s を含みます。

X を含む D のトランザクションの c パーセントが Y も含む場合、トランザクション・セット D の相関ルール XY の信頼度は c になります。ルールの信頼度は次の条件付き確率で表すことができます。

confidence(XY) = support (XY)/support(X)

トランザクションのセット D = {T1, T2, …, Tn} で、最小支持度 s および最小信頼度 cs よりも大きな支持度のすべてのアイテムセット X を発見し、c よりも大きな信頼性のすべての相関ルール XY を生成します。

そのため、相関ルールの発見は、マイニング (訓練) と発見 (予測) の 2 つの段階に分かれます。マイニング段階には、ラージ・アイテム・セットの生成、つまり指定されたパラメーターよりも大きな支持度を含むセットの生成が含まれます。発見段階で、アルゴリズムは、マイニング段階で識別したラージ・アイテム・セットを使用して相関ルールを生成します。