frequente modello di data mining è un problema elementare in molte applicazioni . Un tipico database transazionale - ad esempio un database che descrive il comportamento degli acquirenti su Main Street , per corrispondenza o online - contiene un enorme numero di set di elementi e rappresenta una sfida in termini di sviluppo di algoritmi efficienti e scalabili . Modello frequenti algoritmi di data mining noti come Apriori , Eclat e FP - crescita sono tra i più conosciuti .
Apriori Algoritmo
L'algoritmo Apriori , proposto per primo da Rakesh Agrawal e Ramkrishnan Srikant di IBM Almaden Research Center , nel 1994 , si basa sul principio che i set di elementi sono contati quando si verificano nelle transazioni . Il database viene sottoposto a scansione per trovare frequenti 1- set di elementi , il 1 - set di elementi vengono utilizzati per generare 2- set di elementi e così via fino al k- set di elementi . A k - itemset è detto di essere frequenti se e solo se tutti i suoi subitemsets sono frequenti. Da quando è stato proposto , numerosi miglioramenti all'algoritmo Apriori sono stati suggeriti
FP - crescita Algoritmo
L'algoritmo FP - crescita - . FP sta per "Pattern frequente " - impiega una tecnica nota come l'algoritmo esegue la scansione del database per creare un elenco di elementi frequenti in ordine decrescente , che utilizza per comprimere il database in un FP -tree "divide et impera ". . La FP - albero stesso è estratto , iniziando con ciascuna frequenti lunghezza - 1 pattern - noto anche come un pattern suffisso - creare un condizionale FP -tree , che contiene prefissi corrispondenti articoli che co- verificarsi con il pattern suffisso iniziale. Il modello di suffisso iniziale è concatenato con i pattern frequenti trovati nel condizionale FP -tree per raggiungere una crescita pattern.
Eclat Algoritmo
Apriori e algoritmi FP -growth miniera pattern frequenti da un insieme di operazioni disposte orizzontalmente. L'algoritmo di Equivalenza classe Transformation ( Eclat ) - proposta da Mohammed J. Zaki , un professore di informatica presso il Rensselaer Polytechnic Institute , nel 2000 - d'altra parte , le miniere frequenti modelli in una serie di operazioni disposte verticalmente . L'algoritmo Eclat inizia con un singolo elemento e utilizza una intersezione di set per determinare i set di elementi frequenti e si ripete fino a quando nessun altro set di elementi frequenti possono essere trovati .
software © www.354353.com