|
Nel corso degli anni la necessità di trattare masse di dati sempre più grandi,
la velocità sempre crescente con cui questi venivano immagazzinati, e la
necessità di studiare questa enorme massa di dati, ha portato alla nascita
di un nuovo ramo dell'Informatica. Si tratta del Data Mining, cioè dello
studio di dati e conseguente estrazione da questi di informazioni prima non
note e comunque non esplicitamente rilevabili dai dati stessi.
Io sono uno studente universitario, approcciandomi alla materia ho riscontrato
l'esigenza di ampliare la conoscenza fornitami dai miei professori. In più,
per molti amici è stato evidente, nonchè per me, è stata evidente la
difficoltà nell'approccio ai singoli argomenti del DataMining.
Da qui è nata una ricerca approfondita dei contenuti trattati che mi ha
portato a recuperare molto materiale. Questo comprende gli articoli scientifici
dei creatori delle singole metodologie studiate, le lezioni di corsi universitari
in formati vari -PDF, PPT,....
Vista la mole di dati e la necessità di ordinarli, insieme alla presenza di un
filo conduttore fornito dai miei studi, ho deciso di sintetizzare tutto questo
materiale per potermi essere d'aiuto in futuro. Poichè molti amici e colloghi
mi hanno chiesto lo stesso materiale, e pensando che da qualche parte ci possa
essere qualcuno che ne ha bisogno, ho pubblicato questo sito che contiene le
mie sintesi/traduzioni, e -ovviamente- il riferimento puntuale e puntiglioso
a dove poter reperire il materiale che ho trovato in rete.
Una nota doverosa è che tutto ciò che è scritto è opera esclusivamente mia
e non è stato rivisto o corretto da nessuno se non da me. Non fornisce materiale
completo di studi per affrontare un esame universitario, perchè non pretende
di essere una trattazione completa e professionale di un argomento così
vasto -come detto prima- e quanto mai in continuo aggiornamento.
Buon Lavoro,
Sandro Gallo.
|
Introduzione
Regole di Associazione e Algoritmo A-priori
Miglioramenti Apriori
Park Chen Yu
Estensioni Iceberg
Algoritmi Randomizzati
Basso Supporto - Alta Confidenza
Min-Hashing e k-min-hashing
Locality Sensitive Hashing
Page Rank
Hub and Authority
Web Mining e DICE
Book and Authors
Clustering
BFR e k-means
FastMap
BIRCH
CURE
Antipole Clustering
Sequence Matching
HMM
Episode Mining
Alberi Decisionali
Ricerca in Database Strutturati
OLAP
Mysql Internals and Berkeley DB
|