DataMining For Dummies


Nel corso degli anni la necessità di trattare masse di dati sempre più grandi, 
la velocità sempre crescente con cui questi venivano immagazzinati, e la 
necessità di studiare questa enorme massa di dati, ha portato alla nascita 
di un nuovo ramo dell'Informatica. Si tratta del Data Mining, cioè dello 
studio di dati e conseguente estrazione da questi di informazioni prima non 
note e comunque non esplicitamente rilevabili dai dati stessi.
Io sono uno studente universitario, approcciandomi alla materia ho riscontrato 
l'esigenza di ampliare la conoscenza fornitami dai miei professori. In più, 
per molti amici è stato evidente, nonchè per me, è stata evidente la 
difficoltà nell'approccio ai singoli argomenti del DataMining.
Da qui è nata una ricerca approfondita dei contenuti trattati che mi ha 
portato a recuperare molto materiale. Questo comprende gli articoli scientifici 
dei creatori delle singole metodologie studiate, le lezioni di corsi universitari 
in formati vari -PDF, PPT,....
Vista la mole di dati e la necessità di ordinarli, insieme alla presenza di un 
filo conduttore fornito dai miei studi, ho deciso di sintetizzare tutto questo 
materiale per potermi essere d'aiuto in futuro. Poichè molti amici e colloghi 
mi hanno chiesto lo stesso materiale, e pensando che da qualche parte ci possa 
essere qualcuno che ne ha bisogno, ho pubblicato questo sito che contiene le 
mie sintesi/traduzioni, e -ovviamente- il riferimento puntuale e puntiglioso 
a dove poter reperire il materiale che ho trovato in rete.
Una nota doverosa è che tutto ciò che è scritto è opera esclusivamente mia 
e non è stato rivisto o corretto da nessuno se non da me. Non fornisce materiale 
completo di studi per affrontare un esame universitario, perchè non pretende 
di essere una trattazione completa e professionale di un argomento così 
vasto -come detto prima- e quanto mai in continuo aggiornamento.
Buon Lavoro,
Sandro Gallo.

  • Introduzione
  • Regole di Associazione e Algoritmo A-priori
  • Miglioramenti Apriori
  • Park Chen Yu
  • Estensioni Iceberg
  • Algoritmi Randomizzati
  • Basso Supporto - Alta Confidenza
  • Min-Hashing e k-min-hashing
  • Locality Sensitive Hashing
  • Page Rank
  • Hub and Authority
  • Web Mining e DICE
  • Book and Authors
  • Clustering
  • BFR e k-means
  • FastMap
  • BIRCH
  • CURE
  • Antipole Clustering
  • Sequence Matching
  • HMM
  • Episode Mining
  • Alberi Decisionali
  • Ricerca in Database Strutturati
  • OLAP
  • Mysql Internals and Berkeley DB
  • Introduzione


    Google