DSTK - Data Science Toolkit 3 is een set data- en tekstmining-software, volgens het CRISP DM-model. DSTK biedt gegevensbegrip met behulp van statistische en tekstanalyse, gegevensvoorbereiding met behulp van normalisatie en tekstverwerking, modellering en evaluatie voor machine learning en statistische leeralgoritmen.
DSTK 3 biedt aantrekkelijke functies zoals Deep Neural Network (Deep Learning), Text Link Analysis met Visualizations, KMeans Clustering. Sommige van deze functies kunnen in een oudere versie worden gepresenteerd, maar omdat de algoritmen worden herschreven om het gebruik van externe bibliotheken zoals Weka te verminderen om de bestandsgrootte te verkleinen, hebben we meer tijd nodig om ze te ontwikkelen. DSTK Engine bevindt zich nog in de bètastadium, daarom kunnen er bugs en onnauwkeurigheden zijn.
DSTK 3 bestaat uit DSTK Engine, DSTK ScriptWriter, DSTK Studio en DSTK Text Explorer. DSTK Engine is R vereenvoudigd, met de nadruk op Data Mining. DSTK ScriptWriter biedt een GUI om een script te schrijven voor DSTK Engine. DSTK Studio biedt SPSS Statistics zoals GUI voor datamining en DSTK Text Explorer biedt een GUI voor Text Mining.
Vereisten :
Java Runtime Environment, Microsoft. Net Framework
Beperkingen :
10-gebruik-proef
Reacties niet gevonden