MultiDendrograms is een eenvoudige maar krachtige toepassing om de hiërarchische clustering van echte gegevens, gedistribueerd onder een open source licentie & nbsp;. Vanaf een afstand (of gewichten) matrix, berekent MultiDendrograms haar dendrogram met behulp van de meest voorkomende agglomeratieve hiërarchische clustering algoritmen , kan de afstemming van veel van de parameters grafische weergave, en de resultaten kunnen gemakkelijk worden geëxporteerd naar een bestand. Een samenvatting van de kenmerken:
- Multiplatform: ontwikkeld in Java, draait op alle besturingssystemen (zoals Windows, Linux en MacOS).
- Grafische gebruikersinterface: data selectie, hiërarchische clustering opties, parameters dendrogram vertegenwoordiging, navigatie over de dendrogram, afwijking maatregelen.
- Hiërarchische Clustering algoritmes geïmplementeerd: variable-groep Single koppeling, complete koppeling, gewogen gemiddelde, gewogen gemiddelde, gewogen zwaartepunt, Gewogen zwaartepunt en Joint tussen-in.
- Vertegenwoordiging parameters: grootte, oriëntatie, labels, assen, etc.
- Afwijking maatregelen: Cophenetic correlatiecoëfficiënt Genormaliseerde Mean Squared Error en Genormaliseerde Mean Absolute Error.
- Export: ultrametric matrix, dendrogram informatie in tekst en Newick boom formaten.
- Perceel: dendrogram afbeelding in JPG, PNG en EPS formaten.
MultiDendrograms voert de variabele-groep algoritmen in de niet-uniek probleem gevonden in de standaard pair-groep algoritmen en implementaties oplossen. Dit probleem ontstaat wanneer twee of meer minimale afstanden tussen verschillende clusters gelijk tijdens de samenvoeging proces. De standaardbenadering bestaat in het kiezen van een paar, breken de band tussen afstanden, en verloopt op dezelfde wijze tot de laatste hiërarchische indeling wordt verkregen. Echter, verschillende clusters zijn mogelijk afhankelijk van het criterium voor de band te breken (gewoonlijk een paar wordt enkel willekeurig gekozen!).
De variabele-groep algoritmes groep meer dan twee clusters tegelijk waarop banden optreden, geleid tot een grafische representatie genoemd multidendrogram. Hun belangrijkste eigenschappen zijn:
- Wanneer er geen banden, de variabele-groep algoritmen geven dezelfde resultaten als het paar-groep degenen.
- Ze geven altijd een uniek bepaald oplossing.
- In de multidendrogram representatie van de resultaten kan men expliciet waarnemen het optreden van de banden tijdens de agglomererend proces. Bovendien is de hoogte van eventuele fusie interval (de banden in het programma) geeft de mate van heterogeniteit in de bijbehorende cluster
Eisen .
- Java 2 Standard Edition Runtime Environment
Reacties niet gevonden