WordTabulator is bedoeld voor tekstanalyse. Met hulp van wordTabulator kunt u index van woord elementen gewonnen uit bepaalde tekst set te genereren. Word elementen kan zijn woorden, N-gram (van gedefinieerde grootte) of zinnen (syntagmes). Het programma kan teksten te verwerken in gewone 2-bytes codeert (ANSI), zoals in multibyte UTF-8-codering. Bronteksten worden gedefinieerd als een reeks van platte tekstbestanden of HTML / XML / SGML-documenten. In het laatste geval kan het programma de inhoud van markup filteren. Bovendien kunt u alleen gedefinieerd content binnen geselecteerde gekoppelde tags te verwerken. Of je kunt dat de inhoud van de verwerking over te slaan. Het omvat morfologie module voor Russische, drie verschillende formaten van de output index, drie verschillende soorten woord elementen (woorden, N-Gram en zinnen), de browser van de context, en ware alfabetische bestellen.
Software informatie:
Versie: 3.5
Upload datum: 15 Apr 15
Licentie: Gratis
Populariteit: 370
Maat: 2708 Kb
Reacties niet gevonden