Software informatie:
Versie: 4.0
Upload datum: 3 Jun 15
Licentie: Gratis
Populariteit: 2
Sherlock Holmes is een universele zoekmachine, een systeem voor het verzamelen en indexeren van de tekstuele gegevens (tekstbestanden, webpagina's, etc), zowel lokaal als via het netwerk.
Eigenschappen .
- Verzamelt bestanden via HTTP of van lokale bestanden
- Parset tekstbestanden, HTML, PDF, en een aantal andere formaten met behulp van externe parsers (zoals MS Word en PostScript).
- Het hele systeem is modulair, zodat uw eigen gegevensbronnen of parsers toevoeging is gewoon kwestie van inpluggen in de juiste module (nou ja, meestal ook het schrijven ervan).
- Werkt goed in gemengde charset milieu.
- acht meerdere voorkomens van hetzelfde bestand (zelfs met kleine wijzigingen) een enkel document met meerdere URL's.
- Alles is zeer configureerbaar. U kunt filteren regels schrijven in een speciale taal die het mogelijk maakt om de configuratie variabelen tweaken afhankelijk van het document dat wordt verwerkt.
- Het zoeken van woorden, zinnen en boolean uitdrukkingen. Zoeken in bestandsnamen en links tekst.
- Proximity zoeken en de nabijheid weging van gewone zoekopdrachten.
- De erkenning van talen, eenvoudige integratie van stemmers en synoniem woordenboeken.
- Spellingcontrole gebaseerd op woord frequenties waargenomen in de geïndexeerde data, doorschemeren de gebruiker dat zijn vraag zou kunnen worden gespeld.
- Zoek resultaten omvatten context in elk document.
- Weegschalen goed op tientallen miljoenen documenten op een normale pc-hardware.
- User interface (de front-end) is volledig gescheiden van de rest van het systeem, waardoor het gemakkelijk aan te passen en ook om de zoekmachine te bedden in bestaande applicaties.
- Gedownloade bestanden en indices worden gecomprimeerd om ruimte te besparen.
Reacties niet gevonden