Open Search Server (OSS) is een zoekmachine ontwikkelde software onder de GPL v3 open source licentie.
Gebouwd met behulp van de beste open source-technologieën beschikbaar, Open Search Server is een stabiele, high-performance stukje software. Het is zowel een moderne zoekmachine en een suite van high-powered full text search algoritmen.
Open Search Server draait op Windows 20xx / XP / Vista, MacOS X, Solaris en Linux + Java Virtual Machine.
OSS Engine
Deze add-on is een native library ontwikkeld in C ++, en een aanzienlijke impuls aan de capaciteiten van de Open Search Server. Dankzij een geoptimaliseerde native code, OSS Engine krijgt uitzonderlijke prestaties van Open Search Server. Verbeteringen zijn onder meer:
* Relevantie personalisatie biedt gigantische mogelijkheden
* Document indexatie is sneller door een orde van grootte
* Verbeterde responstijden
* Verhoogde aantal mogelijke gelijktijdige queries
OSS Engine werkt als een add-on voor Open Search Server op Linux, Solaris, Windows 20xx / XP / Vista en MacOS X of in 32 of 64 bits. Het wordt verspreid via de toekenning van een eigen licentie
Eigenschappen .
- Multi-talen indexeren. Documenten kunnen worden geïndexeerd in zestien talen -. Chinees, Deens, Nederlands, Engels, Fins, Frans, Duits, Hongaars, Italiaans, Noors, Portugees, Roemeens, Russisch, Spaans, Zweeds, Turks
- Multi-lingual analyzers snijd zinnen in woorden, dan lopen lemmatisering algoritmes op woorden op basis van de taal van het document (enkelvoud / meervoud, geslacht, geconjugeerde werkwoorden, enz.)
- De crawlers gaan door websites en bestandssystemen om snel en gemakkelijk op te bouwen uw index.
- Talloze document formaten worden ondersteund, zoals XML, HTML / XHTML, Adobe PDF, Microsoft Word, PowerPoint, OpenOffice, etc.
- De webinterface is opgebouwd rond de stroom die door de Zkoss kader. Het loopt met de belangrijkste Ajax browsers. Dit RIA-achtige interface is zo comfortabel om te gebruiken als die van een zware klant.
- Eenvoudige configuratie via een enkele XML-bestand, welke velden definitie en de indexering opties omvat.
- Snel integratie dankzij een XML-interface via HTTP queries (XML over HTTP).
Wat is nieuw in deze release:.
- Dit developer versie onthult nieuwe krachtige functies en een aantal bugfixes
- De screenshot-functie registreert automatisch screenshots van de webpagina's worden doorzocht.
- Zoek queries in staat zijn om het gebied terug te keren van de niet-opgeslagen velden.
- Negatieve filters zijn beschikbaar.
- De Web crawler is in staat om sitemap bestanden te volgen.
Wat is nieuw in versie 1.2.1-r987:
- Nieuwe functies:
- 3176150: tijd / datumstempel
- 3186042: uitschakelen niet wordt toegestaan (robots.txt)
- 3182953: Crawl URL uit een database
- 3182950: Patroon en uitsluiting lijst deactivable
- 3182097: toevoegen veld boost ondersteuning
- 3175585: Meer als deze functie
- 3169421: Japanse en Koreaanse support
- 3159477: Identificeer identieke webpagina's
- 3151757: Upgrade naar PDFBox 1.4.x
- 3141193: FTP / FTPS ondersteuning in de file crawler
- 3141192: SMB / CIFS ondersteuning in file crawler
- 3034238: Crawler kunnen inloggen in de beveiligde website
- 3011773: Voeg Quartz als scheduler dienst
- 3138603: Upgrade Tomcat naar versie 6.0.xx
- 3103055: Zet HTML-entiteiten
- 3087916: Upgrade naar PDFBox 1,2
- 3043692: Torrent Parser
- 3042488: Audio parser
- 2882260: Voeg een parser voor text / plain
- 3010010: RTF parser
- 3038733: Voeg een grind filter
- 3036262: Log beheer
- 3031800: Schema-interface
- 3031204: toevoegen Ngram support
- 3008440: Index replicatie
- 3026212: API en interface voor het document verwijderen
- 3023327: Sub domeinnaam extractie in Web Crawler
- 2820289: Database crawler
- 3019035: Neglight dynamische url terwijl kruipen
- 3017277: Laat wildcard query in de URL browser
- 3016491: Url exporteur
- 3016566: Monitoring API
- 3015939: Cluster instortende
- 2830490: Grootte van de index
- 3011847: Score toelichting
- 3008633: Mogelijkheid om de markering uit te schakelen
- 2997836: In de geretourneerde velden met extra velden van Meta tags
- 2997826: Mogelijkheid te indexeren alleen de opgegeven inhoud
- 2991252: Mogelijkheid om index binair bestand en toe te voegen aan een document
- 2982545: extraheren term frequentie informatie
- 2881385: API om de beschikbare indice halen
- 2887376: Enhancement voor de indexpagina dropping indexen
- 2881388: API naar de lijst / creëren / velden in een bepaald schema te wijzigen
- 2973374: Upgrade naar ZKoss 5.0.x
- 2970747: Upgrade Tomcat naar versie 6.0.26
- 2966139: Statistieken verloren wanneer OSS herstart
- 2964704: Upgrade naar Lucene 2.9.x
- 2958015: Voeg bron archief
- 2958005: Upgrade Apache HttpClient bibliotheek naar 4.0.1
- 2956498: Zorg voor een manier om de statistieken rapport sturen per e-mail
- 2953803: Upgrade naar PDFBox 1,0
- 2953802: Upgrade naar POI 3,6
- 2953575: Tekensetfilter detectie moet kijken naar meta http-equiv
- 2953524: Geef standaard karakterset voor parser
- 2929332: Faceting bericht instortende
- 2900462: Upgrade POI tot 3,5 voor xlsx en docs support
- 2900449: Upgrade PDFBox tot 0,8
- Bug fixes:
- 3178432: Verkeerde cron waarden in de scheduler
- 3104065: File crawler crashes met java.io.EOFException
- 3090248: Statistieken configuratie verloren wanneer het toevoegen van velden
- 3051308: wordt niet geïnterpreteerd
- 2881689: Requests.xml niet in slaagt om te draaien op een aantal Windows-platforms
- 3019491: NullPointerException & gt; op java.util.regex.Matcher
- 3017481: De webcrawler selecteert de gastheer in alfabetische volgorde
- 3015838: Web crawler probleem met UTF-8 BOM encoding
- 2993103: NoClassDefFoundError BouncyCastleProvider
- 2990960: trefwoord worden niet gemarkeerd in fragmenten
- 2982541: Phrase synoniemen genereren ongewenste woorden
- 2934214: Verschoven nadruk op snippet
Wat is nieuw in versie 1.2 Beta:.
- Meer dan 50 nieuwe functies en bugfixes werden toegevoegd
- Een index kan worden gerepliceerd op een externe server.
- Een n-gram filter en een kiezel filter bieden nieuwe mogelijkheden, zoals een ideeënbus, verkeerde spelling verdraagzaamheid, en geautomatiseerde onderwerp generatie.
- Een database crawler ondersteunen mee query's en externe bestanden toegevoegd.
- Een aantal verbeteringen aangebracht op het web crawler, zoals een URL exporteur, subdomein extractie, een uitsluitingslijst, handmatige kruipen, en een parameter filter.
- Een API en webinterface voor controle en toezicht werd toegevoegd.
- De nieuwe audio-parser biedt de mogelijkheid om index torrent, MP3 / MP4, OGG Vorbis, FLAC en WMA-bestanden.
Wat is nieuw in versie 1.1.2:
- Nieuwe functies:
- Voeg bron archief
- Lucene alleen lezen support
- Bug fixes:
- PHP API mislukken op sommige vraag met verkeerde xml tekens
- Probleem met statistieken aggregatie
- Sorteren functionnality lijken soort negeren bestellen
- Prestaties probleem met groot veld cache
- probleem met de prestaties van de webcrawler
- Negatieve waarde op webcrawler statistieken
- Gedrag probleem van de wildcard functie
- dubbel terug het veld in terug xml
Wat is nieuw in versie 1.1:
- synoniemen support
- Spellingcontrole ondersteuning
- Web crawler en file crawler
- Ondersteuning voor extra talen: Roemeens, Turks, Deens, Russisch en individuele Chinese karakters
- OpenDocument Format ondersteuning
- Beheer van verschillende indices binnen één instantie
Reacties niet gevonden