NCBI C ++ Toolkit biedt gratis, draagbare, openbaar domein bibliotheken zonder beperkingen te gebruiken. Het werkt op Unix, MS Windows en Mac OS-platforms:
ย ท Netwerken en Interprocess Communication (IPC) bibliotheek met iostream adapters
ย ท multithreading Bibliotheek
ย ท CGI en Fast-CGI Bibliotheek
ย ท HTML Generation Library
ย ท SQL Database Access Bibliotheek
ย ท C ++ wrapper-bibliotheek voor BerkeleyDB
ย ท C ++ iostream Adaptor / wrapper Bibliotheek
ย ท GZIP en BZ2 C ++ wrapper Bibliotheek met iostream adapters
ย ท ASN.1- en XML Serialization bibliotheek met C ++ Code Generator Tool (datatool)
ย ท Datum en tijd Bibliotheek
ย ท File System Functiebibliotheek
ย ท opdrachtregelargument, Configuratie en Milieu Processing Library
ย ท Sequence uitlijningsalgoritmen Bibliotheek
ย ท BLAST Engine Library
ย ท Biologische Sequences opzoeken en verwerken Bibliotheek
ย ท Portable FLTK en OpenGL gebaseerde GUI en grafische bibliotheken
Naast het bovenstaande, zijn er nog veel meer handige bibliotheken, zowel voor algemene doeleinden en biotech-gerelateerde die voortdurend worden ontwikkeld, onderhouden en gebruikt in real-life productie door honderden Web en stand-alone applicaties en hun programmeurs (ook meegeteld in honderdtallen).
Als je een C ++ ontwikkelaar vindt u het draagbare karakter van de bibliotheken zeer nuttig in het bouwen van cross-platform applicaties te vinden, zelfs als je niet veel interesse in Bioinformatica. Bibliotheken zoals die voor de CGI / snel CGI, HTML, Networking, SQL Databasetoegang, ASN.1 en XML serialisatie zijn vrij algemeen doel en kan worden gebruikt in een verscheidenheid van toepassingen buiten het Bioinformatics probleem domein.
De C ++ Toolkit ondergaat actieve ontwikkeling van de bibliotheken worden gebouwd elke nacht. De broncode is vrij beschikbaar via FTP en CVS. De documentatie voor de C ++ Toolkit is online beschikbaar in de NCBI Bookshelf formaat en ook als downloadbare boek in Acrobat PDF formaat
Wat is nieuw in deze release:.
< p>- HOOGTEPUNTEN:
- Geplaatst LDS2 (Local Data Storage v.2) dat is gebaseerd op SQLite3 heeft nieuwe functies en betere prestaties. Eveneens uitgevoerd LDS2 gegevens loader te LDS2 gebruiken uit de Object Manager.
- XmlWrapp -dit handige XML afhandeling API is meestal afgewerkt (en zelfs gepolijst) geweest.
- Implementatie van tunneling en autorisatie van HTTP-verbindingen en tunneling van secure sockets, via HTTP proxy's.
- CFormatGuess maakt nu onderscheid tussen GTF, GFF3 en GFF2. Het is een eventueel breken van verandering. Zie voor meer details hieronder.
- Uitgevoerd grote delen van CFeatTree, de klasse om functies gedefinieerd op een biologische sequentie in een hiërarchie die hun ouder-kind relaties weerspiegelt organiseren (op basis van de functie subtypes).
- CORELIB:
- Implementatie van locale-onafhankelijke omzetting van string naar verdubbelen en terug; veranderde kern libraries gebruiken.
- nstr :: Justify () - voor de opmaak van alinea's tekst .
- CNcbiApplication - maak FindProgramExecutablePath statisch, en robuuster; voeg een statische hoger niveau GetAppName methode. Kijk voor globale configuratie bestanden in meer gevallen.
- CMetaRegistry :: FindRegistry -. Nieuwe methode het blootstellen van de logica bepalen welk bestand (indien aanwezig) om te laden
- CEnvironmentCleaner -. Nieuwe klasse om ongewenste omgevingsvariabelen gooi
- CFileIO - terug naar oorspronkelijke gedrag:. Heb de file handle niet sluiten als het wordt toegewezen via SetFileHandle ()
- SERIAL:
- Serialization van AnyContent data objecten - vast te herkennen en correct proces attributen in hun waarden .
- Gecorrigeerd het lezen van XML-gegevens toewijzen aan een element standaard waarde wanneer het heeft geen inhoud.
- Ondersteuning voor reeksen van elementen, waarbij het element heeft een standaard waarde.
- DATATOOL:
- Gecorrigeerd code generatie:
- CHOICE gegevens objecten;
- binaire data types met attributen.
- Gecorrigeerd omzetting van dubbele soort waarden om meer significante cijfers te behouden.
- CONNECT:
- Toegevoegd keepalive socket optie (fSOCK_KeepAlive).
- Toegevoegd NCBI connectiviteit test (CConnTest).
- Hulpprogramma's:
- g_FindDataFile -. Nieuwe functie voor het zoeken van data-bestanden in (configureerbaar) standaard locaties
- CChecksumStreamWriter -. Nieuwe klasse aan checksum van de gegevens weggeschreven naar een stream te berekenen
- g_GZip_ScanForChunks () - nieuwe API, om gecomprimeerde stroom posities opvragen. Toegevoegd implementatie voor het verkrijgen van posities voor de gescheiden gzip-bestanden in aaneengeschakelde gzip bestand.
- Toegevoegd compressie / decompressie beek manipulatoren (include / util / comprimeren / stream_util.hpp).
- CFormatGuess (util / format_guess. {W / k} pp) bijgewerkt, met een eventueel breken van verandering. Het doel hiervan is om CFormatGuess te onderscheiden GTF, GFF3 en GFF2. Momenteel brokken al die formaten in een een 'eGtf' waarde. De oude 'eGtf' waarde (3) wordt vervangen door 'eGtf_POISONED', en zal niet meer worden geretourneerd. De nieuwe waarde voor 'eGtf' (21) zal een bestand dat moet worden gelezen met CGtfReader (objtools / lezers / gtf_reader.hpp) betekenen. De nieuwe waarde 'eGff3' (22) is voor de bestanden bedoeld om gelezen te worden met CGff3Reader (objtools / lezers / gff3_reader.hpp), en 'eGff2' (24) is voor de bestanden bedoeld om gelezen te worden met CGff2Reader (include / objtools / lezers /gff2_reader.hpp)
- BIO-objecten:
- CBioseq :: GetNonLocalId - Nieuwe methode om plaats sequenties uit FASTA bestanden met een bereik specificaties in meer context geïmporteerd helpen; verpakt door CBioseq_Handle :: GetNonLocalIdOrNull (ook nieuw).
- CSeq_id :: IdentifyAccession - Implementeren of verbeteren van erkenning voor meer voorvoegsels (GA, HH, HI, HO-HU, JA-JO, EAAA-EZZZ en IAA-IZZ, waarvan sommige overeenkomen met de nieuwe mogelijkheid van DDBJ TPA WGS gegevens) en mixed-in TPA eiwit toetredingen (meestal van EMBL, maar sommige van GenBank ook).
- Onderscheid WGS meester toetredingen door een nieuwe vlag beetje. Ontspan te strenge VOB erkenning logica.
- CSeq_id :: IsValidLocalID, CSeq_id :: ParseIDs -. Nieuwe functionaliteit voor het werken met platte tekst volgorde identifiers, meegenomen uit CFastaReader en enigszins gegeneraliseerde
- SSeqIdRange - Nieuw type (compleet met parser en on-the-fly & quot; iterator & quot;) voor het werken met Seq-id reeksen, zoals aanwezig in sommige FASTA defline bron modifiers .
- BIO-TOOLS:
- CFastaOstream - Optioneel accepteren aangepaste titels voor enkele sequenties. Tag negatieve-streng reeksen met toonaangevende 'c's.
- CFastaReader - Ondersteuning negatieve-streng reeksen en Sequin's compacte defline-stijl kloof syntax (?? & Quot; & gt; N & quot; waarin N een getal; of & quot; & gt; unk100 & quot;)
- COBALT:
- Toegevoegd command-line optie -num_domain_hits dat aantal beperkt geconserveerde domeinen per sequentie die wordt gebruikt bij het berekenen van alignmentconstraints.
- De fylogenetische bomen:
- Toegevoegd hoger level interface voor het berekenen van fylogenetische boom uit sequentievergelijkingen (bijvoorbeeld BLAST en kobalt resultaten). Klasse CPhyTreeCalc berekent fylogenetische boom, en CPhyTreeFormater drukt de boom in Newick en Nexus-formaat.
- BIO-objectbibliotheken:
- Uitgevoerd CheckNumRows () en andere methoden voor sparse uitlijningen.
- Om het geheugen voetafdruk te verkleinen: toegevoegde lees-haken aan geheugen gebruikt door optimalisaties na deserialisatie verminderen; Na-streng maakt nu gebruik van een byte van het geheugen waar mogelijk; Score.value keuze is nu ingebed in CScore.
- Capitalize toetreding in CSeq_id :: GetLabel ().
- BIO-OBJECT MANAGER:
- Toegevoegd getter methoden voor boolean velden in CTableFieldHandle.
- Toegevoegde GetBestGeneForFeat () op basis van CFeatTree.
- Uitgevoerd GetBestOverlappingFeat () op CFeatTree.
- Toegevoegd snel cscope :: GetTaxid ().
- Uitgevoerd in bulk te laden voor acc / ver, gi, etiket, en taxid.
- Toegevoegd lengte nul hiaten controleren om CSeqMap en CSeqVector.
- Uitgevoerd GetLength () en GetCoverage () voor obligaties plaatsen.
- Verbeteringen:
- Toegevoegd helper methode om CFeatTree vullen op locatie.
- versneld in kaart brengen van eenvoudige CSeq_loc_mix locaties in CFeat_CI.
- Strengere sorteren van functies in CFeat_CI om onduidelijkheden te voorkomen.
- CSeq_feat_Handle doorzetters nu werken met Seq-tafel beschikt ook.
- Seq-tafel functies ondersteunen nu multi-level gebruiker velden.
- Non Seq-prestatie Seq-tafels worden nu erkend, ook als zich in split brok.
- versneld CBioseq_Handle :: AddId ().
- Geoptimaliseerd cscope :: AttachXxx ().
- Ondersteuning splitsing van de naam annotatie.
- CSeqVector en CSeqVector_CI's CanGetRange () nu return false in plaats van het gooien van een uitzondering.
- Laat aan te geven hoe om te gaan met bestaande handgrepen in ResetHistory ().
- Geoptimaliseerd re-ouderschap als er meer functies worden toegevoegd aan CFeatTree.
- Mogelijkheid toegevoegd om cscope creatie / verwijderen debuggen.
- Veel veranderingen in de C ++ opruimen functionaliteit aan de cleanup functionaliteit die al bestaat in C. Er is nog meer werk worden gedaan met BasicCleanup, maar significante vooruitgang geboekt imiteren. Weinig werk is gedaan voor ExtendedCleanup als nog.
- CSeq_loc_Mapper kan nu worden geïnitialiseerd met een GC-Assemblee.
- Bug fixes:
- Vast in kaart brengen van de mix locaties op negatieve streng in CFeat_CI.
- Veel verbeteringen in de manier waarop CFeatTree koppelt kenmerken.
- Verschillende thread-veiligheid fixes.
- Vaste typo voorkomen van het toevoegen uitgelijnd en grafieken te CSeq_annot_EditHandle.
- Beveiliging tegen uitzonderingen bij het sorteren van functies in CFeat_CI.
- GENBANK DATA LADER:
- Geregistreerde HPRD externe annotaties.
- Toegevoegd optionele exclude_wgs_master param in pubseqos / pubseqos2 lezers.
- Uitgevoerd in bulk te laden voor acc / ver, gi, etiket, en taxid.
- Toegevoegd CGBDataLoader :: CloseCache ().
- Verbetering:
- Gebruik bulkbelading verzoeken in cscope :: GetBioseqHandles ().
- Aparte lezer statistieken per type geplaatste blobs.
- Toegevoegd timestamp aan GenBank debug-berichten.
- Gebruik IConnValidator voor het openen van PubSeqOS verbindingen.
- Toegevoegd split-versie aan brok verzoeken en brok subsleutels in GenBank cache om te voorkomen dat het gebruik van verkeerde brokken toen blob split toestand is veranderd in ID.
- Toegevoegd secundaire minder verwarrend param namen voor open-time-out.
- Niet vermenigvuldigen retry telling van het aantal aansluitingen.
- OBJECT MANAGER TEST EN DEMO TOEPASSINGEN:
- id2_fetch_simple -. Voegde -id opties voor willekeurige Seq-id's
- test_bulkinfo -. Nieuwe test applicatie
- FASTA:
- C ++ functie tafel functionaliteit is functioneler gemaakt, zoals voor een deel van de Bankit project.
- asn2flat hulpprogramma
- Enorme aantal wijzigingen flatfile formatter te brengen veel dichter bij de release-klaar staat (eventueel vrijgeven klaar op dit punt, hoewel een aantal relatief kleine problemen blijven).
- XMLWRAPP:
- Vaste segmentatie fout in het geval van het nemen van een verwijzing naar XPath expressie uitvoeren resultaten.
- Toegevoegd helpers aan de openbare ID, systeem-ID en DTD naam te krijgen voor externe en interne subsets.
- Toegevoegd methoden om knooppunt attributen opzoeken.
- Vaste uitvoering van XPath-expressie:. Het begint nu uit de gegeven knooppunt
- Vaste zoeken attributen (inclusief standaard) wanneer een namespace wordt verstrekt.
- mogelijkheid toegevoegd aan XPath-expressie draaien zonder noodzaak om namespaces expliciet registreren.
- Toegevoegde mogelijkheid om containers te voorzien voor het verzamelen van fouten en waarschuwingen tijdens het ontleden van documenten.
- Toegevoegde mogelijkheid om waarden en namespaces van node default attributen te wijzigen.
- Mogelijkheid toegevoegd om te testen of een attribuut is standaard.
- Toegevoegde mogelijkheid om plaatsen of te verwijderen attributen, rekening houdend met hun namespaces.
- Toegevoegde mogelijkheid om XML declaratie strippen wanneer een document wordt opgeslagen.
- WindowMasker:
- Voegde een nieuwe input formaat, & quot; seqids & quot ;; met deze input formaat, de ingang is een bestand met een sequentie id op elke lijn, en het algoritme maakt gebruik van de Bio-Object Manager te zoeken van de sequenties.
- Voegde een nieuwe klasse CWinMaskConfig, voor alle WindowMasker configuratieparameters opslaan. De klasse kan worden gebruikt om de benodigde command-line argumenten van de configuratieparameters van de command-line argumenten toevoegen aan CArgDescriptions, en dan krijg.
- bouwraamwerk (UNIX):
- Interpreteer command-line specificaties van APP_PROJ of LIB_PROJ als een cue om andere * _PROJ instellingen niet ook er voorzien duidelijk uit. (Vereist GNU Make;. Bouwt met Sun maken blijven werken als voorheen)
- Supply meer doelen in submappen:. * _f (Met behulp van lokale platte makefiles geproduceerd op bestelling, het negeren van afhankelijkheid van andere delen van de boom), * _fd (het verpakken van de top-level Makefile.flat), clean_sources en purge_sources
- Configure en de handige scripts (compilers / unix / * sh.):
- Opmerkelijk nieuwe vlag --without-3PSW -. Niet te gebruiken met een 3rd-party software
- Toegevoegd een cheque van Glew.
- Verbeterde controles voor Boost en OpenGL.
- Ondersteuning specificeren run paden op Darwin (Mac) systemen met moderne toolchains.
- BLAST:
- Op Darwin (Mac OS X), bouwen alleen voor Intel-processors, zelfs in anders universele bouwt vanwege een PowerPC toolchain beperking.
- Ondersteuning toegevoegd voor het ophalen van NCBI Taxonomy ID's waarvoor WindowMasker ondersteuning beschikbaar is.
- Laat de specificatie van een zoeksequentie samen met multiple sequence alignment bestand in psiblast.
- Toegevoegd databank hard-masking support.
- Toegevoegd databank soft-masking voor vertaalde zoekopdrachten.
- Ondersteuning voor Btop (BLAST traceback operaties) en query en onderwerp lengte in het rapport in tabelvorm.
- Command-line toepassingen - laten psiblast om meerdere query's te zoeken, toegevoegd optionele -input_type voor makeblastdb
- Laat gebruik van de beste hit en XML in blast2sequences modus.
- Verbeterde opmaak prestaties voor remote zoekopdrachten.
- makembindex kunnen nu direct bouwen gemaskeerde megablast index een BLAST nucleotide database met behulp van maskeren informatie in de BLAST database. Dit wordt bereikt door de nieuwe command line optie -db_mask te makembindex. De optie aanvaardt de integer id van het filteralgoritme ondersteund door de BLAST database. De optie kan alleen worden toegepast in samenhang met -iformat blastdb.
- Als u een gebruiker in het vinden van de numerieke id's van filtering algoritmen ondersteund door een BLAST-database te helpen, de vlag -show_filters wordt geïntroduceerd. Het toepassen van de vlag met -iformat blastdb en BLAST-database als input makembindex toebrengt aan de uitgang van een lijst met beschikbare filtering algoritmen en uitgang.
- Toepassingen NetCache:
- NetCache wordt herwerkt om de volgende functies omvatten:
- een beter beheer van schijfruimte;
- lock-minder werk met blobs, wordt versiebeheer plaats daarvan gebruikt;
- multi-poort luisteren en per-client-instellingen te differentiëren.
- NetCache en iCache API's:
- Gebruik uint8 overal voor blob grootte.
- Laat gedeeltelijke blob ophalen.
- Geïntroduceerd blob wachtwoordbeveiliging; lege wachtwoorden worden behandeld als er geen wachtwoord.
- Worker knooppunt API's:
- Nieuwe parameter voor opzegging van de werknemer knooppunt als het geheugengebruik van de grenswaarde overschrijdt (parameter & quot; total_memory_limit & quot;) .
- Nieuwe parameter voor opzegging van de werknemer knooppunt als de looptijd groter is dan de opgegeven limiet (parameter & quot; total_time_limit & quot;) .
- grid-toepassingen:
- netscheduled
- Fixed a bug die geen antwoord op de wachtrij verwijderen commando veroorzaakt.
- remote_app
- Nieuwe configuratie parameter (& quot; tmp_dir & quot;). Om te bepalen hoe tijdelijke map naam wordt gegenereerd - om zijn lengte te verminderen
- Meld blob schrijffout.
- netcache_control
- Laat gedeeltelijke blob ophalen.
- Nieuwe opdracht -remove om blobs verwijderen door hun id's.
- Nieuwe parameter -auth om authenticatie tekenreeks opgeven om te gebruiken.
- Nieuwe opdrachten -reconf en -reinit voor gebruik door NetCache beheerders.
- netschedule_control
- Ingeschakeld compatibiliteitsmodus te netschedule_control te laten werken met oudere werknemer knooppunten.
- cgi2rcgi.cgi
- Gebruik een lege NetCache blob niet maken als een tijdelijke aanduiding voor de voortgang bericht.
- Inloggen Grid fouten die gemeld worden aan de gebruiker.
- Laat ruimtes in de parameter job ID.
- Ondersteuning uitgang van de job status informatie in JSON-formaat.
- Laat aangepaste HTML-sjablonen te worden gedefinieerd voor GRID fouten en andere evenementen.
- Toegevoegd no-cache HTTP headers om caching van tussentijdse resultaten te voorkomen.
- ncfetch.cgi
- Nieuwe parameter om toegang te krijgen met een wachtwoord beveiligd blobs.
- Interpreteer extra parameter & quot; filename & quot; als een bestandsnaam voor het gedownloade bestand.
.
Wat is nieuw in versie 31 december 2008:
- Deze versie voegt een methode om de column-specifieke berekenen pseudocounts in PSI-BLAST.
- Het refactors de grid diensten bibliotheek.
- Het voegt unit test framework en error logging voor alle File API-klassen.
- Het lost pthread ondersteuning op IRIX. Het verbetert de ondersteuning van XML serialisatie.
- Het lost ondersteuning voor Sybase.
- Het voegt ondersteuning toe voor kleinere lookup tabellen voor kleine vragen.
- Het voegt een API om GenBank loader statistieken op te halen.
- Het is assorti andere verbeteringen, snelheidswinst, en bugfixes.
Reacties niet gevonden