lxml

Software screenshot:
lxml
Software informatie:
Versie: 3.4.1
Upload datum: 17 Feb 15
Ontwikkelaar: Martijn Faassen
Licentie: Gratis
Populariteit: 12

Rating: nan/5 (Total Votes: 0)

LXML is een geavanceerde, krachtige, gratis en uniek Python module die de libxml2 en libxslt bibliotheken bindt, waardoor Python ontwikkelaars te werken met zowel XML- en HTML-bestanden met voorkennis hun Python code.An XML verwerking librarylxml is een XML (Extensible Markup Language ) verwerken bibliotheek geschreven in de programmeertaal Python, speciaal ontworpen om de ElementTree API specificatie zoveel mogelijk te volgen.
Het kan de ElementTree API uit te breiden tot specifieke functionaliteit van de libxslt en libxml2 bibliotheken, zoals Relax NG (Next-Generation), XPath, XML Schema, c14n, XSLT (Extensible Stylesheet Language) bloot, etc.Use LXML om Python-code uit te roepen XSLT stylesheetsDevelopers staat zal zijn om de LXML programma te gebruiken om Python-code van XSLT stylesheets en XPath-expressies te bellen via uitbreiding functies. Een breed scala aan tutorials zijn beschikbaar op de project & rsquo; s homepage (zie de link aan het einde van het artikel).
De software is open source door ontwerp en combineert de functie voor de volledigheid en de snelheid van de genoemde bibliotheken met de eenvoud van Python & rsquo; s API (Application Programming Interface) .Getting begonnen met lxmlIt is vrij gemakkelijk te LXML installeren op een GNU / Linux distributie met behulp van de bron archief verdeeld over Softoware en het project & rsquo; s officiële website. Gewoon downloaden van de source pakket, sla het op uw thuismap, pak het uit, open de Terminal app en ga naar de locatie van de uitgepakte archiefbestanden (bijvoorbeeld cd /home/softoware/lxml-3.4.1).
Voer de & lsquo; maken & rsquo; commando om het programma, dat ongeveer 1-2 minuten moet nemen op een moderne computer samen te stellen. Na een succesvolle compilatie, voert u de & lsquo; make install & rsquo; commando als root of de & lsquo; sudo make install & rsquo; commando als bevoorrechte gebruiker om LXML systeem wide.Supports GNU / Linux en Microsoft Windows-besturingssystemen systemsThe software wordt officieel ondersteund op GNU / Linux en Microsoft Windows-besturingssystemen te installeren. Het is met succes getest op 32-bits en 64-bits computers

Wat is nieuw in deze release:.

  • Kenmerken toegevoegd:
  • Nieuwe htmlfile HTML generator om de incrementele xmlfile rangschikking API begeleiden. Patch door Burak Arslan.
  • Bugs vastgesteld:
  • lxml.sax.ElementTreeContentHandler niet zijn superklasse initialiseren.

Wat is nieuw in versie 3.3.1:

  • Bugs vastgesteld:
  • LP # 1014290: HTML-documenten ontleed met parser.feed () geen elementen tijdens tag iteratie vinden
  • .
  • LP # 1273709: Gebouw in pypy mislukt vanwege ontbrekende ondersteuning voor PyUnicode_Compare () en PyByteArray _ * () in pypy's C-API
  • .
  • LP # 1274413: Compilatie in MSVC mislukt vanwege ontbrekende & quot; stdint.h & quot; standaard header-bestand.
  • LP # 1274118: iterparse () niet in geslaagd om te ontleden BOM voorafgegaan bestanden
  • .

Wat is nieuw in versie 3.0 Alpha 2:

  • Eigenschappen toegevoegd:
  • De methode .iter () van elementen accepteert nu tag argumenten zoals & quot; {*} naam & quot; om te zoeken naar elementen met een bepaalde lokale naam in elke namespace. Met deze toevoeging, alle combinaties van wildcards nu werken zoals verwacht: & quot; {ns} naam & quot ;, & quot; {} naam & quot ;, & quot; {*} naam & quot ;, & quot; {ns} * & quot ;, & quot; {} * & quot; en & quot; {*} * & quot ;. Merk op dat & quot; naam & quot; is gelijk aan & quot; {} naam & quot ;, maar & quot; * & quot; is & quot; {*} * & quot ;. Dezelfde wijziging geldt voor de .getiterator (), .itersiblings (), .iterancestors (), .iterdescendants (), .iterchildren () en .itertext () methodes; de strip_attributes (), strip_elements () en strip_tags () functies alsmede de iterparse () klasse.
  • C14N maakt het specificeren van de inclusieve voorvoegsels naar het hoogste niveau te worden bevorderd in exclusieve rangschikking.
  • Bugs vastgesteld:
  • Passen lange Unicode-tekenreeksen in het voer () parser-interface niet in geslaagd om de hele reeks te lezen.

Wat is nieuw in versie 2.3.5:

  • Crash bij het samenvoegen van tekst knooppunten in element.remove ( ).
  • Crash in sax / target parser bij het rapporteren van lege doctype.

Wat is nieuw in versie 2.3.4:

  • Crash bij het bouwen van een nsmap (Element eigendom) met lege namespace URI's.
  • Crash vanwege race condition wanneer er fouten (of gebruiker berichten) optreden tijdens schroefdraad XSLT verwerken.
  • XSLT-stylesheet compilatie compilatie fouten kon negeren.

Wat is nieuw in versie 2.3.2:

  • Eigenschappen toegevoegd:
  • lxml.objectify.deannotate () heeft een nieuwe boolean optie cleanup_namespaces naar het objectiveren naamruimtedeclaraties verwijderen (en in het algemeen het schoonmaken van de naamruimtedeclaraties) na het verwijderen van het type annotaties.
  • lxml.objectify eigen subelement () functie opgedaan als een kopie van etree.SubElement aan een anders redundante import van lxml.etree aan de gebruikerskant te voorkomen.
  • Bugs vastgesteld:
  • Vast de & quot; afstammeling & quot; bug in cssselect een tweede keer (na een eerste fix in LXML 2.3.1). De vorige verandering resulteerde in een serieuze prestatie regressie voor de XPath gebaseerde evaluatie van de vertaalde uitdrukking. Merk op dat deze breekt het gebruik van enkele van de gegenereerde XPath expressies XSLT locatie paden die eerder werkte in 2.3.1.
  • Vast parsing van enkele selectors in cssselect. Witruimte na combinatoren & quot; & Gt; & quot ;, & quot; + & quot; en & quot; ~ & quot; is nu correct genegeerd. Eerder is werd ontleed als een afstammeling combinator. Bijvoorbeeld, & quot; div & gt; .foo & quot; werd dezelfde geparsed als & quot; div & gt; * .foo & quot; in plaats van & quot; div & gt; .foo & quot;.

Wat is nieuw in versie 2.3.1:

  • Eigenschappen toegevoegd:
  • Nieuwe optie kill_tags in lxml.html.clean specifieke labels en de inhoud daarvan (dwz hun hele subtree) te verwijderen.
  • pi.get () en pi.attrib op verwerking instructies om pseudo-attributen ontleden van de inhoud van de tekst van de verwerking van instructies.
  • lxml.get_include () geeft een lijst van onder andere paden die kunnen worden gebruikt om externe C-code tegen lxml.etree compileren. Dit vereist is voor statisch gelinkt LXML bouwt wanneer code dient in te stellen tegen exact dezelfde header bestandsversies als LXML zelf.
  • Resolver.resolve_file () neemt een extra optie close_file dat configureert als het bestand (-achtige) object zal worden gesloten na het lezen of niet. Standaard wordt het bestand gesloten, omdat de gebruiker niet wordt verwacht dat zij een verwijzing te houden aan het.
  • Bugs vastgesteld:
  • HTML reiniging niet 'data:' verwijderen. Koppelingen
  • De html5lib parser integratie maakt nu gebruik van de 'officiële' implementatie in html5lib zelf, dat maakt het werken met de nieuwere versies van de bibliotheek.
  • In lxml.sax, kon endElementNS () ten onrechte een gewone tag naam weigeren wanneer de bijbehorende startgebeurtenis afgeleid dezelfde vlakte tag naam te worden in de standaard namespace.
  • Wanneer een open file-achtig object wordt overgegaan in parse () of iterparse (), zal de parser niet meer dicht na gebruik. Dit keert een verandering in LXML 2.3, waar alle bestanden zou worden gesloten. Het is de gebruikers verantwoordelijkheid om het bestand (-achtige) object goed sluiten, ook in de fout gevallen.
  • Bewering fout in lxml.html.cleaner bij inlevering van top-level elementen.
  • In lxml.cssselect, gebruik dan de xpath 'A // B' (afkorting voor 'A / afstammeling-of-zelf :: knooppunt () / B') in plaats van 'A / afstammeling :: B' voor de css afstammeling selector ('A B'). Dit maakt een paar rand gevallen consistent met de selector gedrag in WebKit en Firefox, te zijn en maakt meer css uitdrukkingen geldige locatie paden (voor gebruik in xsl: template match).
  • In lxml.html, niet-geselecteerde tags te zien niet meer in de verzamelde vorm waarden.
  • Het toevoegen / verwijderen van waarden naar / van een meervoudige vorm veld selecteert de juiste kiest hen en deze gedeactiveerd hen.
  • Andere wijzigingen:
  • Statische bouwt kan de download directory met de optie --download-dir opgeven.

Wat is nieuw in versie 2.3:

  • Eigenschappen toegevoegd:
  • Bij het zoeken naar de kinderen, lxml.objectify neemt '{} tag "omschreven als een lege namespace, in tegenstelling tot de ouder namespace.
  • Bugs vastgesteld:
  • Als u klaar bent het lezen van een bestand-achtig object, de parser zijn .close () methode oproepen onmiddellijk.
  • Als u klaar bent parsing, iterparse () sluit direct de input file.
  • Work-around voor libxml2 bug dat de HTML-parser kunnen achterlaten in een niet-functionele staat na een severly gebroken document (in libxml2 2.7.8 vaste) parsing.
  • marque tag in HTML opruimen code juistheid van de naam feesttent.
  • Andere wijzigingen:
  • Een aantal publieke functies in de Cython-level C-API hebben meer expliciete return types.

Wat is nieuw in versie 2.2.8 / 2.3 Beta 1:

  • Crash in nieuwere libxml2 versies als bewegende elementen tussen documenten die attributen vervangen XInclude knooppunten gehad.
  • XMLID () functie ontbrak de optionele parser en base_url parameters.
  • Zoeken naar wildcard-tags in iterparse () werd gebroken in PY3.
  • lxml.html.open_in_browser () werkte niet in Python 3 door het gebruik van os.tempnam. Het duurt nu een parameter optionele 'encoding'.

Eisen

  • Python

Vergelijkbare software

omega t+
omega t+

3 Jun 15

PottyMouth
PottyMouth

20 Feb 15

Zoem
Zoem

11 May 15

html2text
html2text

15 Apr 15

Andere software van ontwikkelaar Martijn Faassen

z3c.relationfield
z3c.relationfield

14 Apr 15

hurry.resource
hurry.resource

11 May 15

Reacties op lxml

Reacties niet gevonden
Commentaar toe te voegen
Zet op de beelden!