Sanitize

Software screenshot:
Sanitize
Software informatie:
Versie: 4.0.0 Bijgewerkt
Upload datum: 12 May 15
Ontwikkelaar: Ryan Grove
Licentie: Gratis
Populariteit: 38

Rating: nan/5 (Total Votes: 0)

Op basis van de Nokogiri HTML parser voor Ruby, Sanitize is een whitelist-gebaseerd systeem voor het verwijderen van HTML uit een blok van tekst.
De "witte lijst" techniek zal ontwikkelaars om setup maken een lijst van HTML-tags die Sanitize zal gebruiken als referentie voor wat zij van mening is "aanvaardbaar" HTML.
Elke andere HTML-tag niet in de lijst zullen worden verwijderd uit de ontleed tekst.
Sanitize kan werken met de normen voldoet, of met misvormde HTML.
De bibliotheek kan detecteren en filteren van HTML-tags, attributen en protocollen.
De gereinigde tekst wordt altijd uitgevoerd als geldige HTML of XHTML.
Om ontwikkelaars te helpen de slag te gaan op hun projecten, Sanitize wordt geleverd met een aantal kant en klare configuraties inbegrepen. Controleer het README bestand voor meer informatie

Wat is nieuw in deze release:.

  • Toegevoegd twee nieuwe CSS config instellingen: at_rules_with_properties en:. at_rules_with_styles
  • Toegevoegd volledige ondersteuning voor CSS @ Page regels in de ontspannen configuratie, inclusief ondersteuning voor alle pagina-marge doos regels.
  • voegde de volgende CSS-regels bij aan de ontspannen config.
  • toegevoegd een hele hoop van CSS-eigenschappen aan de ontspannen config. Bekijk hier de volledige lijst.
  • Kleine prestatieverbeteringen.
  • Verbeterde Crass naar 1.0.2 te halen een oplossing die het interpreteren van CSS @ Page regels aangetast.

Wat is nieuw in versie 3.1.2:

  • Vast: #document en #fragment gefaald op bevroren strijkers, en kon onbedoeld bevroren strings te wijzigen indien ze gebruik gemaakt van een ander dan UTF-8-codering of als ze personages die niet toegestaan ​​in HTML.

Wat is nieuw in versie 3.0.2:

  • Bijgewerkt Nokogumbo tot 1.1.12, omdat 1.1. 11 stilletjes teruggekeerd van de verandering die we probeerden te halen in de laatste release.

Wat is nieuw in versie 3.0.0:

  • Toegevoegd geavanceerde CSS sanering ondersteuning via Crass, dat is volledig compatibel met de CSS Syntax Module Level 3 parsing spec. De inhoud van de witte lijst & # X3c; stijl & # x3e; elementen en de stijl attributen in HTML wordt opgeschoond als CSS, of u kunt de Sanitize :: CSS-klasse gebruiken om CSS stylesheets of eigenschappen handmatig te ontsmetten.
  • een Toegevoegd: allow_doctype setting. Wanneer waar, goed gevormde doctype definities zullen worden toegestaan ​​in de documenten. Wanneer valse (de standaard), zal doctype definities worden verwijderd uit documenten. Doctype definities zijn nooit toegestaan ​​in fragmenten, ongeacht deze instelling.
  • Toegevoegd de volgende elementen aan de ontspannen config, naast diverse attributen:. Artikel, opzij, lichaam, data, div, voettekst, hoofd, header, html, belangrijkste, nav, sectie, spanwijdte, stijl, titel
  • De: whitespace_elements config is nu een Hash, en kunt u de tekst die voor en na deze elementen als ze verwijderd moeten worden geplaatst opgeven. De oude-stijl-array gebaseerde config waarde wordt nog steeds ondersteund voor achterwaartse compatibiliteit.
  • Ongeschikte Unicode-tekens worden nu verwijderd uit HTML voordat deze wordt ontleed.
  • Vast:
  • Non-tag beugels in-ingang, zoals & quot; 1 & # x3e; 2 en 2 en # X3c; 1 & quot; worden nu ontleed en correct ontsnapte in overeenstemming met de HTML5 spec, worden & quot; 1 & gt; 2 en 2 & lt; 1 & quot;.
  • Siblings toegevoegd na het huidige knooppunt tijdens traversal nu ook doorkruist. In vorige versies werden ze gewoon overgeslagen.
  • Nokogiri is geslagen en geïnstrueerd om te stoppen met het toevoegen van nieuwe regels na bepaalde elementen, want als mensen wilden er nieuwe regels zouden ze hen daar hebben gezet, dammit.

Wat is nieuw in versie 2.0.6:

  • Version 2.0.5 per ongeluk opgenomen wat werk-in -progress veranderingen die hun weg moeten hebben gemaakt in de master branch.

Wat is nieuw in versie 1.2.1:

  • een Toegevoegd: remove_contents config instelling. Indien ingesteld op true, Zuiver de inhoud van alle niet-witte lijst elementen naast de elementen zelf te verwijderen. Indien ingesteld op een matrix van element namen, zal Sanitize de inhoud van alleen die elementen (toen gefilterd) te verwijderen, en laat de inhoud van de andere gefilterde elementen. [Met dank aan Rafael Souza voor de optie Array]
  • een Toegevoegd: output_encoding config instellen om het karakter codering voor HTML uitvoer te laten worden gespecificeerd. De standaard is 'UTF-8'.
  • Het milieu hash doorgegeven aan transformatoren bevat nu een: node_name punt met de kleine letters de naam van het huidige HTML-knooppunt (bijvoorbeeld & quot; div & quot;)
  • .
  • iets anders dan een Hash of nihil Terugkerend van een transformator wordt nu sprake van een zinvolle Sanitize :: Error eerder uitzondering dan een onbedoelde NameError.

Eisen

  • Ruby 1.9.2 of hoger
  • Nokogiri 1.4.4 of hoger

Vergelijkbare software

selectivizr
selectivizr

13 May 15

Voyeur.js
Voyeur.js

13 May 15

csv2html
csv2html

5 Jun 15

Box.js
Box.js

6 Jun 15

Andere software van ontwikkelaar Ryan Grove

Synchrotron
Synchrotron

13 Apr 15

Net::Amazon::S3
Net::Amazon::S3

11 May 15

JSHint
JSHint

10 Apr 16

Reacties op Sanitize

Reacties niet gevonden
Commentaar toe te voegen
Zet op de beelden!