Kapitel 11. Konvertering av data

InnehÄllsförteckning

11.1. Verktyg för konvertering av textdata
11.1.1. Konvertera en textfil med iconv
11.1.2. Kontrollerar att filen Àr UTF-8 med iconv
11.1.3. Konvertera filnamn med iconv
11.1.4. EOL-konvertering
11.1.5. TAB-konvertering
11.1.6. Redaktörer med automatisk konvertering
11.1.7. Extrahering av vanlig text
11.1.8. Markera och formatera data i klartext
11.2. XML-data
11.2.1. GrundlÀggande tips för XML
11.2.2. XML-bearbetning
11.2.3. Extrahering av XML-data
11.2.4. XML-data lint
11.3. InstÀllning av typ
11.3.1. roff sÀttning
11.3.2. TeX/LaTeX
11.3.3. Skriv ut en manuell sida
11.3.4. Skapa en manuell sida
11.4. Utskrivbara data
11.4.1. Ghostscript
11.4.2. SlÄ samman tvÄ PS- eller PDF-filer
11.4.3. Verktyg för utskrivbara data
11.4.4. Skriva ut med CUPS
11.5. Konvertering av postdata
11.5.1. Grunderna för e-postdata
11.6. Grafiska dataverktyg
11.6.1. Grafiska dataverktyg (metapaket)
11.6.2. Grafiska dataverktyg (GUI)
11.6.3. Grafiska dataverktyg (CLI)
11.7. Diverse datakonvertering

Verktyg och tips för att konvertera dataformat pÄ Debian-systemet beskrivs.

Standardbaserade verktyg Àr i mycket gott skick, men stödet för proprietÀra dataformat Àr begrÀnsat.

Följande paket för konvertering av textdata fÄngade min uppmÀrksamhet.


[Tips] Tips

iconv(1) tillhandahÄlls som en del av libc6-paketet och Àr alltid tillgÀngligt pÄ praktiskt taget alla Unix-liknande system för att konvertera kodningen av tecken.

Du kan konvertera kodningar i en textfil med iconv(1) pÄ följande sÀtt.

$ iconv -f encoding1 -t encoding2 input.txt >output.txt

KodningsvÀrdena Àr skiftlÀgesokÀnsliga och ignorerar "-" och "_" vid matchning. Kodningar som stöds kan kontrolleras med kommandot "iconv -l".

Tabell 11.2. Lista över kodningsvÀrden och deras anvÀndning

kodningsvÀrde anvÀndning
ASCII American Standard Code for Information Interchange, 7 bitars kod utan accentuerade tecken
UTF-8 aktuell flersprÄkig standard för alla moderna operativsystem
ISO-8859-1 gammal standard för vÀsteuropeiska sprÄk, ASCII + accentuerade tecken
ISO-8859-2 gammal standard för östeuropeiska sprÄk, ASCII + accentuerade tecken
ISO-8859-15 gammal standard för vÀsteuropeiska sprÄk, ISO-8859-1 med eurotecken
CP850 kodsida 850, Microsoft DOS-tecken med grafik för vÀsteuropeiska sprÄk, ISO-8859-1-variant
CP932 kodsida 932, Microsoft Windows-stil Shift-JIS-variant för japanska
CP936 kodsida 936, Microsoft Windows stil GB2312, GBK eller GB18030 variant för förenklad kinesiska
CP949 kodsida 949, Microsoft Windows-stil EUC-KR eller Unified Hangul Code-variant för koreanska
CP950 kodsida 950, Microsoft Windows stil Big5-variant för traditionell kinesiska
CP1251 kodsida 1251, Microsoft Windows stilkodning för det kyrilliska alfabetet
CP1252 kodsida 1252, Microsoft Windows-stil ISO-8859-15-variant för vÀsteuropeiska sprÄk
KOI8-R gammal rysk UNIX-standard för det kyrilliska alfabetet
ISO-2022-JP standardkodning för japansk e-post som endast anvÀnder 7-bitars koder
eucJP gammal japansk UNIX-standard 8-bitars kod och helt annorlunda Àn Shift-JIS
Shift-JIS JIS X 0208 Appendix 1 standard för japanska (se CP932)

[Notera] Notera

Vissa kodningar stöds endast för datakonvertering och anvĂ€nds inte som lokala vĂ€rden (Avsnitt 8.1, ”Lokalen”).

För teckenuppsÀttningar som ryms i en enda byte, t.ex. ASCII- och ISO-8859-teckenuppsÀttningar, betyder teckenkodningen nÀstan samma sak som teckenuppsÀttningen.

För teckenuppsÀttningar med mÄnga tecken, t.ex. JIS X 0213 för japanska eller Universal Character Set (UCS, Unicode, ISO-10646-1 ) för praktiskt taget alla sprÄk, finns det mÄnga kodningsscheman för att passa in dem i byte-datasekvensen.

För dessa finns det tydliga skillnader mellan teckenuppsÀttning och teckenkodning.

Kodsidan anvÀnds som synonym till teckenkodningstabellerna för vissa leverantörsspecifika tabeller.

[Notera] Notera

Observera att de flesta kodningssystem delar samma kod med ASCII för 7-bitars tecken. Men det finns nĂ„gra undantag. Om du konverterar gamla japanska C-program och URL-data frĂ„n kodningsformatet shift-JIS till UTF-8-format ska du anvĂ€nda "CP932" som kodningsnamn i stĂ€llet för "shift-JIS" för att fĂ„ förvĂ€ntat resultat: 0x5C → "\" och 0x7E → "~". Annars konverteras dessa till fel tecken.

[Tips] Tips

recode(1) kan ocksÄ anvÀndas och erbjuder mer Àn den kombinerade funktionaliteten hos iconv(1), fromdos(1), todos(1), frommac(1) och tomac(1). För mer information, se "info recode".

Intelligenta moderna editorer som vim-programmet Àr ganska smarta och klarar sig bra med alla kodningssystem och alla filformat. För bÀsta kompatibilitet bör du anvÀnda dessa redigeringsprogram i UTF-8-lokalen i en UTF-8-kompatibel konsol.

En gammal vÀsteuropeisk Unix-textfil, "u-file.txt", som lagras i kodningen latin1 (iso-8859-1) kan redigeras enkelt med vim pÄ följande sÀtt.

$ vim u-file.txt

Detta Àr möjligt eftersom den automatiska detekteringsmekanismen för filkodningen i vim först antar UTF-8-kodningen och, om den misslyckas, antar att den Àr latin1.

En gammal polsk Unix-textfil, "pu-file.txt", som lagras i kodningen latin2 (iso-8859-2) kan redigeras med vim pÄ följande sÀtt.

$ vim '+e ++enc=latin2 pu-file.txt'

En gammal japansk unix-textfil, "ju-file.txt", som lagrats i eucJP-kodning kan redigeras med vim pÄ följande sÀtt.

$ vim '+e ++enc=eucJP ju-file.txt'

En gammal japansk MS-Windows textfil, "jw-file.txt", lagrad i den s.k. shift-JIS-kodningen (mer exakt: CP932) kan redigeras med vim pÄ följande sÀtt.

$ vim '+e ++enc=CP932 ++ff=dos jw-file.txt'

NÀr en fil öppnas med flaggorna "++enc" och "++ff", lagrar ":w" i Vims kommandorad den i originalformat och skriver över originalfilen. Du kan ocksÄ ange sparformatet och filnamnet i kommandoraden i Vim, t,ex, ":w ++enc=utf8 new.txt".

Se mbyte.txt "multi-byte text support" i vim on-line help och Tabell 11.2, ”Lista över kodningsvĂ€rden och deras anvĂ€ndning” för lokala vĂ€rden som anvĂ€nds med "++enc".

Programfamiljen emacs kan utföra motsvarande funktioner.

Du kan markera och formatera vanlig textdata pÄ följande sÀtt.

Tabell 11.6. Lista över verktyg för att markera data i klartext

paket popcon storlek sökord beskrivning
vim-runtime V:17, I:366 38132 highlight Vim MACRO för att konvertera kÀllkod till HTML med ":source $VIMRUNTIME/syntax/html.vim"
cxref V:0.01, I:0.24 1191 c→html konverterare för C-programmet till latex och HTML (C-sprĂ„k)
src2tex V:0.02, I:0.21 1799 highlight konvertera mÄnga kÀllkoder till TeX (C-sprÄk)
source-highlight V:0.5, I:3.3 2131 highlight konvertera mÄnga kÀllkoder till HTML, XHTML, LaTeX, Texinfo, ANSI fÀrg-escape-sekvenser och DocBook-filer med markering (C++)
highlight V:0.5, I:3.3 1411 highlight konvertera mÄnga kÀllkoder till HTML-, XHTML-, RTF-, LaTeX-, TeX- eller XSL-FO-filer med markering (C++)
grc V:0.9, I:5.9 208 text→fĂ€rg generisk fĂ€rglĂ€ggare för allt (Python)
pandoc V:10, I:48 207402 text→nĂ„gon allmĂ€n markup-omvandlare (Haskell)
python3-docutils V:13, I:53 2009 text→nĂ„gon Formatering av ReStructured Text-dokument till XML (Python)
markdown V:0.6, I:6.7 56 text→html Formatering av Markdown-textdokument till (X)HTML (Perl)
asciidoctor V:0.5, I:5.1 101 text→nĂ„gon AsciiDoc textdokumentformaterare till XML/HTML (Ruby)
python3-sphinx V:7, I:27 2996 text→nĂ„gon ReStructured Text-baserat system för publicering av dokument (Python)
hugo V:0.8, I:5.3 62224 text→html Markdown-baserat system för publicering av statiska webbplatser (Go)

XML (Extensible Markup Language) Àr ett mÀrksprÄk för dokument som innehÄller strukturerad information.

Se inledande information pÄ XML.COM.

XML-text ser ut ungefÀr som HTML. Det gör det möjligt för oss att hantera flera format för utdata för ett dokument. Ett enkelt XML-system Àr docbook-xsl-paketet, som anvÀnds hÀr.

Varje XML-fil börjar med en standard XML-deklaration enligt följande.

<?xml version="1.0" encoding="UTF-8"?>

Den grundlÀggande syntaxen för ett XML-element mÀrks upp enligt följande.

<name attribute="value">content</name>

XML-element med tomt innehÄll mÀrks upp i följande korta form.

<name attribute="value" />

Attributet "attribute="value"" i exemplen ovan Àr valfritt.

KommentarsfÀltet i XML Àr markerat enligt följande.

<!-- comment -->

Förutom att lÀgga till markeringar krÀver XML en mindre konvertering av innehÄllet med hjÀlp av fördefinierade enheter för följande tecken.


[Observera] Observera

"<" eller "&" kan inte anvÀndas i attribut eller element.

[Notera] Notera

NÀr anvÀndardefinierade entiteter i SGML-stil, t.ex. "&some-tag;", anvÀnds, vinner den första definitionen över de andra. Entitetsdefinitionen uttrycks i "<!ENTITY some-tag "entitetsvÀrde">".

[Notera] Notera

SÄ lÀnge XML-markeringen görs konsekvent med en viss uppsÀttning taggnamn (antingen vissa data som innehÄll eller attributvÀrde), Àr konvertering till en annan XML en trivial uppgift med hjÀlp av Extensible Stylesheet Language Transformations (XSLT).

Det finns mÄnga verktyg för att bearbeta XML-filer, t.ex. Extensible Stylesheet Language (XSL).

NÀr du har skapat en vÀlformad XML-fil kan du konvertera den till valfritt format med hjÀlp av Extensible Stylesheet Language Transformations (XSLT).

XSL-FO (Extensible Stylesheet Language for Formatting Objects) Àr tÀnkt att vara en lösning för formatering. Paketet fop Àr nytt i Debians main arkiv pÄ grund av dess beroende av programsprÄket Java. SÄ LaTeX-koden genereras vanligtvis frÄn XML med hjÀlp av XSLT och LaTeX-systemet anvÀnds för att skapa utskrivbara filer som DVI, PostScript och PDF.


Eftersom XML Àr en delmÀngd av Standard Generalized Markup Language (SGML) kan det bearbetas med de omfattande verktyg som finns för SGML, t.ex. Document Style Semantics and Specification Language (DSSSL).


[Tips] Tips

GNOME:s yelp Àr ibland praktiskt för att lÀsa DocBook XML-filer direkt eftersom den Äterges hyfsat pÄ X.

Unix-programmet troff, som ursprungligen utvecklades av AT&T, kan anvÀndas för enkel sÀttning. Det anvÀnds vanligtvis för att skapa manpages.

TeX, som skapades av Donald Knuth, Àr ett mycket kraftfullt verktyg för typsÀttning och Àr de facto-standarden. LaTeX, som ursprungligen skrevs av Leslie Lamport, ger tillgÄng till TeX:s kraft pÄ hög nivÄ.


Traditionellt Àr roff det huvudsakliga textbehandlingssystemet i Unix. Se roff(7), groff(7), groff(1), grotty(1), troff(1), groff_mdoc(7), groff_man(7), groff_ms(7), groff_me(7), groff_mm(7) och "info groff".

Du kan lÀsa eller skriva ut en bra handledning och referens om "-me" -makro i "/usr/share/doc/groff/" genom att installera groff-paketet.

[Tips] Tips

"groff -Tascii -me -" ger ut vanlig text med ANSI escape-kod. Om du vill fÄ ut manpage-liknande utdata med mÄnga "^H" och "_", anvÀnd "GROFF_NO_SGR=1 groff -Tascii -me-" istÀllet.

[Tips] Tips

Om du vill ta bort "^H" och "_" frÄn en textfil som genererats av groff filtrerar du den med "col -b -x".

Programvarudistributionen TeX Live erbjuder ett komplett TeX-system. Metapaketet texlive innehÄller ett anstÀndigt urval av TeX Live-paketen som bör rÀcka för de vanligaste uppgifterna.

Det finns mÄnga referenser tillgÀngliga för TeX och LaTeX.

  • HOWTO för teTeX: Den lokala guiden för Linux-teTeX

  • tex(1)

  • latex(1)

  • texdoc(1)

  • texdoctk(1)

  • "The TeXbook", av Donald E. Knuth, (Addison-Wesley)

  • "LaTeX - A Document Preparation System", av Leslie Lamport, (Addison-Wesley)

  • "The LaTeX Companion", av Goossens, Mittelbach, Samarin, (Addison-Wesley)

Detta Àr den mest kraftfulla sÀttningsmiljön. MÄnga SGML-processorer anvÀnder detta som sin backend-textprocessor. Lyx som tillhandahÄlls av lyxpaketet och GNU TeXmacs som tillhandahÄlls av texmacs-paketet erbjuder en trevlig WYSIWYG-redigeringsmiljö för LaTeX medan mÄnga anvÀnder Emacs och Vim som val för kÀllredigeraren.

Det finns mÄnga tillgÀngliga resurser pÄ nÀtet.

NÀr dokumenten blir större kan TeX ibland orsaka fel. Du mÄste öka poolstorleken i "/etc/texmf/texmf.cnf" (eller mer lÀmpligt redigera "/etc/texmf/texmf.d/95NonPath" och köra update-texmf(8)) för att ÄtgÀrda detta.

[Notera] Notera

TeX-kÀllan till "The TeXbook" finns tillgÀnglig pÄ www.ctan.org tex-archive site for texbook.tex. Denna fil innehÄller de flesta av de nödvÀndiga makron. Jag har hört att man kan bearbeta detta dokument med tex(1) efter att ha kommenterat raderna 7 till 10 och lagt till "\input manmac \proofmodefalse". Det rekommenderas starkt att köpa den hÀr boken (och alla andra böcker av Donald E. Knuth) i stÀllet för att anvÀnda onlineversionen, men kÀllan Àr ett bra exempel pÄ TeX-inmatning!

Utskrivbara data uttrycks i PostScript-format pÄ Debian-systemet. CUPS (Common Unix Printing System) anvÀnder Ghostscript som backendprogram för rastrering för icke-PostScript-skrivare.

Utskrivbara data kan ocksÄ uttryckas i PDF-format pÄ det senaste Debian-systemet.

PDF-filer kan visas och dess formulĂ€rposter kan fyllas i med hjĂ€lp av GUI-visningsprogram som Evince och Okular (se Avsnitt 7.4, ”GUI-applikationer”) och moderna webblĂ€sare som Chromium.

PDF-filer kan redigeras med hjĂ€lp av vissa grafikverktyg som LibreOffice, Scribus och Inkscape (se Avsnitt 11.6, ”Grafiska dataverktyg”).

[Tips] Tips

Du kan lÀsa en PDF-fil med GIMP och konvertera den till PNG-format med en upplösning pÄ mer Àn 300 dpi. Detta kan anvÀndas som en bakgrundsbild för LibreOffice för att producera en önskvÀrd Àndrad utskrift med minsta möjliga anstrÀngning.

Du kan slÄ samman tvÄ PostScript (PS) - eller Portable Document Format (PDF) -filer med hjÀlp av gs(1) i Ghostscript.

$ gs -q -dNOPAUSE -dBATCH -sDEVICE=pswrite -sOutputFile=bla.ps -f foo1.ps foo2.ps
$ gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=bla.pdf -f foo1.pdf foo2.pdf
[Notera] Notera

PDF, som Àr ett allmÀnt anvÀnt utskriftsformat för flera plattformar, Àr i huvudsak det komprimerade PS-formatet med nÄgra ytterligare funktioner och tillÀgg.

[Tips] Tips

För kommandoraden Àr psmerge(1) och andra kommandon frÄn psutils-paketet anvÀndbara för att manipulera PostScript-dokument. pdftk(1) frÄn pdftk-paketet Àr ocksÄ anvÀndbart för att manipulera PDF-dokument.

Jag fick upp ögonen för följande paket för utskriftsvÀnliga dataverktyg.

Tabell 11.15. Lista över utskrivbara dataprogram

paket popcon storlek sökord beskrivning
poppler-utils V:134, I:490 760 pdf→ps,text,
 PDF-verktyg: pdftops, pdfinfo, pdfimages, pdftotext, pdffonts
psutils V:4, I:54 34 ps→ps Verktyg för konvertering av PostScript-dokument
poster V:0.1, I:1.8 58 ps→ps skapa stora affischer av PostScript-sidor
enscript V:1, I:11 2138 text→ps, html, rtf konvertera ASCII-text till PostScript, HTML, RTF eller Pretty-Print
a2ps V:0.6, I:7.3 4083 text→ps "Allt till PostScript"-konverterare och pretty-printer
pdftk V:1, I:25 28 pdf→pdf Verktyg för konvertering av PDF-dokument: pdftk
html2ps V:0.2, I:1.9 256 html→ps omvandlare frĂ„n HTML till PostScript
gnuhtml2latex V:0.07, I:0.67 26 html→latex omvandlare frĂ„n html till latex
latex2rtf V:0.1, I:2.3 495 latex→rtf konvertera dokument frĂ„n LaTeX till RTF som kan lĂ€sas av MS Word
ps2eps V:2, I:35 95 ps→eps konvertering frĂ„n PostScript till EPS (Encapsulated PostScript)
e2ps V:0.01, I:0.12 104 text→ps Text till PostScript-omvandlare med stöd för japansk kodning
impose+ V:0.1, I:1.5 118 ps→ps PostScript-verktyg
trueprint V:0.01, I:0.08 148 text→ps skriver ut mĂ„nga kĂ€llkoder (C, C++, Java, Pascal, Perl, Pike, Sh och Verilog) till PostScript. (C-sprĂ„k)
pdf2svg V:0.3, I:3.3 33 pdf→svg omvandlare frĂ„n PDF till skalbart vektorgrafikformat
pdftoipe V:0.01, I:0.46 74 pdf→ipe konverterare frĂ„n PDF till IPE:s XML-format

Kommandona lp(1) och lpr(1) som erbjuds av Common Unix Printing System (CUPS) ger möjlighet till anpassad utskrift av utskrivbara data.

Du kan skriva ut 3 kopior av en fil som Àr sorterad med hjÀlp av nÄgot av följande kommandon.

$ lp -n 3 -o Collate=True filename
$ lpr -#3 -o Collate=True filename

Du kan anpassa skrivarfunktionen ytterligare genom att anvÀnda skrivaralternativ som "-o number-up=2", "-o page-set=even", "-o page-set=odd", "-o scaling=200", "-o natural-scaling=200", etc., som finns dokumenterade i Command-Line Printing and Options.

Följande paket för konvertering av postdata fÄngade min uppmÀrksamhet.


[Tips] Tips

IMAP4-servern ( Internet Message Access Protocol version 4) kan anvÀndas för att flytta ut e-post frÄn proprietÀra e-postsystem om e-postklientprogrammet kan konfigureras sÄ att det ocksÄ anvÀnder IMAP4-servern.

Mail(SMTP) bör begrĂ€nsas till serier av 7-bitarsdata. BinĂ€rdata och 8-bitars textdata kodas dĂ€rför till 7-bitarsformat med hjĂ€lp av MIME (Multipurpose Internet Mail Extensions) och val av teckenuppsĂ€ttning (se Tabell 11.2, ”Lista över kodningsvĂ€rden och deras anvĂ€ndning”).

Standardlagringsformatet för e-post Àr mbox formaterat enligt RFC2822 (uppdaterad RFC822). Se mbox(5) (tillhandahÄlls av mutt-paketet ).

För europeiska sprÄk anvÀnds vanligtvis "Content-Transfer-Encoding: quoted-printable" med teckenuppsÀttningen ISO-8859-1 för e-post eftersom det inte finns sÄ mÄnga 8-bitars tecken. Om europeisk text Àr kodad i UTF-8 kommer sannolikt "Content-Transfer-Encoding: quoted-printable" att anvÀndas eftersom det mestadels Àr 7-bitarsdata.

För japanska anvÀnds traditionellt "Content-Type: text/plain; charset=ISO-2022-JP" för e-post för att hÄlla texten i 7 bitar. Men Àldre Microsoft-system kan skicka e-postdata i Shift-JIS utan korrekt deklaration. Om japansk text kodas i UTF-8 kommer Base64 sannolikt att anvÀndas eftersom den innehÄller mÄnga 8-bitarsdata. Situationen för andra asiatiska sprÄk Àr liknande.

[Notera] Notera

Om dina e-postdata som inte Àr Unix Àr tillgÀngliga för en klientprogramvara som inte Àr Debian och som kan prata med IMAP4-servern, kan du kanske flytta ut dem genom att köra din egen IMAP4-server.

[Notera] Notera

Om du anvÀnder andra lagringsformat för e-post Àr det ett bra första steg att flytta dem till mbox-format. Ett mÄngsidigt klientprogram som mutt(1) kan vara praktiskt för detta.

Du kan dela upp innehÄllet i brevlÄdan till varje meddelande med procmail(1) och formail(1).

Varje e-postmeddelande kan packas upp med munpack(1) frÄn mpack-paketet (eller andra specialiserade verktyg) för att fÄ fram det MIME-kodade innehÄllet.

Även om GUI-program som gimp(1) Ă€r mycket kraftfulla, Ă€r kommandoradsverktyg som imagemagick(1) ganska anvĂ€ndbara för att automatisera bildmanipulering via skript.

De facto bildfilformat för digitalkameror Àr EXIF ( Exchangeable Image File Format ), som Àr JPEG-bildfilformatet med ytterligare metadatataggar. Det kan innehÄlla information som datum, tid och kamerainstÀllningar.

Patentet för den förlustfria datakomprimeringen Lempel-Ziv-Welch (LZW) har löpt ut. GIF-verktyg (Graphics Interchange Format) som anvÀnder LZW-komprimeringsmetoden Àr nu fritt tillgÀngliga pÄ Debian-systemet.

[Tips] Tips

Alla digitalkameror eller skannrar med flyttbara inspelningsmedia fungerar med Linux via USB-lagringslĂ€sare eftersom de följer designregeln för kamerafilsystem och anvĂ€nder FAT-filsystem. Se Avsnitt 10.1.7, ”Flyttbar lagringsenhet”.

Följande paket för datakonvertering, redigering och organisationsverktyg för GUI-grafik fÄngade min uppmÀrksamhet.

Tabell 11.18. Lista över verktyg för grafikdata (GUI)

paket popcon storlek sökord beskrivning
gimp V:33, I:229 32032 bild(bitmap) GNU-program för bildmanipulering
xsane V:10, I:136 1512 bild(bitmap) GTK-baserad X11-frontend för SANE (Scanner Access Now Easy)
scribus V:1, I:14 32289 ps/pdf/SVG/
 Scribus DTP-editor
libreoffice-draw V:101, I:436 10992 bild(vektor) LibreOffice kontorspaket - ritning
inkscape V:13, I:85 110787 bild(vektor) SVG-redigerare (skalbar vektorgrafik)
dia V:2, I:18 3812 bild(vektor) diagramredigerare (Gtk)
xfig V:0.6, I:9.2 7951 bild(vektor) Möjlighet till interaktiv generering av siffror enligt X11
gocr V:0.6, I:4.4 549 bild→text gratis OCR-programvara
eog V:32, I:165 10310 bild(Exif) Ögon av GNOME grafikvisare program
gthumb V:3, I:13 5162 bild(Exif) bildvisare och webblÀsare (GNOME)
geeqie V:4, I:12 2871 bild(Exif) bildvisare med GTK
shotwell V:16, I:259 6334 bild(Exif) digital fotoorganisator (GNOME)
gwenview V:41, I:119 6001 bild(Exif) bildvisare (KDE)
kamera I:118 982 bild(Exif) stöd för digitalkamera för KDE-applikationer
digikam V:1.9, I:9.2 302 bild(Exif) program för hantering av digitala foton för KDE
darktable V:4, I:12 35892 bild(Exif) virtuellt ljusbord och mörkrum för fotografer
hugin V:0.6, I:6.2 6489 bild(Exif) panorama foto stitcher
librecad V:1, I:15 9100 DXF, ... 2D CAD-dataredigerare
freecad V:1, I:21 107 DXF, ... 3D CAD-dataredigerare
blender V:3, I:24 92911 blend, TIFF, VRML, 
 3D-innehĂ„llsredigerare för animering etc
mm3d V:0.04, I:0.28 4123 ms3d, obj, dxf, 
 OpenGL-baserad 3D-modellredigerare
fontforge V:0.7, I:6.0 4058 ttf, ps, 
 fontredigerare för PS-, TrueType- och OpenType-teckensnitt
xgridfit V:0.01, I:0.10 878 ttf program för gridfitting och hintning av TrueType-teckensnitt

Följande paket för CLI-verktyg för konvertering, redigering och organisering av grafikdata fÄngade min uppmÀrksamhet.

Tabell 11.19. Lista över verktyg för grafikdata (CLI)

paket popcon storlek sökord beskrivning
imagemagick V:9, I:291 77 bild(bitmap) bildbehandlingsprogram
graphicsmagick V:1.3, I:9.4 5816 bild(bitmap) bildmanipuleringsprogram (gaffel av imagemagick)
netpbm V:29, I:301 8435 bild(bitmap) verktyg för grafisk konvertering
libheif-examples V:0.3, I:3.5 439 heif→jpeg(bitmap) konvertera HEIF (High Efficiency Image File Format) till JPEG-, PNG- eller Y4M-format med kommandot heif-convert(1)
icoutils V:4, I:35 221 png↔ico(bitmapp) konvertera MS Windows-ikoner och markörer till och frĂ„n PNG-format(favicon.ico)
pstoedit V:2, I:41 1076 ps/pdf→bild(vektor) Konvertera PostScript- och PDF-filer till redigerbar vektorgrafik (SVG)
libwmf-bin V:5, I:90 149 Fönster/bild(vektor) Verktyg för konvertering av Windows-metafiler (vektorgrafikdata)
fig2sxd V:0.04, I:0.20 151 fig→sxd(vektor) konvertera XFig-filer till OpenOffice.org Draw -format
unpaper V:2, I:17 417 bild→bild verktyg för efterbehandling av skannade sidor för OCR
tesseract-ocr V:8, I:33 2210 bild→text gratis OCR-programvara baserad pĂ„ HP:s kommersiella OCR-motor
tesseract-ocr-eng V:8, I:34 4032 bild→text OCR-motordata: tesseract-ocr-sprĂ„kfiler för engelsk text
ocrad V:0.3, I:2.5 604 bild→text gratis OCR-programvara
exif V:3, I:55 335 bild(Exif) kommandoradsverktyg för att visa EXIF-information i JPEG-filer
exiv2 V:2, I:21 429 bild(Exif) Verktyg för hantering av EXIF/IPTC-metadata
exiftran V:1, I:12 81 bild(Exif) omvandla digitalkamerans jpeg-bilder
exiftags V:0.3, I:3.0 309 bild(Exif) verktyg för att lÀsa Exif-taggar frÄn en JPEG-fil frÄn en digitalkamera
exifprobe V:0.3, I:2.6 502 bild(Exif) lÀsa metadata frÄn digitala bilder
dcraw V:1.0, I:8.3 428 bild(Raw)→ppm avkoda rĂ„a digitalkamerabilder
findimagedupes V:0.1, I:1.3 75 bild→fingeravtryck hitta visuellt liknande eller duplicerade bilder
ale V:0.01, I:0.15 818 bild→bild sammanfoga bilder för att öka Ă„tergivningen eller skapa mosaiker
imageindex V:0.2, I:1.4 143 bild(Exif)→html generera statiska HTML-gallerier frĂ„n bilder
outguess V:0.2, I:1.3 230 jpeg,png universellt steganografiskt verktyg
jpegoptim V:0.8, I:6.2 59 jpeg optimera JPEG-filer
optipng V:3, I:43 187 png optimera PNG-filer, förlustfri komprimering
pngquant V:1, I:11 62 png optimera PNG-filer, förlustfri komprimering

Det finns mĂ„nga andra program för konvertering av data. Följande paket fĂ„ngade mina ögon med hjĂ€lp av regex "~Guse::converting" i aptitude(8) (se Avsnitt 2.2.6, ”Sök metodalternativ med aptitude”).


Du kan ocksÄ extrahera data frÄn RPM-format med följande.

$ rpm2cpio file.src.rpm | cpio --extract