InnehÄllsförteckning
Verktyg och tips för att konvertera dataformat pÄ Debian-systemet beskrivs.
Standardbaserade verktyg Àr i mycket gott skick, men stödet för proprietÀra dataformat Àr begrÀnsat.
Följande paket för konvertering av textdata fÄngade min uppmÀrksamhet.
Tabell 11.1. Lista över verktyg för konvertering av textdata
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
libc6
|
V:930, I:999 | 5370 | charset | textkodningskonverterare mellan lokala av iconv(1)
(fundamental) |
recode
|
V:2, I:14 | 528 | teckenuppsÀttning+eol | textkodningskonverterare mellan lokala sprÄk (mÄngsidig, fler alias och funktioner) |
konwert
|
V:2, I:43 | 137 | charset | textkodningskonverterare mellan lokala sprÄk (snyggt) |
nkf
|
V:0.5, I:8.7 | 359 | charset | teckenuppsÀttningsöversÀttare för japanska |
tcs
|
V:0.01, I:0.15 | 518 | charset | teckenuppsÀttningsöversÀttare |
unaccent
|
V:0.04, I:0.31 | 34 | charset | ersÀtta accentuerade bokstÀver med deras oaccentuerade motsvarighet |
tofrodos
|
V:1, I:13 | 50 | eol | textformatkonverterare mellan DOS och Unix: fromdos(1)
och todos(1) |
macutils
|
V:0.04, I:0.47 | 319 | eol | textformatkonverterare mellan Macintosh och Unix:
frommac(1) och tomac(1) |
|
Tips |
|---|---|
|
|
Du kan konvertera kodningar i en textfil med iconv(1) pÄ
följande sÀtt.
$ iconv -f encoding1 -t encoding2 input.txt >output.txt
KodningsvÀrdena Àr skiftlÀgesokÀnsliga och ignorerar "-"
och "_" vid matchning. Kodningar som stöds kan
kontrolleras med kommandot "iconv -l".
Tabell 11.2. Lista över kodningsvÀrden och deras anvÀndning
| kodningsvÀrde | anvÀndning |
|---|---|
| ASCII | American Standard Code for Information Interchange, 7 bitars kod utan accentuerade tecken |
| UTF-8 | aktuell flersprÄkig standard för alla moderna operativsystem |
| ISO-8859-1 | gammal standard för vÀsteuropeiska sprÄk, ASCII + accentuerade tecken |
| ISO-8859-2 | gammal standard för östeuropeiska sprÄk, ASCII + accentuerade tecken |
| ISO-8859-15 | gammal standard för vÀsteuropeiska sprÄk, ISO-8859-1 med eurotecken |
| CP850 | kodsida 850, Microsoft DOS-tecken med grafik för vÀsteuropeiska sprÄk, ISO-8859-1-variant |
| CP932 | kodsida 932, Microsoft Windows-stil Shift-JIS-variant för japanska |
| CP936 | kodsida 936, Microsoft Windows stil GB2312, GBK eller GB18030 variant för förenklad kinesiska |
| CP949 | kodsida 949, Microsoft Windows-stil EUC-KR eller Unified Hangul Code-variant för koreanska |
| CP950 | kodsida 950, Microsoft Windows stil Big5-variant för traditionell kinesiska |
| CP1251 | kodsida 1251, Microsoft Windows stilkodning för det kyrilliska alfabetet |
| CP1252 | kodsida 1252, Microsoft Windows-stil ISO-8859-15-variant för vÀsteuropeiska sprÄk |
| KOI8-R | gammal rysk UNIX-standard för det kyrilliska alfabetet |
| ISO-2022-JP | standardkodning för japansk e-post som endast anvÀnder 7-bitars koder |
| eucJP | gammal japansk UNIX-standard 8-bitars kod och helt annorlunda Àn Shift-JIS |
| Shift-JIS | JIS X 0208 Appendix 1 standard för japanska (se CP932) |
|
Notera |
|---|---|
|
Vissa kodningar stöds endast för datakonvertering och anvĂ€nds inte som lokala vĂ€rden (Avsnitt 8.1, âLokalenâ). |
För teckenuppsÀttningar som ryms i en enda byte, t.ex. ASCII- och ISO-8859-teckenuppsÀttningar, betyder teckenkodningen nÀstan samma sak som teckenuppsÀttningen.
För teckenuppsÀttningar med mÄnga tecken, t.ex. JIS X 0213 för japanska eller Universal Character Set (UCS, Unicode, ISO-10646-1 ) för praktiskt taget alla sprÄk, finns det mÄnga kodningsscheman för att passa in dem i byte-datasekvensen.
EUC och ISO/IEC 2022 (Àven kÀnd som JIS X 0202 ) för japanska
UTF-8, UTF-16/UCS-2 och UTF-32/UCS-4 för Unicode
För dessa finns det tydliga skillnader mellan teckenuppsÀttning och teckenkodning.
Kodsidan anvÀnds som synonym till teckenkodningstabellerna för vissa leverantörsspecifika tabeller.
|
Notera |
|---|---|
|
Observera att de flesta kodningssystem delar samma kod med ASCII för
7-bitars tecken. Men det finns nÄgra undantag. Om du konverterar gamla
japanska C-program och URL-data frÄn kodningsformatet shift-JIS till
UTF-8-format ska du anvÀnda " |
|
Tips |
|---|---|
|
|
Du kan kontrollera om en textfil Àr kodad i UTF-8 med
iconv(1) pÄ följande sÀtt.
$ iconv -f utf8 -t utf8 input.txt >/dev/null || echo "non-UTF-8 found"
|
Tips |
|---|---|
|
AnvÀnd alternativet " |
HÀr Àr ett exempel pÄ ett skript för att konvertera kodning av filnamn frÄn sÄdana som skapats under Àldre operativsystem till moderna UTF-8 i en enda katalog.
#!/bin/sh ENCDN=iso-8859-1 for x in *; do mv "$x" "$(echo "$x" | iconv -f $ENCDN -t utf-8)" done
Variabeln "$ENCDN" anger den ursprungliga kodningen som
anvĂ€nds för filnamn under Ă€ldre operativsystem som i Tabell 11.2, âLista över kodningsvĂ€rden och deras anvĂ€ndningâ.
För mer komplicerade fall kan du montera ett filsystem (t.ex. en partition
pÄ en hÄrddisk) som innehÄller sÄdana filnamn med korrekt kodning med
alternativet mount(8) (se Avsnitt 8.1.3, âKodning av filnamnâ) och kopiera hela innehĂ„llet till ett annat
filsystem som Àr monterat som UTF-8 med kommandot "cp
-a".
Textfilformatet, sÀrskilt koden för radavslut (EOL), Àr beroende av plattformen.
Tabell 11.3. Lista över EOL-stilar för olika plattformar
| plattform | EOL-kod | kontroll | decimal | hexadecimal |
|---|---|---|---|---|
| Debian (unix) | LF | ^J |
10 | 0A |
| MSDOS och Windows | CR-LF | ^M^J |
13 10 | 0D 0A |
| Apples Macintosh | SR | ^M |
13 | 0D |
Konverteringsprogrammen för EOL-format, fromdos(1),
todos(1), frommac(1) och
tomac(1), Àr ganska
praktiska. recode(1) Àr ocksÄ anvÀndbart.
|
Notera |
|---|---|
|
Vissa data i Debian-systemet, t.ex. wikisidans data för paketet
|
|
Notera |
|---|---|
|
De flesta redigeringsprogram (t.ex. |
|
Tips |
|---|---|
|
AnvÀndningen av " |
Det finns nÄgra fÄ populÀra specialiserade program för att konvertera tab-koderna.
Tabell 11.4. Lista över TAB-konverteringskommandon frÄn paketen
bsdmainutils och coreutils
| funktion | bsdmainutils |
coreutils |
|---|---|---|
| expandera fliken till mellanslag | "col -x" |
expandera |
| oexpanderad flik frÄn utrymmen | "col -h" |
unexpand |
indent(1) frÄn indent-paketet
omformaterar blanksteg i C-programmet helt och hÄllet.
Editorprogram som vim och emacs kan
ocksÄ anvÀndas för TAB-konvertering. Med vim kan du till
exempel expandera TAB med kommandosekvenserna ":set
expandtab" och ":%retab". Du kan ÄterstÀlla
detta med kommandosekvenserna ":set noexpandtab" och
":%retab!".
Intelligenta moderna editorer som vim-programmet Àr
ganska smarta och klarar sig bra med alla kodningssystem och alla
filformat. För bÀsta kompatibilitet bör du anvÀnda dessa redigeringsprogram
i UTF-8-lokalen i en UTF-8-kompatibel konsol.
En gammal vÀsteuropeisk Unix-textfil, "u-file.txt", som
lagras i kodningen latin1 (iso-8859-1) kan redigeras enkelt med
vim pÄ följande sÀtt.
$ vim u-file.txt
Detta Àr möjligt eftersom den automatiska detekteringsmekanismen för
filkodningen i vim först antar UTF-8-kodningen och, om
den misslyckas, antar att den Àr latin1.
En gammal polsk Unix-textfil, "pu-file.txt", som lagras i
kodningen latin2 (iso-8859-2) kan redigeras med vim pÄ
följande sÀtt.
$ vim '+e ++enc=latin2 pu-file.txt'
En gammal japansk unix-textfil, "ju-file.txt", som
lagrats i eucJP-kodning kan redigeras med vim pÄ följande
sÀtt.
$ vim '+e ++enc=eucJP ju-file.txt'
En gammal japansk MS-Windows textfil, "jw-file.txt",
lagrad i den s.k. shift-JIS-kodningen (mer exakt: CP932) kan redigeras med
vim pÄ följande sÀtt.
$ vim '+e ++enc=CP932 ++ff=dos jw-file.txt'
NÀr en fil öppnas med flaggorna "++enc" och
"++ff", lagrar ":w" i Vims kommandorad
den i originalformat och skriver över originalfilen. Du kan ocksÄ ange
sparformatet och filnamnet i kommandoraden i Vim, t,ex, ":w
++enc=utf8 new.txt".
Se mbyte.txt "multi-byte text support" i vim on-line help
och Tabell 11.2, âLista över kodningsvĂ€rden och deras anvĂ€ndningâ för lokala vĂ€rden som anvĂ€nds
med "++enc".
Programfamiljen emacs kan utföra motsvarande funktioner.
Följande lÀser in en webbsida till en textfil. Detta Àr mycket anvÀndbart
nÀr du kopierar konfigurationer frÄn webben eller anvÀnder grundlÀggande
Unix-textverktyg som grep(1) pÄ webbsidan.
$ w3m -dump https://www.remote-site.com/help-info.html >textfile
PÄ samma sÀtt kan du extrahera vanlig textdata frÄn andra format med hjÀlp av följande.
Tabell 11.5. Lista över verktyg för att extrahera data i klartext
| paket | popcon | storlek | sökord | funktion |
|---|---|---|---|---|
w3m
|
V:11, I:145 | 2853 | htmlâtext | HTML till text-omvandlare med kommandot "w3m -dump" |
html2text
|
V:4, I:72 | 298 | htmlâtext | avancerad HTML till text-omvandlare (ISO 8859-1) |
lynx
|
V:29, I:458 | 1972 | htmlâtext | HTML till text-omvandlare med kommandot "lynx -dump" |
elinks
|
V:3, I:17 | 1791 | htmlâtext | HTML till text-omvandlare med kommandot "elinks -dump" |
links
|
V:3, I:22 | 2321 | htmlâtext | HTML till text-omvandlare med kommandot "links -dump" |
links2
|
V:1, I:11 | 5466 | htmlâtext | HTML-till-text-omvandlare med kommandot "links2 -dump" |
catdoc
|
V:17, I:177 | 682 | MSWordâtext,TeX | konvertera MSWord-filer till vanlig text eller TeX |
antiword
|
V:1.0, I:6.8 | 587 | MSWordâtext,ps | konvertera MSWord-filer till vanlig text eller ps |
unhtml
|
V:0.08, I:0.50 | 40 | htmlâtext | ta bort markeringstaggarna frĂ„n en HTML-fil |
odt2txt
|
V:2, I:25 | 60 | odtâtext | omvandlare frĂ„n OpenDocument Text till text |
Du kan markera och formatera vanlig textdata pÄ följande sÀtt.
Tabell 11.6. Lista över verktyg för att markera data i klartext
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
vim-runtime
|
V:17, I:366 | 38132 | highlight | Vim MACRO för att konvertera kÀllkod till HTML med ":source
$VIMRUNTIME/syntax/html.vim" |
cxref
|
V:0.01, I:0.24 | 1191 | câhtml | konverterare för C-programmet till latex och HTML (C-sprĂ„k) |
src2tex
|
V:0.02, I:0.21 | 1799 | highlight | konvertera mÄnga kÀllkoder till TeX (C-sprÄk) |
source-highlight
|
V:0.5, I:3.3 | 2131 | highlight | konvertera mÄnga kÀllkoder till HTML, XHTML, LaTeX, Texinfo, ANSI fÀrg-escape-sekvenser och DocBook-filer med markering (C++) |
highlight
|
V:0.5, I:3.3 | 1411 | highlight | konvertera mÄnga kÀllkoder till HTML-, XHTML-, RTF-, LaTeX-, TeX- eller XSL-FO-filer med markering (C++) |
grc
|
V:0.9, I:5.9 | 208 | textâfĂ€rg | generisk fĂ€rglĂ€ggare för allt (Python) |
pandoc
|
V:10, I:48 | 207402 | textânĂ„gon | allmĂ€n markup-omvandlare (Haskell) |
python3-docutils
|
V:13, I:53 | 2009 | textânĂ„gon | Formatering av ReStructured Text-dokument till XML (Python) |
markdown
|
V:0.6, I:6.7 | 56 | textâhtml | Formatering av Markdown-textdokument till (X)HTML (Perl) |
asciidoctor
|
V:0.5, I:5.1 | 101 | textânĂ„gon | AsciiDoc textdokumentformaterare till XML/HTML (Ruby) |
python3-sphinx
|
V:7, I:27 | 2996 | textânĂ„gon | ReStructured Text-baserat system för publicering av dokument (Python) |
hugo
|
V:0.8, I:5.3 | 62224 | textâhtml | Markdown-baserat system för publicering av statiska webbplatser (Go) |
XML (Extensible Markup Language) Àr ett mÀrksprÄk för dokument som innehÄller strukturerad information.
Se inledande information pÄ XML.COM.
XML-text ser ut ungefÀr som HTML. Det gör det
möjligt för oss att hantera flera format för utdata för ett dokument. Ett
enkelt XML-system Àr docbook-xsl-paketet, som anvÀnds
hÀr.
Varje XML-fil börjar med en standard XML-deklaration enligt följande.
<?xml version="1.0" encoding="UTF-8"?>
Den grundlÀggande syntaxen för ett XML-element mÀrks upp enligt följande.
<name attribute="value">content</name>
XML-element med tomt innehÄll mÀrks upp i följande korta form.
<name attribute="value" />
Attributet "attribute="value"" i exemplen ovan Àr
valfritt.
KommentarsfÀltet i XML Àr markerat enligt följande.
<!-- comment -->
Förutom att lÀgga till markeringar krÀver XML en mindre konvertering av innehÄllet med hjÀlp av fördefinierade enheter för följande tecken.
Tabell 11.7. Lista över fördefinierade enheter för XML
| fördefinierad enhet | tecken som ska konverteras till |
|---|---|
" |
": offert |
' |
': apostrof |
< |
<: mindre Àn |
> |
>: större Àn |
& |
& : ampersand |
|
Observera |
|---|---|
|
" |
|
Notera |
|---|---|
|
NÀr anvÀndardefinierade entiteter i SGML-stil,
t.ex. " |
|
Notera |
|---|---|
|
SÄ lÀnge XML-markeringen görs konsekvent med en viss uppsÀttning taggnamn (antingen vissa data som innehÄll eller attributvÀrde), Àr konvertering till en annan XML en trivial uppgift med hjÀlp av Extensible Stylesheet Language Transformations (XSLT). |
Det finns mÄnga verktyg för att bearbeta XML-filer, t.ex. Extensible Stylesheet Language (XSL).
NÀr du har skapat en vÀlformad XML-fil kan du konvertera den till valfritt format med hjÀlp av Extensible Stylesheet Language Transformations (XSLT).
XSL-FO (Extensible
Stylesheet Language for Formatting Objects) Àr tÀnkt att vara en
lösning för formatering. Paketet fop Àr nytt i Debians
main arkiv pÄ grund av dess beroende av programsprÄket Java. SÄ LaTeX-koden
genereras vanligtvis frÄn XML med hjÀlp av XSLT och LaTeX-systemet anvÀnds
för att skapa utskrivbara filer som DVI, PostScript och PDF.
Tabell 11.8. Lista över XML-verktyg
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
docbook-xml
|
V:16, I:424 | 2126 | xml | XML-dokumenttypdefinition (DTD) för DocBook |
docbook-xsl
|
V:16, I:151 | 14823 | xml/xslt | XSL-stilmallar för bearbetning av DocBook XML till olika utdataformat med XSLT |
xsltproc
|
V:16, I:76 | 83 | xslt | XSLT kommandoradsprocessor (XMLâ XML, HTML, vanlig text, etc.) |
xmlto
|
V:0.6, I:9.3 | 124 | xml/xslt | XML-till-alla-konverterare med XSLT |
fop
|
V:0.8, I:8.7 | 281 | xml/xsl-fo | konvertera Docbook XML-filer till PDF |
dblatex
|
V:1.2, I:6.4 | 4636 | xml/xslt | konvertera Docbook-filer till DVI-, PostScript-, PDF-dokument med XSLT |
dbtoepub
|
V:0.07, I:0.59 | 37 | xml/xslt | DocBook XML till .epub-omvandlare |
Eftersom XML Àr en delmÀngd av Standard Generalized Markup Language (SGML) kan det bearbetas med de omfattande verktyg som finns för SGML, t.ex. Document Style Semantics and Specification Language (DSSSL).
Tabell 11.9. Lista över DSSSL-verktyg
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
openjade
|
V:1, I:23 | 1066 | dsssl | ISO/IEC 10179:1996 standard DSSSL-processor (senaste) |
docbook-dsssl
|
V:0.5, I:8.6 | 2594 | xml/dsssl | DSSSL-stilmallar för bearbetning av DocBook XML till olika utdataformat med DSSSL |
docbook-utils
|
V:0.4, I:6.0 | 287 | xml/dsssl | verktyg för DocBook-filer inklusive konvertering till andra format (HTML,
RTF, PS, man, PDF) med docbook2*-kommandon med DSSSL |
Du kan extrahera HTML- eller XML-data frÄn andra format pÄ följande sÀtt.
Tabell 11.10. Lista över verktyg för extrahering av XML-data
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
man2html
|
V:0.2, I:1.4 | 142 | manpageâhtml | omvandlare frĂ„n manpage till HTML (CGI-stöd) |
doclifter
|
V:0.00, I:0.05 | 473 | troffâxml | omvandlare frĂ„n troff till DocBook XML |
texi2html
|
V:0.2, I:3.1 | 1847 | texiâhtml | omvandlare frĂ„n Texinfo till HTML |
info2www
|
V:1.0, I:1.7 | 74 | infoâhtml | konverterare frĂ„n GNU info till HTML (CGI-stöd) |
wv
|
V:0.3, I:2.7 | 733 | MSWordânĂ„gon | dokumentkonverterare frĂ„n Microsoft Word till HTML, LaTeX, etc. |
unrtf
|
V:0.4, I:3.1 | 159 | rtfâhtml | dokumentkonverterare frĂ„n RTF till HTML, etc |
wp2x
|
V:0.00, I:0.11 | 200 | WordPerfectânĂ„got | WordPerfect 5.0- och 5.1-filer till TeX, LaTeX, troff, GML och HTML |
För HTML-filer som inte Àr XML kan du konvertera dem till XHTML, som Àr en instans av vÀlformad XML. XHTML kan bearbetas av XML-verktyg.
Syntaxen i XML-filer och korrektheten i de webbadresser som finns i dem kan kontrolleras.
Tabell 11.11. Lista över XML Pretty Print-verktyg
| paket | popcon | storlek | funktion | beskrivning |
|---|---|---|---|---|
libxml2-utils
|
V:65, I:216 | 205 | xmlâhtmlâxhtml | xML-verktyg för kommandoraden med xmllint(1)
(syntaxkontroll, omformatering, lint, ...) |
tidy
|
V:1.0, I:7.9 | 79 | xmlâhtmlâxhtml | HTML syntaxkontroll och omformatering |
weblint-perl
|
V:0.07, I:0.95 | 32 | ludd | syntax och minimal stilkontroll för HTML |
linklint
|
V:0.05, I:0.52 | 343 | lÀnk kontroll | verktyg för kontroll av snabblÀnkar och underhÄll av webbplatser |
NÀr korrekt XML har genererats kan du anvÀnda XSLT-teknik för att extrahera data baserat pÄ markeringskontexten etc.
Unix-programmet troff, som ursprungligen utvecklades av AT&T, kan anvÀndas för enkel sÀttning. Det anvÀnds vanligtvis för att skapa manpages.
TeX, som skapades av Donald Knuth, Àr ett mycket kraftfullt verktyg för typsÀttning och Àr de facto-standarden. LaTeX, som ursprungligen skrevs av Leslie Lamport, ger tillgÄng till TeX:s kraft pÄ hög nivÄ.
Traditionellt Àr roff det huvudsakliga
textbehandlingssystemet i Unix. Se roff(7),
groff(7), groff(1),
grotty(1), troff(1),
groff_mdoc(7), groff_man(7),
groff_ms(7), groff_me(7),
groff_mm(7) och "info groff".
Du kan lÀsa eller skriva ut en bra handledning och referens om
"-me" -makro i
"/usr/share/doc/groff/" genom att installera
groff-paketet.
|
Tips |
|---|---|
|
" |
|
Tips |
|---|---|
|
Om du vill ta bort "^H" och "_" frÄn en textfil som genererats av
|
Programvarudistributionen TeX Live erbjuder
ett komplett TeX-system. Metapaketet texlive innehÄller
ett anstÀndigt urval av TeX Live-paketen som
bör rÀcka för de vanligaste uppgifterna.
Det finns mÄnga referenser tillgÀngliga för TeX och LaTeX.
tex(1)
latex(1)
texdoc(1)
texdoctk(1)
"The TeXbook", av Donald E. Knuth, (Addison-Wesley)
"LaTeX - A Document Preparation System", av Leslie Lamport, (Addison-Wesley)
"The LaTeX Companion", av Goossens, Mittelbach, Samarin, (Addison-Wesley)
Detta Àr den mest kraftfulla sÀttningsmiljön. MÄnga SGML-processorer anvÀnder detta som sin
backend-textprocessor. Lyx som tillhandahÄlls av
lyxpaketet och GNU
TeXmacs som tillhandahÄlls av texmacs-paketet
erbjuder en trevlig WYSIWYG-redigeringsmiljö
för LaTeX medan mÄnga anvÀnder Emacs och Vim som val för
kÀllredigeraren.
Det finns mÄnga tillgÀngliga resurser pÄ nÀtet.
TEX Live Guide - TEX Live 2007 (
"/usr/share/doc/texlive-doc-base/english/texlive-en/live.html")
(paketettexlive-doc-base )
NÀr dokumenten blir större kan TeX ibland orsaka fel. Du mÄste öka
poolstorleken i "/etc/texmf/texmf.cnf" (eller mer
lÀmpligt redigera "/etc/texmf/texmf.d/95NonPath" och köra
update-texmf(8)) för att ÄtgÀrda detta.
|
Notera |
|---|---|
|
TeX-kÀllan till "The TeXbook" finns tillgÀnglig pÄ www.ctan.org tex-archive site for
texbook.tex. Denna fil innehÄller de flesta av de nödvÀndiga
makron. Jag har hört att man kan bearbeta detta dokument med
|
Du kan skriva ut en manuell sida i PostScript pÄ ett snyggt sÀtt med nÄgot av följande kommandon.
$ man -Tps some_manpage | lpr
Ăven om det Ă€r möjligt att skriva en manuell sida (manpage) i det vanliga troff-formatet finns det fĂ„ hjĂ€lppaket för att skapa den.
Tabell 11.13. Lista över paket som hjÀlper till att skapa manpage
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
docbook-to-man
|
V:0.7, I:6.2 | 189 | SGMLâmanusida | konverterare frĂ„n DocBook SGML till roff man-makron |
help2man
|
V:0.6, I:6.7 | 542 | textâmanpage | automatisk generator av manpage frĂ„n --help |
info2man
|
V:0.02, I:0.21 | 134 | infoâmanpage | omvandlare frĂ„n GNU info till POD eller man pages |
txt2man
|
V:0.07, I:0.70 | 112 | textâmanpage | konvertera platt ASCII-text till man page-format |
Utskrivbara data uttrycks i PostScript-format pÄ Debian-systemet. CUPS (Common Unix Printing System) anvÀnder Ghostscript som backendprogram för rastrering för icke-PostScript-skrivare.
Utskrivbara data kan ocksÄ uttryckas i PDF-format pÄ det senaste Debian-systemet.
PDF-filer kan visas och dess formulĂ€rposter kan fyllas i med hjĂ€lp av GUI-visningsprogram som Evince och Okular (se Avsnitt 7.4, âGUI-applikationerâ) och moderna webblĂ€sare som Chromium.
PDF-filer kan redigeras med hjĂ€lp av vissa grafikverktyg som LibreOffice, Scribus och Inkscape (se Avsnitt 11.6, âGrafiska dataverktygâ).
|
Tips |
|---|---|
|
Du kan lÀsa en PDF-fil med GIMP och konvertera den till PNG-format med en upplösning pÄ mer Àn 300 dpi. Detta kan anvÀndas som en bakgrundsbild för LibreOffice för att producera en önskvÀrd Àndrad utskrift med minsta möjliga anstrÀngning. |
KÀrnan i hanteringen av utskrivbara data Àr Ghostscript PostScript (PS) -tolken som genererar rasterbilder.
Tabell 11.14. Lista över Ghostscript PostScript-tolkar
| paket | popcon | storlek | beskrivning |
|---|---|---|---|
ghostscript
|
V:153, I:580 | 183 | GPL Ghostscript PostScript/PDF-tolk |
ghostscript-x
|
V:1, I:17 | 88 | GPL Ghostscript PostScript/PDF-tolk - Stöd för X-display |
libpoppler147
|
V:111, I:283 | 4891 | Bibliotek för PDF-rendering frÄn PDF-tittaren xpdf |
libpoppler-glib8t64
|
V:66, I:278 | 550 | Bibliotek för PDF-rendering (GLib-baserat delat bibliotek) |
poppler-data
|
V:168, I:600 | 13086 | CMaps för PDF-renderingsbibliotek (för CJK-stöd: Adobe-*) |
|
Tips |
|---|---|
|
" |
Du kan slÄ samman tvÄ PostScript (PS) -
eller Portable Document Format
(PDF) -filer med hjÀlp av gs(1) i Ghostscript.
$ gs -q -dNOPAUSE -dBATCH -sDEVICE=pswrite -sOutputFile=bla.ps -f foo1.ps foo2.ps $ gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=bla.pdf -f foo1.pdf foo2.pdf
|
Notera |
|---|---|
|
PDF, som Àr ett allmÀnt anvÀnt utskriftsformat för flera plattformar, Àr i huvudsak det komprimerade PS-formatet med nÄgra ytterligare funktioner och tillÀgg. |
|
Tips |
|---|---|
|
För kommandoraden Àr |
Jag fick upp ögonen för följande paket för utskriftsvÀnliga dataverktyg.
Tabell 11.15. Lista över utskrivbara dataprogram
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
poppler-utils
|
V:134, I:490 | 760 | pdfâps,text,⊠| PDF-verktyg: pdftops, pdfinfo,
pdfimages, pdftotext,
pdffonts |
psutils
|
V:4, I:54 | 34 | psâps | Verktyg för konvertering av PostScript-dokument |
poster
|
V:0.1, I:1.8 | 58 | psâps | skapa stora affischer av PostScript-sidor |
enscript
|
V:1, I:11 | 2138 | textâps, html, rtf | konvertera ASCII-text till PostScript, HTML, RTF eller Pretty-Print |
a2ps
|
V:0.6, I:7.3 | 4083 | textâps | "Allt till PostScript"-konverterare och pretty-printer |
pdftk
|
V:1, I:25 | 28 | pdfâpdf | Verktyg för konvertering av PDF-dokument: pdftk |
html2ps
|
V:0.2, I:1.9 | 256 | htmlâps | omvandlare frĂ„n HTML till PostScript |
gnuhtml2latex
|
V:0.07, I:0.67 | 26 | htmlâlatex | omvandlare frĂ„n html till latex |
latex2rtf
|
V:0.1, I:2.3 | 495 | latexârtf | konvertera dokument frĂ„n LaTeX till RTF som kan lĂ€sas av MS Word |
ps2eps
|
V:2, I:35 | 95 | psâeps | konvertering frĂ„n PostScript till EPS (Encapsulated PostScript) |
e2ps
|
V:0.01, I:0.12 | 104 | textâps | Text till PostScript-omvandlare med stöd för japansk kodning |
impose+
|
V:0.1, I:1.5 | 118 | psâps | PostScript-verktyg |
trueprint
|
V:0.01, I:0.08 | 148 | textâps | skriver ut mĂ„nga kĂ€llkoder (C, C++, Java, Pascal, Perl, Pike, Sh och Verilog) till PostScript. (C-sprĂ„k) |
pdf2svg
|
V:0.3, I:3.3 | 33 | pdfâsvg | omvandlare frĂ„n PDF till skalbart vektorgrafikformat |
pdftoipe
|
V:0.01, I:0.46 | 74 | pdfâipe | konverterare frĂ„n PDF till IPE:s XML-format |
Kommandona lp(1) och lpr(1) som
erbjuds av Common Unix Printing
System (CUPS) ger möjlighet till anpassad utskrift av utskrivbara
data.
Du kan skriva ut 3 kopior av en fil som Àr sorterad med hjÀlp av nÄgot av följande kommandon.
$ lp -n 3 -o Collate=True filename
$ lpr -#3 -o Collate=True filename
Du kan anpassa skrivarfunktionen ytterligare genom att anvÀnda
skrivaralternativ som "-o number-up=2", "-o
page-set=even", "-o page-set=odd", "-o
scaling=200", "-o natural-scaling=200", etc.,
som finns dokumenterade i Command-Line Printing and
Options.
Följande paket för konvertering av postdata fÄngade min uppmÀrksamhet.
Tabell 11.16. Lista över paket som hjÀlper till med konvertering av e-postdata
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
sharutils
|
V:3, I:30 | 1436 | post | shar(1), unshar(1),
uuencode(1), uudecode(1) |
mpack
|
V:0.9, I:8.4 | 109 | MIME | kodning och avkodning av MIME-meddelanden:
mpack(1) och munpack(1) |
tnef
|
V:0.4, I:4.3 | 103 | ms-tnef | uppackning av MIME-bilagor av typen "application/ms-tnef" som endast Àr ett Microsoft-format |
uudeview
|
V:0.2, I:1.9 | 105 | post | kodare och avkodare för följande format: uuencode, xxencode, BASE64, quotted printable, och BinHex |
|
Tips |
|---|---|
|
IMAP4-servern ( Internet Message Access Protocol version 4) kan anvÀndas för att flytta ut e-post frÄn proprietÀra e-postsystem om e-postklientprogrammet kan konfigureras sÄ att det ocksÄ anvÀnder IMAP4-servern. |
Mail(SMTP) bör begrĂ€nsas till serier av 7-bitarsdata. BinĂ€rdata och 8-bitars textdata kodas dĂ€rför till 7-bitarsformat med hjĂ€lp av MIME (Multipurpose Internet Mail Extensions) och val av teckenuppsĂ€ttning (se Tabell 11.2, âLista över kodningsvĂ€rden och deras anvĂ€ndningâ).
Standardlagringsformatet för e-post Àr mbox formaterat enligt RFC2822 (uppdaterad RFC822). Se
mbox(5) (tillhandahÄlls av
mutt-paketet ).
För europeiska sprÄk anvÀnds vanligtvis "Content-Transfer-Encoding:
quoted-printable" med teckenuppsÀttningen ISO-8859-1 för e-post
eftersom det inte finns sÄ mÄnga 8-bitars tecken. Om europeisk text Àr kodad
i UTF-8 kommer sannolikt "Content-Transfer-Encoding:
quoted-printable" att anvÀndas eftersom det mestadels Àr
7-bitarsdata.
För japanska anvÀnds traditionellt "Content-Type: text/plain;
charset=ISO-2022-JP" för e-post för att hÄlla texten i 7 bitar.
Men Àldre Microsoft-system kan skicka e-postdata i Shift-JIS utan korrekt
deklaration. Om japansk text kodas i UTF-8 kommer Base64 sannolikt att anvÀndas eftersom den innehÄller
mÄnga 8-bitarsdata. Situationen för andra asiatiska sprÄk Àr liknande.
|
Notera |
|---|---|
|
Om dina e-postdata som inte Àr Unix Àr tillgÀngliga för en klientprogramvara som inte Àr Debian och som kan prata med IMAP4-servern, kan du kanske flytta ut dem genom att köra din egen IMAP4-server. |
|
Notera |
|---|---|
|
Om du anvÀnder andra lagringsformat för e-post Àr det ett bra första steg
att flytta dem till mbox-format. Ett mÄngsidigt klientprogram som
|
Du kan dela upp innehÄllet i brevlÄdan till varje meddelande med
procmail(1) och formail(1).
Varje e-postmeddelande kan packas upp med munpack(1) frÄn
mpack-paketet (eller andra specialiserade verktyg) för
att fÄ fram det MIME-kodade innehÄllet.
Ăven om GUI-program som gimp(1) Ă€r mycket kraftfulla, Ă€r
kommandoradsverktyg som imagemagick(1) ganska anvÀndbara
för att automatisera bildmanipulering via skript.
De facto bildfilformat för digitalkameror Àr EXIF ( Exchangeable Image File Format ), som Àr JPEG-bildfilformatet med ytterligare metadatataggar. Det kan innehÄlla information som datum, tid och kamerainstÀllningar.
Patentet för den förlustfria datakomprimeringen Lempel-Ziv-Welch (LZW) har löpt ut. GIF-verktyg (Graphics Interchange Format) som anvÀnder LZW-komprimeringsmetoden Àr nu fritt tillgÀngliga pÄ Debian-systemet.
|
Tips |
|---|---|
|
Alla digitalkameror eller skannrar med flyttbara inspelningsmedia fungerar med Linux via USB-lagringslĂ€sare eftersom de följer designregeln för kamerafilsystem och anvĂ€nder FAT-filsystem. Se Avsnitt 10.1.7, âFlyttbar lagringsenhetâ. |
Följande metapaket Àr bra utgÄngspunkter för att söka efter grafiska
dataverktyg med aptitude(8). "Packages overview for Debian
PhotoTools Maintainers" kan vara en annan startpunkt.
Tabell 11.17. Lista över verktyg för grafikdata (metapaket)
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
education-graphics
|
I:0.40 | 31 | svg, jpeg, ⊠| metapaket för undervisning i grafik och bildkonst. |
open-font-design-toolkit
|
I:0.06 | 9 | ttf, ps, ⊠| metapaket för öppen typsnittsdesign |
|
Tips |
|---|---|
|
Sök efter fler bildverktyg med hjÀlp av regex
" |
Följande paket för datakonvertering, redigering och organisationsverktyg för GUI-grafik fÄngade min uppmÀrksamhet.
Tabell 11.18. Lista över verktyg för grafikdata (GUI)
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
gimp
|
V:33, I:229 | 32032 | bild(bitmap) | GNU-program för bildmanipulering |
xsane
|
V:10, I:136 | 1512 | bild(bitmap) | GTK-baserad X11-frontend för SANE (Scanner Access Now Easy) |
scribus
|
V:1, I:14 | 32289 | ps/pdf/SVG/⊠| Scribus DTP-editor |
libreoffice-draw
|
V:101, I:436 | 10992 | bild(vektor) | LibreOffice kontorspaket - ritning |
inkscape
|
V:13, I:85 | 110787 | bild(vektor) | SVG-redigerare (skalbar vektorgrafik) |
dia
|
V:2, I:18 | 3812 | bild(vektor) | diagramredigerare (Gtk) |
xfig
|
V:0.6, I:9.2 | 7951 | bild(vektor) | Möjlighet till interaktiv generering av siffror enligt X11 |
gocr
|
V:0.6, I:4.4 | 549 | bildâtext | gratis OCR-programvara |
eog
|
V:32, I:165 | 10310 | bild(Exif) | Ăgon av GNOME grafikvisare program |
gthumb
|
V:3, I:13 | 5162 | bild(Exif) | bildvisare och webblÀsare (GNOME) |
geeqie
|
V:4, I:12 | 2871 | bild(Exif) | bildvisare med GTK |
shotwell
|
V:16, I:259 | 6334 | bild(Exif) | digital fotoorganisator (GNOME) |
gwenview
|
V:41, I:119 | 6001 | bild(Exif) | bildvisare (KDE) |
kamera
|
I:118 | 982 | bild(Exif) | stöd för digitalkamera för KDE-applikationer |
digikam
|
V:1.9, I:9.2 | 302 | bild(Exif) | program för hantering av digitala foton för KDE |
darktable
|
V:4, I:12 | 35892 | bild(Exif) | virtuellt ljusbord och mörkrum för fotografer |
hugin
|
V:0.6, I:6.2 | 6489 | bild(Exif) | panorama foto stitcher |
librecad
|
V:1, I:15 | 9100 | DXF, ... | 2D CAD-dataredigerare |
freecad
|
V:1, I:21 | 107 | DXF, ... | 3D CAD-dataredigerare |
blender
|
V:3, I:24 | 92911 | blend, TIFF, VRML, ⊠| 3D-innehÄllsredigerare för animering etc |
mm3d
|
V:0.04, I:0.28 | 4123 | ms3d, obj, dxf, ⊠| OpenGL-baserad 3D-modellredigerare |
fontforge
|
V:0.7, I:6.0 | 4058 | ttf, ps, ⊠| fontredigerare för PS-, TrueType- och OpenType-teckensnitt |
xgridfit
|
V:0.01, I:0.10 | 878 | ttf | program för gridfitting och hintning av TrueType-teckensnitt |
Följande paket för CLI-verktyg för konvertering, redigering och organisering av grafikdata fÄngade min uppmÀrksamhet.
Tabell 11.19. Lista över verktyg för grafikdata (CLI)
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
imagemagick
|
V:9, I:291 | 77 | bild(bitmap) | bildbehandlingsprogram |
graphicsmagick
|
V:1.3, I:9.4 | 5816 | bild(bitmap) | bildmanipuleringsprogram (gaffel av imagemagick) |
netpbm
|
V:29, I:301 | 8435 | bild(bitmap) | verktyg för grafisk konvertering |
libheif-examples
|
V:0.3, I:3.5 | 439 | heifâjpeg(bitmap) | konvertera HEIF (High
Efficiency Image File Format) till JPEG-, PNG- eller Y4M-format med
kommandot heif-convert(1) |
icoutils
|
V:4, I:35 | 221 | pngâico(bitmapp) | konvertera MS Windows-ikoner och markörer till och frĂ„n PNG-format(favicon.ico) |
pstoedit
|
V:2, I:41 | 1076 | ps/pdfâbild(vektor) | Konvertera PostScript- och PDF-filer till redigerbar vektorgrafik (SVG) |
libwmf-bin
|
V:5, I:90 | 149 | Fönster/bild(vektor) | Verktyg för konvertering av Windows-metafiler (vektorgrafikdata) |
fig2sxd
|
V:0.04, I:0.20 | 151 | figâsxd(vektor) | konvertera XFig-filer till OpenOffice.org Draw -format |
unpaper
|
V:2, I:17 | 417 | bildâbild | verktyg för efterbehandling av skannade sidor för OCR |
tesseract-ocr
|
V:8, I:33 | 2210 | bildâtext | gratis OCR-programvara baserad pĂ„ HP:s kommersiella OCR-motor |
tesseract-ocr-eng
|
V:8, I:34 | 4032 | bildâtext | OCR-motordata: tesseract-ocr-sprĂ„kfiler för engelsk text |
ocrad
|
V:0.3, I:2.5 | 604 | bildâtext | gratis OCR-programvara |
exif
|
V:3, I:55 | 335 | bild(Exif) | kommandoradsverktyg för att visa EXIF-information i JPEG-filer |
exiv2
|
V:2, I:21 | 429 | bild(Exif) | Verktyg för hantering av EXIF/IPTC-metadata |
exiftran
|
V:1, I:12 | 81 | bild(Exif) | omvandla digitalkamerans jpeg-bilder |
exiftags
|
V:0.3, I:3.0 | 309 | bild(Exif) | verktyg för att lÀsa Exif-taggar frÄn en JPEG-fil frÄn en digitalkamera |
exifprobe
|
V:0.3, I:2.6 | 502 | bild(Exif) | lÀsa metadata frÄn digitala bilder |
dcraw
|
V:1.0, I:8.3 | 428 | bild(Raw)âppm | avkoda rĂ„a digitalkamerabilder |
findimagedupes
|
V:0.1, I:1.3 | 75 | bildâfingeravtryck | hitta visuellt liknande eller duplicerade bilder |
ale
|
V:0.01, I:0.15 | 818 | bildâbild | sammanfoga bilder för att öka Ă„tergivningen eller skapa mosaiker |
imageindex
|
V:0.2, I:1.4 | 143 | bild(Exif)âhtml | generera statiska HTML-gallerier frĂ„n bilder |
outguess
|
V:0.2, I:1.3 | 230 | jpeg,png | universellt steganografiskt verktyg |
jpegoptim
|
V:0.8, I:6.2 | 59 | jpeg | optimera JPEG-filer |
optipng
|
V:3, I:43 | 187 | png | optimera PNG-filer, förlustfri komprimering |
pngquant
|
V:1, I:11 | 62 | png | optimera PNG-filer, förlustfri komprimering |
Det finns mÄnga andra program för konvertering av data. Följande paket
fÄngade mina ögon med hjÀlp av regex "~Guse::converting"
i aptitude(8) (se Avsnitt 2.2.6, âSök metodalternativ med aptitudeâ).
Tabell 11.20. Lista över diverse verktyg för datakonvertering
| paket | popcon | storlek | sökord | beskrivning |
|---|---|---|---|---|
alien
|
V:1, I:14 | 150 | rpm/tgzâdeb | konverterare för det utlĂ€ndska paketet till Debian-paketet |
freepwing
|
V:0.01, I:0.02 | 447 | EBâEPWING | omvandlare frĂ„n "Electric Book" (populĂ€rt i Japan) till ett enda JIS X 4081-format (en delmĂ€ngd av EPWING V1) |
calibre
|
V:9, I:27 | 65618 | allaâEPUB | e-bokskonverterare och bibliotekshantering |
Du kan ocksÄ extrahera data frÄn RPM-format med följande.
$ rpm2cpio file.src.rpm | cpio --extract