Thursday, 17 April 2008

Filformat.wtf - vilket skall man välja?

Säg att du vill börja skriva dagbok på en dator. I vilket format skall du skriva din dagbok i för att det skall vara möjligt ännu om femtio eller kanske hundra år att läsa den?

Helt säker på att det format man väljer är läsbart om femtio år kan man aldrig vara. Ingen vet hur framtiden ser ut. Säkrast är troligen att printa ut allt, men det är ju inte helt praktiskt och kanske inte ens ändamålsenligt för alla sorts dokument. Du kan ju ha en videodagbok. Problemet med långvarig läsbarhet gäller förstås inte bara dagböcker, utan alla sorts filer man sparar i digital form: bilder, musik, filmer, databaser, dokument, med mera, med mera. Projekt Gutenberg,

http://www.gutenberg.org, som strävar efter att digitalisera klassiska böcker och sätta dem på nätet, fritt tillgängliga för alla, har löst problemet genom att spara alla böcker i det enklast möjliga formatet -- vanliga textfiler. Med det formatet är all text i samma storlek och varken fetstil eller kursiv stil är möjligt. Bilder kan man glömma. Det är alltså ett mycket primitivt format, men det gör sannolikheten större för att det skall vara läsbart även i framtiden. För vanliga användare duger oftast inte denna lösning.

Filformat kan delas in i tre olika grupper: kommersiella stängda, kommersiella öppna och icke-kommersiella öppna format. Man kan enkelt säga att kommersiellt stängda format är de man borde undvika, icke-kommerciella öppna format de man borde använda och kommersiella öppna format en bra kompromiss. Problemet med kommersiella stängda format -- som exempelvis .doc och .xls -- är att de är och gör dig beroende av företaget som äger formatet. När företaget slutar stöda formatet eller går i konkurs sitter man i värsta fall med en massa filer man inte kan läsa mera.

Kommersiella öppna format är format som ägs av ett företag, men har gett ut specifikationerna för formatet, så att andra kan göra program som kan läsa formatet eller producera filer i formatet. Exempel på ett kommersiellt öppet format är .pdf. Risken med denna sorts format är att företaget stänger formatet igen eller gör förändringar i formatet som det inte berättar om. Vad gäller pdf-formatet tror jag att denna risk är rätt liten, men det lönar sig förstås alltid att tänka på dessa saker när man väljer sina format.

Icke-kommersiella öppna format har en öppen dokumentation och kan inte stängas. Det är fritt fram för vem som helst att göra program som använder sig av formatet. Detta betyder att om mitt i allt finner att det inte finns något program för din dator-plattform som kan läsa din farmors dagbok, så kan du i värsta fall göra ett läsningsprogram själv -- eller beställa programmet av någon annan. Med ett stängt format är detta inte möjligt utan ägarens tillstånd -- om ägaren ännu ens existerar eller kommer ihåg specifikationerna! Exempel på icke-kommersiella öppna format är Portable Network graphic (.png), Joint Photographic Expert Group (.jpg / .jpeg) ( .mpeg2), eXtensible Markup Language (.xml), Scalable Vector Graphic (.svg) och inte minst OpenDocument-formatet.

Valet av filformat och i förlängningen vilket program man skall använda för större projekt (som t ex dagböcker, arkiv, bild/fotografi-arkiv, musikbibliotek) är alltså av stor vikt. Portabilitet och användarvänlighet är också att tänka på. Har formatet de egenskaper jag vill ha? Att det är lätt att omvandla formatet till andra format är en garanti för att man skall kunna hålla sina filer i ordning.

Mer om ämnet hittas på

http://en.wikibooks.org/wiki/Choosing_The_Right_File_Format/Formats.

No comments: