[Pc-listen] et problem med pdf-filer på computer?

Brian Hovmand Olesen brian at blindkom.dk
Tor Aug 31 11:25:35 CEST 2023


Hejsa

JO sådan er det jo når man skal dekode ethvert filformat.

Godt vi har mange værktøjer i kassen efterhånden.

Det ville bare være rart om de alle tog lidt mere hensyn til tilgængeligheden.

 

Fra: Pc-listen <pc-listen-bounces at blindkom.dk> På vegne af Nicolai Svendsen via Pc-listen
Sendt: 31. august 2023 10:34
Til: pc-listen at blindkom.dk
Cc: Nicolai Svendsen <chojiro1990 at gmail.com>
Emne: Re: [Pc-listen] et problem med pdf-filer på computer?

 

Hej Brian

 

Nej, det er ikke så mærkeligt. Det afhænger af dit rendering engine. F.eks. bruger iOS som udgangspunkt PDFKit, hvilket generelt garanterer en konsekvent oplevelse. Android er nogle gange lidt anderledes, da nogle apps benytter pdf.js til at vise dokumentet, og andre bruger PDFRenderer klassen, der er en del af Android Framework. Med programmer på computeren, har du ikke samme garanti, og ikke alle programmer kan håndtere den kodning, der sandsynligvis er brugt. Der kan sagtens være unøjagtigheder i gengivelsen af dokumentet, især når der bruges forskellige rendering engines til det. Som du selv har observeret, kan resultatet nogle gange variere. Det afhænger også af, hvordan udgiveren af dokumentet først og fremmest har skabt filen. Et PDF-dokument er jo ikke bare tekst, men indeholder objekter, skrifttyper, indlejrede filer og mere, hvilket gør problematikken meget kompleks, når dokumentet bagefter skal vises. That’s the reality. Om vi kan lide det eller ej, så må vi læse dokumentet i et andet program, på en anden enhed eller bruge noget som ABBYY FineReader. Desuden kan du også åbne PDF-er direkte i Word, så måske er dette et forsøg værd. Den laver vist OCR eller sådan noget.

 

Nicolai

Sendt fra Mail <https://go.microsoft.com/fwlink/?LinkId=550986>  til Windows

 

Fra: Brian Hovmand Olesen via Pc-listen <mailto:pc-listen at blindkom.dk> 
Sendt: 31. august 2023 10:14
Til: pc-listen at blindkom.dk <mailto:pc-listen at blindkom.dk> 
Cc: Brian Hovmand Olesen <mailto:brian at blindkom.dk> 
Emne: Re: [Pc-listen] et problem med pdf-filer på computer?

 

Hej Nicolai

Men så har det altså med ombrydning af linjer at gøre. Det er så bare mærkeligt, at telefonerne godt kan vise det på den rigtige måde og at computeren vælger i nogle programmer at vise det rigtigt og i andre forkert.

 

Brian

 

Fra: Pc-listen <pc-listen-bounces at blindkom.dk <mailto:pc-listen-bounces at blindkom.dk> > På vegne af Nicolai Svendsen via Pc-listen
Sendt: 31. august 2023 10:02
Til: pc-listen at blindkom.dk <mailto:pc-listen at blindkom.dk> 
Cc: Nicolai Svendsen <chojiro1990 at gmail.com <mailto:chojiro1990 at gmail.com> >
Emne: Re: [Pc-listen] et problem med pdf-filer på computer?

 

Hejsa

 

Men for nu at komme med et svar på din oprindelige besked: 😊

 

Faktisk, så findes der sandsynligvis en mere nøjagtig grund for, hvorfor du oplever dette. Jeg kan så også fortælle, at problemet ikke kun eksisterer i Firefox. Der er også en grund til, at du kun oplever det på computeren, men det bliver en unødvendigt lang forklaring, der dykker ned i, hvordan rendering engines  virker på teknisk niveau. Der er også en teknisk grund til, at det primært rammer skærmlæserbrugere. Jeg tænker ikke, at de fleste er interesserede i det, da det omfatter datarepræsentation, fortolkning, kodning af dokumentet, samt gengivelsen af det kodede dokument (rendering). Jeg gjorde det til mit projekt, da jeg gik på datamatikerstudiet på University College Nordjylland for en stund, fordi der var en del PDF’er på det tidspunkt, hvor problemet opstod.

 

Men for at gøre det relativt kort, så er der ikke noget specielt mystisk i, hvorfor problemet sandsynligvis opstår. Når der skrives, bruger nogle programmer ofte en blød bindestreg (( Unicode U+00AD) til at ombryde ord, når man når slutningen af en linje. Det samme er tilfældet, når der er linjeskift. Typisk, så kan du indsætte et blødt linjeskift med shift+enter, og et regulært linjeskift med enter-tasten alene. I modsætning til den bløde bindestreg, så har det bløde linjeskift faktisk ingen visuel repræsentation, da dens funktion kun er at flytte efterfølgende tekst til den næste linje.

 

Du ville formodentligt kunne se problemet, hvis du åbner din PDF-fi i en hex editor, så du kan få dens rå binære data vist. Her kan du se det heksadecimale format, sammen med dens ASCII-tegnsæt eller andet.

 

Her ville man kunne se det bløde linjeskift ved disse kontroltegn:

1.	Carriage Return (CR): `0D`
2.	CR+LF-kombination: `0D 0A`
3.	Line Feed (LF): `0A`

 

Har man fundet et sådanne tilfælde, ville man typisk undersøge dataene omkring det problematiske tegn for evt. at lokalisere problemer, der bliver introduceret under kodningen af dokumentet. Det kan f.eks. være problemer, der opstod, da det blev konverteret til, oprettet som eller redigeret som et PDF-dokument. At man kan opnå forskellige resultater, når man læser dokumentet i forskellige programmer, kan sagtens være tilfældet, da nogle håndterer kodning bedre end andre. Det afhænger også af, hvordan filen bliver gengivet. F.eks. har jeg selv erfaret ved grundig forskning i de filer, som jeg selv har haft problemer med, at teorien holder.

 

Naturligvis skal man have en forståelse for filformater, kodning og filstrukturer. I praksis ville du kunne gemme den rettede fil fra din heksadecimale editor og derved løse problematikken. Man kunne også bare opfordre til, at folk lærte at oprette korrekt opmærkede PDF-filer, da værktøjerne eksisterer.

 

Nicolai

 

Sendt fra Mail <https://go.microsoft.com/fwlink/?LinkId=550986>  til Windows

 

Fra: Brian Hovmand Olesen via Pc-listen <mailto:pc-listen at blindkom.dk> 
Sendt: 30. august 2023 16:52
Til: pc-listen at blindkom.dk <mailto:pc-listen at blindkom.dk> 
Cc: Brian Hovmand Olesen <mailto:brian at blindkom.dk> 
Emne: Re: [Pc-listen] et problem med pdf-filer på computer?

 

Hejsa

Ah jeg har sandsynligvis selv fundet svaret.

Jeg brugte Firefox som pdf-fremviser, men det er åbenbart den, som når der er et fysisk linjeskift i filen bare klasker ordene sammen og det ser jo ikke så godt ud. Så nu tester jeg, om Google opfører sig lidt pænere på dette felt.

Så selvom jeg er stor fan af Firefox på stort set alle andre områder må jeg desværre rapportere til dem, at de lige skal slappe lidt af med deres ombrydning af pdf-filer. 😊

 

Rigtig god dag til alle.

 

Mvh. Brian

 

Fra: Pc-listen <pc-listen-bounces at blindkom.dk <mailto:pc-listen-bounces at blindkom.dk> > På vegne af Brian Hovmand Olesen via Pc-listen
Sendt: 30. august 2023 15:44
Til: pc-listen at blindkom.dk <mailto:pc-listen at blindkom.dk> 
Cc: Brian Hovmand Olesen <brian at blindkom.dk <mailto:brian at blindkom.dk> >
Emne: [Pc-listen] et problem med pdf-filer på computer?

 

Hejsa

Flere af jer har sikkert set dette her problem før, men har muligvis valgt at leve med det.

Nogle pdf-filer ser ud som om de mangler mellemrum. Altså at ord står som om de hænger sammen og der ikke er mellemrum imellem dem.

Det sker bare ikke, hvis man læser samme fil på en telefon.

Har I en forklaring eller endnu bedre en løsning på dette?

 

Det skal siges, at for nemheds skyld læser jeg filen i Firefox.

Jeg har aldrig rigtig fået adobe Reader dc eller hvad de nu kalder den for øjeblikket til at virke.

Mvh. Brian

 

 

-------------- næste del --------------
En HTML-vedhæftning blev fjernet...
URL: <http://blindkom.dk/pipermail/pc-listen_blindkom.dk/attachments/20230831/b93d4a25/attachment.html>


Mere information om maillisten Pc-listen.