19 feb. 2026

Realtid
Bybit

En ny standard

Google hittar skannad text

administrator

administrator

Nu kan du hitta och kopiera text i skannade dokument med sökmotorn.

Dessutom går det att se Googles egen tolkning av bilden till text, som vanlig html av mycket hög kvalitet. Klicka bara på ”Se som HTML-version”.

Googles produktchef Evin Levey berättar om den nya funktionen på företagets egen blogg.

Pappersdokument som läses in som bilder i datorn med en skanner kan omvandlas till Adobes standardiserade dokumentformat pdf.

Många myndigheter och företag skapar årsredovisningar, rapporter och pressreleaser i datorn, bara för att sedan skriva ut dokumentet på en skrivare innan de läser in det igen med en skanner.

Bilden av dokumentet omvanldas till en fil med formatet pdf som de sedan lägger ut på sin hemsida.

Varför? Kanske av okunskap, kanske för att den rätta programvaran för att omvanlda ordbehandlarens text till pdf saknats. Kanske för att en del innehåll inte är menat för vem som helst.

Förut har det inneburat att det blir omöjligt att hitta dokumentet genom att söka på innehållet.

Den som ändå hittat texten och velat återanvända den har varit tvungen att själv skriva av bilden, bokstav för bokstav.

<annons1><annons1>Med hjälp av Googles sökmotor går det nu att hitta dessa dokument genom att söka på innehållet.

Google har ”sedan en tid” samlat på sig innehållet i webbens alla pdf-dokument.

Än så länge saknas merparten av alla skannade dokument som finns på internet. När Google hunnit tugga igenom allt framgår inte.

Hur lång tid det tar för sökmotorn att hitta nya dokument är inte heller klart.

Google använder OCR, optisk igenkänning av bokstäver, för att känna igen text i bilder. Googles har utvecklat tolkningen av bilderna och klarar till exempel att skilja på bokstaven o, siffran noll och den lilla cirkel som är tecknet för grader.

Senaste lediga jobben