OCR scanning

Tråden skapades och har fått 19 svar. Det senaste inlägget skrevs .
1

Jag använder programmet Vuescan sedan flera år,
Vill ha OCR-tillägg för svenska i programmets inlästa fil som klarar å,ä,ö bl a. På hämtsidan står att en ” ocr_sv.bin” skall hämtas och läggas i ”Användare – Delad”. Se länk http://translate.google.com/translate?u=http:....

Har hämtat och klickat på uppackning – händer inget. Försökt lägga in den i ”Delad” men lyckas ej.

Kan någon ge mig ett råd hur jag skall lösa detta.?

Instruktionen säger "Lagra den här filen på din hårddisk…" och inget om att packa upp filen.
Så lägg filen i /Användare/Delat/ (Samma sak som /Users/Shared/), starta VueScan och OCR:a för glada livet.

Försöker igen - Tack

Ursprungligen av reboot81:

Instruktionen säger "Lagra den här filen på din hårddisk…" och inget om att packa upp filen.
Så lägg filen i /Användare/Delat/ (Samma sak som /Users/Shared/), starta VueScan och OCR:a för glada livet.

Tyvärr så enkelt var det inte. Har startat om allt - även datorn.

Ursprungligen av aake39:

Tyvärr så enkelt var det inte. Har startat om allt - även datorn.

Jo det är enkelt. Men väldigt svårt att förstå var det tar stopp för dig.

Du behöver inte starta om, det här är OS X.

Spara filen ocr_sv.bin i mappen /Användare/Delat/ eller under dess engelska namn /Users/Shared/

Starta Vuescan.

Exakt så har jag gjort från början, sen gav jag upp och ställde frågan till forumet. Omstart av datorn var en sista utväg. Det jag menar med resultatet är att jag vill slippa göra petiga korrigeringar i den svenska texten. Så här blir resultatet:

<1 Sergels torg sett frfin Mister Samuelsgatans viadukt éver
Sveavéigen. Husen pé torgets sédra sida stir fortfarande
kvar, kommunpolitikerna har énnu inte beslutat vad som
skall komma i stéllet (jmf med bild 122). Augusti 1964 - and 121

Kan du välja Svenska som "OCR text, språk" på Export-fliken?

Ursprungligen av reboot81:

Kan du välja Svenska som "OCR text, språk" på Export-fliken?

Exportvalen ser ut som bifogade skärmdump. !. Förvalt 2. Enegelska 3. Mer - där jag kommer till sidan med binfilen som jag länkat till tidigare i tråden. Förvalt ger resultatet svensk text men utan svenska tecken, som du ser i textdumpen tidigare,

Ursprungligen av aake39:

Exportvalen ser ut som bifogade skärmdump. !. Förvalt 2. Enegelska 3. Mer - där jag kommer till sidan med binfilen som jag länkat till tidigare i tråden. Förvalt ger resultatet svensk text men utan svenska tecken, som du ser i textdumpen tidigare,

Ligger filen ocr_sv.bin på rätt ställe?

Ursprungligen av reboot81:

Ligger filen ocr_sv.bin på rätt ställe?

Den ligger under min hd>användare>delat. Se skärmdump

  • Medlem
  • Helsingborg
  • 2016-03-26 09:22
Ursprungligen av aake39:

Den ligger under min hd>användare>delat. Se skärmdump

det där är ett packat arkiv som måste öppnas. I den ligger filen som du är ute efter.

Fungerarar det inte med inbyggda kan du ex använda The Unarchiver.

Ursprungligen av illerG:

det där är ett packat arkiv som måste öppnas. I den ligger filen som du är ute efter.

Fungerarar det inte med inbyggda kan du ex använda The Unarchiver.

Fungerar ej med inbyggt uppckningsprogram. Då skapas filnamnet ocr_sv (1).bin 2. Funkar inte heller med Unarchiver se skärmdump. Har även testat med den första filen jag fick ocr_sv (1)

  • Medlem
  • Helsingborg
  • 2016-03-26 10:19

Bin-filen är den du är ute efter.

Så har du packat upp filen .cpgz så är du färdig.

Men sedan kan du döpa om filnamnet till det korrekta "ocr_sv.bin".
Så bort med parenteserna och 1an.

Ursprungligen av illerG:

Bin-filen är den du är ute efter.

Så har du packat upp filen .cpgz så är du färdig.

Men sedan kan du döpa om filnamnet till det korrekta "ocr_sv.bin".
Så bort med parenteserna och 1an.

Tack-har testat och det går ej att döpa om filen. Den återfår suffixet .cpgz

Ursprungligen av aake39:

Tack-har testat och det går ej att döpa om filen. Den återfår suffixet .cpgz

Har nu fått bort suffixet och har ett rent "bin-namn". Försöker och återkommer med rapport.

Ursprungligen av aake39:

Har nu fått bort suffixet och har ett rent "bin-namn". Försöker och återkommer med rapport.

Scannerprogrammet avslutas med felrapport vid tre försök. När jag tar bort den rena bin-filen ur Delat-mappen startar programmet igen och jag får den OCRscanning jag haft från början. Får nog nöja mig med att få med huvuddelen av texten och peta i de svenska tecknen. Tar tacksamt emot andra för allt, tack för allt engagemang.

  • Medlem
  • Helsingborg
  • 2016-03-26 10:56

Här har du rätt fil. Prova och se om det fungerar bättre?

https://dl.dropboxusercontent.com/u/12560091/ocr_sv.bin

Ursprungligen av aake39:

Scannerprogrammet avslutas med felrapport vid tre försök. När jag tar bort den rena bin-filen ur Delat-mappen startar programmet igen och jag får den OCRscanning jag haft från början. Får nog nöja mig med att få med huvuddelen av texten och peta i de svenska tecknen. Tar tacksamt emot andra för allt, tack för allt engagemang.

Filen du hämtar från https://www.hamrick.com/ocr.html ska inte packas upp på något sätt. Tar man bara bort suffixet är filen självt fortfarande modifierad (cpgz-arkiv). Nu vet jag inte vilken webbläsare du använder så det kan ju hända att den försöker packa upp den åt dig automatiskt.
Håll då inne Control samtidigt som du klickar på länken och välj att spara målet och skriv över den filen du har i Delat katalogen. Du ska alltså bara spara ner filen, inte packa upp eller modifiera på något sätt. Se bara till att den heter ocr_sv.bin när du sparar den.

Ursprungligen av suddgummi:

Filen du hämtar från https://www.hamrick.com/ocr.html ska inte packas upp på något sätt. Tar man bara bort suffixet är filen självt fortfarande modifierad (cpgz-arkiv). Nu vet jag inte vilken webbläsare du använder så det kan ju hända att den försöker packa upp den åt dig automatiskt.
Håll då inne Control samtidigt som du klickar på länken och välj att spara målet och skriv över den filen du har i Delat katalogen. Du ska alltså bara spara ner filen, inte packa upp eller modifiera på något sätt. Se bara till att den heter ocr_sv.bin när du sparar den.

Tack "suddgummi" otroligt att det gick att lösa. Många timmar har gått åt till att putsa texter och även att försöka knäcka detta problem. 99mac är alltid en träffsäker diskussionsplats där jag brukar få bra lösningar.

Än en gång tusen tack.
ÅS

Om en fil efter nedladdning fortfarande heter något med ändelsen .cpgz kan det också betyda att den inte laddats ner ordentligt/nedladdningen avbrutits i förtid. Lätt hänt vid mycket stora nedladdningar från exvis WeTransfer där nedladdningen avbrutits genom att man av misstag exvis försatt datorn i vila.

1
Bevaka tråden