Hur skriva umlaut till xml i UTF8?

Tråden skapades och har fått 12 svar. Det senaste inlägget skrevs .
1
  • Medlem
  • 2010-11-02 07:49

Jag kan inte skriva vettiga åäö till en xml i utf8. Hur gör man?

Då är inte din fil UTF8-kodad…

  • Medlem
  • 2010-11-02 11:03
write myCollectedSidecars & return to fileRef starting at eof as «class utf8»
  • Medlem
  • 2010-11-03 11:31

Jag hade missat att läsa in text i en variabel som utf8.

  • Medlem
  • 2010-11-03 13:04

Nähä, det var fel.
Jag kan skriva rätt till en fil i utf8, men inte läsa in innehållet i den filen till en ny xml med utf8.

  • Medlem
  • 2010-11-03 13:46

Det gick om jag först skriver till txt och sedan läser in i xml.

precis som du har write as ut8 så har du read as utf8.

Observera att detta inte är samma "as" som när du gör en konvertering mellan två klasser.

  • Medlem
  • 2010-11-03 18:43

Så om jag inte definierar hur jag vill läsa blir det inte det det är från början?

Hmm... nu kommer detta att låta nästan filosofiskt, men text "är" inte en viss kodning. Det är bara en sekvens av ettor och nollor. Genom att ange hur sekvensen ska tolkas får man ett visst utfall.

Det är precis därför man i XML har (kan ha) information om kodningen, så att ett program som läser det ska förstå hur resten av bytesekvensen ska tolkas.

Den kodningen är bara meningsfull om man har en XML-tolk, om man läser filen som text så "förstår" AS inte vad det är – det är upp till dig att ange det, så att filen läser på rätt sätt.

Normalt sett när AppleScript läser en textfil utgår den från att bytesekvensen ska tolkas som MacRoman-kodad text, och om då texten inte är det (dvs. om bytesekvensen inte stämmer med regelverket för utf8-kodad text) kommer det att bli fel.

För att ta en analogi, så är det som när du låter en engelsk text to speech läsa svensk text.

Så, mao, om man vet att man har en utf8-kodad textfil så måste man tala om för AS att den ska läsas som just utf8

  • Medlem
  • 2010-11-03 20:02

Ok, jag trodde det fanns info i dokumentet som talade om detta. Nu förstår jag att det kanske inte är så.

  • Medlem
  • 2010-12-09 11:46

Jag har tappat detta igen. Om jag först skriver till mac-os roman kan jag läsa som utf, men skriver jag utf8 kan jag inte läsa som utf8.

På bilden sidecar.png till höger nedan visar jag vad jag först skriver med applescipt i UTF8, sidecar tmp.png (till vänster) visar vad ett annat applescript läser in från den filen.

  • Medlem
  • 2010-12-09 13:57

Problemet löst av Richard irl.

irl = Rönnbäck, via telefon

1
Bevaka tråden