Script för att logga in och ladda ner PDF från di.se?

Tråden skapades och har fått 17 svar. Det senaste inlägget skrevs .
1

Hej,

Nu har letat på nätet pga att jag har blivit utmanad av en Windowsanvändare hur man automatiserar en nedladdning.

Vad jag vill åstadkomma är följande:

Logga in på di.se och ladda ner dagens tidning. Dagens Industri lägger ut sin tidning i pdfformat från kl 2200 dagens innan tidningen kommer ut fysiskt. Filen är i pdf-format och ska läggas i min Dropbox så att jag sedan kan läsa den på min iPad

Jag trodde jag skulle kunna lösa detta enkelt via Automator eller script men sprang in i väggen utan någon bra start.

Är det någon som har gjort detta eller har något förslag så jag kan bräda windowsanvändare som är på väg att lösa detta?

Tack!

// Daniel

Har förtydligat trådens rubrik.

/Mod

  • Medlem
  • 2011-12-09 21:57

Du kanske kan beskriva hur siten ser ut för oss som inte har di+?

  • Medlem
  • Sollentuna
  • 2011-12-10 19:36

Varför fungerar PDF-versionen bättre än iPad-version på just en iPad?

  • Medlem
  • 2011-12-11 12:17

Det är inte samma sak. PDF-versionen är en digital faksimilutgåva av papperstidningen. DI+ för läsplatta är en egen produkt.
Sydsvenskan och DN har samma varianter. I Sydsvenskan för läsplatta ingår en PDF-version av papperstidningen. Hur det är med DN vet jag inte.

  • Avstängd
  • 2011-12-11 12:29

Hmmm, inga idéer ännu... skulle också vilja se ett generellt script för detta som man sen lät kan modifiera för andra auto pdf ner-laddningar från div webplatser.

  • Medlem
  • 2011-12-11 13:11
set mySourceFile to "http://cache.99.se/customavatars/avatar174147..."
set myTargetFile to ((path to desktop as Unicode text) & "Lahes_avatar.gif")
tell application "URL Access Scripting"
	download mySourceFile to myTargetFile replacing yes
end tell
[B]

[/B]

  • Medlem
  • 2011-12-11 13:02

Har man länken till pdf:en är det väl bara att be sin webbläsare att gå till länken. Annars kan man väl knappast ha en generell metod?

  • Avstängd
  • 2011-12-11 13:13
Ursprungligen av Baron:

Har man länken till pdf:en är det väl bara att be sin webbläsare att gå till länken. Annars kan man väl knappast ha en generell metod?

Jo, men det var ju ett auto script med auto inloggning som efterfrågades ju
Om jag nu inte missupfattat det...

  • Medlem
  • 2011-12-11 13:23

Vill du ha ett skript som letar reda på uppladdade pdf-filer, vilka som helst, på en site och laddar ner dem?
Jag trodde du var ute efter ett skript som laddar hem tex DI:s pdf-tidning.

Jag hittar inte ens var man loggar in på di.se.
Googlar jag på detta finns den en rad mer eller mindre klumpiga inloggningsvarianter av vilka de flesta verkar gå ut på att man låter datorn simulera "vanliga" knapptryckningar. Det är ingen bra idé eftersom det aldrig är samma på olika siter, typ "tryck tab, sedan användarnamn, tab två gånger och sedan lösen, sedan retur".
Men det finns nog listigare sätt.

Mitt lilla skript ovan låter användaren ladda hem filer automatiskt om de inte är skyddade. Ibland är länkarna inte skyddade utan bara vägen fram till länken.

  • Avstängd
  • 2011-12-11 14:38

Nu vet jag inte vem du frågar/svarar men så uppfattade jag jag att trådskaparen ville ha det mesans jag ville ha en grundide vilket jag fått nu, tackar så mycket
Försökte också hitta en inloggning/skapa ny användere på DI men hittade inte var eller hur????

  • Medlem
  • 2011-12-11 14:43
Ursprungligen av LaHe:

Försökte också hitta en inloggning/skapa ny användere på DI men hittade inte var eller hur????

Det är nog kopplat till ett prenumerationssystem, men man borde i alla fall enkelt kunna se var man loggar in.

  • Medlem
  • Stockholm
  • 2011-12-11 15:38

Man kan ladda ner filen med curl till dropboxmappen och schemalägga detta till 22.00 dagligen med launchd eller cron. Sedan beror det lite på hur login fungerar på di, enklast är nog: "curl --user namn:lösenord" men det är inte säkert att detta fungerar, det kan hända att du måste använda POST och dessutom hantera cookies.

I sin enklaste form skulle skriptet kunna se ut så här. (skickar lösenord i klartext)

#!/bin/bash

curl --user namn:lösenord http://www.di.se/addresstillpdf/dagens > /sökväg/till/din/dropbox/"di $(date "+%Y-%m-%d").pdf"

Vilket ger en fil som har namnet: di 2011-12-11.pdf

Sedan måste du skapa en plist fil för launchd, enklaste är att använda lingon för detta. cron är äldre men förmodligen lättare (alla cron job hanteras av launchd i OS X). För att lägga till ditt skript med cron kör:

crontab -u användarnamn -e

10 22 * * * /sökväg/till/ditt/sparade/script

Detta kör scriptet 22:10 dagligen (lade till 10 minuter för att ha lite marginal).

  • Avstängd
  • 2011-12-11 23:36
Ursprungligen av Baron:

Det är nog kopplat till ett prenumerationssystem, men man borde i alla fall enkelt kunna se var man loggar in.

Troligen, och håller med

Ursprungligen av Fred!:

Man kan ladda ner filen med curl till dropboxmappen och schemalägga detta till 22.00 dagligen med launchd eller cron. Sedan beror det lite på hur login fungerar på di, enklast är nog: "curl --user namn:lösenord" men det är inte säkert att detta fungerar, det kan hända att du måste använda POST och dessutom hantera cookies.

I sin enklaste form skulle skriptet kunna se ut så här. (skickar lösenord i klartext)

#!/bin/bash

curl --user namn:lösenord http://www.di.se/addresstillpdf/dagens > /sökväg/till/din/dropbox/"di $(date "+%Y-%m-%d").pdf"

Vilket ger en fil som har namnet: di 2011-12-11.pdf

Sedan måste du skapa en plist fil för launchd, enklaste är att använda lingon för detta. cron är äldre men förmodligen lättare (alla cron job hanteras av launchd i OS X). För att lägga till ditt skript med cron kör:

crontab -u användarnamn -e

10 22 * * * /sökväg/till/ditt/sparade/script

Detta kör scriptet 22:10 dagligen (lade till 10 minuter för att ha lite marginal).

Fattar nada, men för en införstådd är det nog super

Hej,

Tack för responsen. Jag ska försöka förtydliga min fråga. Detta handlar inte om DI+ eller någon App utan helt enkelt medlemssidorna för di.se. Om man går in på Startsida - Dagensindustri så finns det en loginfunktion (Java eller inte vet jag inte) på höger sida. Layoutmässigt ser inte prelogin ut speciellt annorlunda ut än postlogin, dvs det finna en massa färgglada bilder däribland en bild & text som säger Morgondagens DI.

Vad jag vill göra är att kl 2204 be min dator logga in på dagens industris medlemssida och ladda ner pdf-filen som är Morgondagens DI och lägga denna i tex Dropbox och skicka ett email när detta är klart.

Du kan prova en trialversion av Fake - Mac OS X Web Browser Automation and Webapp Testing Made Simple.
Däri borde du kunna trixa till ett skript som laddar ner din PDF automatiskt.

Hej,

gå in på Startsida - Dagensindustri och du ser Logga in längst upp till höger - se bifogad fil.

Väl inloggad så trycker man på Läs Tidningen. Länken till pdf-filen är inte i ren text och antagligen därmed krypterad / kodad.

  • Avstängd
  • 2011-12-13 11:05

<-- Blind

1
Bevaka tråden