Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Geokettle är en ETL appliktion som står för hantera data genom att:

  • Extrakt - hämta 
  • Transform - berabeta
  • Load - Ladda

Ikartan använder Geokettle för att förädla eller filtrera information så att den kan användas för integration med andra.

Mer dokumentation finns under Spatialytics ETL

Image Removed 

Table of Contents

Image Added

Applikationen

Applikationen har ett grafiskt utseende.

Steg

Vänstra sidan består av listor med många funktioner som kan dras in  på arbetsytan och kallas  "steg". Det finns hundratals steg att välja mellan. Så många att nästan alla typer av data kan läsas, transformeras och skrivas.

Hopp

Stegen kan sammanbindas med pilar som kallas "hopp".  Bilden visar applikationen Geokettle men Transformationen 'GeonamesToPostgres' aktivt på skrivbordet. Hoppen styr flödet som kan fördelas på olika sätt beroende på resultatet av ett steg.

 

 

 

Parametrar

Varje steg innehåller fält där värden kan skrivas in. Värdena kan vara variabler eller parametrar som sätts när en körning ska göras eller när en körningen kallas från en annan körning. Bilden bredvid innehåller egenskaperna från steget "CVS file input" i bilden ovan och där filnamnet sätts samman av två parametrar.

 

 

Två typer av flöden

Jobb

Jobb är ett flöde som är seriellt och varje steg måste avslutas innan nästa påbörjas. Ett typiskt jobb kan vara att som bilden visar: Hämta en fil, packa upp den och kalla på en transformation för att bearbeta den.

Transformation

Transformation är ett flöde som pågår genom alla steg samtidigt. Typiskt exempel från första bilden där data läses från en fil, rad för rad med flödet fortsätter till nästa steg som beräknar en geometri som sen går vidare till att bestämma en kartprojektion, vidare till ett filter som bestämmer vilka attribut som ska finnas med innan det sista steget skriver informationen till en databastabell.

Jobb och transformationer kan kalla på varandra och på så vis kan mycket komplexa dataflöden hanteras. Jobb och transformationerna kan köras direkt från Geokettle

 

 

 

Automatisering

Starta från en kommandorad

När de jobb och transformationer är klara och gör det jobb de ska kan de sen köras utan att starta Geokettle utan istället köras i en konsolmiljö. Kommandot med sina parametrar kan sparas i en fil och en hel datakörning kan köras igång med ett klick.

Automatisera från operativsystemet

Operativsystemet, Windows, Linux, m.fl. med dess egenskaper att automatiskt starta starta processer, t.ex. på en viss tid, gör att en datakörning helt kan automatiseras.