Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Geokettle är en ETL appliktion som står för applikation  för hantera data genom att:

  • Extrakt - hämta 
  • Transform - berabeta
  • Load - Ladda

Ikartan använder Geokettle används för att förädla eller filtrera information automatisera dataströmmar så att den kan användas för integration med andrade passar in och kan integreras med annan information.

Mer dokumentation finns under Spatialytics ETL

 

Table of Contents

 

Image Removed

Applikationen

Applikationen har ett grafiskt utseende.

Image Added

Steg

Vänstra sidan består av listor med många funktioner som kan dras in  på arbetsytan och kallas  "steg". Det finns hundratals steg att välja mellan. Så många att nästan alla typer av data kan läsas, transformeras och skrivas.

Hopp

Stegen kan sammanbindas med pilar som kallas "hopp".  Bilden visar applikationen Geokettle men Transformationen 'GeonamesToPostgres' aktivt på skrivbordet. Hoppen styr flödet som kan fördelas på olika sätt beroende på resultatet av ett steg.

Parametrar

Varje steg innehåller fält där värden kan skrivas in. Värdena kan vara variabler eller parametrar som sätts när en körning ska göras påbörjas eller när en körningen kallas från en annan körningeller som parametrar vid start från script. Bilden bredvid innehåller egenskaperna från steget "CVS file input" i bilden ovan och där filnamnet sätts samman av två parametrar.

Två typer av flöden

Jobb

Jobb är ett flöde som är seriellt och varje steg måste avslutas innan nästa påbörjas. Ett typiskt jobb kan vara att som bilden visar: Hämta en fil, packa upp den och kalla på en transformation för att bearbeta den.

Transformation

Transformation är ett flöde som pågår genom alla steg samtidigt. Typiskt exempel från första bilden där data läses från en fil, rad för rad med flödet fortsätter till nästa steg som beräknar en geometri som sen går vidare till att bestämma en kartprojektion, vidare till ett filter som bestämmer vilka attribut som ska finnas med innan det sista steget skriver informationen till en databastabell.

Jobb och transformationer kan kalla på varandra och på så vis kan mycket komplexa dataflöden hanteras. Jobb och transformationerna kan köras direkt från Geokettle

 

 

 

Automatisering

Starta från en kommandorad

När de jobb och transformationer är klara och gör det jobb de ska kan de sen köras utan att starta Geokettle utan istället köras i en konsolmiljö. Kommandot med sina parametrar kan sparas i en fil och en hel datakörning kan köras igång med ett klick.

Automatisera från operativsystemet

Operativsystemet, Windows, Linux, m.fl. med dess egenskaper att automatiskt starta starta processer, t.ex. på en viss tid, gör att en datakörning helt kan automatiseras.