Informatica Tutorial: Forstå Informatica ‘Inside Out’



Denne informatica opplæringsbloggen vil forklare Informatica PowerCenter i detalj, informatica arkitektur og hvordan du lager et domene i Informatica

Vi lærte i den siste bloggen om og dens virkelige applikasjon.La oss dype dykk nå og forstå i denne Informatica Tutorial-bloggen om Informatica, dens arkitektur og en brukssak. er en av de mest oppslukte ferdighetene i dagens marked, da det er en unik og upartisk dataintegrasjonsplattform som fungerer sammen over et bredt spekter av forskjellige standarder, systemer og applikasjoner.Som diskutert i forrige blogg, er Informatica PowerCenter flaggskipet til Informatica og brukes ofte om hverandre. Bare for å oppsummere, Informatica Powercenter er en enkelt, enhetlig dataintegrasjonsplattform for bedrifter som gjør det mulig for selskaper og offentlige organisasjoner i alle størrelser å få tilgang til, oppdage og integrere data fra praktisk talt ethvert forretningssystem, i hvilket som helst format og levere dataene i hele virksomheten til enhver hastighet . Det er et ETL-verktøy (Extract, Transform and Load) med hovedfordelen i forhold til annet ETL-verktøy som følger:

  • Den er robust og kan brukes i både windows og UNIX-baserte systemer
  • Det er høyt ytende, men veldig enkelt for utvikling, vedlikehold og administrering

Informatica Tutorial: Forstå Informatica PowerCenter

For å forstå Informatica i sanntid, bør vi forstå inngående om Informatica Architecture og andre komponenter i Informatica. Så på slutten av denne Informatica Tutorial-bloggen vil du kunne forstå følgende:





  1. Hva er Informatica Architecture?
    1. Kundekomponent av Informatica
      1. Informatica PowerCenter Repository Manager
      2. Informatica PowerCenter Designer
      3. PowerCenter Workflow Manager
      4. PowerCenter arbeidsflytmonitor
      5. Konsolladministrator
    2. Serverkomponent av Informatica
      1. Repository Service
      2. Integrasjonstjeneste
      3. SAP BW-tjeneste
      4. Webservices Hub
  2. Datastrøm i Informatica
  3. Informatica Domain & Nodes
  4. Informatica Services & Service Manager
  5. Brukstilfelle: Slik laster du inn produktdimensjonstabellen ved hjelp av SCD

Hva er Informatica Architecture?

Arkitekturen til Informatica PowerCenter er basert på Service Oriented Architecture (SOA) -konseptet. En serviceorientert arkitektur (SOA) kan defineres som en gruppe tjenester som kommuniserer med hverandre. Kommunikasjonsprosessen innebærer enten enkel dataoverføring, eller det kan involvere to eller flere tjenester som koordinerer samme aktivitet.

Utvikling av Informatica er basert på komponentbasert utviklingsteknikk. Komponentbasert utvikling er en teknikk der forhåndsdefinerte komponenter eller funksjonelle enheter, eller begge deler, med spesifikke funksjoner brukes til å montere sluttproduktet. PowerCenter følger komponentbaserte utviklingsmetoder ved å tillate å bygge en datastrøm fra en kilde til målet, ved å bruke forskjellige komponenter (kalt transformasjoner) og knytte dem til hverandre etter behov. En god måte å gjøre det på ville være å først forstå hva som er komponentene i Informatica, og så vil vi lære å bruke Informatica for å løse typiske forretningsproblemer gjennom en brukssak.



Så, Informatica PowerCenter-verktøyet består av to komponenter. De er:

  • Kundekomponent
  • Serverkomponent
Informatica-tutorial-Informatica-Architecture

Fig: Informatica Architecture Overview

Kundekomponenter til Informatica PowerCenter:

  • PowerCenter Repository Manager:

Repository Manager brukes til å administrere repositories. Den kan administrere bruker og grupper. Vi kan opprette, slette og redigere databaser og brukergrupper. Vi kan også tilordne og tilbakekalle lagringsrettigheter og mappetillatelser.



Repository Manager har følgende vinduer:

  • Navigator: Den viser alle objekter du oppretter i Repository Manager, Designer og Workflow Manager. Den er organisert først etter depot og deretter etter mappe.
  • Hoved: Det gir egenskaper for objektet som er valgt i Navigator. Kolonnene i dette vinduet endres avhengig av objektet som er valgt i Navigator.
  • Produksjon: Det gir utdata fra oppgaver som er utført i Repository Manager.

Fig: Repository Manager

  • Informatica PowerCenter Designer

PowerCenter Designer er klienten der vi spesifiserer hvordan data skal flyttes mellom forskjellige kilder og mål. Det er her vi tolker de forskjellige forretningskravene ved å bruke forskjellige PowerCenter-komponenter som kalles transformasjoner, og sender dataene gjennom dem (transformasjoner). Designeren brukes til å lage kildedefinisjoner, måldefinisjoner og transformasjoner som kan brukes videre til å utvikle kartlegginger.

Fig: Informatica PowerCenter Designer

  • Informatica PowerCenter Workflow Manager

    Det er et ordnet sett med en eller flere økter og andre oppgaver, designet for å oppnå et generelt operativt formål. Det eutfører en serie kartlegginger (som økter) og andre oppgaver.

Fig: Workflow Manager

Workflow Manager er PowerCenter-applikasjonen som gjør det mulig for designere å bygge og kjøre arbeidsflyter. Den kan åpnes som følger:

  • Kan startes fra Designer ved å klikke på “W” -ikonet
  • Kan åpnes uavhengig av banen Start> Alle programmer> Informatica PowerCenter 9.6.1> Client> PowerCenter Client> PowerCenter Workflow Manager
  • Kan åpnes fra Workflow Designer-verktøyet du bruker til å lage Workflow-objekter

Fig: Workflow Manager-grensesnitt

Workflow Manager viser følgende vinduer for å hjelpe deg med å opprette og organisere arbeidsflyter:

  • Du kan koble til og jobbe i flere arkiver og mapper. I Navigator viser Workflow Manager et rødt ikon over ugyldige objekter.
  • Du kan opprette, redigere og vise oppgaver, arbeidsflyter og arbeidsfly.
  • Den inneholder faner for å vise forskjellige typer utdatameldinger. Output-vinduet inneholder følgende faner:
    • Viser meldinger når du lagrer en arbeidsflyt, arbeidsett eller oppgave. Lagre-fanen viser et valideringssammendrag når du lagrer en arbeidsflyt eller en arbeidsett.
    • Hent logg. Viser meldinger når Workflow Manager henter objekter fra depotet.
    • Viser meldinger når du validerer en arbeidsflyt, arbeidsett eller oppgave.
    • Viser meldinger når du kopierer arkivobjekter.
    • Viser meldinger fra integrasjonstjenesten.
    • Viser meldinger fra depottjenesten.

Informatica arbeidsflytdesigner

Det kartlegger kjøringsrekkefølgen og avhengighetene til økter, oppgaver og arbeidsplasser for Informatica Server

Fig: Workflow Designer

  • Oppgaveutvikler

Det skaper Session, Shell Command og Email oppgaver. Oppgaver som er opprettet i Task Developer kan gjenbrukes

  • Worklet Designer

Det lager objekter som representerer et sett med oppgaver. Worklet-objekter kan brukes på nytt.

Workflow Manager viser også en statuslinje som viser status for operasjonen du utfører.

hvordan du bruker substring i java

Følgende figur illustrerer hvordan en typisk arbeidsflyt ser ut, inkludert startoppgave-, koblings- og øktoppgavekomponenter.

Fig: Eksempel på Workflow Manager

  • Informatica PowerCenter arbeidsflytmonitor

Workflow Monitor, et PowerCenter-verktøy, brukes til å overvåke utførelsen av arbeidsflyter og oppgaver.

Workflow Monitor kan brukes til å:

  • Vis detaljer om en arbeidsflyt eller oppgavekjøring i Gantt-diagramvisning eller oppgavevisning
  • Kjør, stopp, avbryt og gjenoppta arbeidsflyter eller oppgaver
  • Workflow Monitor viser arbeidsflyter som har kjørt minst en gang.
  • Workflow Monitor mottar kontinuerlig informasjon fra Integration Service and Repository Service. Den henter også informasjon fra depotet for å vise historisk informasjon.

Fig: Arbeidsflytmonitor

Hvordan åpne Informatica Workflow Monitor:

For å åpne Workflow Monitor, gå til:

Start> Alle programmer> lnformatica PowerCenter 9.6.1> Client> PowerCenter Client> PowerCenter Workflow Monitor

Skjermen kan også åpnes:

  • Fra Workflow Manager Navigator
    • Workflow Manager kan konfigureres til å åpne Workflow Monitor når en arbeidsflyt kjøres fra Workflow Manager
    • Fra Verktøy> Arbeidsflytmonitor i Designer, Workflow Manager eller Repository Manager
  • Eller fra Workflow Monitor-ikonet på verktøylinjen Verktøy

Fig: Workflow monitor-seksjoner

  • DatabehandlingKonsolladministrator

Informatica Administrator-konsoll (Administrator-verktøy) er administrasjonsverktøyet for å administrere Informatica-domenet og Informatica-sikkerhet.Informatica administratorkonsoll (administratorverktøyet) er tilgjengelig etter installasjon av Informatica.

Fig: Informatica Administrator Console

Administrasjonskonsollen utfører følgende oppgaver i domenet:

  • Administrere applikasjonstjenester: Den administrerer alle applikasjonstjenester i domenet, inkludert integrasjonstjeneste og depottjeneste.
  • Konfigurere noder: Den konfigurerer nodeegenskaper inkludert sikkerhetskopikatalog og ressurser. Det gjør at nodene kan stenges og deretter startes på nytt også når det er nødvendig.
  • Administrere domeneobjekter: Den oppretter og administrerer objekter som tjenester, noder, lisenser og mapper.
  • Vise og redigere egenskaper for domenegjenstander: Det gjør det mulig å se på egenskaper for alle objekter i domenet og redigere dem.
  • Sikkerhetsadministrative oppgaver: Administrer brukere, grupper, roller og privilegier.
  • Vise logghendelser: Den bruker loggviseren til å vise logghendelser fra domenet, integrasjonstjeneste, SAP BW-tjeneste, webtjenestehub, samt depottjeneste.

Fig: Administratorkonsoll-grensesnitt

Så i et nøtteskall består klientkomponenten i Informatica av 5 komponenter, nemlig. Informatica Repository Manager, Informatica PowerCenter Designer, Informatica Workflow Manager, Informatica Workflow Monitor og Informatica Administrator Console. Det danner formarbeidet til hele verktøyet. La oss nå prøve å forstå serverkomponenten i Informatica PowerCenter.

Serverkomponenter til Informatica PowerCenter

PowerCenter-serverkomponentene består av følgende tjenester:

  • Datalagringstjeneste: Repository-tjenesten administrerer depotet. Den henter, setter inn og oppdaterer metadata i depotdatabasetabellene.
  • Integrasjonstjeneste: Integrasjonstjenesten kjører økter og arbeidsflyter.
  • SAP BW-tjeneste: SAP BW-tjenesten ser etter RFC-forespørsler fra SAP BW og starter arbeidsflyter for å trekke ut data fra, eller laste inn data i SAP BW.
  • Webtjenestehub: Webtjenestehubben mottar forespørsler fra webtjenesteklienter og avslører PowerCenter-arbeidsflyter som tjenester.

Nå som vi har forstått både klient- og serverkomponenter i Informatica, vil følgende infografikk forklare datastrømmen i Informatica, dvs. hvordan data behandles:

Fig: Dataflyt i Informatica

Det er veldig logisk på dette punktet å forstå hva som er andre grunnleggende enheter i Informatica som Domain & Node, Service & Service Manager. Så la oss ta et øyeblikk å forstå dem før vi utfører en håndson på Informatica.

Informatica Domain & Nodes:

De fremtredende egenskapene til et domene er som følger:

  • Et domene er en logisk samling eller et sett med noder og tjenester
  • PowerCenter Domain er den grunnleggende administrative enheten til PowerCenter
  • Et domene kan være en enkelt PowerCenter-installasjon, eller den kan bestå av flere PowerCenter-installasjoner

De fremtredende egenskapene til en node er som følger:

  • En node er en logisk fremstilling av en fysisk maskin. Den har fysiske attributter som vertsnavn og portnummer
  • Hver node driver en tjenesteansvarlig som er ansvarlig for applikasjonen og kjernetjenestene
  • En node kan være en gateway-node eller en arbeiderknute, men den kan bare tilhøre ett domene

Fig: Informatica Domain n Node

Informatica Services & Service Manager:

En tjeneste er en ressurs som gir spesialiserte funksjoner. Alle PowerCenter-prosesser kjører som tjenester på en node.

Informatica PowerCenter har to typer tjenester:

  • Application Services representerer serverbaserte funksjoner, inkludert Repository og Integration Services.
  • Kjernetjenester representerer funksjoner som administrerer og vedlikeholder miljøet der PowerCenter opererer, og inkluderer tjenester som Log Service, Lisensieringstjeneste og Domenetjeneste blant mange andre.

Serviceleder

  • Service Manager er en tjeneste som administrerer all domenedrift og kjører på hver node i et domene
  • På gatewaynoden er Service Manager ansvarlig for følgende:
    • Kontrollerer domenet
    • Administrere tjenestene som kjører på domenet
    • Gi serviceoppslag
  • På alle noder er Service Manager ment å kontrollere kjernetjenestene og applikasjonstjenestene

Hvordan ulike komponenter i PowerCenter samhandler:

Fig: Informatica Component Interaction

Brukstilfelle: Slik laster du inn en produktdimensjonstabell med SCD

Problemstilling: Vårt mål er å laste inn en produktdimensjonstabell ved hjelp av SCDs (Slow Changing Dimensions) (SCD) Type 2 med virkningsdato.

Gitt et kundekildesystem som inneholder kunde-ID, navn, by, delstat og landdetaljer for kundene, må vi opprette en ny oppføring i måldimensjonstabellen hver gang en kunde kommer med en annen verdi.

For å forstå dette bedre, hvis en kunde returnerer med en annen verdi for stat eller by sammenlignet med verdien som allerede er tilstede i måldimensjonstabellen, må en ny oppføring opprettes med den oppdaterte verdien. Dette oppnås ved bruk av SCD-løsningsbasert måltabell.

Nedenfor er en trinnvis prosess for å laste inn produktdimensjonstabellen ved hjelp av SCD.

Trinn 1 : Åpne PowerCenter Designer.

Steg 2 : Koble til depotet

Fig: Opprette forbindelse til Repository

Trinn 3 : Start Designer

Fig: Starter PowerCenter Designer

fail raskt vs fail safe

Trinn 4: Last kilden fra databasen

Fig: Ulike alternativer for å laste inn kildedata

Trinn 5: Koble til databasen

Trinn 6: Velg SCD_INPUT_DATA-tabell

Trinn 7: Tilsvarende laster målsett fra database

Fig: Ulike alternativer for målsett

Trinn 8 : Design en arbeidsflyt for å utføre den nødvendige operasjonen som vist nedenfor

Fig: Workflow Design for Database

Trinn 9 : Start Oracle SQL Developer og last SCD_CUSTOMER bord

Fig: SCD_CUSTOMER tabell

Trinn 10 : Endre tilstandsverdiene for kundene Mary og Hannah

Fig: Modifisering av verdier til Mary

Fig: Modifisering av verdiene til Hannah

Trinn 11 : Start arbeidsflytmonitor og kjør arbeidsflyten

Fig: Utføre arbeidsflyt

Fig: Arbeidsflytutgang

Trinn 12: Utfør kommandoen nedenfor for å få den målrettede databasen

  • velg * fra scd_customer_target

Fig: Utføre SQL-spørring for målrettet utgang

Trinn 13: Produkt Dimensjonstabell utgang

Fig: Produkt Dimensjonstabell Utgang

For å avslutte inneholder den lastede produkttabellen en historisk verdi av dataene, inkludert variasjonen til de tilstedeværende verdiene, og dette oppnås ved bruk av Informatica PowerCenter.

Jeg håper denne Informatica opplæringsbloggen var nyttig for å bygge grunnlaget for Informatica og har skapt nok interesse til å lære mer om Informatica.

Hvis du allerede har bestemt deg for å ta Informatica som en karriere, vil jeg anbefale deg hvorfor ikke ta en titt på vår kurs side. Informatica-sertifiseringsopplæringen på Edureka vil gjøre deg til en ekspert på Informatica gjennom live instruktørledede økter og praktisk trening ved bruk av virkelige brukssaker.

Har du et spørsmål til oss? Vennligst nevn det i kommentarfeltet, så kommer vi tilbake til deg.