Big Data Engineer Jobbbeskrivelse Mal/Brief

Vi søker etter en profesjonell fremtredende dataingeniør for å hjelpe oss med å opprette og administrere selskapets big data -tilbud. Du vil være ansvarlig for å designe og utføre store datamekanismer og rammer, håndheve ELT -prosedyrer, samarbeide med utviklingsteam, lage skyplattformer og støtte produksjonssystemet i denne jobben.

For å være en vellykket, fremtredende dataingeniør, må du forstå Hadoop-teknologi, fremragende prosjektstyringsferdigheter og sterke problemløsningsevner. En toppnivå Big Data Engineer kjenner selskapets mål og implementerer skalerbare dataløsninger for å oppfylle disse kravene nå og i fremtiden.

Big Data Engineer Jobbprofil

Fremtredende dataingeniører grensesnitt mot store databehandlingssystemer og databaser i store datamaskininnstillinger. De filtrerer gjennom enorme datamengder for å identifisere relevante sett for analyse, som selskaper deretter bruker for å forutsi atferd.

Distinguished Data Engineers gjennomfører studier som hjelper firmaer med å vurdere resultatene, identifisere markedsdemografi og spå forestående endringer og markedstrender. Kjente dataingeniører er nødvendige i nesten alle bransjer fordi de genererer innsikt som er nyttige innen næringsliv, finans, myndigheter, helsevesen, forskning, telekommunikasjon og andre bransjer.

Rapporterer til

  • C Suite
  • Datateam

Big Data Engineer -ansvar

  • Samle og analysere rå data i stor skala
  • Lag dataapper ved hjelp av en rekke verktøy og rammer
  • Les, hente, omforme, scene og last inn dataene for å velge rammer og verktøy
  • Lag skript, skrap nettsteder, ring API -er, skriv SQL -spørsmål osv.
  • Samarbeid tett med det tekniske teamet for å innlemme arbeidet ditt i produksjonsprosessene våre
  • Konverter ustrukturerte data til et analyse-klart format
  • Undersøk de behandlede dataene
  • Hjelp forretningsavgjørelser med ad hoc -vurdering etter behov
  • Overvåk dataytelse og gjøre nødvendige endringer i infrastrukturen
  • Etablere retningslinjer for oppbevaring av data
  • Utvikle og vedlikeholde integrasjonsverktøy, databaser, lager og analytiske systemer
  • Etablere datatilgangsverktøy for dataforskere

Big Data Engineer Krav og ferdigheter

  • grundig kunnskap om distribuerte databehandlingsprinsipper
  • Hadoop Cluster Management, inkludert alle medfølgende tjenester
  • Evne til å feilsøke eventuelle aktuelle klyngeproblemer - Kunnskap om Hadoop V2, MapReduce og HDFS
  • Tidligere erfaring med å utvikle strømforedlingssystemer, for eksempel storm eller gnist
  • grundig forståelse av big data spørringsteknologier som gris, bikub og impala
  • Tidligere gnistopplevelse
  • Tidligere erfaring med å integrere data fra flere datakilder
  • Kunnskap om NoSQL -databaser som HBase, Cassandra og MongoDB
  • Forståelse av flere ETL -metoder og rammer, for eksempel Flume
  • Erfaring med forskjellige meldingssystemer, for eksempel Kafka eller RabbitMQ - Erfaring med Big Data ML -verktøysett, for eksempel Mahout, Sparkml eller H2O - Solid forståelse av Lambda -arkitekturen, inkludert fordeler og ulemper
  • Kunnskap om Cloudera/MAPR/Hortonworks