Big Data Engineer Jobbeskrivelse Skabelon/kort

Vi søger efter en professionel fremtrædende datetekniker for at hjælpe os med at skabe og administrere vores virksomheds big data -tilbud. Du vil være ansvarlig for at designe og udføre big data -mekanismer og rammer, håndhæve ELT -procedurer, samarbejde med udviklingsteam, skabe skyplatforme og støtte produktionssystemet i dette job.

For at være en succesrig, fremtrædende dataingeniør skal du forstå Hadoop-teknologi, fremragende projektstyringsevner og stærke problemløsningsevner. En top-tier big dataingeniør kender virksomhedens mål og implementerer skalerbare dataløsninger for at imødekomme disse krav nu og i fremtiden.

Big Data Engineer jobprofil

Fremtrædende dataingeniører interface med store databehandlingssystemer og databaser i store computerindstillinger. De filtrerer gennem enorme mængder data for at identificere relevante sæt til analyse, som virksomheder derefter bruger til at forudsige adfærd.

Distinguished Data Engineers foretager undersøgelser, der hjælper virksomheder med at vurdere deres præstationer, identificere markedsdemografi og forudsige forestående ændringer og markedstendenser. Kendte dataingeniører er nødvendige i næsten enhver branche, fordi de genererer indsigt, der er nyttige inden for erhvervslivet, økonomi, regering, sundhedsydelser, forskning, telekommunikation og andre brancher.

Rapporterer til

  • C Suite
  • Datateam

Big Data Engineer Ansvar

  • indsamle og analysere rå data i stor skala
  • Opret dataapps ved hjælp af en række værktøjer og rammer
  • Læs, hent, omform, scene og indlæs dataene til valgte rammer og værktøjer
  • Lav scripts, skrabe websteder, ring API'er, skriv SQL -forespørgsler osv.
  • Samarbejd tæt sammen med det tekniske team for at inkorporere dit arbejde i vores fremstillingsprocesser
  • Konverter ustrukturerede data til et analyse-klar format
  • Undersøg de behandlede data
  • Hjælp forretningsbeslutninger med ad hoc -vurdering efter behov
  • Overvåg dataens ydelse og foretag de nødvendige ændringer i infrastrukturen
  • Oprette politikker til opbevaring af data
  • Udvikle og vedligeholde integrationsværktøjer, databaser, lager og analytiske systemer
  • Opret værktøjer til dataadgang for dataforskere

Krav og færdigheder til big data.

  • grundig viden om distribuerede computerprincipper
  • Hadoop Cluster Management, inklusive alle bundlede tjenester
  • Evne til at fejlfinde eventuelle aktuelle klyngeproblemer - Kendskab til Hadoop V2, MapReduce og HDFS
  • Tidligere erfaring med at udvikle strømforarbejdningssystemer, såsom storm eller gnist
  • Grundig forståelse af forespørgselssteknologier for big data som svin, bikub og Impala
  • Tidligere gnistoplevelse
  • Tidligere erfaring med at integrere data fra flere datakilder
  • Kendskab til NoSQL -databaser som HBase, Cassandra og MongoDB
  • Forståelse af flere ETL -metodologier og rammer, såsom flume
  • Erfaring med forskellige messaging -systemer, såsom Kafka eller RabbitMQ - Erfaring med Big Data ML -værktøjssæt, såsom Mahout, SparkMl eller H2O - Solid forståelse af Lambda -arkitekturen, herunder dens fordele og ulemper
  • Kendskab til Cloudera/Mapr/Hortonworks