Inżynier dużych danych Opis stanowiska szablon/krótki

Szukamy profesjonalnego wybitnego inżyniera danych, który pomoże nam tworzyć i zarządzać ofertami dużych zbiorów danych. Będziesz odpowiedzialny za projektowanie i realizację mechanizmów i ram dla dużych zbiorów danych, egzekwowanie procedur ELT, współpracując z zespołami programistów, tworzenie platform chmurowych i wspieranie systemu produkcji w tym zadaniu.

Aby odnieść sukces, wybitny inżynier danych, musisz zrozumieć technologię Hadoop, wybitne umiejętności zarządzania projektami i silne umiejętności rozwiązywania problemów. Najwyższy poziom inżyniera dużych zbiorów danych zna cele firmy i wdraża skalowalne rozwiązania danych, aby zaspokoić te wymagania teraz iw przyszłości.

Profil pracy inżyniera dużych zbiorów danych

Widoczne inżynierowie danych interfejs z rozległymi systemami przetwarzania danych i bazami danych w dużych ustawieniach komputerowych. Filtrują ogromne ilości danych w celu zidentyfikowania odpowiednich zestawów do analizy, których korporacje wykorzystują wówczas do prognozowania zachowania.

Wybitni inżynierowie danych prowadzą badania, które pomagają firmom w ocenie ich wyników, identyfikowaniu danych demograficznych rynkowych oraz prognozowaniu zbliżających się zmian i trendów rynkowych. Dobrze znani inżynierowie danych są potrzebni w prawie każdej branży, ponieważ generują spostrzeżenia, które są pomocne w biznesie, finansach, rządach, opiece zdrowotnej, badaniach, telekomunikacji i innych branżach.

Raporty do

  • C Suite
  • Zespół danych

Obowiązki inżyniera dużych zbiorów danych

  • Zbieraj i analizuj surowe dane na dużą skalę
  • Utwórz aplikacje danych za pomocą różnych narzędzi i frameworków
  • Odczytaj, pobieraj, przekształcaj, sformatuj i załaduj dane do wybranych frameworków i narzędzi
  • Rób skrypty, zeskrobaj strony internetowe, połączenie interfejsów API, zapisz zapytania SQL itp.
  • ściśle współpracuj z zespołem technicznym, aby włączyć swoją pracę do naszych procesów produkcyjnych
  • Konwertuj nieustrukturyzowane dane na format gotowy do analizy
  • Zbadaj przetworzone dane
  • Pomoc w decyzjach biznesowych z oceną ad hoc zgodnie z wymaganiami
  • Monitoruj wydajność danych i wprowadzaj niezbędne zmiany w infrastrukturze
  • Ustanowienie zasad zatrzymywania danych
  • Opracuj i utrzymuj narzędzia integracyjne, bazy danych, magazyny i systemy analityczne
  • Ustal narzędzia do dostępu do danych dla naukowców danych

Wymagania i umiejętności inżyniera dużych zbiorów danych

  • Dokładna znajomość rozproszonych zasad obliczeniowych
  • Zarządzanie klastrami Hadoop, w tym wszystkie usługi pakietowe
  • Zdolność do rozwiązywania problemów z obecnymi problemami klastrowymi - znajomość Hadoop V2, MapReduce i HDFS
  • Wcześniejsze doświadczenie opracowywanie systemów przetwarzania strumienia, takich jak Storm lub Spark
  • Dokładne zrozumienie technologii zapytań Big Data, takich jak świnia, ula i impala
  • Poprzednie doświadczenie Spark
  • Wcześniejsze doświadczenie integrując dane z kilku źródeł danych
  • Znajomość baz danych NoSQL, takich jak HBase, Cassandra i MongoDB
  • Zrozumienie kilku metodologii i ram ETL, takich jak Flume
  • Doświadczenie z różnymi systemami przesyłania wiadomości, takimi jak Kafka lub Rabbitmq - Doświadczenie z zestawami narzędzi Big Data ML, takich jak Mahout, Sparkml lub H2O - Solidne zrozumienie architektury Lambda, w tym jej korzyści i wady
  • Znajomość Cloudera/Mapr/Hortonworks