metamorworks - stock.adobe.com
IT-Jobs: Was macht ein Data Scientist?
Der Bedarf für Data Scientists ist in den letzten Jahren stark gestiegen. Grund genug, das Aufgabenfeld eines Datenwissenschaftlers näher unter die Lupe zu nehmen.
Arbeitsbereiche mit IT-Bezug spielen heute eine zentrale Rolle für den Erfolg von Unternehmen. Dabei sind die Berufsbilder ähnlich vielfältig wie die Tools und Programme, die für die Ausübung der einzelnen IT-Jobs notwendig sind.
Ein Bereich, der in den letzten Jahren stetig an Bedeutung gewonnen hat, ist die Datenwissenschaft beziehungsweise Data Science. Mit den modernen Möglichkeiten zur Datenverarbeitung ist der Bedarf für Data Scientists, welche sowohl Big als auch Small Data analysieren und die Ergebnisse für Unternehmen verwertbar machen, sprunghaft angestiegen. Das macht den Job für viele attraktiv. Die beiden Harvard-Business-Review-Autoren Thomas H. Davenport und D.J. Patil bezeichneten den Berufszweig 2012 sogar als „sexiest job of the 21st century“.
Einfach ausgedrückt, ist die Aufgabe eines Data Scientists, geschäftsrelevante statistische Erkenntnisse aus Daten zu gewinnen. Sie beurteilen, welche Analysen sich am besten eignen, um Erkenntnisse zu gewinnen und welche Rohdaten erforderlich sind. Mit wissenschaftlichen Datenanalysemethoden entwickeln sie Modelle zur Informationsverarbeitung und zu Prognosen für Big-Data-Anwendungen.
Ein Data Scientist muss aber noch mehr können und als Allround-Talent verschiedene Arbeitsbereiche beherrschen. Datenwissenschafler müssen herausfinden, was die Daten einem Unternehmen wirklich erzählen, und sie müssen in der Lage sein, relevante von irrelevanten Daten zu unterscheiden.
Welche Aufgaben ein Data Scientist hat und welche Fähigkeiten gefragt sind, erklärt die Datenwissenschaftlerin Adriana Menegozzo im Gespräch mit ComputerWeekly.de. Menegozzo wurde in Italien geboren und zog nach ihrem Mathematikstudium nach Deutschland. In den letzten fünf Jahren hat sie bei der Data Insights GmbH als Data-Scientist-Beraterin gearbeitet und Kunden von der Idee bis zur Umsetzung von Machine-Learning- und Data-Science-Projekten unterstützt.
Was sind die Aufgaben eines Data Scientist?
Adriana Menegozzo: Der Data Scientist ist eine ziemlich neue Rolle, die noch versucht, ihre richtige Bedeutung zu finden. Aber ich gebe zu, dass es recht schwierig ist, das ganze Spektrum der Aufgaben eines Datenwissenschaftlers zu erfassen. Die Rolle variiert sehr stark und verlangt viel Flexibilität. Im Allgemeinen arbeitet man mit Daten, also unserer Gegenwart und unserer Zukunft, und versucht, daraus Einsichten und Werte zu gewinnen. Im Idealfall entwickelt man einen Algorithmus, der vorhersagt, was in der nahen oder fernen Zukunft passieren wird, erkennt Muster, unterstützt Menschen bei Aufgaben, die ein Computer besser erledigen kann.
Im Grunde genommen ist man also die Person, die Einblicke in die Daten findet, Algorithmen ausprobiert und erklärt und die Benutzer in die Lage versetzt, die von Ihnen erstellten Tools zu nutzen. Man muss neugierig sein, viel lesen, verstehen, was um einem herum passiert, gute Fähigkeiten in der Softwareentwicklung haben und so viel Kenntnisse in Statistik, Mathematik und maschinellem Lernen wie nur möglich aufbauen.
In welchen Bereichen arbeitet ein Data Scientist?
Menegozzo: Das Großartige an diesem Job ist, dass er sehr vielfältig ist. Ich meine, denken Sie an einen Bereich, in dem es nicht entscheidend ist, zu wissen, was in der Zukunft passieren wird. Sie können in den Bereichen Produktion, Marketing, Wirtschaft, Politik, Gesundheit, Kommunikation, IT oder Einzelhandel arbeiten. Sie werden in jedem Sektor Datenwissenschaftler finden. Aber am wichtigsten ist: Arbeiten Sie nie isoliert! Wenn Sie großartige datenwissenschaftliche Arbeit leisten wollen, brauchen Sie ein kreatives, diverses und kompetentes Team.
Welche Fähigkeiten und Eigenschaften beziehungsweise welche Ausbildung sollte ein Data Scientist mitbringen?
Menegozzo: Da der Bereich der Datenwissenschaften unglaublich schnell wächst, tauchen viele spezifische Universitätsabschlüsse auf, zum Beispiel Spezialisierungen in Datenwissenschaften oder Machine Learning, so dass ich sagen würde, dass dies der häufigste Weg in Zukunft sein wird. Auf der anderen Seite stehen die Schlüsselqualifikationen Kommunikation, Präsentation, Teamfähigkeit, Lernbereitschaft und die Fähigkeit zu verstehen, was um einen herum passiert.
„Am wichtigsten ist: Arbeiten Sie nie isoliert! Wenn Sie großartige datenwissenschaftliche Arbeit leisten wollen, brauchen Sie ein kreatives, diverses und kompetentes Team.“
Adriana Menegozzo, Data Insights
Ich denke, es ist ein interessantes Feld, das vor allem für Frauen viele Möglichkeiten eröffnet. Da es sich bei der Datenwissenschaftlerin um eine neue Rolle handelt, gibt es keine geschlechtsspezifische Voreingenommenheit wie bei anderen technischen Rollen. Dies ist eine ausgezeichnete Gelegenheit, ein vielfältigeres und integrativeres Umfeld zu schaffen, in dem auch Frauen zu Vorbildern werden können. Ich hoffe und glaube, dass wir in der Lage sein werden, eine große Rolle in der Datenwissenschaft zu spielen, und wir sind der Unterschied, der es besser machen kann.
Welche Unternehmen beschäftigen Data Scientists?
Menegozzo: Natürlich Data Insights. Nein im Ernst: Ich denke, eine der besten Möglichkeiten, interessante Unternehmen und Projekte zu finden, sind Boutique-Beratungsunternehmen, die agil und nicht zu groß sind. Die Datenwissenschaft ist ein breites Feld mit unterschiedlichem Spezialisierungsgrad: Wenn Sie gerne richtig technisch werden und die Algorithmen der Zukunft entwickeln möchten, dann sind Start-ups oder spezielle Forschungs- und Entwicklungsabteilungen perfekt.
Große und mittlere Unternehmen sind im Allgemeinen auf der Suche nach Datenwissenschaftlern, um ihre Prozesse oder ihr Produkt zu verbessern. Für eine geschäftsbezogenere Position ist dies also der richtige Weg. Letztlich gilt aber: Es gibt kein perfektes Unternehmen für einen Data Scientist. Sie sollten das finden, das für Sie perfekt ist.
Welche Tools und Programme setzt ein Data Scientist ein?
Menegozzo: Das hängt von der Position oder dem Unternehmen ab. Aber ich kann Ihnen sagen, was ich verwende. Die meiste Zeit verbringe ich mit Programmieren: Databricks, Spark und Scala, wenn ich mit großen Datenbeständen arbeite, Python und Bash für kleinere Datensätze.
Im Allgemeinen sollten Sie sich mit Machine-Learning-Algorithmen und -Bibliotheken, zum Beispiel SciPy, Scikit-learn, Tensorflow, PyTorch, Keras, sowie mit Visualisierungswerkzeugen vertraut machen. Denken Sie daran, dass Dateningenieure und Datenexperten Ihre besten Freunde sind, also sollten Sie versuchen, die gleiche Sprache zu sprechen und die von ihnen verwendeten Werkzeuge kennen.