Interview mit Josefine - Data Scientist und Kursleiterin SQL

October 14, 2020

Kannst Du Dich kurz vorstellen und etwas über Deinen beruflichen Werdegang erzählen?

Aktuell arbeite ich als Data Scientist bei der Otto Group und entwickle Machine Learning Lösungen für die Konzerngesellschaften mit verschiedensten Anwendungsfällen. Gestartet bin ich mit einem Dualen Studium der Angewandten Informatik in Stuttgart zusammen mit IBM. In den verschiedenen Praxiseinsätzen habe ich gemerkt, dass mir die Arbeit mit Daten besonders viel Spaß macht. Deshalb habe ich mich dazu entschlossen, einen Master ganz speziell im Bereich Data Science zu machen und bin dafür an eine Universität in Lissabon gegangen. Über ein Praktikum und meine Masterarbeit kam ich anschließend zur Otto Group und entwickle nun seit über 3 Jahren Data Science Lösungen im Bereich E-Commerce.

Wie bist Du mit SQL das erste Mal in Kontakt getreten?

Tatsächlich habe ich es schon auf dem Gymnasium gelernt. Ich hatte das Glück, Informatik durchgehend ab der neunten Klasse zu haben und dort vieles erlernen zu dürfen. SQL im speziellen und wie man Datenbanken aufbaut, hatten wir dann in der Oberstufe. Es kam dann aber auch wieder im Studium vor und bei der Arbeit sowieso.

Hat es Dir geholfen, schon so früh, also ab der neunten Klasse in der Schule, durchgängig Informatikunterricht zu haben?

Auf jeden Fall! Ich hätte Informatik als Studium ziemlich sicher nicht gewählt, hätte ich es vorher nicht als Schulfach gehabt und bin da auch sehr dankbar, dass ich die Möglichkeit hatte, an meiner Schule Informatik als Abiturfach ablegen zu dürfen. Ich finde es schade, dass in vielen Bundesländern oder an vielen Schulen Informatik kein wichtiges Fach ist und wenn es vielleicht Informatikunterricht gibt, es meistens wenig mit Programmieren zu tun hat, sondern eher mit dem allgemeinen Umgang mit dem Computer.

Inwiefern nutzt Du SQL bei Deiner Arbeit?

SQL ist eine Sprache, mit der man sich Daten erstmal generell anschauen kann, sie bearbeiten und natürlich auch erstellen kann. Es ist wie so ein Hammer in einem Werkzeugkasten - man braucht es auf jeden Fall. SQL ist nicht nur ein Tool, was eine Data Scientist haben sollte und jemand, der total viel programmiert, sondern es kann extrem vielen Leuten helfen. Auch wenn man zum Beispiel im Marketing arbeitet und dort Kontakt mit Daten hat - es werden jetzt immer mehr Daten, weil immer mehr Daten gesammelt werden. Und umso mehr Daten es gibt, desto eher reicht es nicht mehr aus, nur mit Excel zu arbeiten, weil es viel zu lange braucht und Excel einfach kein gutes Tool ist, um viele Daten zu handhaben. Ab da macht es dann Sinn, Datenbanken und Tabellen zu nutzen sowie SQL als Sprache, um mit den Daten zu arbeiten. An sich ist es auch eine Sprache, die man sehr einfach lernen kann, um damit schnell arbeiten zu können.

In welchen Bereichen wird SQL genutzt?

Überall, wo viele Daten gesammelt werden, gibt es in der Regel auch Datenbanken und dann kommt man häufig nicht an SQL vorbei. Es gibt auch andere Datenbanktypen, aber SQL ist ein Standard Tool für relationale Datenbanken. Wenn man in der IT arbeitet, wird man immer mal wieder Kontakt mit SQL haben. Aber auch in vielen anderen Bereichen gibt es Daten, die mit SQL verarbeitet werden können, z.B. wie ich gesagt habe, für Analysen im Marketing, aber auch im Finanzwesen, Controlling, Vertrieb oder Recruiting.

Warum sollte man SQL lernen?

Ein Grund ist auf jeden Fall, dass man SQL extrem schnell erlernen kann und man in kürzester Zeit aus bestehenden Daten neue Insights, also Erkenntnisse, gewinnen kann. Es lässt sich mit anderen Programmiersprachen kombinieren und dient unter anderem dazu, Daten vorzubereiten, um sie zum Beispiel in Python weiter zu bearbeiten. Man sollte auf jeden Fall SQL lernen, wenn man sehr viel mit Excel arbeitet und Excel zu kompliziert wird und nicht mehr so funktioniert, wie man das möchte. Auch wenn man bereits Dashboards benutzt, gibt es häufig Integrationen, wo man in Dashboards SQL integrieren kann oder zumindest SQL ähnliche Sprachen benutzen kann.

Mit welchen Werkzeugen, abgesehen von SQL, arbeitest Du als Data Scientist?

Python ist auf jeden Fall auch ein Tool, was wir ständig benutzen und in Python gibt es ganz viele Pakete, die speziell für Data Science entwickelt wurden und womit sehr viele Data Scientists arbeiten, zum Beispiel scikit-learn oder TensorFlow. Ansonsten arbeiten wir zum Beispiel in der Google Cloud, einer Cloud Plattform, in der es Datenbanken gibt und andere wichtige IT-Infrastruktur.

Was gefällt Dir besonders an Deiner Arbeit als Data Scientist?

Wenn man als Data Scientist arbeitet, gibt es in der Regel eine Problemstellung, die man lösen muss. Der Lösungsweg dahin ist erstmal komplett offen. Mir gibt niemand vor, wie die Lösung genau aussehen muss, sondern ich kann sehr kreativ sein und ausprobieren, was alles funktionieren könnte. Es ist eine Challenge, sich erstmal zu überlegen, welche Daten brauche ich, wie muss ich sie aufbereiten und wie kann ich noch mehr Erkenntnisse aus diesen Daten gewinnen. Dann nehme ich meinen Werkzeugkasten an Machine Learning Modellen, um ein Produkt zu entwickeln, das Mehrwert generiert und das Problem eben löst. Man sieht selten etwas Buntes, was dabei entsteht, wie z.B. eine Webseite, die man praktisch anfassen kann, sondern das Ganze ist natürlich zahlenbasiert und wirkt dadurch erstmal sehr trocken. Aber ich finde das eigentlich das Spannende, dass man sehr viel Gehirn selbst reinstecken muss, wie man das Problem löst und nicht nur eine Reihe von Anforderungen in Code übersetzt.

Und Du?

Wenn Du Lust bekommen hast an unserem SQL-Kurs teil zu nehmen: Die aktuellen Kursdaten findest du hier!