Snippets

Ein Snippet ist ein kleiner Denkanstoss aus meinem Alltag.

Kevin Kuhn Kevin Kuhn

NVIDIA entwickelt Alias-Free GAN

NVIDA hat in ihrem Lab eine neue Form von Generative Adversarial Network (GAN) entwickelt; Alias-Free GAN. Für ihre Forschung benötigte NVIDIA 92 GPU Jahre (Rechenleistung), was dem jährlichen Strombedarf von 58 Schweizer Haushalten gleich kommt. Die Ergebnisse ebnen den Weg für generative Modelle, die besser für Video und Animation geeignet sind.

alias-free-GAN.gif

Paper, Code und die Videos in HD: https://nvlabs.github.io/alias-free-gan/

Weiterlesen
Kevin Kuhn Kevin Kuhn

Data Science as a Service für Schweizer KMU

Es zeichnet sich ab, dass Unternehmen in der Schweiz viel mehr mit der Datenhygiene zu kämpfen haben, als mit der Analyse der Daten. Unternehmen sind verzweifelt auf der Suche nach Data Scientist, doch was sie vielmehr benötigen sind Data Engineers, welche Ordnung in die Daten- und Systemlandschaften bringen.

Data Science as a Service kommt dann zum Zug, wenn Daten und Problemstellung klar identifiziert sind. DSaaS hilft insbesondere KMUs in der Schweiz Ressourcen zu schonen und schnell an die Insights zu gelangen, welche einen Vorsprung ermöglichen.

Weiterlesen
Kevin Kuhn Kevin Kuhn

Der Weg von Daten zum Impact

Quelle: gapingvoid.com

Quelle: gapingvoid.com

Um einen wirklichen Einfluss mit Daten zu schaffen bedarf es einiger Zwischenschritte. Daten werden zu Informationen, sobald man sieht, wie diese zusammenhängen. Angereichert mit dem Wissen, lassen sich Verbindungen ziehen. Aus diesem Netz erkennt man Zusammenhänge und kann erste Vermutungen anstellen. Prüft man die Vermutungen, so entsteht Wissen, welches wiederum Einfluss auf zukünftige Entscheidungen hat.

Weiterlesen
Kevin Kuhn Kevin Kuhn

Daten im Verwaltungsrat

In meiner Tätigkeit als Mitglied des Verwaltungsrats der Industriellen Betriebe Kloten kam die Frage auf, wie Daten ihren Weg in die Unternehmensstrategie und das Risk Management finden.

Idealerweise startet man mit einer Bestandsaufnahme der eigenen Daten im Unternehmen und definiert daraufhin deren Einfluss auf das operative Geschäft und deren strategische Wichtigkeit. Ergänzend sollte eine Risikoanalyse und Bewertung der einzelnen Datenquellen (oder -Silos) durchgeführt werden.

Anhand dieser Informationen zur aktuellen Ausgangslage kann der Verwaltungsrat die Menge, Qualität und Wichtigkeit von Daten abschätzen, sowie neue strategische Stossrichtungen im Umgang mit Daten ableiten und Daten als fixer Bestandteil im Risk Management einschliessen.

Weiterlesen
Kevin Kuhn Kevin Kuhn

Eine bessere Art, sich Atome vorzustellen

Henry Reich erklärt auf seinem YouTube-Kanal minutephysics auf einfache Art und Weise wie die Welt um uns herum funktioniert. Er hat sich überlegt, wie man Atome besser darstellen kann. Dabei entstand eine beeindruckende Form der Visualisierung um Position, Geschwindigkeit, Energie und Grösse darzustellen.

Weiterlesen
Kevin Kuhn Kevin Kuhn

Be Decision-Driven not Data-Driven

Im Beitrag «Be Decision-Driven, Not Data-Driven» erklärt Mark Palmer was die wesentlichen Unterschiede zwischen einem datengetriebenen (data-driven) und einem entscheidungsgetriebenen (decision-driven) Ansatz sind.

  1. Beginne mit deiner Frage, nicht den Daten. Entscheidungsorientiertes Denken verbringt mehr Zeit mit der Definition der richten Frage.

  2. Die Entscheider in Unternehmen führen Projekte, nicht die Data Scientist. Der Hauseigentümer gibt den Ton an, nicht der Bauherr.

  3. Unbekanntes zu erforschen ist wichtige, als bekanntes. Am Beispiel Verkaufshandel: Der Data-Driven Ansatz ist sich zu fragen, wie man das Loyalitätsprogramm verbessern kann. Der Decision-Driven Ansatz wäre zu fragen, was Kunden davon abhält überhaupt einen Kauf zu tätigen.

  4. Schaue zuerst breit, gehe erst dann in die Tiefe. Man sollte sich nicht kopfüber in die Daten stürzen. Entscheidungsorientierte Teams gehen erst in die Breite, bevor sie in die Tiefe gehen.

  5. Erschaffe dir neue, eigene Datenquellen. Wer bei Fragen startet stellt rasch fest, welche Daten fehlen und dringend benötigt werden.

  6. Diversität hilft die Einseitigkeit in Daten zu reduzieren. Durch die Einbeziehung eines breiteren Teams im Vorfeld neigen entscheidungsorientierte Teams dazu, vielfältiger zu sein.

  7. Nicht in den Rückspiegel schauen. Data-Driven Ansätze schliessen aufgrund historischer Daten, auf was künftig passieren wird. Die Vergangenheit mag zwar relevant sein, aber die Muster aus der Zeit vor der Pandemie gelten möglicherweise nicht mehr.

Weiterlesen
Kevin Kuhn Kevin Kuhn

Die Quantum Computing Revolution

Es beginnt alles mit einer Idee.

Grossartiger Vortrag von Michelle Simmons, welche auf wunderbare Art und Weise die Geschichte und Entstehung von Quantum Computing erklärt.

Weiterlesen
Kevin Kuhn Kevin Kuhn

Die Datenflut kommt erst noch

Gartner schätzte in einer Studie von 2015, dass 80% der Daten in Unternehmen unstrukturierter Natur sind. Das bedeutet, diese Daten können nicht in einer Tabelle abgebildet werden. Das sind beispielsweise Sprachmemos, Bilder, E-Mails oder Dokumente wie bspw. Chat-Nachrichten. Es schien lange Zeit, als wären diese Daten kaum nutzbar. Mit zunehmender Speicher- und Rechenleistung, sowie neuen Verfahren wird der Zugang du den Informationen in diesen Daten immer zugänglicher. Welches Potenzial siehst du?

Weiterlesen
Kevin Kuhn Kevin Kuhn

«Wir haben Unmengen an Daten»

ist vermutlich die häufigst Aussage, welche ich im Zusammenhang mit Daten – meist von Geschäftsführern– höre.

Der wahre Wert liegt jedoch nicht in der Menge, sondern darin zu wissen, wie gut die Qualität ist und welchen Nutzen diese Daten bieten.

Weiterlesen
Kevin Kuhn Kevin Kuhn

Lebensdauer von Daten

Der Time-to-Live auf TTL genannt ist ein in der IT bekannter Begriff. Er beschreibt die Lebensdauer eines Datenpunktes. Wie lange lebt ein Datensatz? Was ist sein Lebenszyklus? Und wie lange sollte ein Datenpunkt genutzt werden. Ähnlich einer Pflanze kann ein Datensatz nur so lange gedeihen, wie man sich auch um ihn kümmert und wie langer er für den richtigen Zweck eingesetzt wird. Was heisst das für die Daten, welche wir heute sammeln? Was ist der Time-to-Live unserer Daten?

Weiterlesen
Kevin Kuhn Kevin Kuhn

Visualisierung von Ähnlichkeiten in Dokumenten

Es beginnt alles mit einer Idee.

Schönes Beispiel von David McClure, wie man 1.8 Millionen Dokumente, welche auf arXiv.org abgelegt sind anhand von Titel und Abstract visualisiert werden können. Die Ähnlichkeit wird komplett durch Algorithmen definiert.

Tweet von David McClure

Weiterlesen
Kevin Kuhn Kevin Kuhn

Alle Daten enthalten einen Bias

Es beginnt alles mit einer Idee.

Als Bias kann ein Einfluss oder eine gewisse Tendenz verstanden werden. Auf Daten bezogen heisst dies, dass die Vorgabe resp. das Setting, wie Daten entstehen können, sehr starken Einfluss auf die Daten selbst haben. Und somit auch eine Bias erzeugen können.

Hat man in einem CRM-System bspw. die Möglichkeit einen Neukunden einem von drei Kundensegmenten (Konstrukt) zuzuordnen, so ist der Bias per se, dass man davon ausgeht, dass es nur 3 Kundengruppen gibt.

Alle Daten enthalten eine Bias. Es geht nicht darum, diesen Bias auszuschliessen, sondern sich dessen bewusst zu sein und damit umzugehen.

Weiterlesen