Wie man Hürden bei der Datenübernahme in einem PIM-Projekt überwindet
Praxisnahe Empfehlungen zum geschickten Vorgehen bei der Datenübernahme
Wenn man ein neues PIM-System einführt, gilt die Datenübernahme als die größte Hürde. Wenn man geschickt vorgeht, kann man sich die Arbeit wesentlich einfacher machen. Den Begriff „Datenübernahme“ möchte ich etwas genauer umreißen: Es soll dabei sowohl um die einmalige, initiale Datenübernahme gehen als auch um die laufend betriebenen Schnittstellen zu Vorsystemen, insbesondere dem ERP-System.
Die initiale Datenübernahme zur erstmaligen Befüllung kann aus einem bereits bestehenden PIM-System erfolgen – man spricht dann von Datenmigration – oder auf der „grünen Wiese“. Selbst auf der „grünen Wiese“, wenn noch kein PIM-System oder ähnliches vorhanden ist, wird man Datenbestände vorfinden, sei es in Exceldateien, im CMS oder in Dokumenten. Diese Daten, plus der Mediendateien (Bilder, Dokumente, Videos), müssen für den Import in das (neue) PIM-System aufbereitet werden. Und da gibt es natürlich – und auch zu Recht – Befürchtungen, dass der Aufwand einem über den Kopf wächst. Diese Befürchtungen will ich ein Stück weit nehmen, indem ich Möglichkeiten zur Vereinfachung und Beschleunigung der Datenübernahme aufzeige. Allerdings bleibt natürlich Arbeit zu tun, auch wenn man möglichst geschickt vorgeht.
Nutzen Sie bestehende Datenquellen wie das ERP-System
Mein erster Tipp ist es, möglichst viele, bereits bestehende, Daten aus dem ERP-System über eine Schnittstelle laufend zu beziehen. Natürlich nur diejenigen Daten, für die das ERP-System die Datenhoheit hat. Das ist übrigens ganz wesentlich, dass man die Datenhoheiten für jede Information festlegt: Wo soll die Information originär gepflegt werden? Im ERP-System, im PIM-System usw. Diese Informationen sollen dann auch nur in diesem System gepflegt und dann darauf zurückgegriffen werden. Der Vorteil ist, dass man Daten, die man laufend beziehen kann, nicht einmalig aufbereiten und übernehmen muss, das spart viel Arbeit. Man muss „nur“ schauen, dass die Daten aus dem ERP-System dann auch „passen“ (was leider nicht immer der Fall ist). Natürlich ist das Beschriebene selbstredend – und trotzdem erlebe ich eigentlich nahezu immer, dass nicht auf alle PIM-relevanten Daten im ERP-System zurückgegriffen wird.
Vorgehen zur Datenübernahme
Kommen wir zum zweiten Tipp. Grundsätzlich gibt es bei der Datenübernahme zwei gänzlich verschiedene Vorgehensweisen: Zum einen das Vorgehen, alle Daten auf einen Rutsch vollständig zu übernehmen und zum andern das schrittweise Vorgehen. Schrittweise heißt, dass man mit einem bestimmten Produktbereich startet und hierfür alle Ausleitungen durchführt (MVP = Minimal Viable Product), beispielsweise die Daten für die Website oder den Shop bereitstellt oder die entsprechenden Katalogseiten, Datenblätter etc. produziert. Beide Vorgehen haben Vor- und Nachteile. Der wesentliche Vorteil des schrittweisen Vorgehens ist, dass man schnell Erfolge erzielt und dadurch motiviert wird. Für alle Beteiligten ist der Fortschritt sichtbar und keine „Black box“. Der wesentliche Vorteil der vollständigen Datenübernahme ist es, dass man alle Daten in der Gesamtheit im Blick hat und dadurch effizienter ist und gegebenenfalls auch systematischer strukturelle Datenprobleme erkennt. Beide Vorgehen haben ihre Berechtigung; die Wahl sollte jedenfalls zu den Beteiligten passen.
Technische Formate für die Datenübernahme
Beim dritten Tipp wird es etwas technisch. In welcher Form sollen die Daten aufbereitet werden? Dabei geht es oft um Excel, BMEcat, XML und JSON. Für eine Schnittstelle mag BMEcat, XML und JSON gerne verwendet werden, aber für die Phase der Datenaufbereitung würde ich ganz klar Excel empfehlen. Aus dem einfachen Grund, dass man die Daten dort anpassen und ergänzen kann. Die anderen Formate sind gut für die Maschine, aber nicht für den Menschen. Excel ist natürlich auch nicht gleich Excel: Es kommt darauf an, wie die Daten aufbereitet werden können, spalten- oder zeilenweise. Spaltenweise bedeutet, dass die Feldnamen in den Spalten stehen und die Inhalte produktweise in den Zeilen. Das führt zwar zu breiten Excellisten, aber die Übersicht ist viel besser als wenn die Feldnamen in den Zeilen stehen. Ich kann nur empfehlen, dass Sie sich die Möglichkeiten des Imports anschauen, denn der Mehraufwand aufgrund funktioneller Mängel kann schnell in die Wochen gehen. Die Kür ist es übrigens, wenn die Importdateien für Excel auf einer Vorlage basieren (XML-Schema XSD) und dadurch Validierungen und Umwandlungen in XML möglich sind.
Checkliste zur Datenaufbereitung
Bisher haben wir über Tipps zum Vorgehen gesprochen, jetzt möchte ich zu den Dateninhalten selbst kommen. Damit entscheidet sich auf lange Sicht wie nützlich die Daten sind. Hier zählen wirklich die Details und man sollte die 100%-Datenqualität als Ziel haben, also unbedingt Gründlichkeit vor Schnelligkeit wählen, denn wenn die Daten erst einmal in Verwendung sind, werden Korrekturen umso aufwändiger!
Vielleicht denken Sie beim Lesen der Checkliste, ach wie kleinlich, aber alle Tipps haben einen praktischen Hintergrund (aus über 100 PIM-Projekten) und alle Mängel holen einen irgendwann wieder ein.
Hier meine Checkliste für die Datenaufbereitung von Attributen:
- Eindeutigen Datenbanknamen sorgfältig vergeben
Meine Empfehlung sind „natürliche“ Benennungen anstatt fortlaufend vergebener Nummern (kurz, eindeutig und nachvollziehbar).
- Bezeichnungen in den erforderlichen Sprachen sorgfältig vergeben
Ebenso in einem Zuge alternative Bezeichnungen, beispielsweise gekürzte Spaltennamen für Tabellenspalten- oder Zeichnungsbeschriftungen, Erläuterungen usw.
- Klassifizierung einsetzen
Attribute zu Klassen clustern, so dass sie passend sind zur Pflege von gleichartigen Produkten
- Auswahllisten mit festgelegten Einträgen vorgeben – wenn irgend möglich – um Einheitlichkeit zu erzwingen
Hierbei sollen auch Reihenfolgen abweichend von der alphabetischen Sortierung möglich sein.
- Datentypen richtig vergeben
Datentyp Zahl verwenden (im Falle, dass sie zur Umrechnung dienen und als Zahlen formatiert werden sollen). EAN, Zolltarifnummer usw. sinnvollerweise als Text und nicht als Zahl speichern.
- Im Falle von Zahlen: Trennung von den Einheiten
- Splittung von Min-Max-Attributen in zwei Attribute
- Sprachneutrale Inhalte als solche kennzeichnen
Um überflüssigen Übersetzungsaufwand zu vermeiden
- Eingabeprüfungen vorgeben
Beispielsweise Zahlenbereich, Textlänge, Anzahl Nachkommastellen, Eindeutigkeit, multiple oder einfache Zuordnung
- Berechtigungen vergeben
Beispielsweise „Datenpflege sperren“ für Inhalte aus dem ERP-System
- Pflichtfelder: Für Prüfungen vorgeben, ob das Attribut, im Kontext einer Klasse, Pflicht- oder Kannfeld ist.
Für die Verwaltung der Attribute sind folgende PIM-Funktionalitäten sinnvoll:
- Zahlenformatierung: Länderspezifische Dezimal- und Tausendertrennzeichen
Einstellungsmöglichkeiten für Rundungsregeln und Anzahl Nachkommastellen. Falls in Texten ausnahmsweise Zahlen enthalten sind, müssen die Zahlen ebenfalls formatierbar sein („pseudonumerisch“).
- Abhängige Attribute als solche (mehrdimensional) abbilden, um den Zusammenhang zu bewahren
Beispielsweise Nennspannung in Abhängigkeit von der Frequenz
- Attribute verketten
Beispielsweise Min-Max-Attribute oder Attribute mit ihren Einheiten verketten
- Attribute formelmäßig umrechnen
Beispielsweise metrische Maße in Imperialmaße umrechnen. Komplexe Berechnungen mit Bedingungen als Skripte abbilden
- Attribute in Texten oder Grafiken als Platzhalter einfügen
Um die Konsistenz in allen Inhalten zu gewährleisten
- Bilder, beispielsweise Icons, zuordnen können
Denn oft werden zur Visualisierung in Katalogen und Website Bilder statt der textuellen Bezeichnungen eingesetzt
- Vererbungskonzept
Attribute nicht nur auf Ebene der Artikel pflegen können, sondern auch auf Produktgruppenebene für alle darin enthaltenen Artikel usw.
Einsatz von KI zur Datenübernahme
Zum Schluss möchte ich noch meine Erfahrungen mit der Unterstützung durch KI teilen. Hier bin ich der Meinung, dass die KI dann ihr volles Potential entfalten kann, wenn die Grunddaten eine hohe Qualität haben.
Ich möchte zur Erläuterung zwei Beispiele nennen:
- In einem Pilotprojekt wird mit KI-Unterstützung die Klassifizierung von Produkten in die Standardklassifikationen ECLASS geleistet. Dafür werden die bestehenden, sehr sauber gepflegten Daten, verwendet. Ich bin mir sicher, dass ohne diese Datenbasis die KI-Unterstützung nicht erfolgreich wäre.
- In Kundenprojekten werden Beschreibungs- und Werbetexte für das Marketing generiert. Je ordentlicher die Grunddaten sind, umso besser funktioniert die KI-Unterstützung, beispielsweise mit ChatGPT.
Kann KI auch für die initiale Datenaufbereitung genutzt werden? Hmm, theoretisch ja, die Frage ist nur ob sich das rechnet!? Typische Zeiten für die Datenaufbereitung betragen im Schnitt mehrere Monate. Man kann also mit KI eventuell Wochen sparen. Man muss auf der anderen Seite bedenken, dass es einen Korrekturlauf braucht, und oft sind Korrekturen aufwändiger als die manuelle Erstaufbereitung. Daher würde ich empfehlen die initiale Datenaufbereitung händisch zu machen. Und dann als Kür die KI auf einer ordentlichen Datenbasis für weitere Zwecke einzusetzen und zaubern zu lassen.
Fazit
Überlegen Sie sich vor dem Start das Vorgehen zur Datenübernahme:
Legen Sie die Datenhoheiten im Zusammenspiel mit dem ERP-System fest. Entscheiden Sie sich für schrittweises oder vollständiges Vorgehen. Entscheiden Sie welche Tools und Formate zum Einsatz kommen. Gehen Sie die Checkliste zur Datenaufbereitung durch und gleichen Sie die Anforderungen mit den Fachleuten und mit den Funktionen des PIM-System ab. Vor allem: Profitieren Sie von diesen Tipps und geben Sie mir gerne Feedback!
Thomas Kern ist Geschäftsführer und Unternehmensgründer von crossbase. Er war Ideengeber der Software und verfügt über mehr als 25 Jahre Erfahrung im Bereich PIM, MAM, Print, E-Commerce und allem, was dazu gehört. Als Maschinenbauingenieur mit Schwerpunkt Angewandte Informatik kann er unsere Kunden aus der Industrie daher vollumfassend beraten.
Darüber hinaus berät er die Neukunden bei der Einführung von crossbase und verantwortet das Projektmanagement. Seine inhaltlichen Schwerpunkte bei den Projekten sind Analyse, Datenmodell und ERP-Schnittstelle.
In unserem Blog teilt er dieses Wissen auch mit Ihnen und beantwortet gerne Ihre Fragen:
t.kern@crossbase.de
Empfohlene Artikel
Ich freue mich auf ein
persönliches Gespräch mit Ihnen.
Jetzt anrufen unter
+49 7031 9881-770
oder Nachricht schreiben
Herby Tessadri
Vertriebsleiter und Prokurist