/ Savoir / Blog / Reprise des données dans le PIM : comment surmonter les principaux obstacles ?

Comment surmonter les obstacles lors de la reprise des données dans un projet PIM

Thomas Kern
19/09/2025
6 min.
Import de données | Introduction

Recommandations pratiques pour une approche habile de la reprise des données

Lorsque l'on introduit un nouveau système PIM, la reprise des données est considérée comme le principal obstacle. En procédant habilement, il est possible de se simplifier considérablement la tâche. Je voudrais définir plus précisément le terme « reprise des données » : il s'agit aussi bien de la reprise initiale des données que des interfaces avec les systèmes antérieurs, en particulier le système ERP, qui sont exploitées en permanence.

La reprise initiale des données pour le premier remplissage peut se faire à partir d'un système PIM déjà existant – on parle alors de migration des données – ou sur le "terrain". Même si l'on ne dispose pas encore d'un système PIM ou d'un système similaire, on trouvera des stocks de données, que ce soit dans des fichiers Excel, dans le CMS ou dans des documents. Ces données, plus les fichiers média (images, documents, vidéos), doivent être préparées pour être importées dans le (nouveau) système PIM. Et là, il y a bien sûr – et à juste titre – des craintes que la charge de travail dépasse la tête. J'aimerais dissiper un peu ces craintes en montrant les possibilités de simplifier et d'accélérer la reprise des données. Toutefois, il reste évidemment du travail à faire, même si l'on procède le plus habilement possible.


Utiliser les sources de données existantes, comme le système ERP.

Mon premier conseil est de récupérer au fur et à mesure, via une interface, un maximum de données déjà existantes dans le système ERP. Bien entendu, uniquement les données pour lesquelles le système ERP a la souveraineté des données. Il est d'ailleurs essentiel de définir la souveraineté des données pour chaque information : Où l'information doit-elle être gérée à l'origine ? Dans le système ERP, dans le système PIM, etc. Ces informations ne doivent être gérées que dans ce système et il faut ensuite y recourir. L'avantage est que les données que l'on peut obtenir en permanence ne doivent pas être préparées et reprises une seule fois, ce qui permet d'économiser beaucoup de travail. Il faut "seulement" veiller à ce que les données du système ERP "correspondent" (ce qui n'est malheureusement pas toujours le cas). Bien sûr, ce que je viens de décrire va de soi - et pourtant, je constate presque toujours que l'on n'a pas recours à toutes les données pertinentes pour le PIM dans le système ERP.

 

Procédure de reprise des données

Venons-en au deuxième conseil. Il existe en principe deux procédures totalement différentes pour la reprise des données : D'une part, la procédure consistant à reprendre l'intégralité des données en une seule fois et, d'autre part, la procédure par étapes. L'approche progressive signifie que l'on commence par une gamme de produits déterminée et que l'on effectue toutes les dérivations (MVP = Minimal Viable Product), par exemple en préparant les données pour le site web ou la boutique ou en produisant les pages de catalogue, les fiches techniques, etc. correspondantes. Les deux approches ont des avantages et des inconvénients. Le principal avantage de la procédure par étapes est que l'on obtient rapidement des résultats et que l'on est ainsi motivé. Pour toutes les personnes concernées, les progrès sont visibles et ne constituent pas une "boîte noire". L'avantage essentiel de la reprise des données dans leur intégralité est que l'on a une vue d'ensemble de toutes les données, ce qui permet d'être plus efficace et, le cas échéant, de détecter plus systématiquement les problèmes structurels des données. Les deux approches ont leur autorisation ; le choix doit en tout cas convenir aux personnes concernées.

 

Formats techniques pour la reprise des données

Le troisième conseil est un peu plus technique. Sous quel format les données doivent-elles être préparées ? Il s'agit souvent d'Excel, de BMEcat, de XML et de JSON. Pour une interface, on peut volontiers utiliser BMEcat, XML et JSON, mais pour la phase de préparation des données, je recommanderais clairement Excel. Pour la simple raison qu'on peut y adapter et compléter les données. Les autres formats sont bons pour la machine, mais pas pour l'homme. Excel n'est bien sûr pas non plus égal à Excel : tout dépend de la manière dont les données peuvent être préparées, par colonnes ou par lignes. Colonne par colonne signifie que les noms des champs se trouvent dans les colonnes et les contenus dans les lignes, produit par produit. Cela donne certes de larges listes Excel, mais la vue d'ensemble est bien meilleure que lorsque les noms des champs figurent sur les lignes. Je ne peux que vous recommander d'examiner les possibilités d'importation, car le surcroît de travail dû aux lacunes fonctionnelles peut rapidement se chiffrer en semaines. Le summum est d'ailleurs atteint lorsque les fichiers d'importation pour Excel sont basés sur un modèle (schéma XML XSD), ce qui permet des validations et des conversions en XML.

 

Liste de contrôle pour la préparation des données

Jusqu'à présent, nous avons parlé de conseils sur la manière de procéder, je voudrais maintenant en venir au contenu des données lui-même. C'est là que se décide, à long terme, l'utilité des données. C'est là que les détails comptent vraiment et qu'il faut viser une qualité de données de 100 %, donc privilégier absolument la minutie à la rapidité, car une fois que les données sont utilisées, les corrections sont d'autant plus laborieuses !

 

En lisant cette liste, vous vous direz peut-être qu'elle est trop pointilleuse, mais tous ces conseils ont une raison d'être pratique (issus de plus de 100 projets PIM) et toutes les failles finissent par se retourner contre vous à un moment ou à un autre.

 

Voici ma liste de contrôle pour la préparation des données des attributs :

  • Attribuer soigneusement un nom de base de données univoque
    Ma recommandation est d'utiliser des noms "naturels" plutôt que des numéros attribués en continu (courts, clairs et compréhensibles).

 

  • Attribuer soigneusement les désignations dans les langues requises
    De même, attribuer en une seule fois des désignations alternatives, par exemple des noms de colonnes raccourcis pour les étiquettes de colonnes de tableaux ou de dessins, des explications, etc.

 

  • Utiliser la classification
    Regrouper les attributs en classes de manière à ce qu'ils soient adaptés à la gestion de produits similaires.

 

  • Définir des listes de sélection avec des entrées fixes - si possible - afin d'imposer une uniformité
    Il doit également être possible d'utiliser des ordres différents du tri alphabétique.

 

  • Attribuer correctement les types de données
    Utiliser le type de données Nombre (dans le cas où ils servent à la conversion et doivent être formatés comme des chiffres). Il est préférable d'enregistrer les codes EAN, les numéros de tarif douanier, etc. sous forme de texte et non de chiffres.

 

  • Dans le cas de chiffres : séparation des unités.

  • Séparation des attributs min-max en deux attributs

 

  • Marquer les contenus indépendants de la langue en tant que tels
    Pour éviter un effort de traduction superflu

 

  • Prévoir des contrôles de saisie
    Par exemple, plage numérique, longueur de texte, nombre de décimales, unicité, affectation multiple ou simple.

 

  • Attribuer des autorisations
    Par exemple "Bloquer la maintenance des données" pour les contenus du système ERP

 

  • Champs obligatoires : Indiquer pour les contrôles si l'attribut, dans le contexte d'une classe, est un champ obligatoire ou facultatif.

 

 

Les fonctionnalités PIM suivantes sont utiles pour la gestion des attributs :

 

  • Formatage des chiffres : séparateurs décimaux et de milliers spécifiques au pays
    Possibilités de réglage des règles d'arrondi et du nombre de décimales. Si les textes contiennent exceptionnellement des chiffres, ces derniers doivent également pouvoir être formatés ("pseudo-numériques").

 

  • Représenter les attributs dépendants en tant que tels (multidimensionnels) afin de conserver le lien
    Par exemple, la tension nominale en fonction de la fréquence

 

  • Concaténer les attributs
    Par exemple, concaténer les attributs min-max ou les attributs avec leurs unités.

 

  • Convertir les attributs en formules
    Par exemple, convertir les mesures métriques en mesures impériales. Représenter des calculs complexes avec des conditions sous forme de scripts

 

  • Insérer des attributs dans des textes ou des graphiques comme jokers
    Pour assurer la cohérence dans tous les contenus

 

  • Pouvoir attribuer des images, par exemple des icônes
    En effet, des images sont souvent utilisées pour la visualisation dans les catalogues et les sites Web au lieu des désignations textuelles

 

  • Concept d'hérédité
    Pouvoir gérer les attributs non seulement au niveau des articles, mais aussi au niveau des familles de produits pour tous les articles qu'elles contiennent, etc.

 

 

Utilisation de l'IA pour la reprise des données

 

Pour terminer, j'aimerais partager mon expérience sur la prise en charge par l'IA. Dans ce domaine, je suis d'avis que l'IA peut déployer tout son potentiel lorsque les données de base sont d'une grande qualité.

 

Pour illustrer mon propos, je citerai deux exemples :

 

  • Dans un projet pilote, la classification des produits dans les classifications standard ECLASS est effectuée avec le soutien de l'IA. Les données existantes, très bien gérées, sont utilisées à cet effet. Je suis certain que sans cette base de données, le soutien de l'IA ne serait pas couronné de succès.

 

  • Dans les projets des clients, des textes descriptifs et publicitaires sont générés pour le marketing. Plus les données de base sont correctes, plus le soutien de l'IA, par exemple avec ChatGPT, fonctionne bien.

 

L'IA peut-elle également être utilisée pour la préparation initiale des données ? En théorie oui, mais la question est de savoir si cela est rentable ? Les délais typiques pour la préparation des données sont en moyenne de plusieurs mois. On peut donc éventuellement économiser des semaines avec l'IA. D'un autre côté, il ne faut pas oublier qu'il faut un processus de correction, et que les corrections sont souvent plus coûteuses que la préparation manuelle initiale. C'est pourquoi je recommanderais d'effectuer la préparation initiale des données à la main. Puis, en guise d'exercice libre, utiliser l'IA sur une base de données correcte à d'autres fins et la laisser faire de la magie.

Conclusion

Avant de commencer, réfléchissez à la procédure de reprise des données :
Déterminez la souveraineté des données en interaction avec le système ERP. Décidez d'une procédure par étapes ou d'une procédure complète. Décidez quels outils et quels styles seront utilisés. Passez en revue la liste de contrôle pour la préparation des données et comparez les exigences avec les spécialistes et avec les fonctions du système PIM. Et surtout, profitez de ces conseils et n'hésitez pas à me donner votre avis !

Thomas Kern est gérant et fondateur de crossbase. Il est à l'origine de l'idée du logiciel et dispose de plus de 25 ans d'expérience dans le domaine du PIM, du DAM, de l'impression, de l'e-commerce et de tout ce qui s'y rapporte. En tant qu'ingénieur en mécanique avec une spécialisation en informatique appliquée, il est donc en mesure de fournir des conseils complets à nos clients de l'industrie.

 

En outre, il conseille les nouveaux clients lors de l'introduction de crossbase et est responsable de la gestion de projet. Le contenu de ses projets est axé sur l'analyse, le modèle de données et l'interface ERP.

Il partage également ces connaissances avec vous sur notre blog et répond volontiers à vos questions :
t.kern@crossbase.de

Je me réjouis d'un entretien
de consultation personnel avec vous.

Appelez maintenant
+33 3 39 25 04 03 ou

envoyez un message

 

Jean-René Thies

Gérant et chef de projet

Contact

Afin d'éviter toute utilisation abusive du formulaire, nous utilisons le « Friendly Captcha ».
Nous vous remercions pour votre message ! Nous avons bien reçu votre demande et nous allons la traiter au plus vite. Notre équipe vous contactera sous peu. Votre équipe crossbase
Quelque chose a dû mal se passer – veuillez réessayer plus tard. Votre équipe crossbase