Treffer: Automatisation d’un processus de contrôle qualité de données au format tableur issues de Prodinra

Title:
Automatisation d’un processus de contrôle qualité de données au format tableur issues de Prodinra
Contributors:
Structures et Marché Agricoles, Ressources et Territoires (SMART-LERECO), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Centre d'Economie de l'Environnement - Montpellier - FRE2010 (CEE-M), Institut National de la Recherche Agronomique (INRA)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro)
Source:
Cahier des Techniques de l'INRA. 96:7-17
Publisher Information:
CCSD; INRA, 2019.
Publication Year:
2019
Collection:
collection:SHS
collection:CNRS
collection:INRA
collection:UNAM
collection:AGREENIUM
collection:ECON
collection:UNIV-MONTPELLIER
collection:CEE-M
collection:INSTITUT-AGRO-MONTPELLIER
collection:INRAE
collection:INRAEOCCITANIEMONTPELLIER
collection:ARINRAE
collection:ARINRAE-CDT
collection:UM-2015-2021
collection:INSTITUT-AGRO
collection:SMART
Original Identifier:
PRODINRA: 457572
HAL: hal-01986593
Document Type:
Zeitschrift article<br />Journal articles
Language:
French
ISSN:
0762-7939
2534-5710
Rights:
info:eu-repo/semantics/OpenAccess
URL: http://creativecommons.org/licenses/by-sa/
Accession Number:
edshal.hal.01986593v1
Database:
HAL

Weitere Informationen

National audience
The INRA professionals of Technical and Scientific Information (IST) look after the quality of data available in the open repository ProdInra. This work allows obtaining some lists and indicators the most reliable possible about the publications. In this scope, we work together with a computer expert on the automatization to set up an automatized quality control process based on a extracted excel file, which would be more efficient. Thispaper describes the process in detail, so this process could be reused for anyone who works with a corpus of publications in ProdInra. You will find as well some precautionary advices and cares about the files that are used in the process. We propose then possible evolutions for the future ProdInra when migrated in the HAL infrastructure.
Les professionnels de l’Information Scientifique et Technique (IST), de l’Inra veillent à ce que les données disponibles dans l’archive ouverte ProdInra soient de qualité. Ce travail est indispensable pour l’obtention de listes de publications et d’indicateurs les plus fiables possible. Dans ce cadre, nous avons travaillé en collaboration avec un informaticien sur une automatisation d’un processus de contrôle qualité de données extraites au format tableur pour gagner en efficacité. Cet article décrit notre démarche. Il vous propose de faire de même pour votre corpus bibliographique issu de ProdInra. Vous trouverez également des conseils sur les précautions à prendre pour utiliser les fichiers de sortie. Enfin, nous proposons des évolutions en prévision du passage de ProdInra à HaL.