Treffer: A DataOps reference architecture for Data Science

Title:
A DataOps reference architecture for Data Science
Contributors:
Universitat Politècnica de Catalunya. Departament d'Enginyeria de Serveis i Sistemes d'Informació, Queralt Calafat, Anna, Romero Moral, Óscar
Publisher Information:
Universitat Politècnica de Catalunya
Publication Year:
2023
Collection:
Universitat Politècnica de Catalunya, BarcelonaTech: UPCommons - Global access to UPC knowledge
Document Type:
Dissertation bachelor thesis
File Description:
application/pdf
Language:
English
Rights:
Open Access
Accession Number:
edsbas.1AD25818
Database:
BASE

Weitere Informationen

Aquest document presenta la metodologia DataOps per desenvolupar projectes de Data Science de forma semi automatitzada. A més, se centra en el disseny, la implementació i testeig d'una arquitectura de software que reflecteixi la metodologia proposada. L'objectiu del projecte és integrar tot el coneixement d'aquesta metodologia en un document únic i proposar una arquitectura per el Data Management Backbone que pugui ser utilitzable, modificable i extensible pels usuaris. S'ha fet una introducció concisa a la metodologia i s'ha explicat tots els passos implicats. S'ha investigat les millors eines gratuïtes i de codi obert per materialitzar l'arquitectura proposada. Finalment, s'ha provat l'arquitectura implementada utilitzant diferents fonts de dades i se n'ha observat el comportament i les millores. ; This document presents DataOps methodology for developing Data Science projects in a semi-automated way. Furthermore, it focuses on the design, implementation and testing of a software architecture that reflects the proposed methodology. The objective of the project is to integrate all the knowledge of this methodology in a single document and to propose an architecture for the Data Management Backbone that can be usable, modifiable, and extensible by the users. A concise introduction to the methodology has been made, explaining all the steps involved. Research has been done on the best free and open-source tools to materialize the proposed architecture. Finally, the implemented architecture has been tested using different data sources and its behaviour and improvements have been observed.