Result: FORMATION OF BIM MODEL DATASET FOR MACHINE LEARNING TASKS ; ФОРМУВАННЯ НАБОРУ ДАНИХ BIM-МОДЕЛІ ДЛЯ ЗАДАЧ МАШИННОГО НАВЧАННЯ

Title:
FORMATION OF BIM MODEL DATASET FOR MACHINE LEARNING TASKS ; ФОРМУВАННЯ НАБОРУ ДАНИХ BIM-МОДЕЛІ ДЛЯ ЗАДАЧ МАШИННОГО НАВЧАННЯ
Source:
Modern technology, materials and design in construction; Vol. 38 No. 1 (2025); 87-94 ; Современные технологии, материалы и конструкции в строительстве; Том 38 № 1 (2025); 87-94 ; Сучасні технології, матеріали і конструкції в будівництві; Том 38 № 1 (2025); 87-94 ; 2311-1437 ; 2311-1429 ; 10.31649/2311-1429-2025-1
Publisher Information:
Вінницький національний технічний університет
Publication Year:
2025
Document Type:
Academic journal article in journal/newspaper
File Description:
application/pdf
Language:
Ukrainian
DOI:
10.31649/2311-1429-2025-1-87-94
Accession Number:
edsbas.9411F0F1
Database:
BASE

Further Information

This paper presents a reproducible approach to deriving machine-learning-ready datasets from Autodesk Revit BuildingInformation Models. We unify four complementary export routes‒Schedules→CSV, Dynamo→CSV/XLSX/JSON,pyRevit/Revit API→CSV/JSON/XLSX, and IFC→Autodesk Platform Services/Speckle→JSON/CSV‒under a single datacontract: a target schema/ontology with mandatory fields, SI units, a stable key policy (IfcGUID/composite key), and formal data-quality validation. The methodology covers ingestion, normalization of types and units, construction of geometricdescriptors, checks of completeness and referential integrity, and feature preparation for reliable train/validation/test splits.Provided a practical protocol and a final Elements.csv dataset used in a baseline task that predicts element mass as aproxy for cost and logistics; templates for quality checks accompany the flow. Across applied scenarios‒production-rateestimation, cost approximation, and optimization of layout and load-bearing systems‒we show that disciplined datamanagement (schema, keys, units, rules) reduces information leakage and improves reproducibility.The contribution aligns tool-specific export routes with a uniform representation, enabling integration of BIM data withanalytics without dependence on a software stack and establishing a foundation for data-centric design and subsequentoptimization. We also document reproducibility artefacts (JSON/Table Schema definitions, DQI reports, and processing logs)to support audit and repetition. ; У статті представлено відтворюваний підхід до формування наборів даних із BIM-моделі Autodesk Revit дляподальшого застосування методів машинного навчання у проєктуванні. Запропоновано чотиривзаємодоповнювальні маршрути експорту (Schedules→CSV, Dynamo до CSV/XLSX/JSON, pyRevit/Revit API доCSV/JSON/XLSX, IFC до APS/Speckl до JSON/CSV) та уніфікований «договір даних»: цільову схему/онтологію зядром обов’язкових полів, SI-одиницями, стабільною політикою ключів (IfcGUID/композитний ключ) і формальноювалідацією ...