Result: FORMATION OF BIM MODEL DATASET FOR MACHINE LEARNING TASKS ; ФОРМУВАННЯ НАБОРУ ДАНИХ BIM-МОДЕЛІ ДЛЯ ЗАДАЧ МАШИННОГО НАВЧАННЯ
Further Information
This paper presents a reproducible approach to deriving machine-learning-ready datasets from Autodesk Revit BuildingInformation Models. We unify four complementary export routes‒Schedules→CSV, Dynamo→CSV/XLSX/JSON,pyRevit/Revit API→CSV/JSON/XLSX, and IFC→Autodesk Platform Services/Speckle→JSON/CSV‒under a single datacontract: a target schema/ontology with mandatory fields, SI units, a stable key policy (IfcGUID/composite key), and formal data-quality validation. The methodology covers ingestion, normalization of types and units, construction of geometricdescriptors, checks of completeness and referential integrity, and feature preparation for reliable train/validation/test splits.Provided a practical protocol and a final Elements.csv dataset used in a baseline task that predicts element mass as aproxy for cost and logistics; templates for quality checks accompany the flow. Across applied scenarios‒production-rateestimation, cost approximation, and optimization of layout and load-bearing systems‒we show that disciplined datamanagement (schema, keys, units, rules) reduces information leakage and improves reproducibility.The contribution aligns tool-specific export routes with a uniform representation, enabling integration of BIM data withanalytics without dependence on a software stack and establishing a foundation for data-centric design and subsequentoptimization. We also document reproducibility artefacts (JSON/Table Schema definitions, DQI reports, and processing logs)to support audit and repetition. ; У статті представлено відтворюваний підхід до формування наборів даних із BIM-моделі Autodesk Revit дляподальшого застосування методів машинного навчання у проєктуванні. Запропоновано чотиривзаємодоповнювальні маршрути експорту (Schedules→CSV, Dynamo до CSV/XLSX/JSON, pyRevit/Revit API доCSV/JSON/XLSX, IFC до APS/Speckl до JSON/CSV) та уніфікований «договір даних»: цільову схему/онтологію зядром обов’язкових полів, SI-одиницями, стабільною політикою ключів (IfcGUID/композитний ключ) і формальноювалідацією ...