Treffer: Classification and analysis of the MNIST dataset using PCA and SVM algorithms.
Класификција и анализа скупа података МНИСТ помоћу алгоритама ПЦА и СВМ. (Serbian)
Weitere Informationen
Introduction/purpose: The utilization of machine learning methods has become indispensable in analyzing large-scale, complex data in contemporary data-driven environments, with a diverse range of applications from optimizing business operations to advancing scientific research. Despite the potential for insight and innovation presented by these voluminous datasets, they pose significant challenges in areas such as data quality and structure, necessitating the implementation of effective management strategies. Machine learning techniques have emerged as essential tools in identifying and mitigating these challenges and developing viable solutions to address them. The MNIST dataset represents a prominent example of a widely-used dataset in this field, renowned for its expansive collection of handwritten numerical digits, and frequently employed in tasks such as classification and analysis, as demonstrated in the present study. Methods: This study employed the MNIST dataset to investigate various statistical techniques, including the Principal Components Analysis (PCA) algorithm implemented using the Python programming language. Additionally, Support Vector Machine (SVM) models were applied to both linear and non-linear classification problems to assess the accuracy of the model. Results: The results of the present study indicate that while the PCA technique is effective for dimensionality reduction, it may not be as effective for visualization purposes. Moreover, the findings demonstrate that both linear and non-linear SVM models were capable of effectively classifying the dataset. Conclusion: The findings of the study demonstrate that SVM can serve as an efficacious technique for addressing classification problems. [ABSTRACT FROM AUTHOR]
Введение/цель: В современном мире использование методов машинного обучения стало незаменимым при анализе крупномасштабных и сложных данных. Данные методы широко применяются в различных областях: от оптимизации бизнес- операций до продвижения научных исследований. Несмотря на то что такие большие наборы данных открывают возможности для глубокого понимания и инноваций, они также представляют серьезную проблему в таких областях, как качество и структура данных, которые требуют применения эффективных стратегий управления. Методы машинного обучения стали ключевыми инструментами в выявлении и смягчении вышеописанных проблем, а также в разработке соответствующих решений. Набор данных MNIST представляет собой яркий пример широко используемого набора данных в этой области, отличающегося огромной коллекцией рукописных цифр. Данный набор часто используется в таких задачах, как классификация и анализ, о чем свидетельствует настоящее исследование. Методы: В данном исследовании использовался набор данных MNIST для изучения различных статистических методов, включая алгоритм анализа основных компонентов (PCA), с помощью скриптового языка программирования Python. Также применялись модели опорных векторов (SVM) для оценки точности модели в задачах линейной и нелинейной классификации. Результаты: Результаты настоящего исследования показывают, что хотя метод PCA эффективен для уменьшения размерности, он может оказаться не столь эффективным для целей визуализации. Более того, полученные результаты показали, что линейные, так же как и нелинейные SVM-модели эффективно классифицируют набор данных. Выводы: Результаты исследования показали, что SVM явдяется эффективным методом для решения проблем классификации. [ABSTRACT FROM AUTHOR]
Увод/циљ: Методи машинског учења постали су незаменљиви у анализи сложених података великог обима у савременим окружењима заснованим на подацима. Примењују се у најразличитијим областима, од оптимизације пословних процеса до сложених научних истраживања. Упркос томе што овакви обимни скупови података нуде могућности дубинског сагледавања, као и иновација, они представљају и велики изазов у областима као што су квалитет и структура података, што захтева примену ефикасних стратегија управљања. Технике машинског учења су се показале као суштински важни алати за идентификацију и смањивање тих изазова, као и за развијање могућих решења. Скуп података МНИСТ представља изразит пример широко коришћених сетова података у овој области, познат по својој великој колекцији руком писаних цифара, и често је употребљаван за класификације и анализе, као што је то показано у овој студији. Методе: Скуп података МНИСТ коришћен је за испитивање различитих статистичких поступака, укључујући алгоритам анализе главних компоненти (Principal Components Analysis (PCA ‒ ПЦА)) уз помоћ програмског језика Пајтон. Такође, примењени су модели метода потпорних вектора (Support Vector Machine (SVM ‒ СВМ)) за процењивање тачности модела у линеарним и нелинеарним класификационим проблемима. Резултати: Показано је да, иако техника ПЦА јесте ефикасна у редуковању димензионалности, она није толико ефикасна за визуализацију. Штавише, налази показују да су и линерани и нелинеарни модели СВМ успели да ефикасно класификују скуп података. Закључак: Резултати студије показују да СВМ може да буде ефикасна техника за решавање проблема класификације. [ABSTRACT FROM AUTHOR]
Copyright of Military Technical Courier / Vojnotehnicki Glasnik is the property of Military Technical Courier / Vojnotehnicki Glasnik and its content may not be copied or emailed to multiple sites without the copyright holder's express written permission. Additionally, content may not be used with any artificial intelligence tools or machine learning technologies. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)