UDK 519.87 Doi: 10.31772/2712-8970-2022-23-1-33-42
Сравнение методов кластеризации данных для автоматического определения грануляции в генетической нечеткой системе
Плешкова Т. С., Становов В. В.
Сибирский федеральный университет Российская Федерация, 660041, г. Красноярск, просп. Свободный, 79
В статье предлагается применение методов кластеризации для определения наиболее подходя-щего количества нечетких термов при построении генетической нечеткой системы. При этом система на нечеткой логике применяется для решения задач классификации данных и автоматически формируется генетическим алгоритмом. В работе использовался генетический алгоритм с кодировкой термов и классов в бинарную строку, при этом каждый индивид кодировал базу пра-вил. Для построения базы правил необходимо задавать такой параметр, как количество нечетких термов, так как он существенно влияет на качество сформированных классификаторов. Для выявления лучшего метода кластеризации данных было проведено сравнение наиболее известных алгоритмов: DBSCAN, k-средних и алгоритм среднего сдвига. Для оценки эффективности подобранного количества нечетких термов были проведены вычислительные эксперименты на нескольких наборах данных. По результатам было определено, что алгоритм среднего сдвига подбирает такое количество термов, которое позволяет строить более точные классификаторы в сравнении с двумя другими методами, участвовавшими в тестировании. Также было проведено сравнение с альтернативными методами классификации, такими как k ближайших соседей, метод опорных векторов и нейронные сети, в результате которого предложенный метод показал сравнимое качество классификации. Разработанный подход к автоматизации определения количества термов позволяет исключить ручной подбор грануляции для различных данных, снижая затраты на создание эффективной нечеткой системы для задачи классификации.
Ключевые слова: классификация, нечеткая логика, генетический алгоритм, DBSCAN, k-средних, алгоритм среднего сдвига.
References

1. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed, Springer-Verlag, 2009, 764 p.

2. Ashby W. R. An Introduction to Cybernetics. London: Chapman & Hall, 1956, 306 с.

3. Усков А. А., Кузьмин А. В. Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая логика. М. : Горячая Линия – Телеком, 2004, 143 с.

4. Zadeh L. A. Fuzzy sets // Information and Control. 1965, No. 8 (3). P. 338–353.

5. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М. : Горячая линия – Телеком, 2004, 384 с.

6. Становов В. В. Самонастраивающиеся эволюционные алгоритмы формирования систем на нечеткой логике : дис. ... канд. техн. наук. Красноярск, 2016. 148 с.

7. Гладков Л. А., Курейчик В. В., Курейчик В. М. Генетические алгоритмы. М. : Физматлит, 2006. 368 с.

8. Ishibuchi H., Nojima Y. Analysis of interpretability-accuracy tradeoff of fuzzy systems by multiobjective fuzzy genetics-based machine learning // International Journal of Approximate Reasoning. 2007.28 p. Doi:10.1016/j.ijar.2006.01.004.

9. Емельянов В. В., Курейчик В. В., Курейчик В. М. Теория и практика эволюционного моделирования. М. : Физматлит, 2003. 432 с.

10. Генетический алгоритм в оптимизации трехмерной упаковки блоков в контейнер /
О. П. Тимофеева, Т. Ю. Чернышева, О. Н. Корелин и др. Нижний Новгород : Нижегородский гос. техн. ун-т им. Р. Е. Алексеева, 2017. 7 с.

11. Кочкин А. М. Применение генетического алгоритма в задачах оптимизации. Ч. 2. Караганда : Карагандинский гос. техн. ун-т, 2018. 126 с.

12. Asuncion A., Newman D. UCI machine learning repository. University of California, Irvine, School of Information and Computer Sciences [Электронный ресурс]. 2007. URL: http://www. ics.uci.edu/~mlearn/MLRepository.html.

13. Плешкова Т. С., Становов В. В. Автоматическое определение грануляции для генетической нечеткой системы с использованием DBSCAN // Актуальные проблемы авиации и космонавтики : материалы VI Междунар. науч.-практ. конф. творческой молодежи. Красноярск, 2021. 3 c.

14. Ketchen Jr D. J.; Shook C. L. The application of cluster analysis in Strategic Management Research: An analysis and critique // Strategic Management Journal. 1996. No. 17 (6). Р. 441–458. Doi: https://doi.org/10.1002/(SICI)1097-0266(199606)17:6<441::AID-SMJ819>3.0.CO;2-G.

15. Gorban A. N., Zinovyev A. Y. Principal Graphs and Manifolds, Ch. 2 in: Handbook of Research on Machine Learning Applications and Trends: Algorithms, Methods, and Techniques, Emilio Soria Olivas et al. IGI Global, Hershey, PA, USA, 2009. 34 p.

16. Cheng Yizong Mean Shift, Mode Seeking, and Clustering // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1995. Р. 790–799. Doi: 10.1109/34.400568.


Плешкова Татьяна Сергеевна – магистрант; Сибирский федеральный университет. E-mail: tatyana.pleshkova2310@gmail.com.

Становов Владимир Вадимович – кандидат технических наук, доцент базовой кафедры интеллектуальных систем управления; Сибирский федеральный университет. E-mail: vladimirstanovov@yandex.ru.


  Сравнение методов кластеризации данных для автоматического определения грануляции в генетической нечеткой системе