pexels-kat-smith-567985

W języku naturalnym do opisu zjawisk często posługujemy się określeniami nieprecyzyjnymi i wieloznacznymi.  Używamy określeń takich jak: wysoki wzrost, młody człowiek, niska temperatura, duże miasto itp. Ale co to znaczy, że ktoś jest np. wysoki? Czy człowiek, mający 180 cm wzrostu jest wysoki? Czy 179 cm również wystarczy by być uznanym za wysokiego? Co jeśli mówimy o osobie mającej 178 cm? Jest jeszcze wysoka, czy już nie? Gdzie leży granica między ludźmi wysokimi, a takimi, którzy nie są wysocy? Próby ustalenia takiej granicy mają zawsze charakter subiektywny i uznaniowy. Dzieje się tak niemal zawsze, gdy próbujemy przejść od naturalnego opisu świata opartego o pojęcia jakościowe do opisu ilościowego. Ujmując rzecz precyzyjniej, dzieje się tak gdy odwołujemy się w opisie ilościowym do klasycznej logiki, opierającej się na dwóch wartościach logicznych: „prawda” i „fałsz”.

W logice dwuwartościowej przynależność do zbioru jest rozstrzygana w sposób jednoznaczny, zerojedynkowy – dany element (obiekt) do zbioru należy, albo nie. Nie ma stanów pośrednich. Dlatego też przynależność do zbioru osób wysokich na gruncie logiki klasycznej musi być rozstrzygnięta w sposób jednoznaczny, bez względu na wskazaną wcześniej nienaturalność rozgraniczenia pomiędzy osobami wysokimi i niewysokimi.  Można ten problem rozwiązać poprzez wprowadzenie pośrednich stopni przynależności elementów i wykorzystanie logiki wielowartościowej. W logice wartościowej dopuszcza się więcej niż dwie wartości logiczne, a zatem wartością logiczną zdania może być nie tylko prawda (1) i fałsz (0), lecz także dowolna liczba rzeczywista z przedziału [0,1], interpretowana jako stopień prawdziwości podanego zdania. Konsekwencją wprowadzenia pośrednich wartości logicznych jest możliwość określenia stopnia przynależności do zbioru również za pomocą liczby z przedziału [0,1].

W przypadku zbioru osób wysokich może to wyglądać następująco: ludzi o wzroście poniżej 150 cm nie uważamy za wysokich, więc przypisujemy im stopień 0 przynależności do zbioru ludzi wysokich, ludzi o wzroście powyżej 180 cm z kolei za takich uważamy więc przypisujemy im stopień przynależności równy 1. Natomiast osoby o wzroście między 150 a 180 cm mogą być uznane za wysokie w pewnym stopniu, przy czym stopień przynależności jest pośredni między 0 a 1. Funkcję opisującą stopień przynależności do zbioru nazywa się funkcją przynależności zbioru rozmytego. Przykładowy wykres funkcji przynależności zbioru rozmytego ludzi wysokich przedstawiono na wykresie 1.

Formalną definicję zbioru rozmytego, jako pierwszy zaproponował w 1965 roku Lofti A. Zadeh, w artykule Fuzzy sets[1]. Zbiór rozmyty to klasyczny zbiór elementów wraz z ich stopniami przynależności, co można zapisać:

Warto podkreślić, że funkcja przynależności jest określana subiektywnie, jej wybór zależy od użytkownika i dzięki temu może być dopasowana do potrzeb związanych z opisem konkretnych sytuacji. Niemniej istnieją pewne standardowe funkcje przynależności i wśród nich można wskazać funkcję rysunek 2):

  • trójkątną,
  • trapezoidalna,
  • gaussowską,
  • sigmoidalna

Zbiory rozmyte są doskonałym narzędziem do opisu zmiennych lingwistycznych, czyli zmiennych które przyjmują jako wartości nieprecyzyjne pojęcia języka naturalnego.

Na zbiorach rozmytych można zdefiniować działania, które są analogią do działań na zbiorach klasycznych, to znaczy część wspólną, sumę, dopełnienie. W przypadku zbiorów rozmytych możemy definiować takie operacje na (nieskończenie) wiele sposobów. Wynika to z faktu że istnieje wiele funkcji będących odpowiednikiem klasycznych operatorów na zbiorach. Wybór działań na zbiorach rozmytych pozwala na zbudowanie tzw. systemu rozmytego, który umożliwia przeprowadzanie wnioskowania w bardziej elastyczny, niż w oparciu o logikę klasyczną, sposób. Systemy takie mają szereg zalet, wśród których warto wymienić:

  • stabilność – małe różnice w danych wejściowych generują małe różnice w wynikach
  • pozwalają na wprowadzanie zmiennych wyrażanych w języku naturalnym
  • umożliwiają uwzględnienie wiedzy eksperckiej.

[1] Zadeh, L. A. (1965). Zadeh, Fuzzy sets. Inform Control, 8, 338-353.

Niniejszy artykuł powstał dzięki środkom pochodzącym ze współfinansowania przez Unię Europejską Programu Operacyjnego Inteligentny Rozwój 2014-2020, projektu realizowanego w ramach konkursu Narodowego Centrum Badań i Rozwoju: w ramach konkursu „Szybka Ścieżka” dla mikro-, małych i średnich przedsiębiorców – konkurs dla projektów z regionów słabiej rozwiniętych w ramach Działania 1.1: Projekty B+R przedsiębiorstw Poddziałanie 1.1.1 Badania przemysłowe i prace rozwojowe realizowane przez przedsiębiorstwa. Tytuł projektu: „Stworzenie oprogramowania do poprawy trafności prognoz i optymalizacji zapasów z perspektywy odbiorcy i dostawcy współpracujących w ramach łańcucha dostaw przy zastosowaniu rozmytych, głębokich sieci neuronowych.