Autor: admin | Data: 11.04.2014 | Wyświetleń: 3,276 | Brak komentarzy
Z przebiegu matematyki wiadomo, że kierunek największego wzrostu jakiejkolwiek funkcji w naszym przypadku charakteryzuje się gradientem:
gdzie - wektory jednostkowe w kierunku osi współrzędnych. W konsekwencji kierunek przeciwny do gradientu będzie wskazywał kierunek największego spadku funkcji, a metody oparte na wyborze ścieżki optymalizacji przy użyciu gradientu nazywane są gradientem.
Proces znajdowania minimalnego punktu funkcji metodą gradientu zniżania jest następująca: na początku wybieramy jakiś punkt początkowy
i obliczamy w nim gradient funkcji
. Następnie wykonujemy krok w kierunku anty-gradientowym
(gdzie
) W rezultacie otrzymujemy nowy punkt
, wartość funkcji, która jest zwykle mniejsza niż wartość funkcji w punkcie
. Jeśli ten warunek nie zostanie spełniony, to znaczy wartość funkcji nie zmieniła się, a nawet nie zwiększyła, należy zmniejszyć stopień
(
), po czym w nowym punkcie obliczamy gradient i ponownie robimy krok w kierunku przeciwnym do niego
.
Proces trwa aż do uzyskania najniższej wartości funkcji celu. Ściśle mówiąc, czas zakończenia wyszukiwania nastąpi, gdy przejście z danego punktu, przy wyborze dowolnego kroku, prowadzi do zwiększenia wartości funkcji celu. Jeśli minimalna funkcja zostanie osiągnięta w rozważanym obszarze, wówczas w tym punkcie gradient jest zerowy, co może również służyć jako sygnał zakończenia procesu optymalizacji.
Formuły dla pochodnych cząstkowych można uzyskać jawnie tylko wtedy, gdy funkcja docelowa jest podana analitycznie. W przeciwnym razie te pochodne są obliczane przez różnicowanie numeryczne:
Zauważ, że znajdź minimalny punkt funkcji można również osiągnąć poprzez skonstruowanie wielowymiarowego zadania optymalizacji dla sekwencji zadań jednowymiarowych w każdym kroku optymalizacji. Ta metoda jest nazywana metoda skoordynowanego zejścia . Różnica polega na tym, że w metodzie zejścia gradientu kierunek optymalizacji jest określony przez gradient funkcji celu, podczas gdy w metodzie zejścia ze współrzędnych zejście jest wykonywane w każdym kroku wzdłuż jednego ze współrzędnych.